漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-20 talkingdev

Quiet-Star:提升语言模型输出准确性的推理框架开源

Quiet-Star是一个推理框架,旨在增强语言模型生成正确输出的能力。该框架的代码已经公开,同时发布了一个每个令牌8步的模型。Quiet-Star通过优化模型的推理过程,提高了生成文本的准确性和相关性,对于自然语言处理...

Read More
2024-03-15 talkingdev

OpenAI宣布与Le Monde和Prisa Media合作,将其内容整合到ChatGPT中

OpenAI宣布与Le Monde和Prisa Media合作,将他们的内容整合到ChatGPT中,以为用户提供交互式和深入的新闻访问,并协助模型训练。Le Monde和Prisa Media将提供大量的新闻和其他内容,以帮助改进ChatGPT的质量和精度。...

Read More
2024-03-13 talkingdev

Meta发布24k H100s训练Llama 3细节

Meta在这篇博客文章中概述了用于训练Llama 3的基础设施。它介绍了存储、网络、Pytorch、NCCL等改进。这将为Meta今年其余时间上线的H100s打下基础。

Read More
2024-03-11 talkingdev

论文:AI翻译技术应用于语言模型,解决有害内容问题

该项目采用翻译技术,针对多种语言的AI模型中的有害内容问题进行改进,从而提高安全性。由于直接数据缺乏,因此该项目解决了AI模型中的有害内容问题,为该领域的发展提供了新的思路。

Read More
2024-03-11 talkingdev

加州大学三位研究者取得新突破,矩阵乘法更接近理想状态

来自加州大学的三名研究者提出了一种新技术,可以提高矩阵乘法的效率。矩阵乘法是一种基本的计算操作,被广泛应用于人们日常使用的各种算法中。即使是微小的提高,最终也可能带来显著的时间、计算能力和金钱上的节省...

Read More
2024-03-06 talkingdev

论文:支持更长上下文长度的LLMs技术研究

近日,研究人员开发了一种名为Resonance RoPE的新技术,帮助LLMs更好地理解和生成比其原始训练序列更长的文本。这种方法在现有的Rotary Position Embedding(RoPE)系统上进行了改进,提高了模型在长文本上的性能,...

Read More
2024-02-27 talkingdev

GeneOH-改进后的手部-物体交互技术

GeneOH扩散技术是一种新的技术,它通过改正手部动作和与物体的关系中的错误来提高模型对物体的理解和交互。这种方法专注于使这些交互更加自然。

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page