漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-12 talkingdev

微软AICI-实时控制语言模型的输出

人工智能控制界面(AICI)使您能够构建控制器,以实时约束和指导大型语言模型的输出。通过AICI,用户可以使用自己的约束条件或限制来约束模型的输出,同时还可以通过实时反馈来调整约束条件,从而实现更好的模型输出...

Read More
2024-03-12 talkingdev

扎克伯格坚称Quest 3也是计算机,不仅仅是为游戏而生,最新的Vision Pro回应

Quest 3不仅仅是为游戏而生,扎克伯格坚称它也是一台计算机。Quest的顶级应用程序包括社交应用程序、浏览器和视频播放器,同时也有一个对健身应用程序非常热情的社区。

Read More
2024-03-05 talkingdev

DSNIE-单目表面法向量估计新方法

DSNIE是一种方法,可以显著提高单目表面法向量估计的准确度,可用于多种计算机图形应用程序。DSNIE方法基于深度学习,使用卷积神经网络对输入图像进行处理,并输出表面法向量。该方法在各种室内和室外场景中进行了测...

Read More
2024-03-05 talkingdev

GPT-4只能成功完成14%的Agent任务

社区对代理在处理各种数字工作负载方面的潜力非常兴奋。然而,即使是最好的通用模型也难以完成人类70%以上成功的任务。显然,我们可能需要专门针对这些任务进行训练的模型。

Read More
2024-03-05 talkingdev

论文:Gemini在1m+代币窗口中使用HyperAttention技术

众所周知,Gemini的惊人1m+代币窗口使用HyperAttention技术取得了如此的成功。这种技术可使计算机通过模拟人类大脑中的注意力机制来聚焦于代币,并识别出其中的关键信息。HyperAttention技术不仅提高了Gemini的精度...

Read More
2024-03-01 talkingdev

论文:AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈,并创建了Q-Pathway数据集,以分析其清晰度、色彩和亮度。

Read More
2024-02-29 talkingdev

字节跳动开发 MegaScale 系统,可用于训练大型语言模型

据悉,字节跳动开发了一种名为 MegaScale 的系统,可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型,达到了 55.2% 的模型 FLOPs 利用率,相当惊人。此外,字节跳动...

Read More
2024-02-27 talkingdev

使用LLMs进行注释的论文精选

这是一份关于使用LLMs进行注释的精选论文列表,LLMs是一种基于机器学习的语言模型,能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率,目前在自然语言处理和计算机视觉领域被广泛...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page