漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-09 talkingdev

评估大型语言模型作为代理的能力:AgentBench工具

该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...

Read More
2023-08-09 talkingdev

英伟达发布新的人工智能芯片,声称运行LLMs的成本将“显著降低”

英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
2023-08-07 talkingdev

LISA推出推理分割技术 - LLMS

图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...

Read More
2023-08-07 talkingdev

深入了解LLMs的奇特世界

本文是对LLMs领域近几年发展的总结,旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战,包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...

Read More
2023-08-04 talkingdev

Zep开源:为LLM应用开发带来更好用户体验

Zep是一个开源工具,可以让开发者轻松地为他们的LLM应用添加相关文档,聊天历史记录以及丰富的用户数据。这些功能的添加将极大地提升应用的用户体验。Zep强大的特性使得开发者可以更好地理解用户的需求,通过分析用...

Read More
2023-08-03 talkingdev

LISA开源:通过LLM进行推理分割

这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...

Read More
  1. Prev Page
  2. 46
  3. 47
  4. 48
  5. Next Page