该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read More英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...
Read MoreMM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...
Read More最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...
Read More图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...
Read More本文是对LLMs领域近几年发展的总结,旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战,包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...
Read MoreZep是一个开源工具,可以让开发者轻松地为他们的LLM应用添加相关文档,聊天历史记录以及丰富的用户数据。这些功能的添加将极大地提升应用的用户体验。Zep强大的特性使得开发者可以更好地理解用户的需求,通过分析用...
Read More这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...
Read More