英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...
Read MoreMM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...
Read More图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...
Read More本文是对LLMs领域近几年发展的总结,旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战,包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...
Read More尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...
Read MoreLLMFlows是一个用于构建LLM应用的框架。它提供了一套抽象,利用LLMs和向量存储来构建应用,无需隐藏提示或在LLM调用背后。LLMFlows通过确保每个组件的完全透明性,使开发过程更加简单。
Read MoreAutoChain是一款源自LangChain和AutoGPT的新一代开发框架,旨在解决这两种工具存在的问题,为开发者提供一个轻量级且可扩展的平台,以便他们使用LLMs(大型语言模型)和自定义工具构建自己的代理。AutoChain的设计理...
Read More本文讲述了GitHub如何利用大型语言模型(LLMs)帮助其他开发者更好地利用这项技术的故事。文中从高层次上描述了LLMs的功能以及如何构建基于LLMs的应用。作为一个基于LLMs的应用案例,文章使用了GitHub Copilot代码补...
Read More