CleanLab作为一个开源软件包在MIT诞生后,现在已经发展成为一款企业级无代码工具,为工业级ML数据管道提供高质量数据的筛选和清理。该公司最近获得了3000万美元的融资,以加速产品开发和扩展市场。
Read More近日,由一群开发者共同开发的开源系统OpenLLMetry正式发布。OpenLLMetry基于OpenTelemetry,旨在提供对LLMs的观测性能分析。LLMs是轻量级的微服务,可以在边缘设备上运行,OpenLLMetry的发布将为开发人员提供更好的...
Read More研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...
Read More近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...
Read More人工智能驱动软件的下一步演变并非聊天机器人,而是利用LLMs来完成实际工作的应用。AI基础设施联盟的此篇电子书全面覆盖了此领域的各个方面,包括Prompt工程、LLM逻辑和推理、主要框架如LlamaIndex、LangChain、Hays...
Read More这篇教程指导用户如何通过使用Replit构建一个Slack机器人,该机器人使用Google LLMs提供每日频道摘要。Replit的AI能够生成和解释代码,加速开发过程并充当导师。这篇教程是由一位除了一些Python基本数据操作和爬取之...
Read More将大规模语言模型(LLMs)比作一个庞大且复杂的拼图,每一块拼图都代表一份知识。这篇论文研究了我们尝试改变其中一些知识碎片会发生什么情况。结果可能会导致整个拼图被破坏,或者使其变得模糊不清。知识编辑在LLMs...
Read More最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...
Read More