漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-13 talkingdev

CleanLab获得3000万美元融资,助力构建可信赖的LLM

CleanLab作为一个开源软件包在MIT诞生后,现在已经发展成为一款企业级无代码工具,为工业级ML数据管道提供高质量数据的筛选和清理。该公司最近获得了3000万美元的融资,以加速产品开发和扩展市场。

Read More
2023-10-12 talkingdev

开源系统OpenLLMetry:基于OpenTelemetry的LLM观测性能分析

近日,由一群开发者共同开发的开源系统OpenLLMetry正式发布。OpenLLMetry基于OpenTelemetry,旨在提供对LLMs的观测性能分析。LLMs是轻量级的微服务,可以在边缘设备上运行,OpenLLMetry的发布将为开发人员提供更好的...

Read More
2023-10-11 talkingdev

论文:提升大型语言模型(LLMs)的数学推理能力

研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

Read More
2023-10-11 talkingdev

全新视频标记化工具MAGVIT-v2:提升视觉生成的重要武器

近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...

Read More
2023-10-11 talkingdev

Agent完全指南:LLMs与智能应用的革命

人工智能驱动软件的下一步演变并非聊天机器人,而是利用LLMs来完成实际工作的应用。AI基础设施联盟的此篇电子书全面覆盖了此领域的各个方面,包括Prompt工程、LLM逻辑和推理、主要框架如LlamaIndex、LangChain、Hays...

Read More
2023-10-06 talkingdev

我不是程序员,却用AI建造了我的第一个机器人

这篇教程指导用户如何通过使用Replit构建一个Slack机器人,该机器人使用Google LLMs提供每日频道摘要。Replit的AI能够生成和解释代码,加速开发过程并充当导师。这篇教程是由一位除了一些Python基本数据操作和爬取之...

Read More
2023-10-05 talkingdev

论文:LLMs中的知识编辑,大规模语言模型的知识编排之谜

将大规模语言模型(LLMs)比作一个庞大且复杂的拼图,每一块拼图都代表一份知识。这篇论文研究了我们尝试改变其中一些知识碎片会发生什么情况。结果可能会导致整个拼图被破坏,或者使其变得模糊不清。知识编辑在LLMs...

Read More
2023-10-05 talkingdev

思考再说:为LLMs添加暂停标记以提高推理能力

最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page