近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...
Read MoreAWS实验室推出的开源项目agent-squad为构建协作式多智能体AI系统提供了全新框架。该技术突破性地实现了多智能体之间的任务规划、工作委派和协同问题解决能力,标志着分布式人工智能向复杂任务处理迈出重要一步。其核...
Read More谷歌DeepMind推出的Gemini 2.5大模型近日通过开源工具mem0实现了突破性的长期记忆功能。该技术方案利用Gemini API与mem0的协同工作,使聊天机器人能够存储和调用历史交互数据,从而显著提升对话系统的上下文感知能力...
Read MoreAnyscale研究团队近期对TRL、Verl、OpenRLHF等九大开源强化学习框架进行了系统性评测,涵盖采用度指标、系统特性和技术架构三大维度。该研究为开发者选择适合RLHF(人类反馈强化学习)、推理模型或智能体训练场景的...
Read MoreLangChain最新发布的技术指南《智能体上下文工程》深入剖析了Agent开发中的核心环节——上下文工程。该指南不仅系统阐述了上下文工程在智能体架构中的关键作用,还详细介绍了当前业界主流的实现模式及具体应用方案。作...
Read MoreDevin团队在其最新技术分享中提出'防御性提示(defensive prompting)'方法论,强调在AI代理开发过程中,不仅要明确任务目标,更需要通过结构化指令指导AI'如何完成任务'。研究表明,耗时1-6小时的中等复杂度任务能...
Read More法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...
Read More研究人员最新提出了一种创新的神经网络架构预测器,该预测器将图神经网络(GNN)与Transformer架构相结合,通过引入兄弟感知令牌混合器(sibling-aware token mixer)和双向图同构前馈网络(bidirectional graph iso...
Read More