漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-07 talkingdev

[论文推荐] Mercury:基于扩散模型的超高速语言模型

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...

Read More
2025-07-07 talkingdev

agent-squad:构建协作式多智能体AI系统框架

AWS实验室推出的开源项目agent-squad为构建协作式多智能体AI系统提供了全新框架。该技术突破性地实现了多智能体之间的任务规划、工作委派和协同问题解决能力,标志着分布式人工智能向复杂任务处理迈出重要一步。其核...

Read More
2025-07-07 talkingdev

Gemini 2.5聊天机器人迎来长期记忆功能:开源工具mem0实现个性化对话

谷歌DeepMind推出的Gemini 2.5大模型近日通过开源工具mem0实现了突破性的长期记忆功能。该技术方案利用Gemini API与mem0的协同工作,使聊天机器人能够存储和调用历史交互数据,从而显著提升对话系统的上下文感知能力...

Read More
2025-07-04 talkingdev

开源强化学习框架横向评测:TRL、Verl、OpenRLHF等九大工具深度解析

Anyscale研究团队近期对TRL、Verl、OpenRLHF等九大开源强化学习框架进行了系统性评测,涵盖采用度指标、系统特性和技术架构三大维度。该研究为开发者选择适合RLHF(人类反馈强化学习)、推理模型或智能体训练场景的...

Read More
2025-07-04 talkingdev

LangChain发布《智能体上下文工程指南》:揭秘Agent构建核心技术

LangChain最新发布的技术指南《智能体上下文工程》深入剖析了Agent开发中的核心环节——上下文工程。该指南不仅系统阐述了上下文工程在智能体架构中的关键作用,还详细介绍了当前业界主流的实现模式及具体应用方案。作...

Read More
2025-07-04 talkingdev

Devin团队揭秘高效AI Agent开发:防御性提示与任务架构的艺术

Devin团队在其最新技术分享中提出'防御性提示(defensive prompting)'方法论,强调在AI代理开发过程中,不仅要明确任务目标,更需要通过结构化指令指导AI'如何完成任务'。研究表明,耗时1-6小时的中等复杂度任务能...

Read More
2025-07-04 talkingdev

KyutaiTTS开源-支持流式传输与低延迟的TTS引擎

法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...

Read More
2025-07-03 talkingdev

[论文推荐]GNN与Transformer结合:新型神经网络架构预测器诞生

研究人员最新提出了一种创新的神经网络架构预测器,该预测器将图神经网络(GNN)与Transformer架构相结合,通过引入兄弟感知令牌混合器(sibling-aware token mixer)和双向图同构前馈网络(bidirectional graph iso...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page