漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-22 talkingdev

最小成本路径(MCP)与智能体间(A2A)通信基础演示实例

该视频教程通过一个精简案例,系统演示了最小成本路径算法(MCP)与智能体间通信检测(A2A)的核心技术原理。MCP作为路径优化领域的经典算法,在物流调度、网络路由等场景具有重要应用价值;而A2A通信检测机制则是分布式...

Read More
2025-04-25 talkingdev

PhiloAgents教程:将游戏仿真智能体转化为实时交互API

PhiloAgents最新发布的教程展示了如何将游戏仿真中的智能体(Agents)转化为具备API接口的实时交互角色,这一技术突破为构建更具沉浸感的虚拟环境提供了新的可能性。该教程详细介绍了智能体的实时化处理流程,包括状...

Read More
2025-04-23 talkingdev

[开源]个性化多智能体系统FlowReasoner:基于强化学习的元推理框架

新加坡国立大学SAIL实验室推出的FlowReasoner项目,开创性地将强化学习与外部反馈机制相结合,构建了一个可自主生成定制化多智能体系统的元推理框架。该技术突破性地实现了三大创新:1) 通过动态推理引擎解析用户查...

Read More
2025-04-22 talkingdev

[开源]Rowboat:面向多智能体系统的开源IDE,AI辅助开发新范式

由Arjun、Ramnique和Akhilesh团队开发的Rowboat(https://www.rowboatlabs.com/)是一款专为多智能体系统设计的AI辅助集成开发环境(IDE)。该工具通过聊天式Copilot实现从单智能体到协作团队的扩展,支持MCP工具集...

Read More
2025-04-21 talkingdev

[开源]ZeroSumEval Benchmark:多智能体对抗框架重塑大语言模型评估标准

Meta旗下Facebook Research团队推出的ZeroSumEval Benchmark在GitHub开源,这一动态评估框架通过竞争性多智能体模拟,为大语言模型(LLM)在推理、知识储备和规划任务等核心能力维度建立了全新测试范式。该框架创新...

Read More
2025-04-02 talkingdev

Open Hands推出32B代码模型,在代理编码任务中超越更大规模模型

Open Hands团队最新发布的32B参数代码模型(Open Hands LM-32B)在强化学习(RL)训练框架下,基于Qwen架构实现了突破性进展。该模型在代理编码任务(agentic coding tasks)中的表现已超越许多参数规模更大的竞品,...

Read More
2024-07-02 talkingdev

论文:在多智能体Agent模型中更好地探索-QMIX的改进

科研人员已经通过在最大熵框架内增加了一个局部Q价值学习方法,改进了被广泛应用的多智能体强化学习方法QMIX。QMIX是一个众所周知的多代理强化学习方法,它能有效地解决多代理学习中的挑战,如策略的协调和通信难题...

Read More
2024-07-01 talkingdev

Llama Agents-新一代多智能体系统构建框架

Llama Agents是一个以异步为首的框架,用于构建、迭代和生产多智能体系统,包括多智能体通信,分布式工具执行,人在环中等等。Llama Agents的目标是提供一个强大、灵活且易于使用的框架,以支持开发者在各种场景中快...

Read More