漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-02 talkingdev

Arcee AI发布Trinity-Large-Thinking:开源前沿推理模型,为复杂长程智能体而生

人工智能公司Arcee AI近日正式发布了其前沿开源推理模型“Trinity-Large-Thining”。该模型专为处理复杂、长程任务的智能体(Agent)以及多轮工具调用场景而设计,被业界认为是目前中国境外发布的最强大的开源模型之一...

Read More
2026-04-01 talkingdev

开源|GitHub Copilot研究员实践:以智能体驱动开发,三天构建11个代理与近3万行代码

一位GitHub Copilot应用科学领域的研究人员,在构建了一个利用编码智能体分析海量智能体轨迹数据的工具后,总结并提炼出一套“智能体驱动开发”框架。该框架的核心洞见在于,将编码智能体视为初级工程师进行协作:提供...

Read More
2026-03-31 talkingdev

开源|OpenAI推出Codex插件,为Claude Code注入AI代码审查与任务委派新能力

近日,OpenAI在GitHub上正式开源了名为“codex-plugin-cc”的插件项目,旨在将其强大的代码生成模型Codex深度集成至Claude Code环境中。该插件允许开发者在Claude Code内部直接调用Codex的高级功能,核心应用场景聚焦...

Read More
2026-03-31 talkingdev

VS Code团队揭秘:AI代理如何驱动开发流程变革,实现每周发布

Visual Studio Code开发团队近日详细分享了其如何将人工智能深度整合到核心开发工作流中,从而实现了从传统发布周期到每周高频发布的重大转变。团队通过部署GitHub Copilot的代理模式,将问题分类、拉取请求生成等繁...

Read More
2026-03-30 talkingdev

AI代理工作流新突破:揭秘Pretext算法背后的“约束-测量-隔离”循环

近期,一项名为Pretext的文本测量算法因其独特开发模式引发技术社区关注。该算法由AI代理工作流驱动构建,其核心创新在于能够在不依赖传统DOM测量与重排的前提下,快速、精准地完成网页布局计算。开发团队采用了一套...

Read More
2026-03-30 talkingdev

前沿AI能力提升并非以牺牲经济性为代价,自动化成本远低于人力

根据METR(模型评估与追踪研究组织)发布的最新分析,前沿人工智能的能力提升并未伴随推理成本的显著上升。数据显示,尽管完成特定任务所需的单次推理成本有所增加,但当前最先进的AI模型执行同等任务的总成本仍仅约...

Read More
2026-03-30 talkingdev

开源|AutoBe革命性突破:函数调用成功率从6.75%跃升至99.8%,AI自动生成后端代码迈入新阶段

近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...

Read More
2026-03-28 talkingdev

开源|AI信息聚合新突破:last30days-skill智能体跨平台调研,一键生成深度综述

近日,GitHub上开源项目last30days-skill引发科技界广泛关注。该项目是一个AI智能体技能,能够针对用户指定的任何主题,自动在Reddit、X(原Twitter)、YouTube、Hacker News、Polymarket以及整个开放网络中进行实时...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page