近日,一款名为Kimi K2.5的开源权重模型在编程挑战中击败了包括Claude、GPT-5.5和Gemini在内的多个顶级闭源模型。这一事件迅速在科技圈引发广泛关注,尤其在Hacker News上引发了激烈讨论。Kimi K2.5由中国团队开发,...
Read More人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...
Read More在软件开发领域,利用AI编码辅助工具(如Anthropic推出的Claude Code)来加速个人项目的开发,正成为一种值得关注的新趋势。这些工具并非旨在取代开发者,而是作为高效的“加速器”,能够帮助程序员快速将想法转化为可...
Read More随着生成式AI在软件开发中的广泛应用,如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出,AI的最佳用途有时是启发性的提问,并不直接产生任何代码,因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...
Read MoreBroccoli 是一个新颖的开源工具,旨在通过AI代理(包括Claude和Codex)自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单(Tickets)自动转化为GitHub上的拉取请求(Pull Requests)...
Read More软件开发团队Software Mansion近日在GitHub上开源了一款名为Argent的创新工具包,它将人工智能代理(Agent)技术引入iOS模拟器的控制、调试与性能分析领域。Argent的核心价值在于,它允许AI助手以高度自主的方式与iO...
Read MoreAnthropic Labs今日正式发布Claude Design,标志着生成式AI在专业视觉创作领域迈出关键一步。该产品基于Claude Opus 4.7多模态视觉模型构建,能够协助用户高效生成设计原型、商业演示文稿、营销单页等视觉内容。其核...
Read MoreOpenAI近期发布了其AI编程助手Codex的重大版本更新,标志着其在软件开发全生命周期中的角色从辅助工具向全能型AI伙伴的深刻转变。此次更新最引人注目的突破在于,Codex现在能够直接操作计算机,与用户并肩工作,实现...
Read More