近期,一项由人工智能系统独立完成的安全研究引发了科技界广泛关注。该系统在2025年12月至2026年1月期间,在没有人类干预的情况下,自主执行了完整的安全研究流程,成功发现了Node.js和React这两个全球部署最广泛的J...
Read MoreOpenAI近期披露了一项引人注目的内部实验成果。在该项目中,一个小型团队成功发布了一款产品,其整个代码库——包括应用逻辑、测试用例、持续集成(CI)流程、技术文档以及相关工具链——均由Codex智能体(agents)自主...
Read MoreTambo AI 近日在 GitHub 上开源了一个名为 Tambo 的 React 工具包,旨在为开发者提供构建能够生成并与动态用户界面交互的 AI 智能体(Agent)的能力。该工具包的核心创新在于,它允许开发者使用 Zod 模式(Schema)...
Read MoreMeta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More生成式人工智能(Gen-AI)在软件开发领域正引发一场关于效率与协作的深刻反思。最新观点指出,尽管AI工具可能在短期内提升个体开发者的编码速度,但其产生的“负外部性”正悄然侵蚀软件团队的协作根基。核心问题首先体...
Read More近日,知名Python数据验证库Pydantic团队在GitHub上开源了一个名为Monty的项目,这是一个用Rust编写的、极简且安全的Python解释器,专为人工智能应用场景设计。该项目旨在解决一个关键痛点:如何安全地执行由大型语...
Read More人工智能安全与研究公司Anthropic近日公布了一项突破性的AI协作编程实验成果。该公司组建了一个由16个并行运行的Claude Opus 4.6智能体组成的“AI开发团队”,成功自主构建了一个基于Rust语言的C编译器。这个由AI团队...
Read More人工智能研究公司Anthropic近期公布了一项引人注目的技术实验成果:通过协调多个Claude AI智能体并行协作,成功构建了一个基于Rust语言的C语言编译器。该编译器已具备编译最新Linux 6.9内核的能力,标志着AI在复杂系...
Read More