OpenAI 近日详细披露了其 Codex 功能在 Windows 系统上运行背后的工程挑战与解决方案。为了在保证安全性的前提下,让编程 AI 代理能够高效地在本地开发者机器上执行任务,OpenAI 构建了一套高度受限的“Windows 沙箱”...
Read More谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...
Read MoreMistral AI最新发布了Mistral Medium 3.5模型,这是一款拥有1280亿参数的密集模型(128B dense model),专为驱动远程Vibe代理而设计,能够在云端执行长时间、异步的编码任务,用户可直接从命令行界面(CLI)或Le Ch...
Read More近日,一个名为Plain的新型Python Web框架在GitHub上发布,引发了开发者社区的关注。该项目并非从零开始,而是从成熟的Django框架分支而来,并进行了彻底的重新设计,旨在适应所谓的“智能体时代”。其核心设计哲学是...
Read More近期,一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构,通过多个专门化智能体协同工作,对代码进行多轮验证,并设定80%置信度...
Read MoreWorkOS近日发布了其官方命令行工具workos-cli的重大更新,引入了一项由Anthropic的Claude AI模型驱动的革命性功能。开发者仅需在终端执行`npx workos`命令,一个AI代理便会自动扫描分析当前项目代码,智能识别项目所...
Read More近日,技术研究团队对Perplexity推出的名为Comet的智能体浏览器进行了深入的技术剖析。Comet并非传统意义上的浏览器,而是一个配备了先进AI模型的“代理式浏览器”,其核心能力在于能够自主地与网页内容进行交互。该分...
Read More近日,一项名为SWE-Universe的研究提出了一种革命性的可扩展框架,旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战:构建成功率低、验证机制薄弱以...
Read More