漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-07 talkingdev

AI Agent新挑战:不靠源码,仅凭文档和实验逆向生成完整软件

近日,一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体(Agent)在没有源代码的情况下,仅通过阅读文档和进行实验,从零开始逆向构建软件可执行文件的能力。Pro...

Read More
2026-05-04 talkingdev

OpenAI 的“无代码”工程革命:用 AI Agent 编排软件开发新模式

OpenAI 近期在内部工程实践中推行了一种被称为“Harness Engineering”的软件开发理念,它并非字面意义上的不写代码,而是引导工程师将注意力从手写逻辑转向构建 AI Agent 能够自主运行的环境和“控具”(Harness)。核...

Read More
2026-04-30 talkingdev

Mistral Medium 3.5发布:128B密集模型驱动云端异步编程,性能登顶SWE-Bench

Mistral AI最新发布了Mistral Medium 3.5模型,这是一款拥有1280亿参数的密集模型(128B dense model),专为驱动远程Vibe代理而设计,能够在云端执行长时间、异步的编码任务,用户可直接从命令行界面(CLI)或Le Ch...

Read More
2026-04-29 talkingdev

Poolside发布Laguna系列编程模型:开源XS.2小而强,旗舰M.1专注长周期任务

人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...

Read More
2026-04-28 talkingdev

开源|OpenAI发布Codex Symphony:将问题追踪器变为编码Agent控制中枢,PR吞吐量提升5倍

OpenAI 正式开源了名为 Symphony 的规范与框架,旨在重塑编码智能体(Agent)与开发工作流的交互方式。Symphony 的核心创新在于,它将开发者日常使用的 Issue 追踪器(如 GitHub Issues)直接转化为编码 Agent 的“控...

Read More
2026-04-17 talkingdev

AI智能体Morphex深度进化:一年内自动提交数千PR,重构monday.com生产级单体架构

协作平台monday.com的工程团队近日披露了一项前沿技术实践:他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体,并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...

Read More
2026-04-17 talkingdev

OpenAI发布指南:利用沙盒代理实现大型代码库现代化迁移

近日,OpenAI开发者平台发布了一份技术指南,详细阐述了一种利用沙盒代理(Sandboxed Agents)对大型遗留代码库进行现代化迁移的结构化方法。该方案的核心在于将复杂的代码迁移任务分解为多个独立的、在隔离环境中执...

Read More
2026-04-16 talkingdev

AI原生测试服务QA Wolf:将QA周期从数小时压缩至数分钟,助力工程团队实现80%端到端自动化测试覆盖率

软件工程领域,质量保证(QA)环节常成为制约发布速度的关键瓶颈。针对这一痛点,AI原生测试服务商QA Wolf推出了一项革新性解决方案,旨在彻底改变软件测试范式。该服务利用人工智能技术,自主完成对Web和移动应用...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page