在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭...
Read More这篇文章探讨了人工智能如何改变网络安全领域中的漏洞发现与披露文化。传统上,安全社区中存在两种主流文化:一种是“负责任披露”,即研究人员在发现漏洞后先通知厂商,给予修复时间再公开;另一种是“完全公开”,即立...
Read More谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...
Read MoreGitHub 近日发布技术博客,详细介绍了其针对 GitHub Agent Workflows 中 Tokens 使用效率的优化工作。随着AI代理工作流在代码仓库管理和代码质量提升中的广泛应用,其自动调度与触发的特性导致Token消耗量急剧增加,...
Read MoreOpenAI 宣布其 AI 编程模型 Codex 现已原生支持在 macOS 和 Windows 系统的 Chrome 浏览器中直接运行。这一新特性允许 Codex 在后台不接管浏览器控制权的情况下,跨多个标签页并行工作。用户可以通过它高效地执行重...
Read More近日,一项名为ProgramBench的新型基准测试引发了人工智能和软件工程领域的广泛关注。该测试旨在评估AI智能体(Agent)在没有源代码的情况下,仅通过阅读文档和进行实验,从零开始逆向构建软件可执行文件的能力。Pro...
Read More在云服务日益普及的今天,数据隐私和自主权成为技术用户关注的焦点。Cloudflare推出的开源项目Agentic Inbox(GitHub仓库),正是一项旨在解决这一痛点的创新实践。该项目是一个自托管的电子邮件客户端与AI助手,运...
Read More一项最新行业调研显示,高达73%的企业认为数据连接性是阻碍其大规模部署AI的第一大障碍。为了帮助技术决策者跨越这一鸿沟,数据集成平台提供商CData与微软将于5月13日联合举办一场深度网络研讨会,主题聚焦于“AI智能...
Read More