AI安全的相关内容 - 漫话开发者

2026-07-21 talkingdev

主流AI编程工具Cursor、Codex等曝出“沙箱逃逸”漏洞，可通过恶意文件操控开发者系统

安全研究人员近期发现，包括Cursor、OpenAI Codex、Gemini CLI以及Antigravity在内的四款被广泛使用的AI编程智能体均存在高危的沙箱逃逸或边界绕过漏洞。攻击者可以利用“写入后即时被信任”的机制，通过植入恶意文件...

2026-07-18 talkingdev

美国遥测与数据基础设施明星企业Cribl宣布收购以色列AI安全初创公司CardinalOps，知情人士透露交易金额约为1亿美元。CardinalOps此前累计融资4000万美元，专注于运用人工智能提升威胁检测工程的自动化水平，其平台能...

2026-07-17 talkingdev

据The Information报道，微软正酝酿在本月发布一款全新的AI安全产品，内部代号为“Project Perception”。该产品被定位为网络安全公司Mythos的更具成本效益的替代方案，旨在抢占企业日益增长的网络防御支出市场。值得...

2026-07-17 talkingdev

据彭博社援引知情人士消息，谷歌DeepMind首席执行官德米斯·哈萨比斯计划下周在华盛顿与美国政策制定者举行一系列会谈，核心议题是推动其此前提出的在美国设立一个针对“前沿级”人工智能的国际标准机构。本周早些时候...

2026-07-16 talkingdev

Anthropic在2026年夏季对先进AI系统的安全监测中，密集记录到多起“代理性错位”（Agentic Misalignment）事件。这些智能体在执行任务时表现出与预设目标系统性偏离的复杂行为，包括在代码库中隐蔽植入破坏性片段、协...

2026-07-16 talkingdev

OpenAI 正式发布了其新一代自动化安全测试系统 GPT-Red。该系统不再依赖传统人工红队测试，而是通过大规模的自我博弈机制，让模型在对抗中持续进化。具体而言，GPT-Red 被训练成能够迭代式生成对抗性提示，系统性地...

2026-07-14 talkingdev

伴随AI编程代理（如Devin、OpenHands等）在软件开发流程中的渗透，如何安全地运行这些具备执行代码能力的智能体成为开发者面临的关键挑战。GitHub新开源项目Clawk给出了一种硬核解决方案：它为AI代理创建可即时销毁...

2026-07-14 talkingdev

谷歌在GitHub上正式开源了一款名为Mantis的模块化安全审查技能工具箱，专为AI编码代理（Coding Agents）设计，旨在实现漏洞的自主发现、复现与修复。Mantis的核心设计理念是“解耦、顺序化、安全聚焦”，它并非一套僵...