领先的AI安全与研究公司Anthropic近日在官方技术博客中详细分享了其如何跨产品确保AI助手Claude的安全部署策略。面对AI智能体自主操作带来的潜在风险,Anthropic并未单纯依赖人类监督,而是构建了多层次的防御体系。...
Read More最新研究揭示,基于大语言模型(LLM)的智能体AI系统存在根本性安全缺陷——模型无法有效区分指令与数据,导致其极易遭受提示注入攻击。攻击者可通过在Jira工单、网页内容等非受信源中嵌入隐藏指令,诱使具有敏感数据...
Read More人工智能安全与研究公司Anthropic正式推出网页版Claude Code测试功能,这项突破性服务允许开发者直接在浏览器中委托AI执行编程任务。该云服务采用沙盒环境下的并行执行架构,可安全连接GitHub代码库并实时追踪任务进...
Read More