Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...
Read MoreOpenAI最新发布的GPT-5.5模型系统卡(System Card)揭示了其性能表现与安全评估结果。这份详尽的报告显示,GPT-5.5在多项基准测试中表现出色,尤其在事实性查询、网络搜索和结构化任务执行上,已能与业界顶尖模型Cla...
Read More近日,OpenAI开发者平台发布了一份技术指南,详细阐述了一种利用沙盒代理(Sandboxed Agents)对大型遗留代码库进行现代化迁移的结构化方法。该方案的核心在于将复杂的代码迁移任务分解为多个独立的、在隔离环境中执...
Read More人工智能公司Anthropic近日宣布,将不会在短期内向公众发布其最新、能力最强的模型Claude Mythos。公司声明,其决定源于对网络安全的审慎考量,认为该模型目前所展现出的网络能力过于强大,若广泛可用可能带来潜在风...
Read More人工智能安全研究公司Anthropic近日公布了其Claude Mythos预览版的早期评估细节。该评估重点展示了Claude Mythos在网络安全领域的突破性能力,特别是在发现零日漏洞和逆向工程漏洞利用方面表现出色。零日漏洞指尚未...
Read More随着人工智能辅助编程工具的广泛应用,AI生成的代码正悄然进入企业的生产环境。这一趋势在提升开发效率的同时,也带来了潜在的安全风险与质量隐患。关键问题在于,工程团队往往难以全面掌握AI工具在组织内的实际使用...
Read More随着生成式AI在企业中的快速部署与应用,AI安全已成为企业董事会层面不可忽视的战略议题。网络安全公司Wiz近日发布了一份名为“AI安全董事会报告模板”的免费资源,旨在帮助首席信息安全官(CISO)及其他安全负责人,...
Read More近日,一个托管在GitHub上的开源项目“DHS Contracts Explorer”引发了科技界与数据安全领域的广泛关注。该项目基于黑客入侵美国国土安全部(DHS)下属行业合作办公室(Office of Industry Partnership)所获取的数据...
Read More