[开源] 我提取了Apple Intelligence模型的安全过滤器
talkingdev • 2025-07-06
3816 views
近日,一位开发者成功逆向工程了Apple Intelligence生成式模型的安全过滤器加密机制(在框架中被称为“混淆”),并将这些过滤器提取到一个公开的GitHub仓库中。这一发现揭示了苹果如何在其AI模型中实施内容安全控制,为研究者和开发者提供了深入了解苹果AI安全策略的机会。该仓库已引发广泛关注,在Hacker News上获得315个点赞和201条评论,显示出业界对AI模型安全机制的浓厚兴趣。这一突破可能对生成式AI的安全研究产生重要影响,并为其他科技公司提供可借鉴的安全实践。
核心要点
- 开发者成功逆向工程Apple Intelligence生成式模型的安全过滤器加密机制
- 提取的安全过滤器已公开在GitHub仓库中,供研究者和开发者参考
- 这一发现引发业界广泛关注,在Hacker News上获得315个点赞和201条评论