漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-31 talkingdev

[论文推荐]研究人员提出Panacea方法:防御有害微调攻击的新型自适应扰动技术

最新研究揭示了现有防御有害微调攻击(Harmful Fine-Tuning Attacks)方法的脆弱性,并提出了一种名为Panacea的创新解决方案。该方案采用自适应扰动技术,在保持模型微调性能的同时有效维护模型安全性。这一突破性进...

Read More
2024-11-25 talkingdev

最近邻攻击:AI安全新挑战

最近邻攻击是一种新型的安全威胁,它通过精心设计的输入扰动,使得机器学习模型的预测结果偏离真实目标,而指向攻击者指定的最近邻类别。这种攻击手段对于基于深度学习的图像识别系统尤为危险,因为它可以迷惑模型,...

Read More