论文：探索LLMs的安全性

talkingdev • 2024-03-15

540860 views

最近的一项研究中，研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差，提供更复杂的回复，使不当回复更难以检测。