漫话开发者 - UWL.ME
精选全球AI前沿科技和开源产品
Home
AI Tools
About
扫码关注AI
new
微信扫码实时跟踪AI前沿
Search
2024-02-26
talkingdev
大语言模型中
不安全提示
的检测方法
GradSafe是一种新的方法,用于检测大型语言模型中的
不安全提示
,无需进行大量的训练。它通过分析特定参数的梯度,比当前方法更有效地识别不安全的提示。
Read More