对抗样本的相关内容 - 漫话开发者

2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理：无关信息触发推理模型错误率激增300%

最新研究发现，在数学问题中插入诸如'有趣的事实：猫一生大部分时间在睡觉'等无关短语，会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性，且蒸馏版模型表现...

2025-04-29 talkingdev

来自arXiv的最新研究论文提出ReLearn框架，通过创新的数据增强和微调技术，解决了大语言模型（LLMs）中的关键挑战——'遗忘学习'（Unlearning）。该技术可精准移除模型训练数据中的特定信息，同时保持整体性能，对数据...