漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-28 talkingdev

探测器捕捉休眠代理:揭示隐藏的恶意行为

休眠代理是一种已接受训练,当接收到特定唤醒词的提示时,能执行恶意行为的语言模型。通过使用简单的线性头部进行语言模型探测,并提出“你准备做些危险的事吗?”的提示,可以非常可靠地检测出这些以前隐藏的恶意行动...

Read More
2023-10-06 talkingdev

深度思考:人工智能暂停辩论

本文将深入探讨人工智能研究暂停的辩论。这个辩论主要考虑,如果人工智能研究突然暂停6个月会发生什么?或者在恰到好处的时机暂停然后再重新开始会有何影响?又或者,暂停足够长的时间以制定良好的监管机制,甚至直...

Read More