CLLM一致性语言模型:开创新的预测范式
talkingdev • 2024-05-10
652808 views
预测多个令牌的同时生成是当前被积极研究的一个有趣的范式。如果成功,这将大大提高许多大型语言模型的生成速度。本篇文章中的方法,模仿了图像合成中的一致性模型,试图在精调的LLMs上使用并行解码策略来加快生成速度。初步的结果显示,其推测解码性能达到了3倍的提升。这种新的预测范式可能会在语言模型的研究和应用中开创新的可能性。
核心要点
- 预测多个令牌的同时生成是一个新的研究范式
- 通过模仿图像合成中的一致性模型,尝试在精调的LLMs上使用并行解码策略来加快生成
- 初步结果显示,这种新的预测范式能够将解码性能提升3倍