论文：自动检测大型语言模型中的未充分训练的标记

talkingdev • 2024-05-13

1125577 views

语言模型依赖于单独训练的标记生成器。这些标记生成器可能会产生在语言模型训练过程中从未见过的标记。即使在最强大的现代语言模型中，也存在许多此类标记。本文探讨了这种现象，并提出了识别和处理这些标记的方法。语言模型的标记问题一直是许多研究者关注的焦点，这篇论文的发表无疑为该领域提供了新的研究视角和方法。