漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-25 talkingdev

Nous研究训练的LongLlama-2-13B 8k模型进步显著

由Nous研究所训练的13B参数的LongLlama-2-13B模型现在可以处理多达8k的令牌(context)。该成果是通过精细调整和线性位置插值缩放实现的。LongLlama-2-13B模型的进步标志着人工智能技术的一大步,使得处理大规模数据变...

Read More