漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-16 talkingdev

强大的Nous 34B Yi模HF型的微调

Nous研究推出了一款非常强大的34B模型,其建立在双语Yi模型的基础上。Capybara主要通过多轮数据进行训练,每次对话中的令牌数超过1000个,这使得它在处理信息密度较高的某些用户界面任务时具有独特的优势。

Read More
2023-11-06 talkingdev

Nous研究使用Yarn方法优化Mistral 7B模型,可处理长达128k的语境

Nous研究利用他们的Yarn方法对Mistral 7B进行了微调,可以处理长达128k的语境。它在短序列长度上显示出最小的退化,并在长文档上大大提高了性能。

Read More
2023-07-25 talkingdev

Nous研究训练的LongLlama-2-13B 8k模型进步显著

Nous研究所训练的13B参数的LongLlama-2-13B模型现在可以处理多达8k的令牌(context)。该成果是通过精细调整和线性位置插值缩放实现的。LongLlama-2-13B模型的进步标志着人工智能技术的一大步,使得处理大规模数据变...

Read More