漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

Mistral与Nvidia全新多语言模型Nemo 12B震撼发布

Mistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练,展现出了强大的多语言和英语处理能力。值得一提的是,Nemo 12B还支持128k的上下文。这种强大的性能,无疑...

Read More
2024-04-16 talkingdev

Eleuther发布Pile-T5:现代AI编码任务的升级版基础模型

Eleuther团队近期对T5模型进行了重新训练,采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马,此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整,Pile-T5在多项基...

Read More
2024-03-19 talkingdev

16种不同的分词器预训练同一模型揭秘

现代语言模型的一个奇特事实是,在训练模型之前,我们首先训练分词器。另一个奇怪的事实是,在大规模场景下,词汇量大小似乎并不是那么重要。本文将深入探讨这两种现象,分析分词器在模型预训练中的角色和影响,以及...

Read More
2024-03-01 talkingdev

HiGPT:学习异构图谱的新方法

HiGPT 是一种学习跨异构图谱的方法,不需要微调。它与新颖的图谱分词器和大量的图谱指令相结合,使其在适应各种数据分布方面表现出色。

Read More
2024-02-20 talkingdev

Minbpe开源的语言模型分词器

Karpathy发布了一个最小化、干净、可扩展的实现字节对编码的语言模型分词器,Minbpe现已在GitHub Repo中开放。

Read More
2023-09-05 talkingdev

SpeechTokenizer,语音模型的统一语音分词器

研究人员创造了一个名为SpeechTokenizer的工具,该工具通过使用一种混合不同语音方面的特殊架构,帮助模型以更有效的方式理解口语。通过这种方式,它尝试解决语音模型在理解和处理口语时面临的挑战。它的创新之处在...

Read More
2023-06-09 talkingdev

深入理解GPT分词器

## 概述 本文讨论GPT分词器,这是大型语言模型用于将文本转换为预测所需的标记。我们介绍了一个Observable笔记本工具,它允许用户将文本转换为标记,反之亦然,并在完整的标记表中运行搜索。 ## 核心要点 - GPT分词...

Read More