大型语言模型的相关内容 - 漫话开发者

2024-05-22 talkingdev

论文：基于LLMs的文本分类智能专家系统

智能专家系统是一种利用大型语言模型（LLMs）进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求，大大简化了文本分类过程。LLMs具备强大的自然语言处理能力，能够更高效地理解和分类复杂的文...

2024-05-21 talkingdev

近日，知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司，其技术在搜索引擎、聊天机器人等领域有着广泛应用。...

2024-05-13 talkingdev

E2URec是一种全新的方法，可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据，保证用户隐私的同时，又不牺牲系统性能。这种新方法以用户隐私保护为核心，通过改变推荐系统的学习机制，实现对用户数据的有...

2024-05-13 talkingdev

语言模型依赖于单独训练的标记生成器。这些标记生成器可能会产生在语言模型训练过程中从未见过的标记。即使在最强大的现代语言模型中，也存在许多此类标记。本文探讨了这种现象，并提出了识别和处理这些标记的方法。...

2024-05-10 talkingdev

预测多个令牌的同时生成是当前被积极研究的一个有趣的范式。如果成功，这将大大提高许多大型语言模型的生成速度。本篇文章中的方法，模仿了图像合成中的一致性模型，试图在精调的LLMs上使用并行解码策略来加快生成速...

2024-05-10 talkingdev

YOCO架构是一种具有全局注意力能力的解码器-解码器模型，能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器，使得关键-值对的缓存和复用更加高效。与传统的Transformer相比，YOCO在推理内存、延迟和吞吐...

2024-05-10 talkingdev

llm-ui是一个React库，用于大型语言模型，允许开发人员向输出添加自定义组件。该库可以通过npm安装并导入到React项目中，使得开发人员可以使用自己的组件来定制模型的输出。llm-ui还提供了一些默认的组件来展示模型...

2024-05-09 talkingdev

QoQ，一种新型量化算法，通过使用4位权重、8位激活和4位KV缓存，加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术，它能够减少模型的存储需求和计算复杂性。在这种情况下，QoQ算法采用了较低精度的数...