大型语言模型的相关内容 - 漫话开发者

2024-10-11 talkingdev

Lm.rs：无依赖的Rust最小CPU LLM推理框架

Lm.rs 是一个新兴的项目，旨在提供一个轻量级的 CPU LLM 推理解决方案，完全基于 Rust 开发，且不依赖于其他库。这一创新的框架专注于简化 LLM 的使用，使开发者能够在资源有限的环境中高效运行大型语言模型。Lm.rs...

2024-09-14 talkingdev

近期研究表明，LLM（大型语言模型）在生成内容时不可避免地会出现幻觉现象，即其输出的信息可能并不准确或与现实不符。尽管技术不断进步，这种现象依然是一个重要的挑战。研究人员指出，LLM的训练数据和生成机制导致...

2024-07-24 talkingdev

NLUX是一款面向大型语言模型的对话式AI JavaScript库，它极大地简化了将强大的大型语言模型集成到Web应用的过程。NLUX提供了React组件和hooks，以及LLM适配器，拥有流式LLM输出，还支持自定义渲染器。这款库通过GitH...

2024-07-23 talkingdev

llama.ttf是一个创新的字体文件，它不仅包含文字样式信息，还内嵌了一个大型语言模型（LLM）以及相应的推理引擎。这一技术突破利用了Harfbuzz字体塑形引擎中的Wasm塑形器，这个塑形器允许使用任意代码来塑形文本。通...

2024-07-22 talkingdev

研究人员提出了一种名为“多模态专家混合体” (MoME) 的方法，以解决通用的多模态大型语言模型(MLLMs)中的任务干扰问题。在多模态大型语言模型中，任务干扰是一个常见的问题，它可能会影响模型的性能和效率。MoME的提...

2024-07-19 talkingdev

E5-V是一种新的框架，其改编了多模态大型语言模型（MLLMs）以创建全球多模态嵌入。通过使用提示，它弥补了不同输入类型之间的差距，而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...

2024-07-19 talkingdev

研究人员提出了针对大型语言模型（LLMs）的补丁级别训练，以提高训练效率。补丁级别训练是一种新的技术，目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别，提高了模型的训练效率，...

2024-07-17 talkingdev

近日，一种名为解耦拒绝训练（DeRTa）的新方法被提出，这种新方法通过解决拒绝位置偏差问题，进一步提高了大型语言模型（LLMs）的安全性调优效果。LLMs在各类应用场景中起着重要作用，安全性问题也因此变得尤为重要...