模型的相关内容 - 漫话开发者

2024-07-15 talkingdev

MARS-基于全新视觉语言模型改进文生图技术

MARS是一种全新的文本到图像(T2I)生成框架，它引入了语义视觉-语言集成专家(SemVIE)的特征。这种新型框架的主要目标是改进现有的T2I生成技术，使其能更好地理解和处理复杂的视觉语言任务。借助SemVIE，MARS能够实现...

2024-07-15 talkingdev

最近，一种名为猞猁的模型在检测语言模型生成幻觉（即生成与输入无关的信息）方面，大幅优于现有的最先进技术。这一新模型的出现，将有助于我们更好地理解和控制语言模型的输出，避免信息的误导和混淆。猞猁模型的成...

2024-07-15 talkingdev

AuraFlow是由Fal训练的全新开放模型。这款模型采用了muP进行训练，是一款拥有58亿参数的模型。AuraFlow的开发标志着Fal在人工智能领域的又一次重大突破，展示了其强大的技术实力和深厚的研发能力。此次训练使用的muP...

2024-07-12 talkingdev

根据最新报告，PosFormer模型在手写数学表达式识别（HMER）领域的应用有了重大突破。PosFormer模型的出现，有效地解决了序列模型的局限性，从而显著提高了HMER的性能。在以往的研究中，序列模型在处理复杂的手写数学...

2024-07-12 talkingdev

Lookback Lens是一个直接的模型，用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息，来解决大型语言模型（LLM）在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

2024-07-12 talkingdev

PaliGemma是一款基于SigLIP和Gemma 2B的强大视觉语言模型。这份技术报告详细阐述了在构建PaliGemma过程中的架构选择和数据收集方面所做的决策。SigLIP和Gemma 2B的结合使得PaliGemma在视觉语言建模方面展现出卓越性...

2024-07-12 talkingdev

FlashAttention是现代快速语言模型的基础，而最新的FlashAttention 3版本则是其重要的升级。与以前的版本相比，新版本使用了75%的H100容量（相比之前的35%有了显著的提升）。这次的能力提升归因于一系列重要的系统改...

2024-07-11 talkingdev

近日，由香港中文大学、清华大学等机构的研究人员提出了一种新的注意力机制模型——FlashAttention-3。相较于传统的注意力机制，FlashAttention-3 实现了异步和低精度计算，从而实现了在保证准确度的同时，大幅提高了...