漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-23 talkingdev

Llama.ttf:一种既是字体又是LLM的创新技术

Llama.ttf是一种新型字体技术,它不仅可以作为字体使用,还能充当LLM(低级语言模型)的一部分。该技术通过将LLM嵌入字体中,使得字体在呈现文本的同时,也能进行机器学习任务。这项技术的研究者表示,Llama.ttf可以...

Read More
2024-06-20 talkingdev

TroL-高效大型语言和视觉模型开源

近日,一种名为TroL的新型高效大型语言和视觉模型 (LLVMs) 在GitHub上发布,其模型规模分别为18亿、38亿和70亿参数。这些模型能够精确地处理和理解大量的语言和图像信息,其性能和效率都达到了非常高的水平。这些模...

Read More
2024-06-19 talkingdev

Meta发布Chameleon模型并开源,支持同时操作图像和文本

蜥蜴(Chameleon)是一个早期融合模型,它能同时操作图像和文本标记。其团队几周前发布了这篇论文。现在,他们已经发布了模型检查点以及推理代码。这一模型的发布,标志着图像和文本融合技术的新进展,同时,它的开...

Read More
2024-06-18 talkingdev

Meta FAIR分享最新研究成果、模型和数据集

Meta FAIR是Facebook AI Research的一个项目,旨在推进人工智能领域的研究和发展。最近,Meta FAIR分享了他们的最新研究成果、模型和数据集,这些都将有助于推动人工智能技术的发展和应用。其中最引人注目的是他们最...

Read More
2024-06-12 talkingdev

Meta如何规模化训练大型语言模型

近日,Meta公司公布了一篇关于其如何规模化训练大型语言模型的论文。该论文详细介绍了Meta公司的训练方法,该方法可以同时训练多达14亿个参数的语言模型。该规模远超以往的语言模型训练规模,并且可以在更短的时间内...

Read More
2024-06-08 talkingdev

RAG应用中的分块:精准切分很难做到?

自然语言处理(NLP)中,分块是指将句子分成更小的组块(块)的过程,每个块都有自己的语法和含义。在RAG(Retrieval-Augmented Generation)应用程序中,分块是生成响应的重要步骤。不同于传统的基于规则或基于统...

Read More
2024-06-06 talkingdev

XRec:利用大语言模型提升可解释推荐系统

XRec是一种模型无关的框架,它利用大型语言模型的语言能力来增强可解释推荐系统。该框架的核心在于通过自然语言处理技术,为用户提供更透明和易理解的推荐理由。这不仅提升了用户对推荐系统的信任度,还为开发者提供...

Read More
2024-06-05 talkingdev

NX-AI发布xLSTM代码

近日,NX-AI宣布发布了他们的xLSTM代码。xLSTM是一种基于LSTM的模型,用于处理序列数据的分类和回归问题。与传统的LSTM相比,xLSTM具有更好的性能和效率。这个代码的发布将使更多的人能够使用xLSTM,并将其应用于各...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page