漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-06 talkingdev

Perplexity AI推出在线LLM,或将取代谷歌搜索

Perplexity AI将网络索引和最新信息与会话式AI聊天机器人界面相结合,有可能取代谷歌。该公司最近发布了从Mistral和Meta开源模型中微调和增强的版本。这些模型旨在提供有用、真实和最新的信息。它们是第一个基于网络...

Read More
2023-11-17 talkingdev

如何在树莓派上运行LLMs

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号,这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

Read More
2023-11-07 talkingdev

HelixNet:开源三合一模型显著提升生成性能

最近,一项名为HelixNet的新研究显示,如果微调Mistral基础架构的三个任务特定模型,一个用于生成,一个用于批判,最后一个用于再生,则整个系统的生成性能显着提高。该研究使用合成数据来调整这些模型。HelixNet的...

Read More
2023-11-06 talkingdev

Nous研究使用Yarn方法优化Mistral 7B模型,可处理长达128k的语境

Nous研究利用他们的Yarn方法对Mistral 7B进行了微调,可以处理长达128k的语境。它在短序列长度上显示出最小的退化,并在长文档上大大提高了性能。

Read More
2023-11-03 talkingdev

Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文

Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。

Read More
2023-11-03 talkingdev

亚马逊推出RoPE微调Mistral 7B模型,支持长文本上下文

亚马逊开始进入开源LLM领域,推出RoPE微调Mistral 7B模型,支持长文本上下文。该模型可在上下文中扩展至32k个令牌,可用于各种自然语言处理任务,例如问答和文本生成。RoPE是亚马逊开发的一种新的训练技术,可提高大...

Read More
2023-11-02 talkingdev

只需1美元的算力,为Mistral进行微调

Mistral是一种基于深度学习的自然语言处理模型,其7B模型是目前最大的公开模型之一。现在,您可以使用Jupyter笔记本,根据自己的数据集对Mistral的7B模型进行微调,并仅需1美元的计算费用。微调Mistral模型可以提高...

Read More
2023-10-23 talkingdev

Hugging Face Hub发布Math Mistral模型,助力数学与推理能力的提升

近日,人工智能技术公司Hugging Face Hub发布了一款名为Math Mistral的模型,该模型针对数学及推理能力进行了训练,具备强大的能力和广泛的应用场景。 Math Mistral是一种基于自然语言处理技术的模型,它可以帮助用...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page