漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-15 talkingdev

Gemma和Siglip推出VLLM,利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...

Read More
2024-04-05 talkingdev

Gretel开源2300万文本至SQL数据集,助力自然语言处理技术发展

HuggingFace平台上新发布了一个由Gretel收集的大规模文本至SQL数据集,包含2300万条数据。该数据集旨在通过自然语言处理技术生成SQL查询语句,对RAG应用程序和合成数据生成领域具有重要意义。文本至SQL的任务一直是...

Read More
2024-04-03 talkingdev

AutoQuant 笔记本:将 HuggingFace 模型转换为五种不同的量化格式

AutoQuant 笔记本是一个新的工具,它可以将 HuggingFace 上的模型导出为五种不同的量化格式,包括 GGUF、GPTQ、EXL2、AWQ 和 HQQ。这些量化格式旨在优化模型的性能和效率,以便在不同的硬件和平台上部署。通过使用 A...

Read More
2024-04-03 talkingdev

HuggingFace团队揭示大规模合成数据在预训练模型中的应用

HuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成,还包括对数据进行精心的筛选和过滤,以确保其在模型训练中的有效性和准确性。通过这种方...

Read More
2024-03-18 talkingdev

HuggingFace开放财报电话会议问答数据集

HuggingFace Hub最近发布了一个新的数据集,该数据集包含了从财报电话会议中转录的精选问答对。这个数据集对于研究人员和开发者来说是一个宝贵的资源,因为它提供了实际的业务沟通场景中的自然语言处理样本。这些问...

Read More
2024-02-28 talkingdev

AlphaMonarch 7B 模型HF发布

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型,这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计,将会成为自然语言处理领域的一大利器。

Read More
2024-02-23 talkingdev

谷歌开源Gemma对抗Llama,底模基于Gemini

Google已经发布了其Gemma 2B和7B参数模型的权重,可通过HuggingFace获得。这些模型是仅解码器的Transformer,训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色,并提供基础和指令调整版本。

Read More
2024-02-20 talkingdev

Sora相关参考论文合集整理

HuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page