HuggingFace的相关内容 - 漫话开发者

2024-04-15 talkingdev

Gemma和Siglip推出VLLM，利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型（VLLM），该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练，这些数据集包含了大量的图像和相关文本信息，使...

2024-04-05 talkingdev

HuggingFace平台上新发布了一个由Gretel收集的大规模文本至SQL数据集，包含2300万条数据。该数据集旨在通过自然语言处理技术生成SQL查询语句，对RAG应用程序和合成数据生成领域具有重要意义。文本至SQL的任务一直是...

2024-04-03 talkingdev

AutoQuant 笔记本是一个新的工具，它可以将 HuggingFace 上的模型导出为五种不同的量化格式，包括 GGUF、GPTQ、EXL2、AWQ 和 HQQ。这些量化格式旨在优化模型的性能和效率，以便在不同的硬件和平台上部署。通过使用 A...

2024-04-03 talkingdev

HuggingFace团队最近展示了如何为语言模型的预训练阶段生成、筛选、合成和扩展大量的合成数据。这一过程不仅涉及数据的生成，还包括对数据进行精心的筛选和过滤，以确保其在模型训练中的有效性和准确性。通过这种方...

2024-03-18 talkingdev

HuggingFace Hub最近发布了一个新的数据集，该数据集包含了从财报电话会议中转录的精选问答对。这个数据集对于研究人员和开发者来说是一个宝贵的资源，因为它提供了实际的业务沟通场景中的自然语言处理样本。这些问...

2024-02-28 talkingdev

HuggingFace Hub 近期合并发布了 AlphaMonarch 7B 模型，这个经过调优的模型在 elo 和 static benchmarks 中表现优异。它专门为多轮对话和指令跟踪等任务而设计，将会成为自然语言处理领域的一大利器。

2024-02-23 talkingdev

Google已经发布了其Gemma 2B和7B参数模型的权重，可通过HuggingFace获得。这些模型是仅解码器的Transformer，训练了2T和6T个令牌。它们在各种基准测试中都比Llama 2表现出色，并提供基础和指令调整版本。

2024-02-20 talkingdev

HuggingFace Hub最近发布了全新的视频模型Sora，现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究，为研究人员和开发者提供了很好的参考。此外，这些论文还包括了Sora model在计算机视觉...