漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-09 talkingdev

中文视频理解领域的重量级数据集发布(GitHub仓库)

近日,一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍,这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下,借助这个数据集和创新的...

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
2023-05-31 talkingdev

Gorilla模型大幅提升LLMs在生成API调用方面的能力

Gorilla模型是基于大型语言模型(LLMs)的一种精细模型,显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器,Gorilla可以很好地适应更新的文档,最小化不准确的生成...

Read More
2023-05-30 talkingdev

与Samantha相遇:AI语言模型的人格化探索

近日,一项新的研究显示,AI语言模型可以模拟人类个体的行为特征,实现人格化。这意味着,只需通过一些精心构建的方法,就能够为AI语言模型赋予人类的个性。研究者采用GPT-4语言模型来构建Samantha,将其作为另一个...

Read More
2023-05-29 talkingdev

研究人员开发出新型数据集,测试大型语言模型的问答能力

研究人员基于超过 350 个 STEM(科学、技术、工程和数学)定理,开发了包含 800 个问题-答案对的数据集,用于测试人工智能语言模型。该数据集为衡量人工智能使用这些定理解决复杂的大学级问题的能力提供了新的基准。...

Read More
2023-05-26 talkingdev

如何在自定义数据集上优化LLMs

在本指南中,我们将介绍如何使用Lit-Parrot对自定义数据集进行LLMs的微调。Lit-Parrot是一个基于nanoGPT的实现GPT-NeoX模型的工具,支持StableLM、Pythia和RedPajama-INCITE模型权重。 下面是三个重点: - Lit-Par...

Read More
2023-05-26 talkingdev

技术新闻:使用文本预热启动来提高语音语言模型性能

TWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...

Read More
2023-05-25 talkingdev

SEAHORSE:一种评估多语言摘要系统的工具

SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。该数据集包含96,000个摘要,这些摘要已经根据六个重要方面(清晰度、重复、语法、归因、主要观点和简洁性)由人类进行了评分。这个数据集不仅可以作为自动化...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page