漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-11 talkingdev

迪士尼将大情感注入小机器人

迪士尼研发出一款名为Wall-E的小机器人,这是一款拥有超强情感的小机器人,它可以感知人类的情感,并生成相应的情感反馈,比如当你难过时,它会伸出小臂给你拥抱。这项技术是迪士尼为打造更好的主题公园体验所研发的...

Read More
2023-09-27 talkingdev

《毁灭战士》开发者 John Carmack 认为人工通用智能可在2030年实现

John Carmack 称,现阶段的人工智能之所以可能存在,可能要归功于他在《雷神之锤》上的工作,这款游戏引发了对 GPU 的需求。他认为,随着硬件和软件的发展,人工通用智能有望在2030年左右实现。他表示,目前的人工智...

Read More
2023-09-22 talkingdev

DialMe:一款能够让用户畅谈无阻的人工智能面试产品

DialMe是一款集成了语音识别功能的人工智能产品,其主要设计目标是为用户提供一种自由、开放的交流环境。通过这款产品,用户可以随时随地进行各种主题的讨论,从而提高自身的沟通能力和知识储备。同时,该产品也能为...

Read More
2023-09-22 talkingdev

论文:模型如何理解声音和视觉的结合?

这项研究介绍了AV-SUPERB,这是一个新的基准测试,用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展,并为未来的研究提供一个统一的平台。这项研究突出了模...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
2023-09-05 talkingdev

SpeechTokenizer,语音模型的统一语音分词器

研究人员创造了一个名为SpeechTokenizer的工具,该工具通过使用一种混合不同语音方面的特殊架构,帮助模型以更有效的方式理解口语。通过这种方式,它尝试解决语音模型在理解和处理口语时面临的挑战。它的创新之处在...

Read More
2023-08-23 talkingdev

开源Whisper API:实现自我托管的语音转文本转录

近日,一个名为Whisper API的开源项目在GitHub上引起了广泛关注。该项目提供了一个自我托管的API,用于进行语音到文本的转录。这一切都是通过使用一个精心调整的Whisper自动语音识别模型来实现的。这个项目的出现将...

Read More
2023-07-24 talkingdev

L-Eval:长篇语境语言模型的标准化评估工具(GitHub项目)

近日,一项名为L-Eval的项目引起了广泛关注。该项目旨在为长篇语境语言模型提供一套标准化的评估工具。L-Eval评估套件包含了超过2000个跨领域的查询-回应对,能够全面而系统地评估各种长篇语境语言模型的性能。通过...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page