漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-20 talkingdev

微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身,使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...

Read More
2023-11-14 talkingdev

Jupyter Notebook实现超快速语音生成技术

Bark是一种文本转语音系统,它可以生成连贯、快速和超长的音频输出。现在,我们可以在Jupyter Notebook中使用Bark,将文本转换为语音文件,使其更加便捷。Bark使用深度神经网络作为其文本到语音模型,具有很高的准确...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
2023-09-12 talkingdev

古腾堡计划联手微软,发布数千本AI有声读物

古腾堡计划与微软的合作使得数千本公开领域的书籍被转录成了最先进的文本转语音。这些有声读物在大多数流媒体平台上都能找到。关于这个过程的信息已被包含在链接中。这一步骤不仅极大地丰富了有声读物的内容,也为那...

Read More
2023-05-30 talkingdev

Nvidia展示新技术,让你用自己的声音与AI游戏角色交流

Nvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3