漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

VoiceCraft项目发布:700M参数模型实现零样本语音克隆与合成

近期,一项名为VoiceCraft的开源项目在GitHub上引起了广泛关注。该项目通过一个强大的700M参数模型,实现了零样本(Zero shot)的语音克隆和语音合成功能。这意味着用户无需进行任何额外的训练,就能够利用该模型复...

Read More
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2023-06-29 talkingdev

ElevenLabs推出Voice Library社区平台

Eleven推出了Voice Library,这是一个用于创建、分享和探索合成语音的社区平台。该平台利用Eleven自家的Voice Design工具,根据年龄、性别和口音等参数生成独特的多语言语音。用户可以分享他们创建的语音,也可以使...

Read More
2023-05-17 talkingdev

苹果手机能够通过15分钟的训练说出你的声音

苹果公司将在今年晚些时候推出一系列新的辅助功能,可能会随iOS 17一起发布。其中“个人语音”功能可让人们仅通过15分钟的音频录制就能创建出合成语音。该功能使用设备上的机器学习,确保数据的私密性和安全性。同时,...

Read More