文本转语音的相关内容 - 漫话开发者

2024-06-11 talkingdev

Coqui.ai TTS：一款用于文本转语音的深度学习工具包

Coqui.ai TTS是一款用于文本转语音的深度学习工具包，它支持多种语言和声音风格，并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch，是一款开源、易于使用的工具，可帮助研究人员和...

2024-04-10 talkingdev

谷歌近日推出了一款名为Vids的创新应用，旨在为企业工作带来全新的协作式共享视频制作体验。这款应用的设计理念是让制作视频变得和制作幻灯片一样简单，无需视频制作经验。用户可以在应用内整理素材并进行编辑，最终...

2024-03-25 talkingdev

DeepGram公司近日推出了一项名为Aura的创新产品，这是一款文本转语音（TTS）API，其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈，极大提升了交互...

2024-03-04 talkingdev

Rime推出了一款具有强大对话能力的新文本转语音模型。与以往的模型不同，这款模型可以包含“嗯”的说话习惯和逼真的停顿。

2024-02-15 talkingdev

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities（BASE TTS），该模型拥有980万个参数，并具有新兴特性，可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

2024-02-09 talkingdev

这些文本转语音模型由Stability AI开发，可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集，因此其创作者合成注释了大量的语音语料库进行训练。这是注释，上字幕和训练生成模型...

2024-01-22 talkingdev

Tiny Narrations是一个基于最受欢迎的Tiny Stories数据集的文本转语音版本。它使用SF Compute H100集群上的XTTS2。这个系统可以将短小精悍的故事转化为音频文件，方便用户在不同场景下收听。这个系统的优点是使用了...

2024-01-22 talkingdev

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练，但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。