文本转语音的相关内容 - 漫话开发者

2025-07-04 talkingdev

KyutaiTTS开源-支持流式传输与低延迟的TTS引擎

法国研究机构Kyutai Labs近日开源其文本转语音（TTS）系统Kyutai TTS，该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现，达到行业领先水平。系统创新性地提供单词级时间戳输出功能，英语和法语的字错误...

2025-05-06 talkingdev

近日，GitHub上开源了一个名为VoiceStar的文本转语音（TTS）模型，该模型在零样本语音克隆和情感表达控制方面展现出显著优势。VoiceStar能够通过极少的样本数据实现高质量的语音克隆，这意味着用户只需提供几秒钟的...

2025-04-21 talkingdev

近日，一款名为Dia的开源权重TTS（文本转语音）模型正式亮相，专注于生成高度拟真的对话语音。Dia作为开放权重的技术项目，允许开发者自由访问和调整模型参数，为语音合成领域提供了新的工具选择。该模型通过优化对...

2025-04-01 talkingdev

开源项目Orpheus近期引发开发者社区关注，该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似，其最大技术亮点在于完全脱离GPU依赖，仅需简单安装即可在普通计算设备上运行，显著降低了语音合...

2025-03-10 talkingdev

近日，一款轻量级的自回归流式文本转语音模型在GitHub上发布。该模型仅包含3000万参数，能够与任何语言模型（LLM）结合，使其具备理解和生成语音的能力，以响应通用查询。这一技术的核心优势在于，它无需对底层模型...

2024-10-14 talkingdev

Play 3.0 mini是一款轻量级的多语种文本转语音（TTS）模型，专为追求成本效益和可靠性的用户设计。该模型在多个语言之间提供高质量的语音输出，适用于各种应用场景，从教育到娱乐，兼具灵活性和实用性。Play 3.0 min...

2024-07-01 talkingdev

DEX-TTS是一种全新的富有表现力的文本转语音（TTS）模型，它采用参考语音来改善风格表示和模型泛化。这种新型技术的出现，为语音技术领域开创了新的可能性。DEX-TTS模型通过参考语音，能够更准确地捕捉到语音风格的...

2024-06-25 talkingdev

近期，Toucan发布了一套新的文本转语音模型，这套模型已经扩展，可以支持所有ISO-639-3标准语言。这个开创性的举措，将使全球各地的用户都能享受到语言转换的便利。无论是在学习、工作，还是日常生活中，这都是一项...