漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-04 talkingdev

开源语音合成模型Zonos TTS发布:支持多语言与实时生成

近日,开源社区迎来一款突破性的语音合成模型Zonos TTS,该模型基于Apache 2.0协议发布,具备语音生成与克隆能力。其核心技术亮点包括:1)支持多语言合成,打破传统单一语种限制;2)采用实时生成架构,延迟低于200...

Read More
2025-04-01 talkingdev

[开源]Orpheus:无需GPU的轻量级文本转语音系统

开源项目Orpheus近期引发开发者社区关注,该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似,其最大技术亮点在于完全脱离GPU依赖,仅需简单安装即可在普通计算设备上运行,显著降低了语音合...

Read More
2024-12-07 talkingdev

Countless.dev:AI模型比较平台上线,涵盖LLM、TTS和STT技术

PH社区发布了一个名为Countless.dev的新产品,该网站旨在提供一个比较各种AI模型的平台,包括大型语言模型(LLM)、文本到语音(TTS)和语音到文本(STT)技术。在Countless.dev上,用户可以直观地比较不同AI模型的...

Read More
2024-10-14 talkingdev

Play 3.0 mini:轻量级、多语种TTS模型的可靠新选择

Play 3.0 mini是一款轻量级的多语种文本转语音(TTS)模型,专为追求成本效益和可靠性的用户设计。该模型在多个语言之间提供高质量的语音输出,适用于各种应用场景,从教育到娱乐,兼具灵活性和实用性。Play 3.0 min...

Read More
2024-07-01 talkingdev

DEX-TTS:一种新型富有表现力的文本转语音模型

DEX-TTS是一种全新的富有表现力的文本转语音(TTS)模型,它采用参考语音来改善风格表示和模型泛化。这种新型技术的出现,为语音技术领域开创了新的可能性。DEX-TTS模型通过参考语音,能够更准确地捕捉到语音风格的...

Read More
2024-06-25 talkingdev

本地语音聊天机器人June:结合Ollama、Hugging Face Transformers和Coqui TTS Toolkit的能力

最近,一款名为June的本地语音聊天机器人引起了业界的注意。这款聊天机器人结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的技术,实现了高效的人工智能对话功能。“June”通过这三种强大的工具,可以模...

Read More
2024-06-25 talkingdev

Toucan-基于全球7000种语言的文本转语音TTS模型开放

近期,Toucan发布了一套新的文本转语音模型,这套模型已经扩展,可以支持所有ISO-639-3标准语言。这个开创性的举措,将使全球各地的用户都能享受到语言转换的便利。无论是在学习、工作,还是日常生活中,这都是一项...

Read More
2024-06-20 talkingdev

开源Dot:让本地LLMs和TTS/RAG交互更便捷

近日,一个名为Dot(GitHub Repo)的开源应用引起了大家的关注。这是一个独立的开源应用,其主要目的是让用户更轻松地使用本地LLMs(语言模型)和RAG(重新生成的注意力引导)来与文档和文件进行交互。这种交互方式...

Read More
  1. Next Page