漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-26 talkingdev

开源离线语音转写服务,支持区分多人会话和LLM摘要

最近,一家技术公司推出了一款自主研发的离线语音转写和说话人分离服务,服务还提供LLM(语言模型)摘要。这款服务可以帮助用户快速准确地将语音转换为文本,并将不同说话人的语音分离。此外,LLM摘要还可以帮助用户...

Read More
2023-07-14 talkingdev

冻结模型实现简单语音转换:让你以音乐为语言,或者以吠声对话

一款酷炫的应用程序让你能够以吠声进行对话,或者用你的旋律来表达。该应用程序利用声音嵌入空间中的最近邻居实现语音转换。声音嵌入是一种表示声音特性的方式,它能够捕捉到声音中的一些重要特征,比如音调、音色等...

Read More