漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-11-20 talkingdev

微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身,使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...

Read More
2023-04-21 talkingdev

Bark推出基于文本提示的生成音频模型

新闻内容: Bark公司推出了一种基于文本提示的生成音频模型,可以将简短的文字描述转换成高质量的语音音频。该模型的核心特点如下: - 基于深度学习技术,可以自动将文本转换成声音。 - 可以根据用户的需求,自由...

Read More
  1. Prev Page