漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-14 talkingdev

Audible联手出版商扩展AI有声读物库,支持多语言合成

亚马逊旗下有声书服务平台Audible正与多家出版商合作,通过AI语音合成技术大幅扩充其有声读物资源库。该平台目前已集成超过100种AI语音,支持英语、西班牙语、法语和意大利语等多种语言的自动播讲。这一举措标志着数...

Read More
2025-04-28 talkingdev

开源AI模型Dia-1.6B:以小体积实现超越巨头的情绪语音合成

Nari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现,尤其擅长模拟极端情绪状态,如歇斯底里的恐怖尖叫。...

Read More
2025-02-27 talkingdev

ElevenLabs推出高精度多语言转录模型Scribe,支持99种语言

ElevenLabs近日宣布推出其自主研发的转录模型Scribe,该模型支持99种语言,并具备高精度转录能力。Scribe不仅提供词级时间戳和说话人分离功能,还能适应真实世界中的各种音频环境。这一技术的推出将极大提升语音转文...

Read More
2024-06-28 talkingdev

ElevenLabs首款iOS应用——AI音频阅读器上线

ElevenLabs正式发布了其首款iOS应用,名为“ElevenLabs Reader: AI Audio”。这款应用设计用于将文本文件或网页链接转换为音频讲述,用户在出行时也能听取内容。ElevenLabs Reader: AI Audio旨在提升用户的信息获取方...

Read More
2024-05-13 talkingdev

音频扩散AudioDiff:ElevenLabs科学家新作开源

在科技日新月异的今天,ElevenLabs的一位研究科学家发布了一个名为音频扩散PyTorch的GitHub仓库,该仓库可能成为复制令人惊叹的结果的起点。这个仓库是基于PyTorch的音频扩散实验,旨在通过开源的方式,让更多的音频...

Read More
2024-05-10 talkingdev

ElevenLabs预览音乐生成AI模型

人工智能初创企业ElevenLabs正在预览一种新模型,该模型可以将提示转化为歌词。该公司使用的推广策略与OpenAI为Sora AI使用的策略类似。这种新型AI模型的出现,预示着AI在音乐创作领域的应用可能会有很大的突破。Ele...

Read More
2024-04-08 talkingdev

Rabbit携手ElevenLabs在设备上实现语音命令功能

Rabbit与ElevenLabs达成合作,将其语音命令技术整合到即将推出的r1设备中,通过低延迟模型提升人机交互的自然体验。首批r1设备将具备聊天机器人互动和双向翻译等功能,并计划于3月31日前发货。尽管ElevenLabs面临其...

Read More
2023-06-29 talkingdev

ElevenLabs推出Voice Library社区平台

Eleven推出了Voice Library,这是一个用于创建、分享和探索合成语音的社区平台。该平台利用Eleven自家的Voice Design工具,根据年龄、性别和口音等参数生成独特的多语言语音。用户可以分享他们创建的语音,也可以使...

Read More
  1. Next Page