漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-31 talkingdev

[论文推荐]Kyutai发布高保真实时语音互译系统

法国人工智能研究机构Kyutai最新推出突破性语音互译系统,该系统基于多流Transformer架构,可实现高保真度的实时语音到语音翻译。该技术突破传统文本中转翻译模式,直接在声学层面进行跨语言转换,并保持原说话者的...

Read More
2025-03-14 talkingdev

苹果计划在iOS 19中为AirPods推出实时翻译功能

苹果公司正计划在iOS 19系统中为AirPods推出一项新的实时翻译功能,允许用户通过AirPods听到语音的翻译版本,若用户通过iPhone回应,则手机扬声器会播放出翻译后的内容。此外,苹果还计划在本年度对iOS、iPadOS和mac...

Read More
2025-02-14 talkingdev

Meta发布MobileLLM:轻量级移动端语言模型新突破

近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

Read More
2024-03-29 talkingdev

Meta为雷朋智能眼镜引入AI功能

Meta公司正计划为其雷朋品牌的智能眼镜增加人工智能功能。这些功能将包括实时翻译以及通过语音命令激活的物体、动物和纪念碑识别。这一创新将为用户带来更加便捷的交互体验,使得智能眼镜不仅仅是一种时尚配饰,更是...

Read More
2024-02-07 talkingdev

Roblox发布实时AI聊天翻译器,打破语言壁垒

Roblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。

Read More
2024-01-16 talkingdev

Meta展示无缝语音克隆和翻译技术

Meta最近展示了一项新的技术,可以实现不同语言之间的语音克隆和翻译。该技术可以通过对一段语音进行分析和深度学习来实现。在语音克隆方面,该技术可以将一个人的语音克隆到另一个人身上,从而实现更加自然的语音交...

Read More
2023-11-13 talkingdev

三星展示AI实时翻译功能,将于2024年发布

三星一直在人工智能领域保持低调,但最近展示了一项用于电话的实时AI翻译功能。该功能预计将于2024年发布。这项新技术将允许用户在电话中进行实时翻译,无需等待或使用第三方应用。三星表示,这项功能将使用自然语言...

Read More