语音识别技术的相关内容 - 漫话开发者

2025-06-17 talkingdev

Retellio：用AI重构销售通话情报的智能分析平台

Retellio作为新一代销售智能分析平台，通过AI技术实时解析销售通话内容，自动提取关键客户洞察，并以播客、新闻简报或Slack消息等多样化形式输出。该平台采用先进的自然语言处理（NLP）和语音识别技术，能够精准捕捉...

2025-03-17 talkingdev

最近，一项名为WSI的研究将Whisper自动语音识别（ASR）编码器重新应用于多语言说话人识别任务，通过联合损失优化技术实现了显著的性能提升。该技术在多语言和多样化环境中识别说话人时，表现优于现有主流模型如Pyann...

2024-09-18 talkingdev

Moshi 是一款专注于实时对话的语音文本基础模型，旨在提升人机交互的流畅性和自然性。该模型结合了先进的 LLM 技术和高效的文本处理能力，能够在多种应用场景中实现即时的语音转文本功能。Moshi 的独特之处在于其低...

2024-07-09 talkingdev

近日有网友发出问题：浏览器如何隔离内部音频和麦克风输入？对此，业内专家指出，浏览器为了保护用户的隐私，会采取一系列技术手段来隔离内部音频和麦克风输入，比如使用WebRTC API（Web Real-Time Communications A...

2024-07-09 talkingdev

近日，GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力，包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解；口语语言识...

2024-04-30 talkingdev

近日，Ruff的开发团队发布了一款名为Whisper cpp cli的全新语音识别系统，该系统已在GitHub Repo上开源。这是一款完全自主研发的语音转文字系统，基于Whisper技术构建。Ruff团队一直以创新技术和高品质服务闻名于业...

2024-03-11 talkingdev

微软即将于3月21日公开展示Surface Pro 10和Surface Laptop 6，这两款电脑将配备最新的神经处理单元，可提升人工智能能力。这些电脑将由英特尔的第11代酷睿处理器提供动力，其内置的AI引擎可提供更快的AI处理速度和...

2023-12-21 talkingdev

Distil-Whisper 是 Whisper 的精简版本，比 Whisper 更快、更小，且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术，包括低秩分解和知识蒸馏，以实现...