语音识别的相关内容 - 漫话开发者

2023-12-19 talkingdev

关于人工智能的去向、时机和方式

领先的创始人和风投投资者谈论人工智能的发展现状，从LLMs的应用到企业创新。如果“你应该了解的关于人工智能的事情”节奏有点令人不知所措，那么这是一个不错的快速回顾。人工智能正在成为越来越多行业的关键技术之一...

2023-12-13 talkingdev

KwaiAgents是一个先进的代理系统，使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台，使得更多的研究人员可以参与到该项目中来。该...

2023-12-11 talkingdev

一种名为OneLLM的新型AI模型正在掀起波澜，它使用一种独特的方法将所有这些模态与语言对齐，理解包括图像、音频甚至脑活动在内的八种不同类型的数据。OneLLM的这种多模态理解方法可能会推动AI在语义理解方面的进一步...

2023-11-13 talkingdev

三星一直在人工智能领域保持低调，但最近展示了一项用于电话的实时AI翻译功能。该功能预计将于2024年发布。这项新技术将允许用户在电话中进行实时翻译，无需等待或使用第三方应用。三星表示，这项功能将使用自然语言...

2023-10-31 talkingdev

据消息人士透露，苹果在人工智能领域的进展落后于竞争对手 Google 和 Microsoft，内部人士对苹果 AI/ML 团队能否交付有所质疑。苹果的 Siri 功能在自然语言处理和语音识别等方面仍存在不少问题。苹果正加紧研发人工...

2023-10-31 talkingdev

OpenAI的Whisper Large v2音频转录模型发布了。这个模型采用了非常先进的技术，可以在不到10分钟的时间内转录出300分钟的音频。这一速度远远超过了之前的音频转录模型，对于信息的获取和处理提供了极大的便利。这个...

2023-10-25 talkingdev

OpenAI目前通过ChatGPT和API赢得了消费者和企业市场，但他们能否继续这么做还不确定。OpenAI是一家人工智能研究实验室，其目标是创建安全和有益的人工智能。ChatGPT是一种语言生成模型，可以生成与给定输入相关的自...

2023-10-24 talkingdev

本文介绍了SALMONN，这是一种独特的AI模型，它将文本理解与处理各种音频输入（从语音到音乐）的能力相结合。 SALMONN不仅在训练过的音频任务（如语音识别）中表现出色，而且展示了令人印象深刻的新技能，例如将语音...