漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-13 talkingdev

三星展示AI实时翻译功能,将于2024年发布

三星一直在人工智能领域保持低调,但最近展示了一项用于电话的实时AI翻译功能。该功能预计将于2024年发布。这项新技术将允许用户在电话中进行实时翻译,无需等待或使用第三方应用。三星表示,这项功能将使用自然语言...

Read More
2023-10-31 talkingdev

苹果在人工智能领域落后于竞争对手 Google 和 Microsoft

据消息人士透露,苹果在人工智能领域的进展落后于竞争对手 Google 和 Microsoft,内部人士对苹果 AI/ML 团队能否交付有所质疑。苹果的 Siri 功能在自然语言处理和语音识别等方面仍存在不少问题。苹果正加紧研发人工...

Read More
2023-10-31 talkingdev

开源Whisper Large v2音频转录速度破纪录

OpenAI的Whisper Large v2音频转录模型发布了。这个模型采用了非常先进的技术,可以在不到10分钟的时间内转录出300分钟的音频。这一速度远远超过了之前的音频转录模型,对于信息的获取和处理提供了极大的便利。这个...

Read More
2023-10-25 talkingdev

OpenAI能否在消费者和企业市场上取得胜利?

OpenAI目前通过ChatGPT和API赢得了消费者和企业市场,但他们能否继续这么做还不确定。OpenAI是一家人工智能研究实验室,其目标是创建安全和有益的人工智能。ChatGPT是一种语言生成模型,可以生成与给定输入相关的自...

Read More
2023-10-24 talkingdev

SALMONN:AI模型能够理解声音世界

本文介绍了SALMONN,这是一种独特的AI模型,它将文本理解与处理各种音频输入(从语音到音乐)的能力相结合。 SALMONN不仅在训练过的音频任务(如语音识别)中表现出色,而且展示了令人印象深刻的新技能,例如将语音...

Read More
2023-10-20 talkingdev

$13M种子轮融资用于构建企业低代码多模式搜索工具包

Objective公司已经完成了一轮种子融资,以便为企业构建低代码多模式搜索工具包。这款工具包将使用自然语言处理、计算机视觉和语音识别技术,可以帮助企业快速构建自定义搜索引擎,减少搜索时间。Objective的目标客户...

Read More
2023-10-19 talkingdev

论文:Zipformer一种新的语音识别Transformer模型

这项研究介绍了Zipformer,一种用于自动语音识别(ASR)的改进Transformer模型,它更快、占用更少内存,而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型,它使用了一种全新的架构,能够更快...

Read More
2023-10-17 talkingdev

人工通用智能已经存在

尽管如今的AI模型并不完美,但仍有很大可能最终被认定为人工通用智能的首批真正例子。人工智能技术正在飞速发展,从语音识别到图像识别,再到自动驾驶和机器人等领域,都有了巨大的进步。但是,现有的AI技术仍然存在...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page