漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-17 talkingdev

阿里云发布Qwen Audio通用音频转语言模型

阿里云近日发布了Qwen Audio模型,该模型是一款通用的音频转语言模型,能够用于音乐、语音等多种任务。该模型基于深度学习技术,经过大量数据训练,能够准确地识别语音,并将其转化为对应的语言文字,为用户提供更加...

Read More
2023-11-14 talkingdev

开源的音频超分辨率技术

音频超分辨率是提高任何音频的质量和保真度的过程,无论是真实的还是合成的。大多数超分辨率系统都是针对特定任务而设计的,单个模型仅针对单个音频数据类型进行训练(如语音与音乐)。这项新工作是一个惊人的进步,...

Read More
2023-11-10 talkingdev

开源MusicGen升级至立体声生成

Audiocraft MusicGen是一款强大的将文本转化为音乐的人工智能模型。最新升级的版本现在支持立体声生成,通过巧妙地交叉使用左右声道进行微调,提高了整体音乐体验。虽然这一升级并没有提高基准分数,但它能够更好地...

Read More
2023-11-07 talkingdev

Video2Music开源,为视频生成量身定制的音乐

Video2Music的AI框架利用独特的数据集和经过用户研究验证的转换器模型为视频生成情感上相符的音乐

Read More
2023-11-03 talkingdev

披头士利用AI技术发布了他们的最后一首歌曲

披头士乐队解散已经超过五十年了,不过他们最近发布了一首曲子,名为《现在和将来》,这是他们的最后一首歌。这首歌曲通过AI技术使得约翰·列侬的声音焕发出了新的生命力。

Read More
2023-11-03 talkingdev

苹果CEO Tim Cook谈生成AI:我们正在大力投资

据外媒报道,苹果CEO Tim Cook在公司2023年第四季度财报电话会议上承认正在对人工智能(AI)进行重大投资,但未详细说明他们计划如何通过生成AI实现盈利。Cook表示,AI是苹果未来的核心技术,他们将继续在这一领域进...

Read More
2023-10-24 talkingdev

SALMONN:AI模型能够理解声音世界

本文介绍了SALMONN,这是一种独特的AI模型,它将文本理解与处理各种音频输入(从语音到音乐)的能力相结合。 SALMONN不仅在训练过的音频任务(如语音识别)中表现出色,而且展示了令人印象深刻的新技能,例如将语音...

Read More
2023-10-23 talkingdev

环球音乐起诉Anthropic侵犯版权,指控其AI生成的歌词未经授权

环球音乐起诉AI初创公司Anthropic侵犯版权,指控其聊天机器人“Claude”未经授权复制了版权歌词。音乐行业正在应对AI创造“深度伪造”歌曲的能力。随着技术的不断进步,这一问题可能会越来越突出。Anthropic表示,Claude...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page