漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-14 talkingdev

[开源] Audio Flamingo 2:基于Qwen的最先进音频理解模型

Audio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型,其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现,还展示了合成数据在AI训练中的巨大潜力...

Read More
2025-03-06 talkingdev

FlowDec:基于条件流匹配的高质量音频压缩技术

近日,GitHub上发布了一款名为FlowDec的高质量音频压缩工具。FlowDec是一款全频带音频编解码器,采用条件流匹配(conditional flow matching)和非对抗性训练(non-adversarial training)技术,能够实现48 kHz高保...

Read More
2025-03-04 talkingdev

Stability AI与Arm合作推出智能手机端实时生成音频技术

Stability AI与Arm近日宣布合作,成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库,双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

Read More
2025-02-23 talkingdev

FFmpeg推出汇编语言课程,助力开发者深入优化多媒体处理

近日,FFmpeg宣布推出全新的汇编语言课程,旨在帮助开发者更深入地理解多媒体处理的核心技术。该课程将重点讲解如何利用汇编语言优化FFmpeg的性能,特别是在视频编解码、音频处理等领域的应用。通过本课程,开发者将...

Read More
2025-01-31 talkingdev

Audiocube发布:空间音频创作的3D DAW工具

近日,Audiocube正式亮相,这是一款专为空间音频设计的三维数字音频工作站(DAW)。Audiocube通过创新的3D界面,使用户能够在虚拟的三维空间中直观地操控音频元素,从而更精确地实现声音的定位和移动。该工具不仅支...

Read More
2025-01-21 talkingdev

开源DJ软件Mixxx发布新版本,支持GPL协议

Mixxx是一款遵循GNU通用公共许可证(GPL)的开源DJ软件,专为DJ和音乐爱好者设计,提供了全面的音乐混合和播放功能。新版本Mixxx在音频处理、界面设计以及用户体验方面进行了重大改进,包括新的波形显示和增强的音频...

Read More
2024-09-29 talkingdev

SunVox:强大的模块化合成器与数字音频工作站

SunVox是一款功能强大的模块化合成器和数字音频工作站(DAW),为音乐制作人和音响设计师提供了丰富的创作工具。其模块化设计使用户能够自由组合不同的音频模块,从而实现独特的声音设计。SunVox支持多种音频格式,...

Read More
2024-07-04 talkingdev

法国实验室Kyutai Moshi研发出低延迟的纯音频LLM

Kyutai,一家法国的开放研究实验室,成功地训练出一款具有极低延迟的纯音频LLM。他们成功地创建了一个令人印象深刻的演示,将在未来几个月内开源。Kyutai的这项工作表明,纯音频LLM的实现并不遥不可及,只是需要在技...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page