Audio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型,其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现,还展示了合成数据在AI训练中的巨大潜力...
Read More近日,GitHub上发布了一款名为FlowDec的高质量音频压缩工具。FlowDec是一款全频带音频编解码器,采用条件流匹配(conditional flow matching)和非对抗性训练(non-adversarial training)技术,能够实现48 kHz高保...
Read MoreStability AI与Arm近日宣布合作,成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库,双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...
Read More近日,FFmpeg宣布推出全新的汇编语言课程,旨在帮助开发者更深入地理解多媒体处理的核心技术。该课程将重点讲解如何利用汇编语言优化FFmpeg的性能,特别是在视频编解码、音频处理等领域的应用。通过本课程,开发者将...
Read More近日,Audiocube正式亮相,这是一款专为空间音频设计的三维数字音频工作站(DAW)。Audiocube通过创新的3D界面,使用户能够在虚拟的三维空间中直观地操控音频元素,从而更精确地实现声音的定位和移动。该工具不仅支...
Read MoreMixxx是一款遵循GNU通用公共许可证(GPL)的开源DJ软件,专为DJ和音乐爱好者设计,提供了全面的音乐混合和播放功能。新版本Mixxx在音频处理、界面设计以及用户体验方面进行了重大改进,包括新的波形显示和增强的音频...
Read MoreSunVox是一款功能强大的模块化合成器和数字音频工作站(DAW),为音乐制作人和音响设计师提供了丰富的创作工具。其模块化设计使用户能够自由组合不同的音频模块,从而实现独特的声音设计。SunVox支持多种音频格式,...
Read MoreKyutai,一家法国的开放研究实验室,成功地训练出一款具有极低延迟的纯音频LLM。他们成功地创建了一个令人印象深刻的演示,将在未来几个月内开源。Kyutai的这项工作表明,纯音频LLM的实现并不遥不可及,只是需要在技...
Read More