漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-15 talkingdev

Stable Audio Open Small开源TTS模型,可在Arm CPU上运行

Stability AI近日开源了名为Stable Audio Open Small的文本转音频模型,该模型拥有3.41亿参数,专为在Arm架构的CPU上高效运行而优化。这一突破性技术使得在智能手机上生成11秒的音频片段仅需不到8秒的时间,极大地提...

Read More
2025-05-02 talkingdev

开发者耗时两年打造基于3D物理引擎的合成器Anukari,开创GPU音频处理新范式

独立开发者历时两年多打造的Anukari 3D物理合成器近日正式发布,这款创新性音频工具成为首批采用GPU进行实时音频处理的虚拟乐器之一。项目创始人在开发者日志中透露,其物理模拟系统的GUI开发难度远超预期,甚至超过...

Read More
2025-04-29 talkingdev

[开源] Beatsync:跨设备毫秒级精准同步的网页音频播放器

开发者freeman-jiang近日推出开源项目Beatsync,这是一款基于浏览器的网页音频播放器,能够实现多设备间毫秒级精度的音频同步播放,无需额外硬件即可将任意设备组转变为环绕声系统。该项目采用类似网络时间协议(NTP...

Read More
2025-03-04 talkingdev

Stability AI与Arm合作推出智能手机端实时生成音频技术

Stability AI与Arm近日宣布合作,成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库,双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

Read More
2024-10-17 talkingdev

NotebookLM推出音频概述自定义与引导新功能

NotebookLM近日宣布推出一项全新的功能,允许用户自定义和引导音频概述。这一创新使得用户在使用NotebookLM时,能够根据个人需求调整音频内容,提升信息获取的效率。新功能不仅支持多种音频格式,还具备智能化的引导...

Read More
2024-10-04 talkingdev

深度拆解Kekz耳机:逆向工程的精彩探索

近日,Kekz耳机的逆向工程和拆解引起了广泛关注。通过对Kekz耳机的内部结构进行详细分析,技术专家们揭示了其中使用的先进技术和设计理念。Kekz耳机在音质、舒适度和耐用性方面的表现让人印象深刻,尤其是在其独特的...

Read More
2024-09-14 talkingdev

参数化扬声器实现“Rickroll”激光效果

近日,科技爱好者们成功研发出一种新型的参数化扬声器,能够通过激光传输音频信号,从而实现经典的“Rickroll”效果。这项技术利用了参数化声学原理,将音频信息嵌入激光束中,接收者只需在激光照射范围内即可清晰听到...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
  1. Next Page