音频技术的相关内容 - 漫话开发者

2025-05-15 talkingdev

Stable Audio Open Small开源TTS模型，可在Arm CPU上运行

Stability AI近日开源了名为Stable Audio Open Small的文本转音频模型，该模型拥有3.41亿参数，专为在Arm架构的CPU上高效运行而优化。这一突破性技术使得在智能手机上生成11秒的音频片段仅需不到8秒的时间，极大地提...

2025-05-02 talkingdev

独立开发者历时两年多打造的Anukari 3D物理合成器近日正式发布，这款创新性音频工具成为首批采用GPU进行实时音频处理的虚拟乐器之一。项目创始人在开发者日志中透露，其物理模拟系统的GUI开发难度远超预期，甚至超过...

2025-04-29 talkingdev

开发者freeman-jiang近日推出开源项目Beatsync，这是一款基于浏览器的网页音频播放器，能够实现多设备间毫秒级精度的音频同步播放，无需额外硬件即可将任意设备组转变为环绕声系统。该项目采用类似网络时间协议（NTP...

2025-03-04 talkingdev

Stability AI与Arm近日宣布合作，成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库，双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

2024-10-17 talkingdev

NotebookLM近日宣布推出一项全新的功能，允许用户自定义和引导音频概述。这一创新使得用户在使用NotebookLM时，能够根据个人需求调整音频内容，提升信息获取的效率。新功能不仅支持多种音频格式，还具备智能化的引导...

2024-10-04 talkingdev

近日，Kekz耳机的逆向工程和拆解引起了广泛关注。通过对Kekz耳机的内部结构进行详细分析，技术专家们揭示了其中使用的先进技术和设计理念。Kekz耳机在音质、舒适度和耐用性方面的表现让人印象深刻，尤其是在其独特的...

2024-09-14 talkingdev

近日，科技爱好者们成功研发出一种新型的参数化扬声器，能够通过激光传输音频信号，从而实现经典的“Rickroll”效果。这项技术利用了参数化声学原理，将音频信息嵌入激光束中，接收者只需在激光照射范围内即可清晰听到...

2024-07-08 talkingdev

近日，Tongyi语音团队发布了他们的最新成果，一套超强的音频理解与生成模型。这套模型的发布，无疑将大大推动音频技术的发展与进步。模型的理解部分，能够准确分析出音频中的各种元素和信息，包括但不限于音质、音色...