微信扫码实时跟踪AI前沿
3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...