漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

3D-Speaker:一个庞大的语音数据集

talkingdev • 2023-06-29

1439478 views

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型。

核心要点

  • 3D-Speaker是一个庞大的音频数据集
  • 包含来自10000多个说话者的录音数据
  • 有助于研究人员解析语音的不同方面

Read more >