漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-21 talkingdev

3万亿的开放数据集Dolma发布,助力研究者规模化研究数据效应

虽然有许多开放数据集,但能够训练前沿模型的规模却少之又少。艾伦人工智能研究所的Dolma数据集就致力于这一目标,希望能够使研究者能够在大规模上研究数据效应。这一数据集的发布,不仅为研究者提供了更高质量,更...

Read More