漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

近日,一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍,这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下,借助这个数据集和创新的预训练模型,如mPLUG-video,为跨媒体检索、视频字幕生成和视频分类等视频语言任务带来了重大进展。 ## 主要内容 * Youku-mPLUG是目前公开的最大中文视频-文本数据集 * 该数据集由来自中国流行视频共享平台Youku的一千万个精选视频-文本对组成 * 利用此数据集和mPLUG-video等创新的预训练模型,为跨媒体检索、视频字幕生成和视频分类等视频语言任务带来了重大进展。