Image In Words数据集,图像与文字配对的新型标签方法
talkingdev • 2024-05-10
652983 views
近日,一种新型的标签方法被研究者利用在了图片和文字的配对上,这种方法运用了两次的VLMs(视觉语言模型)扫描,产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细,能够帮助训练出更强的多模态模型。这种新型的标签方法,可以为深度学习的研究和应用提供更为精准和丰富的数据资源,对于推动AI技术的研究和发展具有重要意义。
核心要点
- 一种新型的标签方法被研究者利用在了图片和文字的配对上
- 这种方法运用了两次的视觉语言模型扫描
- 产生的配对数据的标题比以往的任何数据集都要详细,能够帮助训练出更强的多模态模型