漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

ICTC-个性化图像聚类库开源

talkingdev • 2023-10-31

935198 views

这篇论文介绍了一种名为IC⁠TC的基于文本条件的图像聚类方法,该方法利用视觉语言模型根据用户提供的文本描述对图像进行排序。IC⁠TC方法使用了预训练的视觉语言模型来生成图像和文本之间的嵌入,然后使用这些嵌入来聚类图像。研究人员还展示了该方法的个性化特点,可以根据不同用户提供的文本描述,为每个用户生成不同的图像聚类结果。

核心要点

  • IC⁠TC是一种基于文本条件的图像聚类方法
  • 使用预训练的视觉语言模型来生成图像和文本之间的嵌入
  • 可以根据不同用户提供的文本描述,为每个用户生成不同的图像聚类结果

Read more >