漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

该项目提出了一种新颖的增强Transformer的方法,使用来自不同模态的无关数据,例如使用音频数据来改善图像模型。多模式路径独特地连接了两种不同模态的Transformer,使目标模态能够从另一种模态的优势中受益。

核心要点

  • 该项目提出了一种新颖的增强Transformer的方法
  • 使用来自不同模态的无关数据
  • 多模式路径独特地连接了两种不同模态的Transformer

Read more >