漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

论文:去噪视觉Transformer

talkingdev • 2024-01-10

730663 views

视觉Transformer (ViT)已经成为视觉领域的主要研究方向,然而在它们的嵌入中,仍然有时会出现网格状的伪影。这使得社区在将其应用于下游任务时持怀疑态度。本研究提出了一种更新位置嵌入的方法,消除了这一问题,并为下游视觉任务提供了25%以上的增益。

核心要点

  • 提出了一种去噪视觉Transformer的新方法
  • 该方法能够消除位置嵌入中的网格状伪影
  • 下游视觉任务性能提升了25%以上

Read more >