漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

近日,研究人员在GitHub上发布了一篇名为“Hiera:简化视觉变换器,加速和提高图像和视频识别准确性”的论文。以下是该论文的三个核心要点: - Hiera是一种简化的视觉变换器,通过使用一个强大的视觉预文本任务(MAE)进行预训练,它在速度和准确性方面优于以前的模型。 - 相比于多阶段变换器,Hiera消除了不必要的复杂性,同时又不影响性能。 - 这项研究为图像和视频识别领域的发展提供了新的思路和方法。