漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-08 talkingdev

论文:CLIP模型使用全合成数据进行训练

由于LAION等大规模数据集的删除,以及版权问题,使得训练大规模图像模型变得具有挑战性。但是,这项工作表明,使用3000万个全合成的图像可以训练出强大的CLIP模型。

Read More
2023-08-04 talkingdev

论文:无需训练的实例分割,颠覆图像识别技术

此研究引入了一种名为“无需训练的实例分割”的全新方法,该方法无需进行繁琐的训练或详细的图像注释,就能在图像中分割实例。该方法通过使用现有的语义分割模型并通过可学习的对象边界分支对输出进行精炼,无需额外的...

Read More
2023-07-20 talkingdev

RepViT:高效的图像识别架构(GitHub Repo)

研究人员已经开发出一种新型的轻量级神经网络,名为RepViT。该网络通过整合轻量级视觉变换器(Vision Transformers)和传统的卷积神经网络(Convolutional Neural Networks)的高效设计元素而形成。这项技术的开发,...

Read More