漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-11 talkingdev

STL-开源自我涌现令牌标记的视觉转换器,提高稳定性

对于视觉转换器(ViTs)的显著进展,研究人员使用一种新的自我涌现令牌标记(STL)框架,提高了完全注意力网络(FAN)模型的鲁棒性。这种方法涉及训练FAN令牌标记器来创建有意义的补丁令牌标记,然后训练FAN学生模型。

Read More
2023-12-07 talkingdev

DiffiT:基于扩散的视觉转换器生成高分辨率图像

该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...

Read More
2023-08-28 talkingdev

苹果开源的超速视觉转换器ViT

苹果发布的一款超快速视觉转换器ViT在边缘计算部署中表现出色,运行延迟低于1毫秒。这款视觉转换器的优秀性能,使其在面对大量和复杂的视觉信息处理任务时,都能够保持高效的运行状态,为用户提供了更加快速、准确的...

Read More
2023-06-15 talkingdev

SoViT:一种更高效的视觉转换器

**研究团队最新发布的技术论文介绍了SoViT,这是一种针对大小和形状进行了优化的视觉转换器,使用先进的缩放方法,其性能与更大的模型相当,但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

Read More