零样本分类的相关内容 - 漫话开发者

2025-04-18 talkingdev

[论文推荐]3D CoCa：融合视觉语言对比学习与场景描述的统一3D场景理解框架

谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架，这一突破性技术通过整合视觉语言对比学习（Contrastive Learning）与场景描述（Captioning）两大前沿方向，实现了对三维场景的多模态联合理解。该框...

2025-02-24 talkingdev

SigLIP2作为SigLIP的升级版本，在多个方面实现了显著改进。SigLIP原本是一款广受欢迎的联合图像与文本编码模型，而SigLIP2在零样本分类性能上取得了重大突破，这一性能曾是CLIP模型的标志性成果。此次升级不仅提升了...

2024-05-02 talkingdev

近日，一个全新的Mamba模型引起了工业界的广泛关注。该模型通过使用对比性语言-图像预训练(CLIP)的方式进行训练，展现出在零样本图像分类任务上的出色效率和性能。据了解，零样本分类任务一直是计算机视觉领域的一个...

2023-12-25 talkingdev

最近，研究人员提出了一种名为CLIP-DINOiser的新方法，它将CLIP模型的零样本能力与自监督特征相结合，从而实现了更好的语义分割，无需标注。CLIP-DINOiser方法使用了自监督任务DINO来学习图像特征，并将其与CLIP模型...