漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

ViT-CoMer:新神经网络模型增强Vision Transformers的密集预测任务能力

近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

Read More
2023-08-18 talkingdev

3D图像的优化:新型关键点识别技术

关键点检测就像在图片中找到特定的点,以创建3D图像。一项名为DeDoDe的研究以全新、更优的方式找到这些点,确保他们在不同的视角中匹配,并提升3D图像的创建质量。关键点的定位和识别在3D图像的构建过程中起着至关重...

Read More