ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...
Read MoreSegment Anything模型(SAM)对于常规图像的处理效果显著,但对于医疗图像的处理效果却不尽如人意。为此,研究者们创建了SAM-Med2D,这是通过在大量医疗图像上训练SAM并提供各种输入信息得到的。这种新模型在处理医...
Read More仅从少数样本中产生多样化的图像一直是技术上的挑战。而新的技术——TexMod,采用独特的技术方法,将各种图像的细节融合在一起,并确保生成的图像具有逻辑性的布局。TexMod的出现,不仅提升了图像生成的质量,也为图像...
Read More传统的提升图像分辨率方法,如CARAFE和SAPA,常常需要大量的计算资源,并且其应用领域存在限制。而DySample作为一种更简洁、更高效的方式,已在各种图像任务中展现出良好的性能。相较于传统方法,DySample的优势在于...
Read More医疗图像分割是一个将图像中每个像素识别为特定类别(如癌症与非癌症)的过程。在历史上,将一个模型转移到另一个任务一直是个巨大的挑战。然而,最新的研究展示了一个强大的模型,该模型仍基于不朽的UNet,可应用于...
Read MoreMeta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...
Read More近日,MidJourney宣布推出其最新的功能“Vary (Region)”。该新功能允许用户进行图像修复——一种可以编辑图像画布内元素的过程。用户现在可以利用这项新技术,进行图像编辑和重构,无论是去除图像中不需要的元素,还是...
Read More关键点检测就像在图片中找到特定的点,以创建3D图像。一项名为DeDoDe的研究以全新、更优的方式找到这些点,确保他们在不同的视角中匹配,并提升3D图像的创建质量。关键点的定位和识别在3D图像的构建过程中起着至关重...
Read More研究人员已经开发出一种新的方法,叫做双聚合变换器(DAT),该方法通过空间和通道注意力来提升图像的超分辨率效果。DAT使用了诸如自适应交互模块和空间门前馈网络等特殊工具,其性能优于当前的其他方法。空间和通道...
Read More一项新的研究论文介绍了一种名为粗细贡献网络(CFSum)的全新工具,旨在提升多模态摘要中对图像的使用效果。CFSum能有效地筛选出无关紧要的图像,只利用对摘要内容有帮助的图像。这一工具的研发,将推动多模态摘要领...
Read More