我们当前的时代正处于一个全新的人工智能阶段,这个阶段的特点是LLMs、变压器和扩散模型的广泛应用。这与以往的人工智能发展阶段有着明显的区别。LLMs是一种复杂的深度学习模型,可以处理大量的数据并预测结果。变压...
Read More虚拟试穿任务,即将一图像上的衣物转移到另一图像,尤其在更高分辨率下,这项任务具有挑战性。许多方法使用生成对抗网络(GAN)。然而,本文介绍的解决方案DCI-VTON,采用了一种结合了样例基础修复和变形模块的扩散...
Read MoreDragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...
Read More研究人员提出了一种新的方法,使用一种扩散模型,具体来说是一种名为稳定扩散的潜在扩散模型(LDM),从通过fMRI捕获的人脑活动中重建高分辨率、高保真度的图像。该方法在保持生成性能的同时减少了计算成本,无需对...
Read More学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而,现在,借助开源扩散模型,我们可以利用文本标记的力量来解开图像中的对象,实现对AI生成图...
Read More近日,一项名为ViCo的新技术问世,其可以根据文本描述生成逼真的图像,并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同,ViCo对系统资源的消耗较小,不需要对原始模型的参数进行微调,但它仍然通过专...
Read More利用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型,我们可以创建各种风格的多视角头像图像,从而实现多样性。 ## 核...
Read More在最近的工作中,强化学习一直备受关注,主要集中在人类反馈方面。但事实证明,您也可以使用计算反馈作为奖励模型。在这项工作中,他们使用LLaVA视觉问答系统为多个不同任务给出bert分数。有趣的是,他们能够显着提...
Read More