扩散模型的相关内容 - 漫话开发者

2024-03-12 talkingdev

VideoElevator：将文本转化为视频的新方法

VideoElevator引入了一种新的方法，通过利用文本到图像模型的优势来增强文本到视频扩散模型。这种即插即用的方法将增强过程分为了调整时间运动和提升空间质量两个部分，从而产生了帧质量和文本对齐得到了提高的视频...

2024-03-11 talkingdev

近日，研究人员提出了一种名为 ViewFusion 的新算法，旨在改善扩散模型从新的视角生成图像的方式，确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时，往往会产生不一致性，导致图像质量下降。ViewFu...

2024-03-05 talkingdev

一种名为Smooth Diffusion的新方法解决了文本到图像扩散模型的潜在空间平滑度挑战。该方法确保在输入微小调整时，图像呈现出一致和逐渐的变化。

2024-03-04 talkingdev

扩散模型将困难问题（比如图像生成）拆分成多个小问题（比如从图像中去除微小的噪点）。单步扩散生成已经得到了很多努力，但似乎这并不符合初衷。本文探讨了扩散蒸馏的悖论，并概述了许多可供研究的方向。

2024-02-28 talkingdev

FlowMDM是一种新的模型，用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建，无需额外的去噪步骤，在关键数据集上表现出卓越的准确性和逼真度。

2024-02-23 talkingdev

最近，一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图，然后将它们拼接在一起，形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分，然后在每个部分上...

2024-02-19 talkingdev

研究人员开发了一种新的视频压缩方法，使用扩散模型生成高质量的视频帧，同时保持低数据速率。该方法将视频压缩与机器学习相结合，能够在保持视频质量的同时减少数据传输的成本。研究人员在测试中发现，这种方法能够...

2024-02-06 talkingdev

AnimateLCM是一种新的方法，可以通过将学习过程分成两部分来快速创建高质量的视频和改进现有的视频扩散模型。AnimateLCM的第一步是利用低复杂度的运动补偿技术来生成一个低质量的视频序列。然后，利用一个基于自适...