漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More