扩散模型的相关内容 - 漫话开发者

2024-01-25 talkingdev

Lumiere-谷歌AI视频生成器能够将可爱的动物放入不同场景中

Lumiere是一款使用时空扩散模型进行逼真视频生成的AI视频生成器。它使用的Space-Time U-Net架构可以一次性生成整个视频的时间持续时间。它旨在处理视频中物体的位置以及物体如何移动和变化。Lumiere可以执行文本到视...

2024-01-22 talkingdev

随着最近将扩散模型用于各种其他视觉任务的趋势，本研究改进了超分辨率的训练稳定性和缩放。

2024-01-20 talkingdev

Compose and Conquer公司推出了一种条件扩散模型，该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像，例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

2024-01-10 talkingdev

扩散模型是一种强大的工具，可以将强化学习性能提升至新的高度。最近，一位研究团队建立了一个GitHub仓库，详细介绍了扩散模型在强化学习中的应用，并展望了未来的跨学科研究机会。扩散模型是一种模拟物质传播的方法...

2024-01-09 talkingdev

DiffusionEdge是一种新颖的边缘检测模型，它集成了扩散概率模型，可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...

2024-01-09 talkingdev

近日，一种名为GUESS的框架被引入，用于从文本中创建人体动作。该框架将复杂的人体姿态简化为各个层次上的更抽象形式，从而使从文本合成动作更加简洁稳定。

2024-01-08 talkingdev

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型，并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长，但它们显示出了很...

2023-12-22 talkingdev

Diff-Text是一种新的无需训练的框架，可用于创建任何语言的具有文本的逼真图像。它通过使用手绘图像作为先验，增强了稳定扩散模型的多语言能力。