扩散模型的相关内容 - 漫话开发者

2024-03-22 talkingdev

论文：扩散状态空间模型引领图像生成新纪元

扩散状态空间模型（DiS）是一种新型的扩散模型，它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时，能够处理长距离依赖问题，并且能够生成高质量的图像。与传统的U-Net相比，DiS模型...

2024-03-21 talkingdev

近期，一项名为Generalized Consistency Trajectory Models（GCTMs）的新项目在GitHub上发布，该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程，实现了通过单...

2024-03-21 talkingdev

StableVITON是一种全新的基于图像的虚拟试穿技术。该方法专注于在利用预训练扩散模型的生成能力的同时，保持服装细节的真实性。StableVITON学习预训练模型潜在空间中衣物与人体之间的语义对应关系，从而实现更加准确...

2024-03-21 talkingdev

DreamDA提出了一种全新的数据增强技术，该技术通过扩散模型合成多样化、高质量的图像，这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色，尤其在训练模型时，能够提高模型...

2024-03-18 talkingdev

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力，避免了传统优化技术，采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性，还大大减...

2024-03-14 talkingdev

由于室外数据的复杂性和空白性，真实世界的室外环境一直是3D场景生成中被忽视的挑战。SemCity通过专注于真实世界的室外环境，彻底颠覆了3D场景生成，实现了真实的室外场景生成。SemCity通过3D扩散模型，将真实世界的...

2024-03-14 talkingdev

这项研究介绍了一种创新的视频生成方法，使用状态空间模型（SSMs）克服了传统的基于注意力扩散模型的内存限制，重点关注线性内存消耗。在UCF101和MineRL Navigate数据集的测试中，SSMs能够创建具有竞争力质量的更长...

2024-03-13 talkingdev

这个项目引入了一种新颖的方法，通过单个图像生成高质量、详细的3D物体，增强了3D物体的生成。该方法基于视频扩散模型，利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域，如游戏制作...