合成图像的相关内容 - 漫话开发者

2024-05-07 talkingdev

论文：利用遮蔽图像模型进行深度假象检测

最新的研究提出一种新的深度假象检测方法，这种方法主要关注于遮蔽图像模型，尤其是在频率域中。这种方法与传统的深度假象检测方法有所不同，对于识别由最新的AI生成技术制作的合成图像表现出显著的改进。遮蔽图像模...

2024-03-26 talkingdev

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法，解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集，显著提高了图像中阴影生成的质量。该技术的...

2024-03-21 talkingdev

DreamDA提出了一种全新的数据增强技术，该技术通过扩散模型合成多样化、高质量的图像，这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色，尤其在训练模型时，能够提高模型...

2024-03-18 talkingdev

MusicLang是一个新兴的API和模型集合，旨在为开发者和音乐爱好者提供生成音乐的功能。通过这一工具，用户可以轻松地创造出独特的旋律和和谐音乐。MusicLang的灵活性和易用性使其成为音乐创作和实验的理想选择，无论...

2024-03-04 talkingdev

粗到细潜在扩散（CFLD）方法引入了一种新的姿势引导人像合成方法，通过对图像进行深度语义理解来避免过拟合，克服了现有模型的局限性。

2024-03-04 talkingdev

Google DeepMind的Genie是一个基础的世界模型，通过在互联网视频上进行训练，可以从合成图像、照片甚至草图中生成各种可玩（动作可控）的环境。该模型使用了深度强化学习和生成式建模技术，可以为游戏开发、虚拟现实...

2024-02-08 talkingdev

由于LAION等大规模数据集的删除，以及版权问题，使得训练大规模图像模型变得具有挑战性。但是，这项工作表明，使用3000万个全合成的图像可以训练出强大的CLIP模型。

2023-08-15 talkingdev

该项目引入了一种名为DatasetDM的新工具，它可以生成无尽的虚假图像，并附带详细的标签，比如哪部分是哪个对象或者图像中的物体离得有多远。这对于训练计算机视觉系统非常有用，仅使用一小部分真实照片，合成的图像...