文本到图像的相关内容 - 漫话开发者

2023-12-12 talkingdev

使用预训练文本到图像扩散模型进行视频编辑

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

2023-12-06 talkingdev

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...

2023-12-05 talkingdev

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型，提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性，更好地满足用户的需求。

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...

2023-10-16 talkingdev

研究人员正在改进我们与文本到图像模型的交互方式，例如Midjourney和Stable Diffusion，这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”，使人们可以自然地与大型语言模型进行交互，以获得更...

2023-09-21 talkingdev

OpenAI的最新文本到图像生成器DALL-E 3将于10月初向ChatGPT Plus和企业客户提供。OpenAI尚未发布有关该模型的任何技术细节。DALL-E 3可以更有效地精细化处理，例如手部细节，并可以创建引人入胜的图像，无需任何hack...

2023-09-20 talkingdev

将长篇文字转化为图像一直是一项艰巨的任务，尤其当需要展示的项目或细节众多时。然而，一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤，确保每个细节在图像中的位置都恰到好处，从而为从文...

2023-09-14 talkingdev

研究人员已经找到一种方法，通过使用名为校正流（Rectified Flow）的技术，加快将文本转化为图像的过程。校正流技术是一种新颖的方法，它可以加速和优化图像的生成过程。这种方法凭借其高效的性能，为文本到图像的快...