文本到图像的相关内容 - 漫话开发者

2023-08-24 talkingdev

前Google Brain生成图像团队创立新的初创企业

前Google Brain的几位顶级文本到图像研究员已经创建了一个新的以艺术为目标的AI公司。他们可能正在使用他们的研究（Imagen）中的想法，结合一些新颖的元素。这一新的尝试可能会对AI在艺术领域的应用产生深远影响。此...

2023-07-28 talkingdev

稳定性AI近期发布了最新的先进文本到图像模型，稳定扩散XL (SDXL) 1.0，该模型已在亚马逊Bedrock，以及其自有API上提供。新模型提供了改进的颜色准确性和细节，并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

2023-07-17 talkingdev

这份报告介绍了一个新系统，它可以为您使用Stable Diffusion、DreamBooth、LoRA等个性化文本到图像模型创建的任何图像添加逼真的运动。该系统使用一个“运动模块”，从现实生活的视频中学习，并可添加到任何文本到图像...

2023-07-08 talkingdev

DragonDiffusion是一种全新的方法，旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应，DragonDiffusion可以进行各种详细的图像修改，如移动和调整对象的大小，替换外观，以及拖动内容，同时保持图像...

2023-06-08 talkingdev

最近，研究人员发现文本图像模型（如Stable Diffusion）可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征，即表示相同的事物，例如人的鼻子，动物的耳朵，汽车的轮胎等。通过巧妙的算法，可以从各种图...

2023-06-06 talkingdev

近日，一项名为ViCo的新技术问世，其可以根据文本描述生成逼真的图像，并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同，ViCo对系统资源的消耗较小，不需要对原始模型的参数进行微调，但它仍然通过专...

2023-06-05 talkingdev

在人工智能领域中，研究人员一直在探索如何利用计算机生成逼真的图像。在这个过程中，DreamBooth 系列研究的下一个步骤——StyleDrop 已经发布。这个开源项目提供了一种新的方法，只需要使用单个参考图像，就可以在任...

2023-05-31 talkingdev

今天，我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型，从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。以下是该框架的三个核心要点： - Threestudio利用...