漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-08 talkingdev

DragonDiffusion:一种采用特征对应提高文本到图像编辑精度的新方法

DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...

Read More
2023-07-03 talkingdev

多视角扩散技术提供全景图像生成能力

这项工作允许您使用一张单一的图像和一个预训练的生成模型来生成全景图像或图像的多个视角。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
2023-07-03 talkingdev

精准医疗成像新方法:有限数据下的更好医学成像(GitHub Repo)

该研究介绍了一种新的方法称为'体积融合'(Volume Fusion,VF),它可以在不需要大量预标注数据的情况下训练三维医学成像模型。研究表明,结合新的网络结构,VF能够提高不同身体部位医学图像解读的准确性。

Read More
2023-06-23 talkingdev

Stability发布全新Stable Diffusion模型,新版将不再出现意大利面手

稳定性人工智能发布了一种新的人工智能模型,用于生成比以往更逼真的图像。该模型名为SDXL 0.9,可以根据基于文本的提示创建图像,这些图像比以前的模型更美观,并具有更多的构图细节。据悉,Stable Diffusion的下一...

Read More
2023-06-08 talkingdev

文本到图像模型中的紧急对应关系

最近,研究人员发现文本图像模型(如Stable Diffusion)可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征,即表示相同的事物,例如人的鼻子,动物的耳朵,汽车的轮胎等。通过巧妙的算法,可以从各种图...

Read More
2023-04-18 talkingdev

新技术发布:多语言文本转图像模型

以下是该模型的三个核心要点: - 该模型能够处理多种语言的文本转图像,输出的质量非常高。 - 该模型基于LAION HighRes和内部专有图像数据集进行训练,尽管无法处理漫反射,但作者提供了在线演示。 - 该模型的参数...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9