漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

DeepFloyd IF代码发布

talkingdev • 2023-04-27

1620977 views

- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd IF 能够根据文本提示生成高质量图片 深度学习模型 DeepFloyd IF 是一种模块化的模型,旨在根据文本提示生成高质量的图像。该基础模型可以创建 64x64 像素的图像,而两个超分辨率模型可以创建 256x256 像素和 1024x1024 像素版本的图像。在 COCO 数据集上,DeepFloyd IF 的零样本 FID 得分为 6.66,优于当前最先进的模型。DeepFloyd IF 生成的图像示例可在存储库中找到。 核心要点: - DeepFloyd IF 是一种模块化的深度学习模型,可生成高质量的图像。 - 该模型可以创建不同分辨率的图像,包括 64x64、256x256 和 1024x1024 像素版本。 - 在 COCO 数据集上,DeepFloyd IF 的零样本 FID 得分为 6.66,表现优异。