漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-10-03 talkingdev

FLUX1.1 [pro]:Black Forest Labs推出全新SotA文本到图像模型

FLUX1.1 [pro]是由Black Forest Labs最新推出的文本到图像模型,代表了当前技术的前沿水平(SotA)。该模型通过先进的算法和深度学习技术,实现了更高质量和更快速度的图像生成能力。FLUX1.1 [pro]不仅在生成图像的...

Read More
2024-06-26 talkingdev

EvalAlign:一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同,EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是,EvalAlign不...

Read More
2024-05-16 talkingdev

论文:英汉文本到图像生成新标杆,混元-DiT的突破性发展

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆,特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道,为持续的模型改进提供了可能性。而这一突破性的发展,不仅提升了英汉文本...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-08 talkingdev

DragonDiffusion:一种采用特征对应提高文本到图像编辑精度的新方法

DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...

Read More