图像生成的相关内容 - 漫话开发者

2024-06-26 talkingdev

EvalAlign：一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同，EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是，EvalAlign不...

2024-06-03 talkingdev

近日，一个名为FABRIC的新方法在GitHub上引起了广泛关注。FABRIC是一种在推理阶段无需训练即可提升图像生成质量的方法。它通过使用评分函数或图像示例来指导输出质量，从而显著改善生成图像的视觉效果。该方法的最大...

2024-05-27 talkingdev

研究人员提出了一种新的方法，通过使用分类器引导来定制扩散模型，从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同，这种技术利用分类器引导扩散模型，无需额外的训练。此方法...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-05-07 talkingdev

研究人员已经开发出“Morph-Tokens”来提高AI的视觉理解和图像生成能力。这些令牌将用于理解的抽象概念转换为用于图像创建的详细视觉，利用MLLM框架的先进处理能力。Morph-Tokens的开发，不仅能够提高AI的图像理解和生...

2024-05-03 talkingdev

近日，一个名为StreamMultiDiffusion的新框架在GitHub上开源，该框架能够实现实时的区域性文本到图像的生成。这是一项突破性的技术，可以将文本信息实时转换为图像，显著提高了图像生成的效率和便利性。无论是在设计...

2024-04-28 talkingdev

Sakana AI近日发布了EvoSDXL-JP，这是一款为日语指令优化的高速图像生成模型，采用了一种革新的模型融合方法。与现有模型相比，EvoSDXL-JP的推断速度提高了十倍，并且性能卓越。这款模型非常适合在日本的教育领域使...