CogView 4图像生成模型发布:性能超越Flux模型,开放许可引关注
talkingdev • 2025-04-30
4142 views
清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前主流Flux架构模型。技术报告显示,CogView 4基于60亿参数规模,通过创新的层级化注意力机制和动态token分配策略,在MS-COCO等基准测试中实现FID分数提升23%。其特色在于支持512×512高分辨率图像的单次生成,同时保持对复杂语义指令的精准响应能力。该模型的开放获取将加速AIGC技术在创意设计、虚拟内容生产等领域的商业化落地进程。
核心要点
- CogView 4采用宽松许可协议,技术指标全面超越Flux架构模型
- 模型创新性采用层级化注意力机制,在MS-COCO基准测试中FID分数提升23%
- 支持512×512高分辨率单次生成,推动AIGC商业化应用进程