谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型
talkingdev • 2025-05-22
2717 views
谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现的同时,处理速度提升了惊人的5倍。这一创新或将重塑自然语言处理领域的技术路线,扩散模型通过渐进式噪声去除的生成方式,可能为长文本连贯性、多模态融合等Transformer的固有痛点提供新的解决方案。行业分析师指出,该突破性进展可能加速扩散模型在AIGC领域的全面应用,并对Stable Diffusion、MidJourney等视觉生成模型厂商构成技术溢出压力。谷歌尚未公布具体的技术白皮书,但实验数据显示其在代码生成、数学推理等基准测试中展现出显著优势。