[论文推荐] Mercury：基于扩散模型的超高速语言模型

talkingdev • 2025-07-07

3569 views

近日，研究人员发布了新一代商业级大语言模型Mercury，该模型基于扩散模型技术，采用Transformer架构进行参数化，并能够并行预测多个token。报告重点介绍了Mercury Coder，这是首套专为编程应用设计的扩散大语言模型系列。目前Mercury Coder提供Mini和Small两种规格，在速度-质量平衡方面创下了新纪录。根据Artificial Analysis的独立评测，在NVIDIA H100 GPU上，Mercury Coder Mini和Small分别实现了1109 tokens/sec和737 tokens/sec的业界最高吞吐量，平均比速度优化的前沿模型快达10倍，同时保持相当的质量水平。该模型在多语言代码基准测试中表现优异，并在Copilot Arena开发者实际验证中位列质量排名第二，同时是整体速度最快的模型。项目团队已开放公共API和免费体验平台。

核心要点

Mercury推出基于扩散模型的编程专用大语言模型系列Mercury Coder
在NVIDIA H100 GPU上实现最高1109 tokens/sec的业界领先吞吐量
模型在保持质量前提下比现有速度优化模型快达10倍

[论文推荐] Mercury：基于扩散模型的超高速语言模型

核心要点

Related posts