漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型系列。目前Mercury Coder提供Mini和Small两种规格,在速度-质量平衡方面创下了新纪录。根据Artificial Analysis的独立评测,在NVIDIA H100 GPU上,Mercury Coder Mini和Small分别实现了1109 tokens/sec和737 tokens/sec的业界最高吞吐量,平均比速度优化的前沿模型快达10倍,同时保持相当的质量水平。该模型在多语言代码基准测试中表现优异,并在Copilot Arena开发者实际验证中位列质量排名第二,同时是整体速度最快的模型。项目团队已开放公共API和免费体验平台。

核心要点

  • Mercury推出基于扩散模型的编程专用大语言模型系列Mercury Coder
  • 在NVIDIA H100 GPU上实现最高1109 tokens/sec的业界领先吞吐量
  • 模型在保持质量前提下比现有速度优化模型快达10倍

Read more >