漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo和GPT-4o mini的全开源模型,其性能表现验证了开源模型可达到商业闭源产品的技术水平。中端型号OLMo 2 7B/13B在英语学术基准上与Meta的Llama系列、Mistral模型形成竞争态势,而轻量级OLMo 2 1B则超越Gemma 3 1B和Llama 3.2 1B等同规模模型。这一技术突破不仅提供了完整的模型预训练框架(包含训练代码、数据集和评估工具),更将为学术界和产业界探索新型预训练方法创造开放环境。

核心要点

  • OLMo 2 32B成为首个超越GPT-3.5 Turbo的全开源大模型
  • 提供从1B到32B的完整模型谱系,覆盖不同计算需求场景
  • 开源内容包括训练框架、数据集及评估工具链

Read more >