Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...
Read More近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...
Read MoreOpenAI近日披露了其专为内部研发定制的AI数据代理系统。该系统由该公司尚未公开发布的最新模型GPT-5.2驱动,旨在赋能其员工,使其能够通过自然语言直接对超过600PB(约60万TB)的庞大数据集进行交互式查询与分析。Op...
Read More近日,一位开发者为解决自身普通话声调学习的痛点,训练并开源了一个超轻量级的语音评估模型。该模型专门用于对普通话的发音和声调进行实时评分与纠正,为解决语言学习中“听不出自身错误”的普遍难题提供了技术方案。...
Read MoreOpenAI近日披露了其内部研发的专用AI数据智能体,该智能体深度融合了GPT-5、Codex以及记忆机制等前沿技术,能够在其内部平台的海量数据集上进行探索与推理。这一工具旨在赋能员工,使其能够在数分钟内完成从提出问题...
Read More在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...
Read More英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...
Read More