漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-11 talkingdev

开源|AIRS-Bench:Meta发布首个端到端AI研究能力基准,量化大模型代理的科研潜力

Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...

Read More
2026-02-04 talkingdev

开源AI生态全景展望:从DeepSeek时刻到AI+时代

近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-01-31 talkingdev

OpenAI揭秘内部GPT-5.2驱动AI数据代理:员工可对超600PB数据进行自然语言分析

OpenAI近日披露了其专为内部研发定制的AI数据代理系统。该系统由该公司尚未公开发布的最新模型GPT-5.2驱动,旨在赋能其员工,使其能够通过自然语言直接对超过600PB(约60万TB)的庞大数据集进行交互式查询与分析。Op...

Read More
2026-01-31 talkingdev

开源|仅9M参数!开发者打造浏览器端普通话发音AI导师,实时纠正声调

近日,一位开发者为解决自身普通话声调学习的痛点,训练并开源了一个超轻量级的语音评估模型。该模型专门用于对普通话的发音和声调进行实时评分与纠正,为解决语言学习中“听不出自身错误”的普遍难题提供了技术方案。...

Read More
2026-01-30 talkingdev

揭秘OpenAI内部数据智能体:GPT-5与Codex协同,数分钟挖掘海量数据洞察

OpenAI近日披露了其内部研发的专用AI数据智能体,该智能体深度融合了GPT-5、Codex以及记忆机制等前沿技术,能够在其内部平台的海量数据集上进行探索与推理。这一工具旨在赋能员工,使其能够在数分钟内完成从提出问题...

Read More
2026-01-08 talkingdev

开源|Hugging Face发布FinePDFs:从PDF中解放3万亿高质量训练令牌

在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...

Read More
2026-01-06 talkingdev

英伟达发布开源AI模型家族Alpamayo,加速基于推理的自动驾驶开发

英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page