GPT-4的相关内容 - 漫话开发者

2026-07-12 talkingdev

马斯克旗下SpaceXAI发布Grok 4.5：专攻编码、智能代理与知识工作的最强模型

埃隆·马斯克旗下的人工智能公司SpaceXAI正式推出了新一代大语言模型Grok 4.5，将其定位为公司在编码、智能代理任务和知识工作领域的最强模型。官方披露，该模型在训练过程中与流行AI编程工具Cursor进行了深度协同优...

2026-06-27 talkingdev

在人工智能领域，开放权重（open-weights）的大语言模型与闭源模型之间的性能差距一直是业界关注的焦点。近日，一项基于“人工分析基准”（Artificial Analysis benchmarks）的预测研究指出，到2026年12月3日，一款能...

2026-05-29 talkingdev

在人工智能领域，开源模型的性能与顶尖闭源模型之间的差距一直是业界关注的焦点。最近一篇来自LessWrong平台的深入分析指出，尽管开源模型在整体能力上仍不及GPT-4、Claude等最先进的闭源模型，但实际差距并没有想象...

2026-01-08 talkingdev

近日，研究人员推出了迄今为止最大规模的开源环境WebGym，专门用于训练能够处理真实世界网页任务的视觉智能体。该环境的核心价值在于解决了现有训练集的局限性：人工合成或小规模任务集无法应对真实网站的多样性和非...

2025-12-09 talkingdev

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练，从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段：...

2025-12-06 talkingdev

根据AI模型聚合平台OpenRouter发布的最新年度研究报告，通过对过去一年内超过100万亿个令牌（tokens）的实证分析，揭示了当前AI模型使用格局的重大转变。报告指出，以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

2025-12-04 talkingdev

英伟达在混合专家模型（Mixture-of-Experts，MoE）的扩展性能方面取得了重大突破。根据官方公布的数据，其最新的GB200 Blackwell NVL72服务器配置，在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

2025-11-26 talkingdev

OpenAI联合创始人兼首席科学家Ilya Sutskever在最新访谈中提出重大行业判断：人工智能发展正在经历从‘规模扩张时代’到‘研究驱动时代’的战略转向。他指出当前大语言模型存在根本性局限——‘这些模型在泛化能力上远逊于...