英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...
Read MoreOpenAI的一个推理模型成功推翻了离散几何学中的核心猜想——“平面单位距离问题”(Planar Unit Distance Problem)。该猜想最早由20世纪著名数学家保罗·埃尔德什于1946年提出,在长达80年的时间里一直未被攻克,是离散...
Read MoreVercel最新发布了一份基于其AI网关产品七个月生产流量数据的分析报告,样本覆盖了数百个模型和超过20万个团队。报告揭示了几个显著趋势:一是智能体(Agentic)工作负载呈现爆发式增长,这类负载在处理时需要动态调...
Read More一家名为Recursive Superintelligence的初创公司近日宣布,已成功融资超过6.5亿美元,公司估值突破40亿美元。该公司致力于研发能够实现自我改进的人工智能系统,旨在大幅减少甚至完全摆脱对人类开发者的依赖。其七位...
Read More一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...
Read More人工智能公司Anthropic近日发布了一项名为“Teaching Claude Why”的研究,旨在提升其大语言模型Claude的推理和解释能力。传统AI模型往往只输出结果,而缺乏对“为什么做出这个决策”的透明解释。这项研究通过创新的训练...
Read More谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出,大语言模型(LLM)产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误,而是模型在输出时未能有效表达其内在的不确定性。研究提...
Read More近日,一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理,为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...
Read More