漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-02 talkingdev

英伟达发布Cosmos 3:物理AI开源基础模型,融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...

Read More
2026-05-21 talkingdev

OpenAI模型攻克几何学难题:80年历史的“单位距离猜想”被推翻

OpenAI的一个推理模型成功推翻了离散几何学中的核心猜想——“平面单位距离问题”(Planar Unit Distance Problem)。该猜想最早由20世纪著名数学家保罗·埃尔德什于1946年提出,在长达80年的时间里一直未被攻克,是离散...

Read More
2026-05-14 talkingdev

AI网关生产流量趋势报告:多模型路由与开源模型采用率激增

Vercel最新发布了一份基于其AI网关产品七个月生产流量数据的分析报告,样本覆盖了数百个模型和超过20万个团队。报告揭示了几个显著趋势:一是智能体(Agentic)工作负载呈现爆发式增长,这类负载在处理时需要动态调...

Read More
2026-05-14 talkingdev

七位顶尖研究者加盟,4亿美元估值打造“自我进化”AI

一家名为Recursive Superintelligence的初创公司近日宣布,已成功融资超过6.5亿美元,公司估值突破40亿美元。该公司致力于研发能够实现自我改进的人工智能系统,旨在大幅减少甚至完全摆脱对人类开发者的依赖。其七位...

Read More
2026-05-11 talkingdev

LLM持续更新记忆可能适得其反:研究发现无记忆模型表现更佳

一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...

Read More
2026-05-09 talkingdev

Anthropic新研究:教Claude理解“为什么”,AI推理能力再升级

人工智能公司Anthropic近日发布了一项名为“Teaching Claude Why”的研究,旨在提升其大语言模型Claude的推理和解释能力。传统AI模型往往只输出结果,而缺乏对“为什么做出这个决策”的透明解释。这项研究通过创新的训练...

Read More
2026-05-06 talkingdev

论文推荐|Google重新定义AI幻觉:从“知识缺陷”转向“不确定性表达”

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出,大语言模型(LLM)产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误,而是模型在输出时未能有效表达其内在的不确定性。研究提...

Read More
2026-05-06 talkingdev

大模型规模化指南:如何高效扩展你的AI模型?

近日,一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理,为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page