模型规模的相关内容 - 漫话开发者

2026-06-23 talkingdev

AI模型规模狂飙：到2031年参数量将达1.4千万亿？核心约束竟是内存速度

一篇来自LessWrong社区的技术文章深入探讨了2023年至2031年间大型语言模型（LLM）规模扩展的物理极限。文章指出，虽然预训练算力是决定模型规模的关键，但一个常被忽视的硬性约束在于推理时的令牌生成速度。具体来说...

2026-05-06 talkingdev

近日，一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理，为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

2026-04-30 talkingdev

随着人工智能大模型规模的不断增长，模型评估（Eval）环节正在迅速演变为一个新的计算瓶颈，其成本在某些情况下甚至已经逼近甚至超过了模型训练的开销。根据最新的行业分析，一次全面的AI评估运行费用可能高达数万美...

2026-04-14 talkingdev

当前，大型语言模型（LLM）驱动的智能体在执行复杂任务时面临根本性挑战：由于缺乏结构化记忆，其无状态的调用方式会导致上下文丢失、多步骤任务中断以及错误重复发生。传统解决方案如向量搜索，虽能处理简单查询，...

2026-04-12 talkingdev

近期，一篇题为《Mythos之后：AI网络安全的锯齿状前沿》的技术博客引发了广泛讨论。文章核心观点指出，在AI驱动的网络安全领域，真正的护城河并非单一模型的能力，而在于整个系统架构。值得注意的是，文中提及不仅大...

2026-03-14 talkingdev

人工智能公司Anthropic正式宣布，其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于，标准定价将适用于完整的100万token上下文窗口，彻底取消了此前针对长上下文的...

2026-02-07 talkingdev

埃里克·张（Eric Jang）在其个人博客Evjang.com上发表了一篇关于人工智能前沿趋势的深度分析文章。文章以范内瓦·布什博士1945年的经典论述《诚如所思》为引，将现实世界比作一个开放式的多人在线游戏（MMO），并指出...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...