长上下文的相关内容 - 漫话开发者

2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型：200K上下文窗口，宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6，该模型最突出的特性是支持高达200K tokens的上下文窗口，使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

2025-09-30 talkingdev

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制，这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域，显著降低了计算复杂度，使得模型...

2025-09-10 talkingdev

英伟达正式推出全新Rubin CPX GPU，该芯片专为处理超过100万token的超长上下文窗口而设计，标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念，Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...

2025-08-13 talkingdev

Anthropic公司宣布其AI模型Claude Sonnet 4现支持高达100万tokens的上下文窗口，较之前版本实现了5倍的性能飞跃。这一突破性升级通过Anthropic API向开发者开放，标志着大语言模型处理长文档、复杂对话和跨文档分析...

2025-07-23 talkingdev

通义千问团队正式发布Qwen3-Coder，这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构（Mixture-of-Experts），其中激活参数达350亿，并支持超长上下文处理。在智能编码、浏览器操作和工具...

2025-07-18 talkingdev

一项名为“Power”注意力的创新技术通过引入超参数p，实现了对状态大小的独立控制，有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力，并支持定制GPU内核，在64k上下文长度下速度...

2025-07-09 talkingdev

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型，支持六种语言，具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能，为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

2025-06-24 talkingdev

本文深入探讨了长上下文问答系统的评估方法，包括指标设计、数据集构建以及人工或大语言模型(LLM)评估技术。文章重点分析了该领域面临的四大核心挑战：信息过载问题、证据分散现象、多跳推理需求以及幻觉生成风险。...