长上下文的相关内容 - 漫话开发者

2026-07-17 talkingdev

Moonshot 发布 Kimi K3：2.8万亿参数多模态巨擘，百万Token上下文与代理编码能力全开

国内人工智能公司 Moonshot 正式推出新一代旗舰多模态模型 Kimi K3，参数规模高达 2.8 万亿，并原生支持 100 万 token 的超长上下文窗口。K3 的亮点不仅在于规模，更在于工程上的深度优化：团队针对长上下文场景大幅...

2026-07-14 talkingdev

Engram是一款专为AI编程代理设计的持久记忆系统，旨在解决智能体在跨会话协作中上下文丢失的痛点。作为一个语言无关的独立Go二进制文件，它底层采用SQLite进行数据存储，并集成了FTS5全文搜索引擎，实现了高效的知识...

2026-07-12 talkingdev

SpaceXAI 正式推出其最新一代大语言模型 Grok 4.5，该模型被定义为迄今最先进版本，专为三大核心领域深度优化：编码生成与推理、自主代理（Agentic）任务执行以及高复杂度知识工作。与前代产品相比，Grok 4.5 在工具...

2026-06-15 talkingdev

由 Z.ai 推出的新一代旗舰大模型 GLM-5.2 现已面向所有GLM编程计划的用户开放，包括 Lite、Pro、Max 和 Team 等套餐。该模型在前代基础上强化了代码生成能力，同时实现了可用的百万级Token超长上下文支持，在需要长...

2026-06-03 talkingdev

在处理长文本或长时间序列时，标准Transformer模型的内存占用和计算复杂度会随序列长度平方级增长，并面临信息稀释问题。GitHub上最新开源的“Wall Attention”项目提出了一种极具创新性的注意力变体机制：通过引入带...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-29 talkingdev

在生产环境中部署基于大语言模型（LLM）的智能体（Agent）时，如何准确评估其在复杂、长上下文任务中的表现一直是个难题。传统LLM评测员（Judge）在处理涉及多步推理、状态验证和动态调整的Agent轨迹时，常出现事实...