长上下文的相关内容 - 漫话开发者

2026-03-14 talkingdev

Claude重磅更新：Opus 4.6与Sonnet 4.6全面开放100万上下文窗口，取消长文本溢价

人工智能公司Anthropic正式宣布，其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于，标准定价将适用于完整的100万token上下文窗口，彻底取消了此前针对长上下文的...

2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布：支持26万超长上下文，集成多模态与强化学习突破

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

2026-02-20 talkingdev

开源|StepFun发布前沿开源模型Step 3.5 Flash：高效推理与智能体能力新标杆

近日，StepFun正式发布了其前沿开源基础模型Step 3.5 Flash。该模型定位为高效、高速推理与具备智能体（Agent）能力的先进模型，其核心特性在于集成了工具使用、长上下文处理以及支持本地部署等关键能力。Step 3.5 F...

2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告，引发开发者社区热议

近日，国内人工智能公司月之暗面（Moonshot AI）在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开，迅速吸引了全球开发者与AI研究者的高度关注，在知名技术社区Hacker News上获得...

2026-01-27 talkingdev

开源|SWE-Pruner：代码智能体上下文剪枝框架，令牌消耗锐减超50%

近日，GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架，旨在显著优化代码智能体（Coding Agents）在处理复杂软件工程任务时的效率与成本。该框架的核心在于，通过一个轻量级模型动态分析与...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

2026-01-01 talkingdev

开源|E2E：基于JAX的端到端测试时训练框架，革新长上下文语言建模

近日，GitHub上开源了一个名为E2E的JAX官方实现项目，它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构，并配合滑动窗口注...

2026-01-01 talkingdev

开源|LMCache：为LLM服务注入极速KV缓存层，响应速度提升3-10倍

近日，一个名为LMCache的开源项目在GitHub上发布，旨在通过创新的键值（KV）缓存加速层，显著提升大型语言模型（LLM）的服务性能。该项目专为LLM推理服务设计，其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...