长上下文的相关内容 - 漫话开发者

2025-12-17 talkingdev

开源|通义千问推出Qwen-Doc项目，专注长文档理解与智能解析

阿里云通义千问团队近日在GitHub上开源了Qwen-Doc项目，这是一个专注于文档人工智能（Document AI）的开源计划。该项目旨在通过提供先进的模型和工具集，显著提升AI系统对长上下文文档的理解、解析能力，并支持基于...

2025-12-12 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2，该模型被定位为专为专业知识工作和长期运行的智能体（agents）而设计的最先进系统。根据官方介绍，GPT-5.2在多个关键领域树立了新的性能标杆，包括代码生...

2025-12-12 talkingdev

OpenAI正式推出其新一代前沿模型GPT-5.2，该模型被定位为专为专业工作场景和长期运行的智能体（agent）工作流而优化的最先进模型。相较于前代，GPT-5.2在多个关键维度实现了显著提升：其一，在知识工作领域，模型展...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-12-04 talkingdev

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据，结果显示，相较于前代H100/H200平台，该服务器在运行特定类型的混合专家模型时，性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

2025-11-22 talkingdev

据《华尔街日报》报道，中国人工智能公司月之暗面（Moonshot AI）正启动新一轮数亿美元规模的融资，估值预计达40亿美元。该公司开发的Kimi智能助手凭借超长上下文处理能力成为行业焦点，目前已向潜在投资者透露计划...

2025-10-21 talkingdev

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-10-17 talkingdev

斯坦福大学研究人员提出的递归语言模型（RLMs）实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量，实现了对无限长上下文的递归处理。在OOLONG基准测试中，基于GPT-5-mini构建的RLMs模型...