英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据,结果显示,相较于前代H100/H200平台,该服务器在运行特定类型的混合专家模型时,性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...
Read More据《华尔街日报》报道,中国人工智能公司月之暗面(Moonshot AI)正启动新一轮数亿美元规模的融资,估值预计达40亿美元。该公司开发的Kimi智能助手凭借超长上下文处理能力成为行业焦点,目前已向潜在投资者透露计划...
Read MoreDeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术,探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...
Read More斯坦福大学研究人员提出的递归语言模型(RLMs)实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量,实现了对无限长上下文的递归处理。在OOLONG基准测试中,基于GPT-5-mini构建的RLMs模型...
Read More智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...
Read More深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制,这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域,显著降低了计算复杂度,使得模型...
Read More英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...
Read MoreAnthropic公司宣布其AI模型Claude Sonnet 4现支持高达100万tokens的上下文窗口,较之前版本实现了5倍的性能飞跃。这一突破性升级通过Anthropic API向开发者开放,标志着大语言模型处理长文档、复杂对话和跨文档分析...
Read More