在处理长文本或长时间序列时,标准Transformer模型的内存占用和计算复杂度会随序列长度平方级增长,并面临信息稀释问题。GitHub上最新开源的“Wall Attention”项目提出了一种极具创新性的注意力变体机制:通过引入带...
Read More中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型,并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口,并且官方承诺API至少保证提供51.2万个token的处...
Read More英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...
Read MorePerplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”(Search as Code,简称 SaC)的全新搜索架构范式。该方案通过提供一个软件开发工具包(SDK),赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...
Read More在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...
Read More阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus,标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合,构建了一个单一、通用的多模态智能体基础...
Read More在AI开发工具日益多元化的今天,如何让Claude Code、Codex、OpenCode、Cursor等不同智能体高效协同工作,成为一个关键的技术挑战。GitHub上开源的ECC项目提供了一套全面的解决方案,它被设计为一个“代理工具性能优化...
Read More开源项目pi-dynamic-workflows为Pi智能助手引入了一项强大的动态工作流扩展能力,它允许助手编写精简的JavaScript脚本,将复杂工作高效分派给大量隔离的“子代理”(subagents)并行处理,并最终完成结果合成。相较于...
Read More