近期,一项关于大语言模型(LLM)上下文学习(ICL)能力的研究取得了重要突破。研究人员提出了一种理论框架,解释了非线性残差变换器如何通过向量算术执行事实召回ICL任务。该研究基于分层概念建模,证明了通过梯度...
Read MoreAnthropic公司推出的模型上下文协议(Model Context Protocol,MCP)旨在标准化大型语言模型(LLM)对外部工具的使用方式,正迅速成为工具集成的行业规范。该开源框架通过结构化接口,使AI代理能够更高效地调用外部A...
Read MoreMeta公司最新推出的DINOv3是一种可扩展的自监督学习模型,在包括网络图像和卫星图像在内的多种图像领域均实现了最先进的性能表现。这一突破性技术采用自监督学习范式,无需依赖大量标注数据即可从海量无标签图像中学...
Read More谷歌近日宣布为其AI聊天机器人Gemini推出重大更新,新增自动记忆功能。该功能默认开启,允许Gemini无需用户提示即可记住过往对话内容,自动识别关键细节和用户偏好,并据此提供个性化输出。目前,该功能已开始向部分...
Read MoreOmnara是由Y Combinator S25批次孵化的移动优先平台,专注于提升AI代理(如Claude和GitHub Copilot)的工作流可视性与控制效率。该平台通过三项核心技术突破重新定义人机协作范式:1) 实时监控功能可动态追踪AI代理...
Read More本文深度剖析了一个从零构建的Web搜索引擎项目,该项目在短短两个月内实现了包括30亿SBERT神经嵌入生成、2.8亿网页爬取与索引、查询延迟优化及服务网格部署等核心技术突破。项目团队动用了200块GPU组成的计算集群,...
Read More艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...
Read More美国上市视频平台Rumble(RUM.O)正考虑以约11.7亿美元(10亿欧元)的全股票交易收购德国AI云服务集团Northern Data AG。这一潜在收购标志着Rumble从视频领域向AI基础设施的战略扩张,也反映了当前AI云计算市场的整...
Read More