中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型,并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口,并且官方承诺API至少保证提供51.2万个token的处...
Read More在生产环境中部署基于大语言模型(LLM)的智能体(Agent)时,如何准确评估其在复杂、长上下文任务中的表现一直是个难题。传统LLM评测员(Judge)在处理涉及多步推理、状态验证和动态调整的Agent轨迹时,常出现事实...
Read MoreOpenAI 近日发布了一项名为 Secure MCP Tunnel 的新功能,旨在解决企业级用户将私有或本地 MCP 服务器与 OpenAI 产品安全连接的核心痛点。该技术通过一个仅支持出站连接的隧道(outbound-only tunnel),允许用户在...
Read More近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...
Read More上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日,初创公司Subquadratic宣布推出一款全新的AI模型,其上下文窗口达到了惊人的1200万token(约合1200万个单词或代码标记),远超过当前主流模...
Read MoreDuckDB,作为一款高性能的嵌入式数据库,近年来在数据分析领域备受关注。近日,一篇技术博客详细介绍了如何在 DuckDB 中实现全文搜索功能。该文章不仅提供了详细的技术实现步骤,还探讨了该功能对轻量级数据库应用场...
Read More在大型语言模型领域,一种新的视角正在引发讨论:将上下文视为“软件”,而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文(如KV缓存)动态地调节模型的激活值,为特定任务提供临时性的“编程”,从而实现...
Read More近日,GitHub上开源了一个名为Pretext的纯JavaScript/TypeScript库,专注于解决前端开发中多行文本的高性能测量与布局问题。该库通过直接调用浏览器字体引擎实现自有文本测量逻辑,有效规避了传统DOM操作中因重排(r...
Read More