模型的相关内容 - 漫话开发者

2025-06-18 talkingdev

MiniMax开源推理模型M1：混合专家架构+闪电注意力

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1，该模型采用创新的混合专家架构（MoE）并引入'闪电注意力'技术，实现百万token级别的超长上下文处理能力（相当于DeepSeek R1的8倍）。特别值得注意...

2025-06-18 talkingdev

TCANet作为一项突破性神经解码技术，通过多尺度卷积网络、时序压缩模块和堆叠自注意力机制的创新性结合，为运动想象脑电信号（MI-EEG）的解码提供了全新解决方案。该模型在GitHub开源后迅速引发脑机接口领域关注，其...

2025-06-18 talkingdev

在机器人技术领域，实时性至关重要——输入与输出之间的延迟会直接影响机器人的性能表现。尽管视觉-语言-动作（VLA）模型在开放世界泛化方面取得了令人瞩目的成果，但其运行速度往往较慢。近日，一项名为“实时分块”的...

2025-06-18 talkingdev

KV（键值）缓存是大型语言模型（LLM）推理过程中的关键技术，通过存储注意力计算的中间结果显著提升生成效率。以逐词生成"Time flies fast"为例，传统方式需在每个步骤重复计算"Time"和"flies"的注意力权重，而采用K...

2025-06-18 talkingdev

谷歌近日宣布其人工智能模型Gemini 2.5 Pro和Flash版本已全面开放使用，同时推出预览版Flash-Lite。此次更新最引人注目的是引入了可控的“思考预算”机制，该技术通过动态分配计算资源，在保证推理精度的同时为开发者...

2025-06-17 talkingdev

知名数据压缩库bzip2的Rust实现版本（bzip2 crate）近日宣布完成从C语言到纯Rust代码的全面迁移，这一技术转型引发开发者社区广泛关注。该项目作为Rust语言在系统编程领域替代C语言的典型案例，其技术迁移过程涉及内...

2025-06-17 talkingdev

近日，一个名为Models.dev的开源网站正式上线，该平台致力于构建一个开放的AI模型数据库，详细收录各类人工智能模型的规格参数、定价信息以及功能特性。这一举措为开发者、研究人员和企业提供了便捷的模型检索和比较...

2025-06-17 talkingdev

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商，这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构，开发者能够以服务器无感知（serverless）方式极速调用Llama...