MoE的相关内容 - 漫话开发者

2025-05-23 talkingdev

Anthropic发布Claude Opus 4和Claude Sonnet 4，树立AI编码与推理新标杆

人工智能研究公司Anthropic正式推出Claude Opus 4和Claude Sonnet 4两大模型，在编码能力、高级推理及AI智能体领域设立全新行业标准。此次升级的核心突破在于模型针对复杂长时任务的设计优化，可持续运行数小时完成...

2025-05-07 talkingdev

法国AI初创公司Mistral近日正式推出企业级对话助手Le Chat Enterprise，该产品最大特点是支持完全本地化部署，为企业数据安全提供保障。作为开源大模型领域的领军者，Mistral此次发布的解决方案允许企业将AI系统部署...

2025-04-28 talkingdev

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2，这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露，R2模型将采用创新的混合架构设计，整合了稀疏专家模型(MoE)与密...

2025-04-24 talkingdev

最新研究表明，采用混合专家模型（MoE）架构的DeepSeek-V3/R1在多节点GPU部署中展现出显著性能优势。该模型通过创新的资源分配机制，在绝大多数应用场景下同步实现了更高吞吐量和更低延迟的双重突破。技术分析显示，...

2025-04-16 talkingdev

OpenAI近日将其内部研发的高性能计算核心——FP4（4-bit浮点）与MoE（混合专家）系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展：FP4作为新兴的低精度计算格式可显著提升...

2025-04-15 talkingdev

由Tianyi实验室发布的C3PO项目在GitHub开源了一种创新的测试时优化技术，该技术通过基于相似参考样本重新混合专家权重，显著提升了混合专家（Mixture-of-Experts，MoE）大语言模型的准确性。这一突破性方法不仅优化...

2025-04-07 talkingdev

谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段，开发者现可通过Google AI Studio的Gemini API进行体验，而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本，2.5 Pro在跨模态理解、长...

2025-04-07 talkingdev

Unsloth团队针对DeepSeek最新R1模型成功开发出创新量化方案，其核心突破在于将混合专家（MoE）层压缩至惊人的1.58bit，同时通过动态量化技术保持其他模块在4-6bit精度。研究发现，模型Tokenizer的特殊结构为量化带来...