漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-18 talkingdev

MiniMax开源推理模型M1:混合专家架构+闪电注意力

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1,该模型采用创新的混合专家架构(MoE)并引入'闪电注意力'技术,实现百万token级别的超长上下文处理能力(相当于DeepSeek R1的8倍)。特别值得注意...

Read More
2025-05-05 talkingdev

阿里巴巴发布Qwen 3系列AI模型,号称可媲美谷歌与OpenAI顶级模型

阿里巴巴近日正式推出Qwen 3系列人工智能模型,该系列模型采用混合专家架构(Mixture of Experts),具备先进的推理能力,并宣称其性能可媲美谷歌和OpenAI的顶级模型。Qwen 3系列模型支持119种语言,训练数据规模高...

Read More
2024-02-07 talkingdev

Roblox发布实时AI聊天翻译器,打破语言壁垒

Roblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。

Read More