漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-01 talkingdev

MiniMax M3开源模型:融合编码与智能体前沿,百万Token超长上下文

MiniMax 最新发布的开源权重模型 M3 在编码和智能体(Agentic)任务上达到前沿水平。该模型不仅支持图像和视频输入,还可以直接操作桌面计算机。技术上,M3 引入了一种新的注意力架构,支持上下文缩放,并能够处理多...

Read More
2026-05-03 talkingdev

中国开源模型Kimi K2.5在编程挑战中击败Claude、GPT-5.5和Gemini,引发业界震动

近日,一款名为Kimi K2.5的开源权重模型在编程挑战中击败了包括Claude、GPT-5.5和Gemini在内的多个顶级闭源模型。这一事件迅速在科技圈引发广泛关注,尤其在Hacker News上引发了激烈讨论。Kimi K2.5由中国团队开发,...

Read More
2026-04-29 talkingdev

Poolside发布Laguna系列编程模型:开源XS.2小而强,旗舰M.1专注长周期任务

人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...

Read More
2026-04-03 talkingdev

谷歌DeepMind发布Gemma 4:基于Gemma 3技术构建,支持140种语言的多模态推理

谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...

Read More
2026-04-03 talkingdev

开源巨作!Arcee AI发布3990亿参数MoE模型Trinity-Large-Thinking,Apache 2.0许可商用无忧

在ChatGPT于2022年底掀起生成式AI浪潮后,开源大模型的接力棒在多家公司间传递。近日,美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构,参数量高达3990亿,是...

Read More
2026-03-23 talkingdev

Cursor承认其新编程模型基于月之暗面Kimi 2.5构建,引发开源模型商业化与地缘技术竞争讨论

近日,科技界发生了一起备受关注的模型溯源事件。AI编程助手Cursor发布的新一代代码生成模型Composer 2,被用户发现其底层架构疑似基于中国人工智能公司月之暗面(Moonshot AI)的开源大模型Kimi 2.5。面对社区质疑...

Read More
2026-02-12 talkingdev

智谱发布GLM-5:7540亿参数开源巨兽,引领智能体工程新范式

智谱AI正式发布了其新一代开源大模型GLM-5,该模型以MIT许可证开源,参数量达到惊人的7540亿,是前代GLM-4.7(3680亿参数)规模的两倍以上。在技术性能上,GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升,...

Read More
2025-12-16 talkingdev

英伟达发布Nemotron 3开源模型家族,以开放生态挑战OpenAI等巨头

英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page