多模态的相关内容 - 漫话开发者

2026-07-17 talkingdev

Moonshot 发布 Kimi K3：2.8万亿参数多模态巨擘，百万Token上下文与代理编码能力全开

国内人工智能公司 Moonshot 正式推出新一代旗舰多模态模型 Kimi K3，参数规模高达 2.8 万亿，并原生支持 100 万 token 的超长上下文窗口。K3 的亮点不仅在于规模，更在于工程上的深度优化：团队针对长上下文场景大幅...

2026-07-16 talkingdev

人工智能公司Thinking Machines正式发布了其首个开放权重模型Inkling。这是一个参数规模高达9750亿的混合专家（Mixture-of-Experts）Transformer模型，原生支持文本、图像和音频的多模态输入与理解。Inkling最引人注...

2026-07-16 talkingdev

近期在GitHub上开源的Boop Agent项目，为iMessage用户提供了一种全新的个人人工智能交互范式。该项目并非简单的聊天机器人，而是一个深度集成在苹果iMessage中的个人智能体应用。其技术核心在于提供了双运行时选择：...

2026-07-15 talkingdev

据TechCrunch报道，国内大语言模型开发商DeepSeek正在与投资者洽谈约15亿美元的新一轮融资，投前估值已高达710亿美元。与此同时，该公司被曝正为2027年首次公开募股（IPO）做准备。这一动作标志着DeepSeek在经历模型...

2026-07-12 talkingdev

OpenAI 近日正式推出全新的 GPT-5.6 模型家族，旗舰版本代号“Sol”，在智能水平、运行效率与成本控制上实现三重跃升。该系列模型在数学推理、代码生成、长文本理解等多个权威基准测试中，不仅全面超越前代 GPT-5，也...

2026-07-12 talkingdev

Meta正式推出了新一代AI模型Muse Spark 1.1，在工具调用、代码生成、计算机交互和多模态推理等关键维度上实现了显著升级。该版本通过深度的模型架构优化与训练数据配比调整，让模型在理解复杂指令并自主操控外部工具...

2026-07-12 talkingdev

OpenAI 正式推出新一代语音模型 GPT-Live，现已驱动 ChatGPT 语音功能。该模型采用全双工架构，允许 AI 在说话的同时持续倾听，彻底打破传统一问一答的交互模式，实现更接近人类自然交流的同步对话。GPT-Live 能够实...

2026-06-27 talkingdev

OpenAI 正式对外预览了其下一代旗舰模型——GPT-5.6 Sol。这一模型不仅在编程、科学研究和网络安全等关键领域展现出显著增强的能力，更引人关注的是，它首次搭载了OpenAI迄今最先进的安全栈。从技术层面看，GPT-5.6 So...