模型的相关内容 - 漫话开发者

2025-11-13 talkingdev

深度解析微软AI战略全景：OpenAI合作、数据中心投资、Neocloud租赁与自研芯片Maia

半导体研究机构SemiAnalysis最新报告系统拆解了微软的AI战略布局。该战略以与OpenAI的深度合作为核心，结合数据中心扩建、Neocloud云服务租赁模式、GitHub Copilot开发者工具链、MAI系列模型及自研AI芯片Maia，构建...

2025-11-12 talkingdev

谷歌近日在GitHub开源了Agent Development Kit for Go（ADK-Go），这是一个代码优先的开源工具包，专为构建、评估和部署复杂AI智能体而设计。该工具包将软件开发的核心原则引入AI智能体创建流程，通过声明式API和结...

2025-11-12 talkingdev

近日，长期开发iOS照片应用的科技团队LateNiteSoft发布了一项针对三大前沿AI图像生成模型的深度评测。该研究通过600余次真实场景的图像生成测试，系统评估了OpenAI的gpt-image-1、Google的nanoBanana（Gemini）以及S...

2025-11-12 talkingdev

当前大型语言模型虽在文本生成领域表现卓越，却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出，构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

2025-11-11 talkingdev

近日，前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型，该模型采用混合专家架构，具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面，Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

2025-11-11 talkingdev

由builddotai团队在Hugging Face平台开源的Egocentric-10K数据集，标志着工业视觉与机器人学习领域取得重大突破。该数据集包含10,000小时以第一人称视角采集的工业操作视频，涵盖192,900个视频片段，真实记录了2,138...

2025-11-11 talkingdev

Meta旗下Facebook Research团队在GitHub开源了Omnilingual ASR多语言语音识别系统，这项突破性技术首次实现对全球1600余种语言的语音转文本支持，其中数百种语言是现有ASR技术从未覆盖的濒危语种。该系统采用创新的...

2025-11-11 talkingdev

Meta近日发布了名为'全语种自动语音识别'（Omnilingual Automatic Speech Recognition）的AI模型套件，这项突破性技术将自动语音识别能力扩展到1600多种语言，覆盖全球绝大多数已知语言体系。该系统的核心创新在于其...