漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-05 talkingdev

微软发布Phi-4推理视觉模型:15B参数实现多模态推理,懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...

Read More
2026-03-02 talkingdev

Claude推出记忆导入工具,可跨平台迁移ChatGPT等AI偏好,大模型“护城河”再受挑战

人工智能公司Anthropic近日为其AI助手Claude推出了一项名为“记忆导入”的新功能。该工具允许用户将其在其他主流AI服务(如OpenAI的ChatGPT或Google的Gemini)中积累的上下文对话历史、使用偏好和个性化设置,一键迁移...

Read More
2026-02-28 talkingdev

OpenAI与五角大楼达成合作,将AI模型部署至美军涉密网络

据多方信源证实,人工智能领域的领军企业OpenAI已与美国国防部(五角大楼)达成一项重要协议,计划将其先进的人工智能模型部署至美国军方的涉密网络环境中。这一合作标志着生成式AI技术正加速进入国家级安全与国防应...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
2026-02-25 talkingdev

Claude Opus 4.6实现“智能产出比”突破,以更少算力解决更复杂任务

近日,一篇关于AI模型“智能产出比”的分析引发行业关注。该分析指出,评估AI模型性能不应仅关注其最终能解决多难的任务,更应关注模型为达到该性能水平所需的计算资源,即“智能产出比”。文章重点介绍了Anthropic公司...

Read More
2026-02-25 talkingdev

推理速度新标杆:Inception Labs发布Mercury 2,号称全球最快推理大语言模型

人工智能初创公司Inception Labs近日正式发布了其新一代大语言模型Mercury 2,并宣称该模型是“全球最快的推理语言模型”。其核心目标是让生产环境中的AI应用响应达到“瞬时”体验。Mercury 2的技术亮点在于其采用了创新...

Read More
2026-02-23 talkingdev

开源|突破显存限制:开发者实现单张RTX 3090运行Llama 3.1 70B,NVMe直连GPU绕过CPU

近日,在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目,其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信,绕过CPU和系统内存的传统数据路径,从而在消费级显卡RTX 3090上成功运行了参数量...

Read More
2026-02-21 talkingdev

印度AI创企Sarvam发布Indus聊天应用Beta版,专为本地语言打造,搭载1050亿参数大模型

总部位于印度班加罗尔的AI初创公司Sarvam,于近日正式推出了其名为“Indus”的聊天应用程序Beta版本,该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型,此次发...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page