大模型的相关内容 - 漫话开发者

2026-04-23 talkingdev

AI推理新挑战：基准测试揭示智能体工作负载对引擎性能的深层影响

随着人工智能向智能体（Agent）方向演进，传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答，而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力，尤其...

2026-04-21 talkingdev

中国人工智能公司月之暗面（Moonshot AI）近日正式推出其新一代大模型系列Kimi K2.6，并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体（Agent）执行支持，旨在为开...

2026-04-20 talkingdev

Anthropic Labs今日正式发布Claude Design，标志着生成式AI在专业视觉创作领域迈出关键一步。该产品基于Claude Opus 4.7多模态视觉模型构建，能够协助用户高效生成设计原型、商业演示文稿、营销单页等视觉内容。其核...

2026-04-10 talkingdev

据《金融时报》报道，阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能（AI）部门的负责人。这一变动紧随公司AI战略的重大转向而发生：阿里巴巴正将其通义千问（Qw...

2026-04-09 talkingdev

近期，一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构，通过多个专门化智能体协同工作，对代码进行多轮验证，并设定80%置信度...

2026-04-09 talkingdev

谷歌旗下广受开发者欢迎的云端编程环境Colab近日迎来两项关键更新，进一步深化了其与Gemini大模型的集成，旨在为用户提供更具个性化和教育意义的AI辅助编程体验。此次更新的核心亮点在于“自定义指令”和“学习模式”两...

2026-04-08 talkingdev

近日，一个名为Clicky的开源项目在GitHub上发布，为macOS用户带来了一种新颖的人机交互体验。该项目本质上是一个运行在光标侧的AI“教师”或“伙伴”，能够实时“看到”用户屏幕内容，并通过语音与用户交流，甚至能直接“指...

2026-04-08 talkingdev

近日，GitHub上开源了一个名为TriAttention的项目，其核心是一种创新的KV（键值）缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时，因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...