漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-23 talkingdev

AI推理新挑战:基准测试揭示智能体工作负载对引擎性能的深层影响

随着人工智能向智能体(Agent)方向演进,传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答,而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力,尤其...

Read More
2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型,宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...

Read More
2026-04-08 talkingdev

开源|TriAttention:基于三角函数的KV缓存压缩技术,助力大模型长上下文推理在内存受限GPU上本地部署

近日,GitHub上开源了一个名为TriAttention的项目,其核心是一种创新的KV(键值)缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时,因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

Read More
2026-04-07 talkingdev

开源|Hippo Memory:受海马体启发的AI记忆系统,让智能体告别“健忘症”

近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...

Read More
2026-03-14 talkingdev

Claude重磅更新:Opus 4.6与Sonnet 4.6全面开放100万上下文窗口,取消长文本溢价

人工智能公司Anthropic正式宣布,其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于,标准定价将适用于完整的100万token上下文窗口,彻底取消了此前针对长上下文的...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
2026-02-20 talkingdev

开源|StepFun发布前沿开源模型Step 3.5 Flash:高效推理与智能体能力新标杆

近日,StepFun正式发布了其前沿开源基础模型Step 3.5 Flash。该模型定位为高效、高速推理与具备智能体(Agent)能力的先进模型,其核心特性在于集成了工具使用、长上下文处理以及支持本地部署等关键能力。Step 3.5 F...

Read More
2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告,引发开发者社区热议

近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page