漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-12 talkingdev

开源|Claude Switcher:让AI提示词变身可执行脚本,支持多云切换与管道操作

近日,GitHub上开源项目Claude Switcher引发了开发者社区的关注。该项目旨在为Anthropic的Claude Code模型提供一套脚本自动化工具,其核心创新在于将AI提示词(Prompts)转化为可直接执行的Markdown文件。通过支持Un...

Read More
2025-12-24 talkingdev

开源|Stirrup:让AI模型自主选择任务路径的轻量级智能体框架发布

近日,GitHub上开源了一个名为Stirrup的新型轻量级框架,专为构建高级智能体(Agent)而设计。该框架的核心创新在于其“模型自主决策”理念:不同于传统框架严格规定执行流程,Stirrup允许AI模型根据任务情境,自行选...

Read More
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾:关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体优化的前沿模型

OpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-11-25 talkingdev

Claude开发者平台推出高级工具使用功能,实现动态学习与执行

Anthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page