近日,GitHub上开源项目Claude Switcher引发了开发者社区的关注。该项目旨在为Anthropic的Claude Code模型提供一套脚本自动化工具,其核心创新在于将AI提示词(Prompts)转化为可直接执行的Markdown文件。通过支持Un...
Read More近日,GitHub上开源了一个名为Stirrup的新型轻量级框架,专为构建高级智能体(Agent)而设计。该框架的核心创新在于其“模型自主决策”理念:不同于传统框架严格规定执行流程,Stirrup允许AI模型根据任务情境,自行选...
Read More人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read MoreOpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...
Read More智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...
Read MoreAnthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...
Read More深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...
Read More