随着AI Agent在复杂任务中的广泛应用,其核心控制机制——Agent Harness的架构设计正成为影响安全性和多用户协作效率的关键因素。Agent Harness本质上是驱动大语言模型(LLM)的控制循环,负责与外部环境交互、管理凭...
Read More在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...
Read More苹果机器学习研究团队提出了一种名为LaDiR(Latent Diffusion Reasoner)的创新推理框架,为大型语言模型(LLM)的文本推理能力带来了显著提升。LaDiR框架的核心在于巧妙地将连续潜在表示的强大表现力与潜在扩散模型...
Read MorePyTorch官方博客近日发布了一项名为AutoSP的创新技术,该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码,用于长上下文大语言模型(LLM)的训练。AutoSP已与微软的DeepSpeed框架深度集成,使得开发者...
Read More大型语言模型(LLM)在生产环境中的行为监控已成为AI工程化的重要挑战。为应对这一难题,业界引入了AI评估栈(AI Evaluation Stack),将测试分为确定性断言(如语法和路由完整性)与基于模型的评估(如语义质量)。...
Read MoreBroccoli 是一个新颖的开源工具,旨在通过AI代理(包括Claude和Codex)自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单(Tickets)自动转化为GitHub上的拉取请求(Pull Requests)...
Read More近日,GitHub上开源了一个名为GoModel的高性能AI网关项目,该项目使用Go语言编写,旨在为开发者提供一个统一的、兼容OpenAI API标准的接口,以无缝对接包括OpenAI、Anthropic(Claude)、Google Gemini、Groq、xAI(...
Read More近日,一项名为CrabTrap的开源项目引起了AI应用安全领域的关注。它是一个HTTP/HTTPS代理,核心功能是拦截AI代理发出的每一个网络请求,并利用“LLM即法官”的技术范式,实时判断该请求是否符合为该代理预设的流量许可...
Read More