微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程,该项目专为人工智能初学者设计,系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型(如MobileNet、Ti...
Read MoreLemonade是一个专为现代计算硬件优化的开源推理服务器,致力于帮助开发者和研究者在本地高效运行大型语言模型。该项目通过集成最先进的推理引擎,可自动适配不同厂商的NPU(神经网络处理器)和GPU硬件平台,实现计算...
Read MoreOpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...
Read MoreGitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...
Read More人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品,该产品专为研究工作场景设计,深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式,可同时支持工作...
Read MorevLLM是一款开源的大语言模型推理引擎,近日其团队发布了全新的V1架构。本文深入剖析了vLLM V1架构如何通过OpenAI兼容API服务器和核心引擎高效处理推理请求,实现业界领先的文本生成性能。该架构优化了推理请求的处理...
Read MoreTokasaurus是一款针对高吞吐量工作负载优化的大型语言模型(LLM)推理引擎,由斯坦福大学Scaling Intelligence团队研发。该引擎通过创新的架构设计和算法优化,显著提升了LLM在批量处理任务时的计算效率,为需要大规...
Read More新加坡国立大学SAIL实验室推出的FlowReasoner项目,开创性地将强化学习与外部反馈机制相结合,构建了一个可自主生成定制化多智能体系统的元推理框架。该技术突破性地实现了三大创新:1) 通过动态推理引擎解析用户查...
Read More