漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-13 talkingdev

开源|微软推出Edge AI入门课程:从模型优化到智能代理开发

微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程,该项目专为人工智能初学者设计,系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型(如MobileNet、Ti...

Read More
2025-08-20 talkingdev

开源|Lemonade:高性能本地大语言模型推理服务器

Lemonade是一个专为现代计算硬件优化的开源推理服务器,致力于帮助开发者和研究者在本地高效运行大型语言模型。该项目通过集成最先进的推理引擎,可自动适配不同厂商的NPU(神经网络处理器)和GPU硬件平台,实现计算...

Read More
2025-08-06 talkingdev

OpenAI发布两款开源推理模型:gpt-oss-120b与gpt-oss-20b

OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...

Read More
2025-07-16 talkingdev

Uzu:专为苹果芯片优化的高性能AI模型推理引擎

GitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...

Read More
2025-07-10 talkingdev

Perplexity推出Comet:一款面向研究场景的AI浏览器

人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品,该产品专为研究工作场景设计,深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式,可同时支持工作...

Read More
2025-06-30 talkingdev

vLLM V1架构解析:揭秘高效推理服务的核心技术

vLLM是一款开源的大语言模型推理引擎,近日其团队发布了全新的V1架构。本文深入剖析了vLLM V1架构如何通过OpenAI兼容API服务器和核心引擎高效处理推理请求,实现业界领先的文本生成性能。该架构优化了推理请求的处理...

Read More
2025-06-06 talkingdev

Tokasaurus:专为高吞吐量工作负载优化的大型语言模型推理引擎

Tokasaurus是一款针对高吞吐量工作负载优化的大型语言模型(LLM)推理引擎,由斯坦福大学Scaling Intelligence团队研发。该引擎通过创新的架构设计和算法优化,显著提升了LLM在批量处理任务时的计算效率,为需要大规...

Read More
2025-04-23 talkingdev

[开源]个性化多智能体系统FlowReasoner:基于强化学习的元推理框架

新加坡国立大学SAIL实验室推出的FlowReasoner项目,开创性地将强化学习与外部反馈机制相结合,构建了一个可自主生成定制化多智能体系统的元推理框架。该技术突破性地实现了三大创新:1) 通过动态推理引擎解析用户查...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page