实时推理的相关内容 - 漫话开发者

2026-07-21 talkingdev

英伟达发布Cosmos 3 Edge：40亿参数世界模型赋能边缘设备实时推理与机器人动作生成

英伟达在Hugging Face上正式推出Cosmos 3 Edge，这是一款拥有40亿参数的开源世界模型，专为边缘设备上的机器人与视觉AI体设计。该模型通过共享的世界表征，将环境理解、实时预测、模拟与动作生成统一在同一框架下，...

2026-06-02 talkingdev

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-05-20 talkingdev

英伟达（NVIDIA）最新开源了LongLive 1.0框架，旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力（Streaming Attention）和KV缓存优化（KV-cache optimization）技术，实现了对超长视频序列...

2026-02-07 talkingdev

Pydantic团队近日在GitHub开源了Monty项目，这是一个用Rust语言编写的极简、安全的Python解释器，专为人工智能应用场景设计。该项目在Hacker News技术社区引发广泛关注，获得162个技术点赞和75条深度讨论，显示出业...

2025-10-27 talkingdev

机器学习领域迎来重大突破——FlashPack技术正式发布，这项专为PyTorch设计的高吞吐量文件格式与加载机制，成功将模型检查点I/O性能推向新高度。传统模型加载过程中，GPU因等待检查点加载而产生的闲置时间一直是行业痛...

2025-10-13 talkingdev

微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程，该项目专为人工智能初学者设计，系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型（如MobileNet、Ti...

2025-07-11 talkingdev

开发者Henry和Roman近日推出开源项目Cactus，这是一个专为智能手机设计的跨平台框架，支持本地部署大型语言模型（LLM）、视觉语言模型（VLM）和文本转语音（TTS）模型。与Ollama专注于笔记本和边缘服务器不同，Cactu...

2025-05-02 talkingdev

微软近日发布了Phi-4-reasoning系列变体，这一创新标志着小型语言模型（SLMs）在效率与复杂推理能力上的重大进展。Phi-4-reasoning通过算法优化和架构改进，在保持参数规模精简的同时，实现了接近大型语言模型（LLMs...