漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-30 talkingdev

DeepSpeed整合AutoSP:自动序列并行技术,轻松训练超长上下文LLM

PyTorch官方博客近日发布了一项名为AutoSP的创新技术,该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码,用于长上下文大语言模型(LLM)的训练。AutoSP已与微软的DeepSpeed框架深度集成,使得开发者...

Read More
2026-04-30 talkingdev

Mistral Medium 3.5发布:128B密集模型驱动云端异步编程,性能登顶SWE-Bench

Mistral AI最新发布了Mistral Medium 3.5模型,这是一款拥有1280亿参数的密集模型(128B dense model),专为驱动远程Vibe代理而设计,能够在云端执行长时间、异步的编码任务,用户可直接从命令行界面(CLI)或Le Ch...

Read More
2026-04-27 talkingdev

AI实验室算力告急:智能编码代理需求激增,行业面临扩容瓶颈

在人工智能领域,编码代理(Coding agents)正成为首个被大规模且定期付费的AI产品。这类基于大模型的智能工具能自动完成代码生成、调试和优化,显著提升开发效率,因此迅速获得企业用户的青睐。然而,随着应用普及...

Read More
2026-04-20 talkingdev

NVIDIA发布NEMOTRON OCR V2:基于合成数据的快速多语言OCR模型实现重大精度突破

NVIDIA近日在Hugging Face平台发布博客,介绍了其最新研发的NEMOTRON OCR V2模型。该模型的核心创新在于完全利用合成数据进行训练,通过构建包含mOSCAR文本和多样化字体的合成数据管道,生成了跨语言的像素级完美标...

Read More
2026-04-08 talkingdev

开源|TriAttention:基于三角函数的KV缓存压缩技术,助力大模型长上下文推理在内存受限GPU上本地部署

近日,GitHub上开源了一个名为TriAttention的项目,其核心是一种创新的KV(键值)缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时,因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

Read More
2026-04-06 talkingdev

开源|Gemma Gem:首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

近日,GitHub上出现了一个名为Gemma Gem的开源项目,它是一个Chrome浏览器扩展,能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于,它通过新兴的WebGPU API来实现高性能...

Read More
2026-04-05 talkingdev

苹果破例!批准Nvidia外置显卡驱动,Arm架构Mac迎来AI算力新可能

近日,科技界发生了一件颇具象征意义的事件:苹果公司批准了一款允许Nvidia外置显卡(eGPU)在基于Arm架构的Mac电脑上工作的驱动程序。这款驱动并非由Nvidia官方提供,而是来自一家名为Tiny Corp的公司。其最大突破...

Read More
2026-04-05 talkingdev

开源|从零构建GPU:一款寓教于乐的游戏化学习工具

近日,一款名为“MVIDIA”的互动式游戏在技术社区引发广泛关注。该游戏的核心目标是让玩家通过模拟实践,深入理解图形处理器(GPU)的底层架构设计原理。开发者坦言,其创作初衷源于当前市场上系统化、可交互的GPU架构...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page