漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-17 talkingdev

Prime Intellect开源Intellect 2分布式训练框架,32B网络实现强化学习推理

人工智能研究机构Prime Intellect近日取得重大突破,成功通过完全分布式的方式训练了一个参数量高达320亿(32B)的神经网络模型,并创新性地结合强化学习技术提升模型的推理能力。值得关注的是,该团队已将其核心训...

Read More
2025-04-16 talkingdev

[开源]OpenAI开源其FP4与MoE核心算子至Triton语言项目

OpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...

Read More
2025-03-20 talkingdev

Zoom的AI进化:从基础会议工具到基于LLMs和SLMs的智能生产力平台

Zoom正通过开发一套自主AI基础设施,将其业务从视频会议扩展到行动导向的工作流程。这一创新包括AI Companion 2.0,它提供了任务管理和文档创建等功能,以及通过新的AI Studio定制的AI代理。Zoom采用联合方法,将公...

Read More
2025-02-26 talkingdev

Google Cloud推出首款Blackwell AI GPU驱动的A4X实例

Google Cloud近日发布了由Nvidia GB200 NVL72系统驱动的A4X虚拟机实例,该实例配备了72个B200 GPU和36个Grace CPU,专为大规模AI和高并发应用设计。A4X实例的训练效率是前代A3实例的四倍,并且与Google Cloud服务无...

Read More
2025-02-25 talkingdev

DeepSeek开源MLA核心框架FlashMLA,推动AI基础设施创新

近日,DeepSeek宣布开源其内部基础设施的一部分,首推MLA(机器学习加速)核心框架FlashMLA。这一开源项目已在GitHub上发布,旨在为开发者提供高效、灵活的机器学习加速工具。FlashMLA通过优化计算资源分配和任务调...

Read More
2024-04-27 talkingdev

英伟达斥资7亿美元收购AI负载管理初创公司Run:ai

英伟达近日宣布,将以约7亿美元的价格收购AI基础设施优化公司Run:ai,以增强其DGX云AI平台的性能,让客户能更好地管理他们的AI工作负载。此次收购将有助于支持跨多个数据中心位置的复杂AI部署。Run:ai此前曾获得风险...

Read More
2024-04-11 talkingdev

谷歌AI基础设施引领企业转型浪潮

谷歌凭借其在人工智能领域的深度投资,不仅帮助客户训练和部署前沿的语言模型,更使得公司站在了AI平台变革的前沿。本文深入探讨了谷歌的基础设施如何助力企业转型,以及这对谷歌竞争力的意义。尽管谷歌可能需要转变...

Read More
2024-04-04 talkingdev

AI基础设施解析:支撑人工智能发展的关键技术

AI基础设施是部署和扩展AI技术的基础,它由GPU、专业软件和云服务构成。GPU作为AI计算的核心,提供了强大的并行处理能力,使得机器学习和深度学习算法得以高效运行。专业软件则为AI开发提供了必要的工具和库,简化了...

Read More
  1. Next Page