漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-18 talkingdev

[开源]DeepSpeed团队推出DeepCompile:基于torch compile的分布式训练加速方案

微软DeepSpeed团队在GitHub开源了DeepCompile项目,通过引入编译技术显著提升分布式训练性能。该项目针对训练过程中的瓶颈操作进行深度优化,采用改进版的torch compile实现算子融合与代码生成,实测可使关键操作获...

Read More
2025-04-17 talkingdev

Stable Diffusion在AMD GPU上实现性能优化

Stability AI与AMD近日宣布,双方已成功针对Radeon显卡及Ryzen AI处理器优化了多款Stable Diffusion模型。这一技术突破显著提升了AMD硬件平台在生成式AI工作负载下的运行效率,实测显示推理速度最高可提升40%。该优...

Read More
2024-11-18 talkingdev

Llama 3.1 405B模型在Cerebras AI加速器上实现高效率

近期,人工智能领域的进步再次迎来了一个重要的里程碑。Llama 3.1 405B,一个领先的大型语言模型,现在在Cerebras AI加速器上运行时,实现了每秒969个令牌的处理速度,这在业界是一个显著的性能提升。Cerebras Infer...

Read More
2024-06-06 talkingdev

英伟达市值突破3万亿美元大关 超越苹果

2024年4月12日,英伟达股价再创历史新高,市值达到3.01万亿美元,成功超越苹果公司成为全球第二大市值公司。英伟达自5月市值突破1万亿美元后,于2月达到2万亿美元。5月份,英伟达公布的净利润高达140亿美元。公司的A...

Read More
2024-04-11 talkingdev

Meta发布新一代AI加速芯片,专注芯片内存与吞吐量提升

Meta公司近日宣布了其人工智能加速器芯片的下一代产品。该芯片的研发重点集中在芯片内存和吞吐量上,采用了128GB的5nm内存和11 TFLOPs的int8吞吐量。这一进步意味着Meta在AI硬件领域的竞争力得到了显著增强。新一代A...

Read More
2024-04-09 talkingdev

微软Arm架构Windows笔记本有望超越苹果M3芯片性能

微软计划于5月20日在西雅图举行的活动上展示其对AI PC的愿景。公司对新款Arm架构Windows笔记本充满信心,认为其将在CPU性能和AI加速任务方面超越苹果搭载M3芯片的MacBook Air。这些笔记本将搭载高通的Snapdragon X E...

Read More
2024-04-05 talkingdev

特斯拉提高AI工程师薪酬以抵御人才挖角

特斯拉首席执行官埃隆·马斯克近日宣布,为了应对来自OpenAI等竞争对手的人才挖角,公司将提高AI工程师的薪酬。此举反映出科技企业之间对AI人才的激烈争夺。AI技术是现代科技发展的关键领域,对于推动公司创新和业务...

Read More
2024-01-08 talkingdev

英特尔称Gaudi 2芯片超越A100

英特尔推出的新芯片在多个平台和本地部署中可用,具有出色的训练吞吐量、浮点运算次数和解码带宽。英特尔的新型AI加速卡Gaudi 2在性能上超越了Nvidia的A100。该芯片采用Intel的海湾科技,这是一种可扩展的、可重复使...

Read More
  1. Next Page