Hazy研究团队最新推出一款名为ThunderKittens的CUDA DSL,旨在帮助开发者更简单、更高效地编写CUDA内核。据了解,该团队已经用这款新工具编写了flash attention模块,结果表明其运行速度比原版本快了30%,而且仅需10...
Read MoreGPU供应商Coreweave近期完成了11亿美元的融资,使得该公司估值达到了惊人的190亿美元。Coreweave是一家专注于租赁超级集群的公司,为各种行业提供高性能计算解决方案。此次融资对于Coreweave的发展无疑是一大利好,...
Read MoreJEDEC(电子设备行业协会)已经发布了DDR5内存规格,其中包括DDR5-6400和DDR5-8400等速率级别,最高速率可达8800MT/S。同时,DDR5规格还增加了抗Rowhammer特性,这是一种攻击DDR内存的技术。DDR5内存将在未来几年内...
Read MoreLambda公司近日宣布,已获得5亿美元的特别债务融资,用于扩大其GPU云服务。此前,Lambda在年初已经完成了2.3亿美元的C轮融资。该扩张计划预计将进一步增强Lambda在GPU云计算市场的影响力,为客户提供更加强大的计算...
Read More1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...
Read MoreCerebras公司近日推出了其最新款的CS3晶圆芯片,该芯片具备训练高达24T参数语言模型的能力。CS3芯片的发布,标志着在人工智能领域对高性能计算芯片的需求得到了进一步的满足。这款芯片原生支持PyTorch,使得开发者能...
Read More由英特尔、谷歌、ARM、高通、三星等科技公司组成的统一加速(UXL)基金会,正在开发开源软件,旨在避免AI开发者受限于英伟达的专有技术。这一举措意味着,未来AI开发将有更多的选择,不必完全依赖英伟达的生态系统。...
Read More在近日举行的英伟达年度GPU技术大会上,公司创始人兼首席执行官黄仁勋发表了主题演讲。本次演讲重点介绍了英伟达最新的技术进展和未来展望。黄仁勋强调了英伟达在人工智能、深度学习以及高性能计算等领域的领先地位...
Read More