Hazy研究推出全新CUDA内核DSL——ThunderKittens
talkingdev • 2024-05-13
644966 views
Hazy研究团队最新推出一款名为ThunderKittens的CUDA DSL,旨在帮助开发者更简单、更高效地编写CUDA内核。据了解,该团队已经用这款新工具编写了flash attention模块,结果表明其运行速度比原版本快了30%,而且仅需100行代码即可完成。这无疑将大大提高开发者在处理CUDA内核编程时的效率和便捷性,对于深度学习、AI等高性能计算领域具有重要的推动价值。
核心要点
- Hazy研究团队推出新型CUDA DSL——ThunderKittens
- 使用这款工具编写的flash attention运行速度比原版快30%
- ThunderKittens将提高CUDA内核编程的效率和便捷性