漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-11 talkingdev

FlashAttention-3: 异步和低精度实现快速准确的注意力机制

近日,由香港中文大学、清华大学等机构的研究人员提出了一种新的注意力机制模型——FlashAttention-3。相较于传统的注意力机制,FlashAttention-3 实现了异步和低精度计算,从而实现了在保证准确度的同时,大幅提高了...

Read More
2024-03-21 talkingdev

矩阵乘法新突破,清华与伯克利联手推动理想计算

清华大学与加州大学伯克利分校的研究团队在矩阵乘法领域取得了重大突破,提出了一种创新技术,该技术已经激发了进一步的优化。这一在核心计算操作上的进步,可能在各种应用中带来显著的时间、能源和成本节省。自2010...

Read More