现代变压器模型在处理数据时,每个数据单元都使用相同的预测计算量,但事实上,不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制,允许模型在生成过程中根据数据单元的难易程度提前退出,从而减少...
Read More英伟达在其开发者大会上宣布了新一代人工智能芯片及软件。这款名为Blackwell的AI图形处理器预计将于今年晚些时候出货。同时推出的NIM软件旨在简化AI的部署过程。英伟达力求通过NIM软件使得所有模型能够在其所有GPU上...
Read More适应性计算是一种模型可以选择对于给定任务应使用多少计算(例如,使用多少参数)的理念。这可能包括基于搜索的采样方法或专家模型的混合。这个阅读清单正在积极维护并且非常详尽。适应性计算的概念更新迅速,这个阅...
Read More