漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-22 talkingdev

Wanda:一种用于大型语言模型的新剪枝方法(GitHub仓库)

该仓库介绍了Wanda,一种通过选择性地丢弃不太重要的网络权重来减少大型语言模型复杂性的独特方法。与其他方法不同,Wanda无需重新训练或大量计算,能够在保持性能的同时实现有效的模型剪枝。

Read More