漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-07 talkingdev

GGML推出,以纯C语言框架降低本地运行成本

GGML以纯C语言编写的框架,让用户可以在MacBook电脑上轻松运行大型语言模型,这种模型通常在本地运行成本较高。目前,这一框架主要被业余爱好者使用,但在企业模型部署方面也有广泛的应用前景。 核心要点: - GGML...

Read More
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3