漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

当GPT-3.5的成本低于Llama 2时

talkingdev • 2023-08-01

1197220 views

训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本,并且受到不同计算资源的瓶颈制约。因此,某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵。这篇博客写得非常优雅,围绕模型部署考虑问题有一些非常好的工程技巧。

核心要点

  • 训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本
  • 某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵
  • 这篇博客围绕模型部署考虑问题有一些非常好的工程技巧

Read more >