漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
2023-06-19 talkingdev

百万上下文窗口背后的秘密武器

本文讨论了几种加速大型语言模型(LLM)训练和推理的技术,以使用高达100K个输入令牌的大上下文窗口。这些技术包括:ALiBi位置嵌入,稀疏注意力,闪电注意力,多查询注意力,条件计算以及使用80GB的A100 GPU

Read More
2023-06-19 talkingdev

以低廉的价格运行A100

Nvidia A100是市场上最强大的GPU之一。它们已被用于训练迄今为止最流行的模型之一。它们是数据中心的GPU,通常意味着您无法在自己的硬件上运行它们。本文探讨了如何以几千美元的价格自己组装一个本地运行的A100超级...

Read More
2023-06-19 talkingdev

字节跳动订购10亿美元的GPU

这家中国巨头已经从NVIDIA购买了约10万个GPU,用于不同的人工智能项目。这些订单是在对GPU出口进行监管限制之前下达的。这是又一家通过计算能力增强其人工智能努力的公司。

Read More
2023-06-14 talkingdev

AMD发布新的人工智能芯片挑战Nvidia的主导地位

AMD推出的MI300X人工智能GPU将于今年秋季后期提供样片,并在明年开始大量出货。目前,Nvidia在AI芯片市场上占据着超过80%的市场份额。尽管AMD尚未披露芯片的价格,但其发布可能会对Nvidia的GPU造成压力,Nvidia的GPU...

Read More
2023-06-14 talkingdev

为AI初创企业提供2K H100 GPU

据报道,一些知名天使投资者为初创企业建立了一个巨大的计算机集群,以便其用于训练模型。该集群提供了2K H100 GPU。 ## 内容要点: 以下是该新闻的三个核心要点: - 一些知名天使投资者为初创企业建立了一个计算...

Read More
2023-05-30 talkingdev

新款100TB GPU系统发布!

近日,全新的DGX系统面世了!节点之间的NVLink连接创造了一个由256个Grace CPU(每个CPU拥有480GB的LPDDR5内存)和256个Hopper GPU(每个GPU拥有96GB的HBM3内存)组成的系统。每个GPU可以以900Gbps的速度直接访问任...

Read More
2023-05-26 talkingdev

Nvidia股票大涨28%:AI芯片繁荣全面到来

## 新闻概要: - Nvidia股票在周四猛涨28%,这标志着AI芯片繁荣的全面到来。 - 这一消息表明,市场对AI芯片的需求在不断增加。 - Nvidia是全球领先的人工智能公司,其GPU芯片是训练和运行深度学习算法的最佳选择。...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page