漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-18 talkingdev

AMD GPU上的多节点大型语言模型训练解析

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台,以优化模型训练的性能和...

Read More
2024-03-18 talkingdev

苹果在最新macOS中移除旧款无线网卡驱动支持,黑苹果面临终结

苹果公司在最新发布的macOS操作系统中,彻底移除了对其最古老型号的无线网络/蓝牙卡的驱动支持。这一举动意味着,使用这些老旧硬件的用户将无法在新的macOS上获得正常的无线网络和蓝牙功能。对于一直依赖这些硬件的...

Read More
2024-03-11 talkingdev

微软或将于本月推出首款'AI PC'

微软即将于3月21日公开展示Surface Pro 10和Surface Laptop 6,这两款电脑将配备最新的神经处理单元,可提升人工智能能力。这些电脑将由英特尔的第11代酷睿处理器提供动力,其内置的AI引擎可提供更快的AI处理速度和...

Read More
2024-03-11 talkingdev

Axolotl开源,本地GPU上训练大模型取得突破

上周,在小型GPU上训练大型模型取得了突破。这个配置展示了如何使用这些技术在消费级硬件上训练Mixtral。

Read More
2024-03-11 talkingdev

谷歌推出 Tensor G4 芯片,将与骁龙 8 代 4 和苹果 A18 Pro 竞争

谷歌即将推出的 Pixel 9 将搭载 Tensor G4 芯片,该芯片设计用于更好的散热和电源管理。虽然 G4 提供了适度的性能提升,但 G5 芯片预计将进一步提高 Pixel 10 系列的硬件和软件整合。

Read More
2024-03-08 talkingdev

AnswerAI开源新微调工具,可在消费级GPU上训练70B参数模型

Answer AI发布了一款新的FSDP/QLoRA训练工具,可在消费级GPU上训练70B参数模型。该公司开源了代码,并使其易于本地运行或在runpod上运行。

Read More
2024-03-08 talkingdev

微软确认3月21日发布会将发布新Surface硬件和Copilot AI

微软将在3月21日的发布会上公布有关Copilot AI,Windows和Surface硬件的消息。虽然微软没有透露任何细节,但外界普遍认为该公司将推出新的Surface设备,并有望展示Copilot AI的最新进展。

Read More
2024-03-07 talkingdev

初创公司在荒野训练LLM模型

Reka的创始人、著名GPU评论家Yi Tay在一篇博客文章中概述了他们在谷歌之外训练极强语言模型的经验。主要的挑战来自于集群和硬件的不稳定性,他们还发现软件的成熟度也是一个挑战。尽管如此,他们还是成功地训练出了...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page