漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-19 talkingdev

Vision Pro体验月记:AR/VR/MR技术的未来之路

尽管AR/VR/MR技术尚未大规模进入市场,仍处于S曲线的起始阶段,Vision Pro的组件距离适应Quest 3的尺寸、重量和价格还有数年之遥。Vision Pro本质上是一个高度完善的原型或开发工具包,而非面向消费者的成品。虽然这...

Read More
2024-03-18 talkingdev

AMD GPU上的多节点大型语言模型训练解析

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台,以优化模型训练的性能和...

Read More
2024-03-18 talkingdev

Cappy:小型评分器如何超越大型多任务语言模型

Cappy是一款小型模型,专门设计用于接收指令和候选完成,然后为完成度打分,以衡量其完成指令的程度。在这项任务上,Cappy的表现超越了许多更大的模型,这表明它可能作为训练和生成过程中的一个反馈机制。Cappy的成...

Read More
2024-03-18 talkingdev

VR头盔逼近眼睛分辨率极限

下一代增强现实、混合现实和虚拟现实头盔的关键在于极高像素密度。更多像素意味着更逼真的视觉效果和更小、更紧凑的显示器。在此规模上构建显示器会导致独特的技术难题,行业仍在努力克服。本文探讨了该领域的技术发...

Read More
2024-03-13 talkingdev

基于Mamba的DNA序列模型

最近,一种基于Mamba竞争对手的DNA序列预测模型被开发出来。这个模型不仅非常高效,而且拥有强大的预测能力,而且模型规模非常小。目前,该模型已经在DNA测序领域得到了广泛的应用。

Read More
2024-03-13 talkingdev

Meta建设GenAI基础设施

本文介绍了Meta的两个版本的24,576 GPU数据中心规模集群的详细信息。这些集群支持公司当前和下一代AI模型以及GenAI和其他领域的AI研究和开发。Meta的长期愿景是建立一种人工智能,这种人工智能是开放的,建立在可负...

Read More
2024-03-12 talkingdev

Covariant推出ChatGPT,为机器人构建LLM

Covariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...

Read More
2024-03-08 talkingdev

深入探讨:大规模模型训练的并行化技术

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术,以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术,并详细讨论了它们的优缺点。...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page