规模的相关内容 - 漫话开发者

2024-03-19 talkingdev

Vision Pro体验月记：AR/VR/MR技术的未来之路

尽管AR/VR/MR技术尚未大规模进入市场，仍处于S曲线的起始阶段，Vision Pro的组件距离适应Quest 3的尺寸、重量和价格还有数年之遥。Vision Pro本质上是一个高度完善的原型或开发工具包，而非面向消费者的成品。虽然这...

2024-03-18 talkingdev

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台，以优化模型训练的性能和...

2024-03-18 talkingdev

Cappy是一款小型模型，专门设计用于接收指令和候选完成，然后为完成度打分，以衡量其完成指令的程度。在这项任务上，Cappy的表现超越了许多更大的模型，这表明它可能作为训练和生成过程中的一个反馈机制。Cappy的成...

2024-03-18 talkingdev

下一代增强现实、混合现实和虚拟现实头盔的关键在于极高像素密度。更多像素意味着更逼真的视觉效果和更小、更紧凑的显示器。在此规模上构建显示器会导致独特的技术难题，行业仍在努力克服。本文探讨了该领域的技术发...

2024-03-13 talkingdev

最近，一种基于Mamba竞争对手的DNA序列预测模型被开发出来。这个模型不仅非常高效，而且拥有强大的预测能力，而且模型规模非常小。目前，该模型已经在DNA测序领域得到了广泛的应用。

2024-03-13 talkingdev

本文介绍了Meta的两个版本的24,576 GPU数据中心规模集群的详细信息。这些集群支持公司当前和下一代AI模型以及GenAI和其他领域的AI研究和开发。Meta的长期愿景是建立一种人工智能，这种人工智能是开放的，建立在可负...

2024-03-12 talkingdev

Covariant推出了RFM-1，旨在通过利用其Brain AI平台的大规模数据收集，为机器人语言构建大型语言模型，提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用，为机器人开启新的聊天界面。ChatGPT将有...

2024-03-08 talkingdev

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术，以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术，并详细讨论了它们的优缺点。...