SCALE的相关内容 - 漫话开发者

2024-02-29 talkingdev

Databricks、Anyscale和微软的十大AI见解

本文报道了对AI领域前沿公司的创始人的采访，涵盖了他们对AGI到来的看法，如何思考LLMs以及创始人在产品中如何处理AI的简单策略。

2024-02-29 talkingdev

据悉，字节跳动开发了一种名为 MegaScale 的系统，可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型，达到了 55.2% 的模型 FLOPs 利用率，相当惊人。此外，字节跳动...

2024-02-06 talkingdev

近日，一家名为SellScale的初创公司推出了一款名为SellScale的新产品，旨在帮助销售人员更好地管理和优化销售电子邮件。 SellScale是一款基于AI技术的产品，可为用户提供即时反馈，以帮助他们改进电子邮件的效果。通...

2023-10-16 talkingdev

研究人员使用预训练的扩散模型在较小的图像上进行训练，以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题，并将问题指向了模型结构的有限感知能力。

2023-10-16 talkingdev

将模型从云存储加载到节点GPU通常需要大部分推理时间。通过一些巧妙的技巧，例如内存流，Anyscale将其缩短了20倍，仅需30秒即可到达Llama 2 70B。

2023-09-22 talkingdev

稳定扩散是一种复杂的技术，其可大幅度提高生成质量，而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架，其独特的...

2023-09-20 talkingdev

Anyscale近日发布了Endpoints，这是一种允许开发者使用流行的LLM API将快速、高效、可扩展的LLM集成到他们的应用程序中的工具。同时，该公司还宣布了与NVIDIA的新整合，以提升在Ray上的LLM的性能和开发，Ray是Anysca...

2023-09-08 talkingdev

在人工智能的淘金热潮中，各公司纷纷加快现代化数据基础设施的步伐。许多数据领导者开始关注语义层，以便将适合人工智能的数据直接交给决策者。在这份最新出炉的报告中，GigaOm的分析师们识别了关键趋势和领先玩家。...