漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-12 talkingdev

bitsandbytes发布4位推理,实现AI模型精度与速度的突破

AI模型包含许多参数,它们在计算机中以十进制数字的形式表示。这些数字的精度决定了它们的准确度和占用的空间大小。如果将精度从32位降低到16位,将会大幅提高运行速度。现在,我们可以将精度降低到4位,从而在一些...

Read More
2023-07-10 talkingdev

扩展AI的记忆:专注Transformer(GitHub Repo)

该研究介绍了一种新的技术,专注变压器,这种技术可以帮助AI模型在处理大量数据的情况下,记住并专注于相关的信息。该方法改进了AI如何理解和使用长篇的文本,他们在OpenAI的模型上的测试显示了这一点。专注变压器的...

Read More
2023-06-23 talkingdev

FlagAI:快速、易用且可扩展的大规模通用人工智能模型工具包开源

FlagAI(Fast Large-scale General AI models)是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库,用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

Read More
2023-06-23 talkingdev

人被聘来训练AI,再将人的工作外包给AI

一项新研究发现,训练AI模型的人员中有很大一部分可能正在将这项工作外包给AI,这引发了人们对这个已经容易出错领域中可能出现更多错误的担忧。

Read More
2023-06-22 talkingdev

探讨AI训练的巨大工作量

本文讨论了训练人工智能的无形劳动力。这些工人被称为数据标注员,他们负责标注用于训练AI模型的数据。这项工作通常是重复而低薪的,但对于AI的发展至关重要。

Read More
2023-06-21 talkingdev

需要去重大量数据吗?

AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中,数据去重往往非常重要。对于文本而言,目前尚不清楚它是否同样重要。然而,无论如何,本博客介绍了用于去重文本样式数据的技术。

Read More
2023-06-19 talkingdev

Meta计划提供免费的商业AI模型

Meta计划提供免费的商业AI模型,这是一个战略性举措,可能会对其竞争对手Google和OpenAI施加压力。Meta希望通过使AI更易于开发者使用来使其商品化,这可能会使Google和OpenAI难以保持竞争优势。

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page