漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-03 talkingdev

Casetext获得6.5亿美元,MosaicML获得13亿美元,大规模的AI融资轮使生成AI迎来美好的一周

这篇文章共享了关于Casetext的深入见解,它是一个花了十年时间才取得成功的一夜爆红案例,这篇文章展示了人工智能的变革性能量以及在机会来临时,必须要抓住机会的重要性。

Read More
2023-06-29 talkingdev

3D-Speaker:一个庞大的语音数据集

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...

Read More
2023-06-26 talkingdev

AI生成图像的单一图像编辑方案:解开图像编辑的离散化之道

学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而,现在,借助开源扩散模型,我们可以利用文本标记的力量来解开图像中的对象,实现对AI生成图...

Read More
2023-06-23 talkingdev

FlagAI:快速、易用且可扩展的大规模通用人工智能模型工具包开源

FlagAI(Fast Large-scale General AI models)是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库,用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

Read More
2023-06-20 talkingdev

基于文本指令的图像编辑大规模数据集发布

MAGICBRUSH是一个独特的、大规模的数据集,可帮助通过文本指令进行图像编辑,改进了过去容易出错且需要大量手动调整的方法。MAGICBRUSH包含超过10,000个图像及其文本指令的示例,已用于训练InstructPix2Pix图像编辑...

Read More
2023-06-17 talkingdev

{

"title": "Apple发布Vision Pro虚拟现实设备,引发行业关注", "content": "虽然现在我们已经有了远远超越原型或概念验证的实用虚拟现实设备,但我们尚未看到大规模市场采用。未来虚拟现实设备将会变得更好,但现...

Read More
2023-06-15 talkingdev

SoViT:一种更高效的视觉转换器

**研究团队最新发布的技术论文介绍了SoViT,这是一种针对大小和形状进行了优化的视觉转换器,使用先进的缩放方法,其性能与更大的模型相当,但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

Read More
2023-06-15 talkingdev

开源代码模型击败ChatGPT在编码任务中(GitHub Repo)

近日,一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大,是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳,因为它们无法从大规模的代码预训练中获得推理能力...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page