漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-06 talkingdev

论文:增强视觉-语言零样本学习技术提升AI性能

这项研究提出了一种通过关注细节和关键词来改进AI对图像文本任务的理解的技术,提高了性能,特别是在面对未知情况时。

Read More
2023-07-03 talkingdev

Casetext获得6.5亿美元,MosaicML获得13亿美元,大规模的AI融资轮使生成AI迎来美好的一周

这篇文章共享了关于Casetext的深入见解,它是一个花了十年时间才取得成功的一夜爆红案例,这篇文章展示了人工智能的变革性能量以及在机会来临时,必须要抓住机会的重要性。

Read More
2023-06-29 talkingdev

Salesforce开源新的70亿语言模型

Salesforce发布了一组新的语言模型,该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练,参数量为70亿。与目前许多开源模型如MPT或Falcon相比,这些模型具有更好或相当的性能。此外,它...

Read More
2023-06-20 talkingdev

基于文本指令的图像编辑大规模数据集发布

MAGICBRUSH是一个独特的、大规模的数据集,可帮助通过文本指令进行图像编辑,改进了过去容易出错且需要大量手动调整的方法。MAGICBRUSH包含超过10,000个图像及其文本指令的示例,已用于训练InstructPix2Pix图像编辑...

Read More
2023-06-05 talkingdev

谷歌推出生成式AI课程

## 新闻内容: - 虽然这个领域正在快速发展,但生成式机器学习的基础已经相当稳固。 - 这个由9部分组成的课程涵盖了很多内容,适合对该领域感兴趣的人学习。 - 最终目标是将新用户引入他们的ML云产品Vertex。即使如...

Read More
2023-05-30 talkingdev

Nvidia展示新技术,让你用自己的声音与AI游戏角色交流

Nvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...

Read More
2023-05-12 talkingdev

用AI和素描创造更好的视频内容

近日,有一篇论文介绍了一种使用人工智能(AI)和文本生成视频内容的新方法。这种方法将两种技术——Text-to-Video Zero和ControlNet结合在一起,可以创建高质量的、与用户意图非常接近的一致性视频,多次实验证明其效...

Read More
2023-04-28 talkingdev

TextDeformer:使用文本引导进行几何形变

该研究介绍了一种技术,可以根据文本提示自动变形三角网格,利用可微分渲染和预训练图像编码器,如CLIP和DINO。通过使用雅可比矩阵进行网格变形表示,该方法实现了平滑变形,并避免了噪声梯度,从而实现了大的形状变...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20