漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-11 talkingdev

全新视频标记化工具MAGVIT-v2:提升视觉生成的重要武器

近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...

Read More
2023-09-30 talkingdev

RealFill:使用扩散模型进行图像修复

RealFill是一个使用扩散模型进行图像修复的新算法。相比于传统的图像修复算法,RealFill能够更好地处理大尺寸的图像,并且修复后的图像质量更高。该算法基于扩散过程来填充缺失的像素。扩散过程考虑了像素之间的相关...

Read More
2023-09-28 talkingdev

RL在扩散模型上的应用库

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在,这将通过扩散模型以及DRLX的发布变得更加容易,DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现,为AI技术...

Read More
2023-09-21 talkingdev

丰田研究所正在开发一种新方法,让机器人在一夜之间学会新技能

丰田研究所(TRI)正在展示其在研究进展中如何在一夜之间教授机器人新技能。TRI运用传统的机器人学习技术和类似于生成AI模型的扩散模型。其系统已经针对60种技能进行了训练,主要关注在不同环境中的多功能性,目标是制...

Read More
2023-09-11 talkingdev

利用2D扩散概率模型雕刻3D人体模型

如果使用扩散模型生成包含距离和形状信息的2D法线图,然后使用3D重建算法,就可以利用底层身体模型生成逼真的3D人体化身。这对于合成化身和角色创建非常有用。扩散模型和3D重建算法的结合开启了一种全新的人体模型生...

Read More
2023-09-04 talkingdev

modular-diffusion:一种使用PyTorch设计和训练自定义扩散模型的简单API

模块化扩散是一种易于使用的模块化API,可用于设计和训练自定义扩散模型。这款API基于PyTorch构建,为用户提供了一种灵活的方式,可根据需要进行定制和优化,从而实现在各种需求场景下的模型训练。由于其模块化的设...

Read More
2023-08-30 talkingdev

论文:利用扩散模型提升安全性:DiffSmooth模型稳健新纪元

科研人员正在探索一种名为“扩散模型”的新方法,以增强已进行训练的模型的强度。这种新方法被命名为“DiffSmooth”,通过使用扩散清理数据,然后利用特殊的平滑过程让模型变得更加可靠。这一创新方法的提出,意味着我们...

Read More
2023-08-24 talkingdev

OneDiffusion:使扩散模型部署更简单可扩展

在生产环境中部署扩散模型一直是一个挑战,因为这些模型难以处理,且计算成本高。但是现在,OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目,它的目标是使扩散模型在...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page