漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-22 talkingdev

DragGAN: 交互式图像处理方法

研究人员开发出一种名为 DragGAN 的工具,使用户可以通过拖动图像中的任意点到目标位置来精确修改图像,从而实现姿势、形状、表情和布局的变化。它不仅在创建逼真结果方面表现优异,而且在跟踪变化方面也非常有效,...

Read More
2023-04-28 talkingdev

多视角图像生成中的照片级真实感

新闻内容: - 该研究专注于用于3D相关应用程序(如图像视点编辑)的多视角图像生成。 - 提出的射线调节方法使用几何无关方法生成多视角图像,通过将2D GAN与光场先验相结合,提供了更好的照片级真实感、身份一致性...

Read More
2023-04-20 talkingdev

Lift3D:将2D GAN提升到3D生成辐射场,合成3D训练数据(GitHub仓库)

以下是新闻要点: - Lift3D是一个反向的2D-to-3D生成框架,通过为下游任务提供适应性分辨率和准确的3D注释,解决了基于NeRF的3D GAN的局限性,并提供了逼真的输出。 - 该框架在自动驾驶数据集上进行了评估,展示了...

Read More
2023-04-17 talkingdev

VidStyleODE:神经-常微分方程技术实现视频编辑

新闻摘要: - VidStyleODE结合了StyleGAN和神经-常微分方程技术,实现了视频的分离表征,可以用于外观操作、运动操作、图像动画以及视频插值/外推等应用。 - VidStyleODE使得视频编辑变得更加容易和高效。 - VidSty...

Read More
2023-04-14 talkingdev

****

VidStyleODE让视频编辑更简单 **新闻内容:** VidStyleODE结合StyleGAN和Neural-ODE,实现了视频的分解式表示,可以实现外观操作、动作操作、图像动画和视频插值/外推等应用。 **核心要点:** - VidStyleODE结合了...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4