漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-26 talkingdev

TF-ICON:无需训练的文本驱动图像合成新框架开源

最近,一个名为TF-ICON的新技术在GitHub上引起了广泛关注。该方法利用文本来指导将对象无缝集成到不同的图像中,无需进行额外的训练或调整模型。这种方法的独特之处在于使用了一个'卓越提示',能够从真实的图像中精...

Read More
2023-06-06 talkingdev

无需提示的扩散,文本转图像更进一步 (GitHub仓库)

最近,研究人员在文本转图像(T2I)领域中推出了一种新的方法,称之为“无需提示的扩散”。这种系统只依靠视觉输入生成图像,无需任何文本提示。其利用了一种称为“语义上下文编码器(SeeCoder)”的独特结构来解释参考...

Read More
2023-04-20 talkingdev

新技术来袭:文本转换为视频合成进入新时代

以下是本篇新闻的三个核心要点: - 最近在图像合成方面取得的进展是通过使用“潜在扩散”来实现的,这样合成就可以在较小的空间内完成,既节省成本又保持高质量的生成。 - 现在这种技术也可以应用于视频生成领域。通...

Read More
2023-04-14 talkingdev

DreamPose:通过稳定扩散实现时尚图像到视频合成

新闻内容: 通过DreamPose,我们可以实现以下三点核心功能: - DreamPose是基于扩散的图像到视频合成模型。 - 通过输入一个人物的图像和姿势序列,DreamPose可以合成一个逼真的视频,展示出输入人物按照姿势序列的...

Read More
  1. Prev Page