漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

文本驱动的图像编辑无需蒙版

研究人员开发了一种基于文本提示进行图像编辑的独特方法。这种方法使用文本到图像模型和边界框生成器来识别需要编辑的区域,从而无需蒙版或草图即可进行更改。该方法可实现文本驱动的图像编辑,可以大大提高图像编辑...

Read More
2024-01-09 talkingdev

论文:基于级联扩散模型的文本驱动人体动作合成技术

近日,一种名为GUESS的框架被引入,用于从文本中创建人体动作。该框架将复杂的人体姿态简化为各个层次上的更抽象形式,从而使从文本合成动作更加简洁稳定。

Read More
2023-07-26 talkingdev

TF-ICON:无需训练的文本驱动图像合成新框架开源

最近,一个名为TF-ICON的新技术在GitHub上引起了广泛关注。该方法利用文本来指导将对象无缝集成到不同的图像中,无需进行额外的训练或调整模型。这种方法的独特之处在于使用了一个'卓越提示',能够从真实的图像中精...

Read More