漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Soundini:自然视频编辑的声音引导扩散技术

talkingdev • 2023-04-18

1499813 views

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有技术,生成与声音特性相对应的逼真视觉效果。 - Soundini为自然视频编辑提供了一种有效的声音引导扩散技术,可用于音乐视频、电影等领域,有望提高视频编辑效率和质量。 *注:以上为三个核心要点的摘要,详情可阅读原文。*