漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-07 talkingdev

Video2Music开源,为视频生成量身定制的音乐

Video2Music的AI框架利用独特的数据集和经过用户研究验证的转换器模型为视频生成情感上相符的音乐。

Read More
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More
2023-08-25 talkingdev

论文:谷歌新推视频生成基准测试工具,助力自动视频生成领域研究

自动视频生成作为一个新兴的研究领域,已经引起了广泛的关注。其中,故事延续、故事混搭等任务的衡量标准十分复杂。谷歌最新推出的视频生成基准测试工具,希望能帮助这一领域取得进一步的进展。通过这个基准测试,研...

Read More
2023-07-04 talkingdev

文本生成无缝视频方案开源

本论文提出了一种新的方法,用于从文本生成一致且高质量的视频。它通过使用经过调整的图像模型创建关键帧,然后利用特殊的匹配和混合技术将这些样式传播到整个视频中,从而产生外观出色且流畅的视频。

Read More
2023-05-03 talkingdev

科技新闻:实时照片真实肖像头像生成器

近日,研究人员开发出一种名为StyleAvatar的新方法,能够生成高保真的人像头像,并且能够控制表情变化。该方法采用了不同的网络组合,并结合了新的技术,如滑动窗口增强方法和预训练策略,生成了高质量的人像视频,...

Read More
2023-04-20 talkingdev

新技术来袭:文本转换为视频合成进入新时代

以下是本篇新闻的三个核心要点: - 最近在图像合成方面取得的进展是通过使用“潜在扩散”来实现的,这样合成就可以在较小的空间内完成,既节省成本又保持高质量的生成。 - 现在这种技术也可以应用于视频生成领域。通...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5