漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-26 talkingdev

Google、Weizmann科学研究所和特拉维夫大学展示Lumiere,用于逼真的AI视频的时空扩散模型

Google、Weizmann科学研究所和特拉维夫大学推出了Lumiere,这是一种用于逼真视频生成的时空扩散模型,相对于现有的AI视频模型,它承诺更连贯的运动和更高的质量。目前尚未公开测试。

Read More
2024-01-25 talkingdev

SyncTalk:创造有真实感的人物形象

SyncTalk是逼真的人物形象中的突破。它克服了以往在同步面部身份、唇部运动和表情方面遇到的挑战。SyncTalk使用最新的深度学习技术,通过从少量的样本中学习,以逼真的方式生成高质量的人物形象。 SyncTalk可以应用...

Read More
2024-01-25 talkingdev

Lumiere-谷歌AI视频生成器能够将可爱的动物放入不同场景中

Lumiere是一款使用时空扩散模型进行逼真视频生成的AI视频生成器。它使用的Space-Time U-Net架构可以一次性生成整个视频的时间持续时间。它旨在处理视频中物体的位置以及物体如何移动和变化。Lumiere可以执行文本到视...

Read More
2024-01-23 talkingdev

论文:BriVIS开放词汇视频实例分割

研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。

Read More
2024-01-23 talkingdev

OMG-Seg全能图像和视频分割模型

OMG-Seg是一种新的模型,可以使用单个高效的系统执行各种图像和视频分割任务。与使用每个任务的不同模型的传统方法不同,OMG-Seg从图像语义到交互式视频分割处理所有内容,是一个一站式解决方案,降低了复杂性并增强...

Read More
2024-01-23 talkingdev

深度解析文本到视频技术原理

将文本描述转化为视频是当前研究的热门领域,最近几周出现了许多强大的模型。Hugging Face团队的这篇博客概述了这一任务、当前面临的挑战以及研究的现状。虽然不是完全全面的,但对于进一步阅读提供了良好的起点。

Read More
2024-01-23 talkingdev

为什么伊隆·马斯克需要MrBeast

上周,MrBeast在X上发布了一个视频,旨在测试该平台上的视频广告收入。该视频获得了超过1.5亿的观看次数,并赚取了26万美元的广告收入。虽然该视频表现出色,但MrBeast指出广告商专门购买广告运行在他的视频上,使他...

Read More
2024-01-21 talkingdev

自动化流程Agent让博客转视频播客

Nathan Lambert最近发布了Interconnect Tools,它允许您使用文本转语音、图像合成和整个工作流程自动化他的多模式博客流程。它允许创作者专注于写作,而工具将事物格式化为易于消费的媒体,以便他们的受众。此工具可...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page