漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

论文:从休闲视频中无人监督估计类别级3D姿态

科研人员已经开发出一种新的方法,可以从休闲的,以对象为中心的视频中,无需人类监督就可以估计出类别级的3D姿态。这种新方法的开发,无疑为3D姿态估计领域带来了新的突破。在无人监督的情况下,能够从视频中准确估...

Read More
2024-04-16 talkingdev

Adobe研发AI生成视频技术,即将集成至Premiere Pro

Adobe正在开发一项人工智能模型,用于生成视频内容,预计将于今年晚些时候集成到Premiere Pro中。该技术将具备添加、移除物体以及生成扩展内容的功能。目前,Adobe正在与第三方供应商合作,并通过对内容凭证的改进,...

Read More
2024-03-06 talkingdev

开源Sora计划启动,旨在打造类似OpenAI的文本到视频模型

近日,开源Sora计划在GitHub上成立,旨在打造类似OpenAI的文本到视频模型。该计划目前正在构建基础组件,并寻求有兴趣的开源贡献者的帮助。据悉,Sora模型通过将自然语言转化为场景描述,再将其转化为视频,实现了文...

Read More
2024-03-01 talkingdev

论文:视频框架成为现实决策的新语言

一篇令人惊叹的论文将视频框架作为人工智能与人类用户交互的一种潜在更好的方法。它展示了视频模型可以用作规划器、代理、计算引擎和环境模拟器。以视频为基础的人工智能可以模拟现实世界,更好地支持人类决策。

Read More
2024-01-23 talkingdev

深度解析文本到视频技术原理

将文本描述转化为视频是当前研究的热门领域,最近几周出现了许多强大的模型。Hugging Face团队的这篇博客概述了这一任务、当前面临的挑战以及研究的现状。虽然不是完全全面的,但对于进一步阅读提供了良好的起点。

Read More
2023-10-03 talkingdev

视频模型高效训练,仅需一台机器和八个标准GPU

训练优秀的视频模型通常需要巨大的资源,这种需求往往超出了学术界的承受范围。现在,研究人员已经找到了一种方法,只需要使用一台配备八个标准GPU的机器,在一天内就能完成这些模型的训练。这意味着,我们不再需要...

Read More