视频技术的相关内容 - 漫话开发者

2024-07-09 talkingdev

论文：从休闲视频中无人监督估计类别级3D姿态

科研人员已经开发出一种新的方法，可以从休闲的，以对象为中心的视频中，无需人类监督就可以估计出类别级的3D姿态。这种新方法的开发，无疑为3D姿态估计领域带来了新的突破。在无人监督的情况下，能够从视频中准确估...

2024-04-16 talkingdev

Adobe正在开发一项人工智能模型，用于生成视频内容，预计将于今年晚些时候集成到Premiere Pro中。该技术将具备添加、移除物体以及生成扩展内容的功能。目前，Adobe正在与第三方供应商合作，并通过对内容凭证的改进，...

2024-03-06 talkingdev

近日，开源Sora计划在GitHub上成立，旨在打造类似OpenAI的文本到视频模型。该计划目前正在构建基础组件，并寻求有兴趣的开源贡献者的帮助。据悉，Sora模型通过将自然语言转化为场景描述，再将其转化为视频，实现了文...

2024-03-01 talkingdev

一篇令人惊叹的论文将视频框架作为人工智能与人类用户交互的一种潜在更好的方法。它展示了视频模型可以用作规划器、代理、计算引擎和环境模拟器。以视频为基础的人工智能可以模拟现实世界，更好地支持人类决策。

2024-01-23 talkingdev

将文本描述转化为视频是当前研究的热门领域，最近几周出现了许多强大的模型。Hugging Face团队的这篇博客概述了这一任务、当前面临的挑战以及研究的现状。虽然不是完全全面的，但对于进一步阅读提供了良好的起点。

2023-10-03 talkingdev

训练优秀的视频模型通常需要巨大的资源，这种需求往往超出了学术界的承受范围。现在，研究人员已经找到了一种方法，只需要使用一台配备八个标准GPU的机器，在一天内就能完成这些模型的训练。这意味着，我们不再需要...