视频的相关内容 - 漫话开发者

2023-11-30 talkingdev

论文：创新方法增强手语视频隐私保护

DiffSLVA是一种创新的手语视频匿名化方法，可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块，克服了以前的限制，不需要精确的姿势估计。

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...

2023-11-29 talkingdev

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

2023-11-28 talkingdev

Kandinsky Video采用双阶段文本到视频生成技术。首先，它通过关键帧来勾勒视频的故事情节，然后平滑过渡和移动，大大提高了视频质量并降低了计算要求。

2023-11-24 talkingdev

本次大型语言模型介绍将讨论它们是什么，它们的发展方向，与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分，近年来得到了广泛关注和应用。它们的出现...

2023-11-23 talkingdev

Stability AI推出的Stable Video可以生成14帧视频，展示了内容创作的未来方向。该技术可以通过对少量关键帧的学习，生成完整的视频帧。通过这种方式，Stable Video为内容创作者提供了更高效的内容创作方式，并且大大...

2023-11-22 talkingdev

LLaVa是一种从文本模型训练多模型的方法。现在它可以用于视频。基于Vicuna的结果模型非常强大，可以轻松实现视频摘要和字幕的最新表现。

2023-11-20 talkingdev

研究人员发现，大型语言模型在视频问答（VideoQA）中有时会出现错误，这是因为它们过于依赖语言而忽略了实际的视频内容。为了解决这个问题，研究人员引入了一种名为Flipped-VQA的新方法，这种方法使得这些模型更好地...