视频的相关内容 - 漫话开发者

2024-01-10 talkingdev

Rabbit R1：AI 助手智能独立设备

Rabbit R1 是一款售价为199美元的独立设备，只有 iPhone 大小一半，由 'Large Action Model' 驱动。它有一个 2.88 英寸的触摸屏、一个用于拍照和录像的旋转摄像头、一个用于导航的滚轮/按钮、128GB 的存储空间和一整...

2024-01-08 talkingdev

ODTrack是一个新的视频追踪系统，改进了我们在视频中跟踪物体的方式。与老旧系统在连接过去和未来的视频帧时存在困难不同，ODTrack使用一种称为'在线令牌传播'的方法来更好地连接连续的视频帧。通过这种方法，ODTrac...

2024-01-02 talkingdev

VideoPoet是一种语言模型，能够从各种各样的条件信号中合成高质量的视频和相应的音频。

2023-12-21 talkingdev

本研究提出了一种深度学习方法，利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸，可实现高精度检测。深度伪造技术已成为一种严重的威胁，对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

2023-12-21 talkingdev

Google的VideoPoet是一种开创性的语言模型，它在处理文本到视频，视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

2023-12-20 talkingdev

最近的一项研究表明，与解码器相比，使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案，显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

2023-12-20 talkingdev

近日，NASA分享了一段视频，详细介绍了其计划向月球发射商业交付服务。目前NASA正在与14家公司合作，将科学技术送到月球表面。NASA计划长期建立一个永久性的月球基地，而商业交付服务将极大地增加可以实现的科学量。...

2023-12-19 talkingdev

视频理解是一个古老的领域，现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能。