最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...
Read More近日,AI系统Vlogger在GitHub上推出了自己的仓库,为用户提供分钟级别的视频博客制作服务。Vlogger的制作流程分为四个阶段:脚本、演员、节目制作和配音,每个阶段都代表着视频制作的不同方面。用户只需要向Vlogger...
Read MoreAnimateAnyone 是一款非常优秀的视频控制模型,它接受图像和骨架动作作为输入,然后将人物动画应用到控制图像上。这个开源仓库是对这项工作的复现,它实现了 AnimateAnyone 的主要功能,并在开发者社区中广受好评。
Read More埃隆·马斯克分享了特斯拉的Optimus人形机器人叠衬衫的视频。该项目自特斯拉AI Day 2022展示了一个早期的原型机后,已经取得了长足的进展。特斯拉的目标是最终将机器人放在人们的家中执行各种任务,但首先计划将其放...
Read MoreSwarovski推出了一款AI智能双筒望远镜,能够识别9000多种鸟类和野生动物,同时还能拍摄照片和视频。这个智能双筒望远镜内置了AI算法,可以对拍摄的图像进行分析和识别,从而快速准确地识别出目标物体。这款智能双筒...
Read MoreeTH(Electric Transformer House)是一款可扩展的豪华迷你住宅,拥有400平方英尺的居住空间、太阳能电池板等多项功能。该房车拥有豪华的内饰、智能科技以及清洁能源供离网能力使用。它配备了美食厨房、宽敞的客厅和...
Read MoreRabbit推出了一款大型行动模型(LAM),可与其R1口袋伴侣电脑搭配使用。该公司的R1设备是计算机和智能手机的重新构想,几乎完全由其LAM驱动。
Read More研究人员开发出一种人脸视频编辑架构,该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色,通过保持一致的视角和帧之间的无缝转换来实现。
Read More