漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-29 talkingdev

Valeo AI推出VaViM和VaVAM:生成式视频模型革新自动驾驶轨迹预测

Valeo AI最新发布了两项突破性技术:VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术,实现了对连续视频帧的高精度建模;而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

Read More
2025-04-28 talkingdev

Character.AI发布AvatarFX:AI视频模型可生成逼真聊天机器人

Character.AI近日推出了一款名为AvatarFX的视频生成模型,该技术能够为AI生成的角色赋予动画效果,并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力,但其可能被滥用于制作深度伪造(deepfake)视频的隐患也...

Read More
2025-03-31 talkingdev

[开源]Mobile-VideoGPT:轻量级多模态视频模型,参数不足10亿却支持边缘设备实时推理

近日,GitHub上开源了一个名为Mobile-VideoGPT的轻量级多模态视频模型,其参数量不足10亿(1B),却通过创新的双视觉编码器和令牌剪枝技术,实现了在边缘设备上的实时推理能力。这一突破性进展为移动端和物联网设备...

Read More
2025-03-13 talkingdev

Flat Color LoRA 模型发布,推动 Wan 视频模型技术革新

近日,Flat Color LoRA 模型在 Hugging Face Hub 上正式发布,这一模型的推出为 Wan 视频模型技术注入了新的活力。LoRA(Low-Rank Adaptation)技术作为一种高效的模型微调方法,能够在保持模型原有性能的同时,显著...

Read More
2025-03-12 talkingdev

MovieAgent:长镜头电影生成技术突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,利用基于角色的提示(persona-based prompting)来确保生成内容的一致性和准确性。MovieAgent进一步使用Stable Diffusion视频模型...

Read More
2025-03-12 talkingdev

MovieAgent:实现长视频一致性生成的新突破

近日,一项名为MovieAgent的创新技术引起了广泛关注。该系统通过结合多种生成模态,并采用基于角色的提示机制,显著提升了视频生成的一致性和准确性。MovieAgent利用Stable Diffusion视频模型生成并拼接帧,从而实现...

Read More
2025-02-27 talkingdev

Google推出AI视频模型Veo 2,每秒成本高达0.5美元

Google近日发布了其最新的AI视频模型Veo 2,该模型的生成成本高达每秒0.5美元,相当于每分钟30美元。这一高昂的成本引发了业界的广泛关注。Veo 2作为Google在AI视频生成领域的最新成果,其技术复杂度和计算资源需求...

Read More
2024-07-01 talkingdev

Lambda Labs训练Open Sora视频模型,一键生成乐高电影

Lambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型,用于制作乐高电影。这一技术的出现,不仅改变了乐高动画制作的传统方式,也为AI技术在创新应用中开辟了新的道路。利用这一模型,制作者可以方...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page