在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...
Read More字节跳动近日在GitHub上开源了一款名为Lance的原生统一多模态模型,以其仅3B(30亿)激活参数的设计,在AI领域引起了广泛关注。该模型打破了传统多模态模型需要为不同任务(如图像理解、视频生成、图像编辑等)分别...
Read More英伟达(NVIDIA)最新开源了LongLive 1.0框架,旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力(Streaming Attention)和KV缓存优化(KV-cache optimization)技术,实现了对超长视频序列...
Read More在AI视频生成领域,生成连贯的长视频一直是一个技术难题。近期,一个名为A²RD的新型框架被提出,旨在解决这一挑战。A²RD代表“Agentic Autoregressive Diffusion”,即基于智能体的自回归扩散模型。该框架引入了一种独...
Read MoreDeepMind的研究团队近日在arXiv上发布了一项名为“弹性循环Transformer”的创新工作,为视觉生成模型领域带来了显著的效率突破。传统视觉生成模型通常依赖堆叠大量独立的Transformer层,导致参数量庞大。ELT的核心创新...
Read More视频制作领域迎来编程化新范式。Remotion平台近日正式发布其“Agent Skills”功能集,旨在为开发者提供一套在Remotion项目中工作的最佳实践指南。该功能的核心突破在于,允许用户通过Claude Code等代码生成式AI代理,...
Read More据彭博社报道,中国短视频巨头快手科技的股价在过去一年中实现了惊人的88%涨幅,其核心驱动力来自于旗下AI视频生成模型“Kling”的巨大成功。该模型自推出以来,已迅速积累了超过6000万用户,成为公司向人工智能战略转...
Read More近日,科技巨头谷歌应迪士尼公司发出的法律函件要求,从其旗下视频平台YouTube上移除了数十个由人工智能生成的视频,这些视频的内容均涉及描绘迪士尼旗下知名卡通角色。此次事件源于迪士尼向谷歌正式发送了一封“停止...
Read More