漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

Read More
2026-05-21 talkingdev

开源|字节跳动Lance:3B参数原生统一多模态模型,图像视频理解与生成编辑全搞定

字节跳动近日在GitHub上开源了一款名为Lance的原生统一多模态模型,以其仅3B(30亿)激活参数的设计,在AI领域引起了广泛关注。该模型打破了传统多模态模型需要为不同任务(如图像理解、视频生成、图像编辑等)分别...

Read More
2026-05-20 talkingdev

开源| NVIDIA LongLive 1.0:实时长视频生成框架,支持流式注意力与交互式编辑

英伟达(NVIDIA)最新开源了LongLive 1.0框架,旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力(Streaming Attention)和KV缓存优化(KV-cache optimization)技术,实现了对超长视频序列...

Read More
2026-05-12 talkingdev

突破!A²RD框架实现超长连贯视频生成,AI视频生成迈入新阶段

在AI视频生成领域,生成连贯的长视频一直是一个技术难题。近期,一个名为A²RD的新型框架被提出,旨在解决这一挑战。A²RD代表“Agentic Autoregressive Diffusion”,即基于智能体的自回归扩散模型。该框架引入了一种独...

Read More
2026-04-14 talkingdev

论文推荐|DeepMind提出弹性循环Transformer:参数锐减4倍,视觉生成质量依然顶尖

DeepMind的研究团队近日在arXiv上发布了一项名为“弹性循环Transformer”的创新工作,为视觉生成模型领域带来了显著的效率突破。传统视觉生成模型通常依赖堆叠大量独立的Transformer层,导致参数量庞大。ELT的核心创新...

Read More
2026-01-23 talkingdev

Remotion推出Agent Skills:用Claude Code等AI代理编程生成视频

视频制作领域迎来编程化新范式。Remotion平台近日正式发布其“Agent Skills”功能集,旨在为开发者提供一套在Remotion项目中工作的最佳实践指南。该功能的核心突破在于,允许用户通过Claude Code等代码生成式AI代理,...

Read More
2026-01-10 talkingdev

AI视频生成成增长引擎!快手股价一年暴涨88%,Kling AI用户突破6000万

据彭博社报道,中国短视频巨头快手科技的股价在过去一年中实现了惊人的88%涨幅,其核心驱动力来自于旗下AI视频生成模型“Kling”的巨大成功。该模型自推出以来,已迅速积累了超过6000万用户,成为公司向人工智能战略转...

Read More
2025-12-13 talkingdev

迪士尼法务重拳出击!谷歌应要求下架数十个AI生成迪士尼角色视频

近日,科技巨头谷歌应迪士尼公司发出的法律函件要求,从其旗下视频平台YouTube上移除了数十个由人工智能生成的视频,这些视频的内容均涉及描绘迪士尼旗下知名卡通角色。此次事件源于迪士尼向谷歌正式发送了一封“停止...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page