漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-20 talkingdev

开源| NVIDIA LongLive 1.0:实时长视频生成框架,支持流式注意力与交互式编辑

英伟达(NVIDIA)最新开源了LongLive 1.0框架,旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力(Streaming Attention)和KV缓存优化(KV-cache optimization)技术,实现了对超长视频序列...

Read More
2026-05-12 talkingdev

突破!A²RD框架实现超长连贯视频生成,AI视频生成迈入新阶段

在AI视频生成领域,生成连贯的长视频一直是一个技术难题。近期,一个名为A²RD的新型框架被提出,旨在解决这一挑战。A²RD代表“Agentic Autoregressive Diffusion”,即基于智能体的自回归扩散模型。该框架引入了一种独...

Read More
2025-09-19 talkingdev

Luma AI推出Ray3视频生成器:具备'预思考'能力的新一代模型

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构,能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出,在保持视觉保真度的同...

Read More
2025-07-31 talkingdev

亚马逊投资AI初创公司Fable,推出用户自制剧集工具Showrunner

亚马逊近日投资了AI初创公司Fable,该公司推出的生成式AI工具Showrunner允许用户通过简单的提示词创建电视剧场景甚至完整剧集。Showrunner将在发布初期免费开放,但未来计划以每月10-20美元的价格提供订阅服务。Fabl...

Read More
2025-07-28 talkingdev

Runway推出Aleph视频模型:支持高保真视频编辑与生成

Runway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...

Read More
2025-06-19 talkingdev

Midjourney发布首款AI视频生成模型V1,开启图像转视频新纪元

Midjourney公司正式推出其首款AI视频生成模型V1,该模型能够将任意静态图像转化为5秒的动态视频,标志着AI在多媒体内容生成领域的又一重大突破。尽管目前仅支持通过Discord平台使用,但其技术潜力不容小觑。据公司透...

Read More
2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试,超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频(text-to-video)和图像生成视频(image-to-video)两项核心任务中均位列榜首,其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

Read More
2025-05-23 talkingdev

谷歌I/O 2025大会AI亮点回顾:Gemini 2.5 Pro Deep Think与Veo 3重磅发布

谷歌最新一期Release Notes播客深度解析了I/O 2025大会的AI技术突破,重点介绍了三大核心创新:1) Gemini 2.5 Pro Deep Think作为下一代多模态AI系统,通过增强的递归神经网络架构实现复杂逻辑推理,其万亿级参数规...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page