漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-03 talkingdev

谷歌Veo 3视频生成模型:迈向可交互世界模型的第一步?

谷歌最新发布的视频生成模型Veo 3展现出突破性潜力,其技术路线可能为游戏开发领域带来革新。与传统视频生成模型不同,世界模型(World Models)的核心在于模拟真实环境的动态交互机制,而Veo 3虽尚未达到完整世界模...

Read More
2025-06-19 talkingdev

Midjourney发布首款AI视频生成模型V1,开启图像转视频新纪元

Midjourney公司正式推出其首款AI视频生成模型V1,该模型能够将任意静态图像转化为5秒的动态视频,标志着AI在多媒体内容生成领域的又一重大突破。尽管目前仅支持通过Discord平台使用,但其技术潜力不容小觑。据公司透...

Read More
2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试,超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频(text-to-video)和图像生成视频(image-to-video)两项核心任务中均位列榜首,其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

Read More
2025-05-23 talkingdev

谷歌I/O 2025大会AI亮点回顾:Gemini 2.5 Pro Deep Think与Veo 3重磅发布

谷歌最新一期Release Notes播客深度解析了I/O 2025大会的AI技术突破,重点介绍了三大核心创新:1) Gemini 2.5 Pro Deep Think作为下一代多模态AI系统,通过增强的递归神经网络架构实现复杂逻辑推理,其万亿级参数规...

Read More
2025-05-20 talkingdev

谷歌发布Veo 3、Imagen 4及影视制作新工具Flow,生成式媒体模型再升级

在2025年谷歌I/O大会上,谷歌正式推出新一代生成式媒体模型Veo 3和Imagen 4,以及专为影视制作设计的新工具Flow。Veo 3作为视频生成模型的迭代版本,在动态细节和场景连贯性上实现突破;Imagen 4则进一步提升了文本...

Read More
2025-04-28 talkingdev

Character.AI发布AvatarFX:AI视频模型可生成逼真聊天机器人

Character.AI近日推出了一款名为AvatarFX的视频生成模型,该技术能够为AI生成的角色赋予动画效果,并支持从现有图像创建视频。尽管这一技术展现了巨大的潜力,但其可能被滥用于制作深度伪造(deepfake)视频的隐患也...

Read More
2025-04-22 talkingdev

Hugging Face发布MAGI 1:自回归视频生成模型实现长视频一致性生成

Hugging Face Hub最新推出的MAGI 1模型标志着自回归视频生成技术的重要突破。该模型能够生成具有长期一致性的长视频内容,其性能与Wan视频生成模型相当,虽略逊于某些闭源商业模型,但作为开源解决方案展现出显著竞...

Read More
2025-04-15 talkingdev

字节跳动团队发布Seaweed-7B:以低成本训练高性能视频生成基础模型

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...

Read More
  1. Next Page