漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-15 talkingdev

Gemini与Whisk平台集成Veo 2,开启视频生成新纪元

近日,Gemini和Whisk两大平台宣布集成Veo 2技术,为用户提供更强大的视频生成能力。Veo 2作为新一代视频生成工具,通过先进的AI算法,能够快速生成高质量的视频内容,满足用户在营销、教育、娱乐等多领域的需求。此...

Read More
2025-03-31 talkingdev

[开源]Mobile-VideoGPT:轻量级多模态视频模型,参数不足10亿却支持边缘设备实时推理

近日,GitHub上开源了一个名为Mobile-VideoGPT的轻量级多模态视频模型,其参数量不足10亿(1B),却通过创新的双视觉编码器和令牌剪枝技术,实现了在边缘设备上的实时推理能力。这一突破性进展为移动端和物联网设备...

Read More
2025-03-26 talkingdev

[开源] Video T1:利用引导模型提升视频帧路径物理一致性

Video T1 是一种创新的视频处理技术,通过使用引导模型来拒绝不符合物理规律或用户指定提示的帧路径,显著提升了视频生成的质量。该技术的核心在于测试时计算(test time compute),这一方法在性能基准测试中表现出...

Read More
2025-03-13 talkingdev

Flat Color LoRA 模型发布,推动 Wan 视频模型技术革新

近日,Flat Color LoRA 模型在 Hugging Face Hub 上正式发布,这一模型的推出为 Wan 视频模型技术注入了新的活力。LoRA(Low-Rank Adaptation)技术作为一种高效的模型微调方法,能够在保持模型原有性能的同时,显著...

Read More
2025-03-11 talkingdev

视频修复模型VideoPainter

最新发布的视频修复模型VideoPainter,通过高效结合背景信息,能够处理任意长度的视频。该模型使用了专用的数据集和基准进行训练和评估,不仅在基础修复任务上表现出色,还展现了在高级视频处理和生成相关训练数据方...

Read More
2025-02-21 talkingdev

Model-Guidance技术提升扩散模型训练效率,ImageNet 256基准测试表现卓越

近日,一项名为Model-Guidance(MG)的技术在扩散模型训练领域取得了突破性进展。该技术通过引入后验概率优化目标,显著提升了扩散模型的训练速度和推理效率。实验结果显示,采用MG技术的扩散模型在ImageNet 256基准...

Read More
2025-02-10 talkingdev

Pika Labs推出Pikadditions:AI视频编辑工具实现无缝对象与角色嵌入

Pika Labs近日发布了其最新视频编辑工具Pikadditions,这是一款基于AI的视频到视频处理工具,能够无缝地将对象和角色嵌入到现有视频中,同时保持高度的真实感。该工具利用先进的embedding技术和LoRA模型,确保添加的...

Read More
2025-01-23 talkingdev

开源AI视频编辑器,助力创作者高效剪辑

近日,一款名为Open-source AI video editor的开源AI视频编辑器正式亮相,引发了技术社区的广泛关注。该工具利用先进的AI技术,能够自动完成视频剪辑、转场效果添加、字幕生成等复杂任务,极大地提升了视频创作的效...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page