漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-04 talkingdev

MegActor模型开源,实现逼真肖像动画生成

MegActor是一个新型模型,它利用原始驾驶视频来实现更逼真的肖像动画。通过一种新颖的数据生成框架和背景编码技术,MegActor在解决身份泄露和背景干扰问题上取得了令人瞩目的成果。该模型的核心创新在于其数据生成框...

Read More
2023-12-05 talkingdev

MoMask-文字转动画技术开源,实现细粒度控制

MoMask文字转动画技术是一项新颖的技术,其作者在此领域的基础性工作已有了新的进展。他们采用了新颖的编码方法,使得最终的动画生成具有细粒度控制能力,可以更具创意地生成动画效果。此技术的优点是可以通过更改编...

Read More
2023-07-17 talkingdev

个性化文本到图像模型:让你的创作动起来

这份报告介绍了一个新系统,它可以为您使用Stable Diffusion、DreamBooth、LoRA等个性化文本到图像模型创建的任何图像添加逼真的运动。该系统使用一个“运动模块”,从现实生活的视频中学习,并可添加到任何文本到图像...

Read More
2023-05-12 talkingdev

新 SDK 允许用户使用稳定 AI 文本转动画生成独特风格动画

近日,一家新兴科技公司发布了新的 SDK,使用户可以使用稳定扩散模型创建动画。这一创新技术可以生成无条件、图像条件或视频条件下的动画,其结果非常美观,但计算成本较高,且具有非常独特的风格。以下是该技术的...

Read More