漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-22 talkingdev

通过扩展UNet优化稳定扩散的生成质量

稳定扩散是一种复杂的技术,其可大幅度提高生成质量,而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架,其独特的...

Read More
2023-08-16 talkingdev

OpenDream开源:为SD工作流带来更便捷的扩展

最近,一款名为OpenDream的新技术在GitHub仓库中引起了大量的关注。OpenDream的核心优势在于,它为稳定扩散工作流带来了多种新的特性。首先,OpenDream引入了层次化的设计,这让开发者能够更好地组织和管理他们的代...

Read More
2023-07-28 talkingdev

稳定性AI发布最新文本到图像模型:稳定扩散XL 1.0

稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....

Read More
2023-07-04 talkingdev

人脑活动的潜在扩散模型实现高分辨率图像重建

研究人员提出了一种新的方法,使用一种扩散模型,具体来说是一种名为稳定扩散的潜在扩散模型(LDM),从通过fMRI捕获的人脑活动中重建高分辨率、高保真度的图像。该方法在保持生成性能的同时减少了计算成本,无需对...

Read More
2023-06-07 talkingdev

Redditor运用稳定扩散技术制作出可读取的动漫风二维码

一位Reddit用户最近发布了一系列采用稳定扩散技术制作的艺术二维码,其风格为动漫和亚洲艺术风格,可通过智能手机相机应用程序进行扫描。该用户显然训练了多个定制的稳定扩散控制网络模型,并在将QR码输入图像生成器...

Read More
2023-05-12 talkingdev

新 SDK 允许用户使用稳定 AI 文本转动画生成独特风格动画

近日,一家新兴科技公司发布了新的 SDK,使用户可以使用稳定扩散模型创建动画。这一创新技术可以生成无条件、图像条件或视频条件下的动画,其结果非常美观,但计算成本较高,且具有非常独特的风格。以下是该技术的...

Read More
2023-05-03 talkingdev

火车稳定扩散,只需要5万美元

Mosaic ML正在开发一个工具包,使模型训练变得非常容易。他们在公共云上复制了稳定扩散训练,只需47,000美元。该代码已经开源。他们的平台可以自动从硬件故障中恢复。有趣的是,这个模型得到了用户高度评价,可能是...

Read More
2023-04-14 talkingdev

DreamPose:通过稳定扩散实现时尚图像到视频合成

新闻内容: 通过DreamPose,我们可以实现以下三点核心功能: - DreamPose是基于扩散的图像到视频合成模型。 - 通过输入一个人物的图像和姿势序列,DreamPose可以合成一个逼真的视频,展示出输入人物按照姿势序列的...

Read More
  1. Prev Page