漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

论文:采用潜在一致性模型实现快速可控图像生成

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度,并采用ControlNet样式提示实现更好的控制。

Read More
2024-01-08 talkingdev

HuggingFace与Stability AI合作开源复现MUSE

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型,并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长,但它们显示出了很...

Read More
2023-10-23 talkingdev

upsampling开源库实现图像生成模型数据质量提升

DALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。

Read More
2023-10-19 talkingdev

ChatGPT的浏览器Browse With Bing推出Beta版,DALL-E 3进入Beta版

ChatGPT的Browse With Bing现已退出Beta测试,DALL-E 3正在进行Beta测试。这是OpenAI最近的两个重要更新,Browse With Bing是一款由OpenAI推出的基于自然语言的浏览器,用户可以通过聊天的方式寻找信息,而DALL-E 3...

Read More
2023-10-05 talkingdev

深度解析:在Jax中运行SDXL与TPU v5的协同作用

SDXL是一种最先进的图像生成模型,虽然强大,但运行速度较慢。然而,Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速,SDXL的性能得到了极大的提升,可以...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-08-14 talkingdev

SDXL ControlNet:利用边缘控制图像生成的最佳开源模型

图像生成是人工智能技术的一个重要应用场景,而如何更好地控制其生成过程,是业界一直在探索的问题。最佳开源模型SDXL,推出了其ControlNet版本,通过利用边缘来调整最终输出,为图像生成提供了新的解决方案。SDXL C...

Read More
2023-05-31 talkingdev

Threestudio:将2D转3D的统一框架

今天,我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型,从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。 以下是该框架的三个核心要点: - Threestudio利用...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page