漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-29 talkingdev

Stable Video Diffusion发布,AI模型全面升级

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

Read More
2023-11-16 talkingdev

论文:MonoDiffusion-无需地面真值的深度估计技术

MonoDiffusion是一种新的自监督单目深度估计框架,其独特的方法将深度估计问题视为迭代去噪过程。它利用预训练的教师模型指导伪地面真值扩散过程,从而提高深度图精度,无需在训练中使用实际的深度真值。

Read More
2023-11-14 talkingdev

论文:利用2D扩散模型对3D网格进行图像风格化

这项研究提出了3DStyle-Diffusion模型,这是一种用于对3D网格进行细节风格化的新方法,整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明,然后使用预训练...

Read More
2023-10-31 talkingdev

Stable Diffusion推出开放共情项目

Stable Diffusion的团队推出了开放共情项目,旨在促进开源人工智能系统中的情感检测能力,以实现更真实的AI-人类交互。该项目的目标是推动AI系统开发,使其能够识别和适应用户的情感状态,并相应地作出反应。该项目...

Read More
2023-10-20 talkingdev

Hugging Face Space推出万圣节LoRA照相亭

Hugging Face Space推出了一款万圣节LoRA照相亭,用户可以通过使用Stable Diffusion将自己的照片变成一个可怕的万圣节主题角色。这款照相亭是基于人工智能技术的,能够通过对照片的处理实现各种特效效果。此外,用户...

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-11 talkingdev

提升文本生成中扩散模型的速度

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态,他们改善了模型处理离散文本变化的方式,从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型,能够以一种高效...

Read More
2023-10-04 talkingdev

OnnxStream,在树莓派Zero 2上运行Stable Diffusion 1.5

最近,一款名为OnnxStream的程序在GitHub上引起了广泛的关注。这款程序可以让用户在树莓派Zero 2上运行Stable Diffusion 1.5。这一技术的实现,无疑为那些希望在低功耗设备上运行复杂算法的用户提供了一个新的可能。...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page