GAN的相关内容 - 漫话开发者

2024-02-21 talkingdev

探秘OpenAI企业内部文化(播客)

你是否曾经想知道OpenAI是如何以如此快的速度进行创新和建设的？在这个播客中，OpenAI的开发关系负责人Logan Kilpatrick讨论了OpenAI的独特文化、高度代理和紧迫性的重要性以及公司推出产品的决策框架。

2024-01-31 talkingdev

研究人员通过在训练手部注释图像中添加三个额外通道，改善了生成模型（例如GAN和扩散模型）创建逼真手部图像的能力。这种方法利用了手部形态的先验知识，可以应用于许多手部相关的任务，例如手语翻译和手势识别。此...

2024-01-24 talkingdev

近日，GitHub开源了MM-Interleaved模型，该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像，同时也可以从图像中提取文本。该模型使用了条件生成对抗网络（Co...

2024-01-15 talkingdev

本文全面介绍深度学习在计算机视觉中的关键领域--盲目运动去模糊技术的作用。从传统方法的基本概念和局限性到现代技术如CNN、GAN、RNN和Transformer的详细比较，本文进行了全面的梳理。本文还对计算机视觉领域的未来...

2024-01-11 talkingdev

该项目介绍了一种一次性编辑人类图像的方法，可以在保留人的身份的同时，对姿势和身形进行重大变化。该技术基于深度学习模型，利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法，用户只需提供一张人体图像，就...

2024-01-10 talkingdev

研究人员开发出一种人脸视频编辑架构，该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色，通过保持一致的视角和帧之间的无缝转换来实现。

2024-01-08 talkingdev

Alphabet的等距堆叠在最新一笔交易中将增强谷歌DeepMind的AlphaFold AI技术，该技术预测蛋白质结构，以实现更快的靶点发现和化合物构建。这些交易涉及发现用于尚未公开的靶标的小分子疗法。这些公告是J.P. Morgan He...

2023-12-11 talkingdev

Kandinsky 3.0是一种文本转图像模型，它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络（GAN）模型，通过学习图像语义和语法，从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...