漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

探秘OpenAI企业内部文化(播客)

你是否曾经想知道OpenAI是如何以如此快的速度进行创新和建设的?在这个播客中,OpenAI的开发关系负责人Logan Kilpatrick讨论了OpenAI的独特文化、高度代理和紧迫性的重要性以及公司推出产品的决策框架。

Read More
2024-01-31 talkingdev

论文:AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-15 talkingdev

论文:深入探究盲目运动去模糊技术

本文全面介绍深度学习在计算机视觉中的关键领域--盲目运动去模糊技术的作用。从传统方法的基本概念和局限性到现代技术如CNN、GAN、RNN和Transformer的详细比较,本文进行了全面的梳理。本文还对计算机视觉领域的未来...

Read More
2024-01-11 talkingdev

人体姿态与身形编辑技术取得新突破

该项目介绍了一种一次性编辑人类图像的方法,可以在保留人的身份的同时,对姿势和身形进行重大变化。该技术基于深度学习模型,利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法,用户只需提供一张人体图像,就...

Read More
2024-01-10 talkingdev

论文:研究人员开发出4D人脸视频编辑技术

研究人员开发出一种人脸视频编辑架构,该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色,通过保持一致的视角和帧之间的无缝转换来实现。

Read More
2024-01-08 talkingdev

谷歌DeepMind AlphaFold AI技术获得Eli Lilly、Novartis 两项将近30亿美元的新交易

Alphabet的等距堆叠在最新一笔交易中将增强谷歌DeepMind的AlphaFold AI技术,该技术预测蛋白质结构,以实现更快的靶点发现和化合物构建。这些交易涉及发现用于尚未公开的靶标的小分子疗法。这些公告是J.P. Morgan He...

Read More
2023-12-11 talkingdev

Kandinsky3.0:升级版文本转图像技术,实现更高质量、真实感的图像生成

Kandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page