漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-11 talkingdev

利用2D扩散概率模型雕刻3D人体模型

如果使用扩散模型生成包含距离和形状信息的2D法线图,然后使用3D重建算法,就可以利用底层身体模型生成逼真的3D人体化身。这对于合成化身和角色创建非常有用。扩散模型和3D重建算法的结合开启了一种全新的人体模型生...

Read More
2023-08-28 talkingdev

FineRecon:深度感知前馈网络实现细节丰富的3D重建

苹果公司最新的研究成果在3D物体重建这一具有挑战性的问题上展现了惊人的性能。这项名为FineRecon的新技术,利用深度感知前馈网络,将2D图像转化为精细的3D模型。这一突破性的技术有望在许多领域得到应用,包括虚拟...

Read More
2023-08-07 talkingdev

Magic123开源:2D图像转化为3D,研究社区的新突破

近期,研究社区一直在努力将单张照片生成为3D资源,但对于稍具细微差别的物体,这一过程通常会出现失败,并且其效果总体来说并不理想。然而,一个名为Magic123的全新方法似乎实现了突破。Magic123采用2D和3D先验知识...

Read More
2023-05-31 talkingdev

Threestudio:将2D转3D的统一框架

今天,我们向大家介绍一个名为Threestudio的开源项目。这个项目采用了先进的2D文本到图像生成模型,从文本提示、单张图像和少量样本图像中创建3D内容的统一框架。 以下是该框架的三个核心要点: - Threestudio利用...

Read More
  1. Prev Page