3D的相关内容 - 漫话开发者

2023-08-07 talkingdev

Magic123开源：2D图像转化为3D，研究社区的新突破

近期，研究社区一直在努力将单张照片生成为3D资源，但对于稍具细微差别的物体，这一过程通常会出现失败，并且其效果总体来说并不理想。然而，一个名为Magic123的全新方法似乎实现了突破。Magic123采用2D和3D先验知识...

2023-08-02 talkingdev

Symphonies采用了一种独特的方法来完成自动驾驶中的3D场景补全，它可以填补来自激光雷达或图像等部分输入的空白。这种技术可以有效提高自动驾驶系统的精确性和稳定性，同时也能够提高驾驶安全性。通过这种新技术，无...

2023-07-31 talkingdev

研究人员引入了一种名为vox2vec的创新方法，该方法通过自我监督学习，能够在体素（3D像素）级别更好地理解医疗图像，如CT扫描图。研究结果显示，与领域内的其他技术相比，vox2vec表现出色，提供了一种更高效的解决方...

2023-06-29 talkingdev

3D-Speaker是一个庞大的音频数据集，包含来自10000多个说话者的录音数据，这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面，并非常适合用于测试大型语音模型...

2023-06-29 talkingdev

LightGlue是一种新技术，可以更轻松、更快速地找到图片之间的相似之处，甚至比当前最好的方法Superglue还要好。LightGlue最好的部分是它可以根据图像复杂度进行自适应，对于简单的图像可以更快地工作，在实时应用中...

2023-06-12 talkingdev

近日，科学家们在像素跟踪领域取得了新突破，即使在出现遮挡的情况下也能实现密集像素跟踪。以下是本次突破的核心内容： - 2015年，有关连续值的6D数字表示方面的突破已经取得。而这项新工作则提出将视频表示为3D体...

2023-06-02 talkingdev

内容摘要： - 研究介绍了一种名为“Occ-BEV”的自动驾驶预训练方法，旨在充分利用多个相机视角，而不仅仅是一个，从而捕捉周围环境的更准确理解。 - 该技术使用独特的3D解码器来预测环境的三维几何形状。 - 这一技术的...

2023-06-01 talkingdev

利用预训练的图像-文本扩散模型和生成对抗网络（GAN）进行训练，作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型，我们可以创建各种风格的多视角头像图像，从而实现多样性。 ## 核...