漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-07 talkingdev

Magic123开源:2D图像转化为3D,研究社区的新突破

近期,研究社区一直在努力将单张照片生成为3D资源,但对于稍具细微差别的物体,这一过程通常会出现失败,并且其效果总体来说并不理想。然而,一个名为Magic123的全新方法似乎实现了突破。Magic123采用2D和3D先验知识...

Read More
2023-08-02 talkingdev

自动驾驶中3D场景补全的新技术开源

Symphonies采用了一种独特的方法来完成自动驾驶中的3D场景补全,它可以填补来自激光雷达或图像等部分输入的空白。这种技术可以有效提高自动驾驶系统的精确性和稳定性,同时也能够提高驾驶安全性。通过这种新技术,无...

Read More
2023-07-31 talkingdev

论文:自我监督学习助力医疗影像技术提升

研究人员引入了一种名为vox2vec的创新方法,该方法通过自我监督学习,能够在体素(3D像素)级别更好地理解医疗图像,如CT扫描图。研究结果显示,与领域内的其他技术相比,vox2vec表现出色,提供了一种更高效的解决方...

Read More
2023-06-29 talkingdev

3D-Speaker:一个庞大的语音数据集

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...

Read More
2023-06-29 talkingdev

LightGlue:更智能快速的图像匹配技术(GitHub开源)

LightGlue是一种新技术,可以更轻松、更快速地找到图片之间的相似之处,甚至比当前最好的方法Superglue还要好。LightGlue最好的部分是它可以根据图像复杂度进行自适应,对于简单的图像可以更快地工作,在实时应用中...

Read More
2023-06-12 talkingdev

密集像素跟踪取得突破,即使有遮挡也能实现

近日,科学家们在像素跟踪领域取得了新突破,即使在出现遮挡的情况下也能实现密集像素跟踪。以下是本次突破的核心内容: - 2015年,有关连续值的6D数字表示方面的突破已经取得。而这项新工作则提出将视频表示为3D体...

Read More
2023-06-02 talkingdev

GitHub开源自动驾驶技术:多相机联合预训练

内容摘要: - 研究介绍了一种名为“Occ-BEV”的自动驾驶预训练方法,旨在充分利用多个相机视角,而不仅仅是一个,从而捕捉周围环境的更准确理解。 - 该技术使用独特的3D解码器来预测环境的三维几何形状。 - 这一技术的...

Read More
2023-06-01 talkingdev

使用GitHub仓库创建时尚3D头像

利用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型,我们可以创建各种风格的多视角头像图像,从而实现多样性。 ## 核...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page