漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-26 talkingdev

NeuralLabeling-利用3D工具进行先进的场景注释

NeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景,从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...

Read More
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-25 talkingdev

打造超真实虚拟人形:新模型生成各种姿态与身形

本篇论文提出了一种能够创造出超级真实的虚拟人类模型,无论你想到的任何姿势,这种模型都能完美呈现。这是首款仅通过虚拟数据训练出来的模型,但其所生成的人类形态却具有极高的准确度,这对科学研究和电子游戏领域...

Read More
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-05 talkingdev

从浏览器小子到后端老大:WASM会赢得网络战争吗?

WebAssembly是一种二进制格式,允许Web开发者以接近本地速度运行代码,这可能确实会成为后端软件开发的未来。WebAssembly(WASM)是一个开放标准,可以将几乎任何语言编写的代码编译成一种可在Web上运行的格式,使得...

Read More
2023-09-05 talkingdev

结合相机和传感器数据如何更好地捕捉动作

这个新项目展示了一种全新的实时捕捉人体动作的方式,其方法是将普通相机图像和被称为IMUs的特殊传感器进行组合。普通的相机图像能够捕捉到人体的外形和动作,但是对于动作的精细度以及速度可能无法准确捕捉。而IMUs...

Read More
2023-08-29 talkingdev

nrhints-基于少量照片实现3D物体光照效果

近期,一项新的研究成果引起了众多科技爱好者的关注。该研究以创新的方式介绍了如何利用少量照片来重现光线与3D物体的交互效果。与旧有技术不同的是,我们的系统巧妙地利用了关于阴影和高光的提示,从而使其能够更有...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page