3D的相关内容 - 漫话开发者

2023-10-04 talkingdev

高效大规模3D场景重建：对自驾车至关重要的新方法

重新构建大型3D场景，特别是在一些数据缺失的情况下，对于自驾车来说至关重要。这种名为PC-NeRF的新方法，通过结合两个模块来优化多层次的重建，即使在数据不完整的情况下，也能确保3D模型的详细程度。PC-NeRF的两个...

2023-09-28 talkingdev

在完成巨额种子轮融资并组建团队、机器学习堆栈和数据管道后，Mistral团队已经发布了一个性能极高的7B模型。该模型最初通过磁力链接（种子）以及一个最小化的GitHub Repo和宽松的许可证发布。这显示了Mistral团队在...

2023-09-26 talkingdev

NeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景，从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...

2023-09-26 talkingdev

LayoutLM是一个擅长阅读商业文件的模型，现在它变得更聪明了。该模型通过两种新的训练方式进行改进，一种是帮助它理解复杂的布局，另一种是获取正确的数值。LayoutLM的出现，让我们可以更有效地处理和理解商业文件，...

2023-09-26 talkingdev

科研人员近日开发出一种名为PVLFF的新模型，这种模型能够观察3D场景，并不仅能识别其中的内容，还可以利用文本描述区分同一物体的不同实例。在现实世界中，同一物体可能有许多不同的实例，而这种模型能够通过文本描...

2023-09-25 talkingdev

这个GitHub仓库介绍了FGFusion（Fine-Grained Fusion，细粒度融合），这是一种新的方法，用于在自动驾驶汽车中以更详细的方式结合相机和激光雷达的数据。与仅使用高级别的细节不同，FGFusion捕获大局和细节，以创建...

2023-09-22 talkingdev

最近，一组研究人员在GitHub上发布了他们的最新研究成果。他们训练了一个模型，该模型可以识别3D面部照片上的重要点，这一过程通常需要人工完成。他们的方法几乎与人类专家的精度相同，但速度却快了很多。在过去，人...

2023-09-20 talkingdev

从单一的2D图像中确定3D深度是一项棘手的任务，因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离，使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下，如...