漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-04 talkingdev

高效大规模3D场景重建:对自驾车至关重要的新方法

重新构建大型3D场景,特别是在一些数据缺失的情况下,对于自驾车来说至关重要。这种名为PC-NeRF的新方法,通过结合两个模块来优化多层次的重建,即使在数据不完整的情况下,也能确保3D模型的详细程度。PC-NeRF的两个...

Read More
2023-09-28 talkingdev

Mistral发布首个性能卓越的7B模型

在完成巨额种子轮融资并组建团队、机器学习堆栈和数据管道后,Mistral团队已经发布了一个性能极高的7B模型。该模型最初通过磁力链接(种子)以及一个最小化的GitHub Repo和宽松的许可证发布。这显示了Mistral团队在...

Read More
2023-09-26 talkingdev

NeuralLabeling-利用3D工具进行先进的场景注释

NeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景,从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...

Read More
2023-09-26 talkingdev

LayoutLM:提升商业文件阅读效率的新模型

LayoutLM是一个擅长阅读商业文件的模型,现在它变得更聪明了。该模型通过两种新的训练方式进行改进,一种是帮助它理解复杂的布局,另一种是获取正确的数值。LayoutLM的出现,让我们可以更有效地处理和理解商业文件,...

Read More
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-25 talkingdev

自动驾驶技术:更精细地结合相机和激光雷达数据

这个GitHub仓库介绍了FGFusion(Fine-Grained Fusion,细粒度融合),这是一种新的方法,用于在自动驾驶汽车中以更详细的方式结合相机和激光雷达的数据。与仅使用高级别的细节不同,FGFusion捕获大局和细节,以创建...

Read More
2023-09-22 talkingdev

GitHub开源更快速分析3D面部照片的方法

最近,一组研究人员在GitHub上发布了他们的最新研究成果。他们训练了一个模型,该模型可以识别3D面部照片上的重要点,这一过程通常需要人工完成。他们的方法几乎与人类专家的精度相同,但速度却快了很多。在过去,人...

Read More
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page