大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型,该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...
Read MoreNeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景,从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...
Read More科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...
Read More研究人员已经介绍了一种名为TCOVIS的在线视频实例分割技术,这种技术优先考虑时间一致性。在线视频实例分割是计算机视觉领域的热门课题,它的目的是将视频帧中的每个实例独立地识别和分割出来。然而,现有的方法通常...
Read More这个GitHub仓库介绍了FGFusion(Fine-Grained Fusion,细粒度融合),这是一种新的方法,用于在自动驾驶汽车中以更详细的方式结合相机和激光雷达的数据。与仅使用高级别的细节不同,FGFusion捕获大局和细节,以创建...
Read More本项目引入了NuPrompt,这是一套以日常语言形式的新指令,帮助自动驾驶汽车更好地理解和追踪周围的物体。NuPrompt的工作效果非常出色!它将在自动驾驶汽车的感知、决策和控制等环节中起到至关重要的作用。通过这种方...
Read More本文摘自沃尔特·艾萨克森的《埃隆·马斯克传》。该书将于9月12日出版。这一章描述了马斯克与公司全自动驾驶(FSD)项目的关系。最新版本的FSD模拟了人类的行为。这引发了一些问题,因为即使是最好的司机也会犯交通规...
Read MoreResFields是一种新型的神经网络,擅长理解随着时间变化的复杂3D场景。通过添加名为‘时间残差层’的组件,它能够处理更多的信息,同时保持准确性。时间残差层的引入,使ResFields在处理大量信息时,不仅能够准确识别3D...
Read More