漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-04 talkingdev

巨型世界模型助力自动驾驶技术的发展

大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型,该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...

Read More
2023-09-26 talkingdev

NeuralLabeling-利用3D工具进行先进的场景注释

NeuralLabeling是一款使用3D技术进行详细场景注释的工具。这款工具可以帮助用户精确地标注出图像中的各个物体和场景,从而为计算机视觉应用如自动驾驶、虚拟现实等提供更丰富、更准确的数据。NeuralLabeling的优势在...

Read More
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-25 talkingdev

论文:在线视频实例分割技术TCOVIS

研究人员已经介绍了一种名为TCOVIS的在线视频实例分割技术,这种技术优先考虑时间一致性。在线视频实例分割是计算机视觉领域的热门课题,它的目的是将视频帧中的每个实例独立地识别和分割出来。然而,现有的方法通常...

Read More
2023-09-25 talkingdev

自动驾驶技术:更精细地结合相机和激光雷达数据

这个GitHub仓库介绍了FGFusion(Fine-Grained Fusion,细粒度融合),这是一种新的方法,用于在自动驾驶汽车中以更详细的方式结合相机和激光雷达的数据。与仅使用高级别的细节不同,FGFusion捕获大局和细节,以创建...

Read More
2023-09-12 talkingdev

通过语言指令让自动驾驶汽车更智能

本项目引入了NuPrompt,这是一套以日常语言形式的新指令,帮助自动驾驶汽车更好地理解和追踪周围的物体。NuPrompt的工作效果非常出色!它将在自动驾驶汽车的感知、决策和控制等环节中起到至关重要的作用。通过这种方...

Read More
2023-09-11 talkingdev

埃隆·马斯克为特斯拉的自动驾驶设置了新的方向

本文摘自沃尔特·艾萨克森的《埃隆·马斯克传》。该书将于9月12日出版。这一章描述了马斯克与公司全自动驾驶(FSD)项目的关系。最新版本的FSD模拟了人类的行为。这引发了一些问题,因为即使是最好的司机也会犯交通规...

Read More
2023-09-08 talkingdev

ResFields,时间维度下更深刻理解3D场景

ResFields是一种新型的神经网络,擅长理解随着时间变化的复杂3D场景。通过添加名为‘时间残差层’的组件,它能够处理更多的信息,同时保持准确性。时间残差层的引入,使ResFields在处理大量信息时,不仅能够准确识别3D...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page