漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-26 talkingdev

全稀疏融合技术提高3D物体检测效率

以下是本文的主要内容: - 本文研究了如何将图像模态整合到全稀疏架构中,以实现高效的远程3D检测。 - 该方法使用实例查询将2D实例分割与基于LiDAR的3D分割进行融合,从而实现了nuScenes和Argoverse 2数据集上的最...

Read More
2023-04-20 talkingdev

机器学习:使用视觉指令调整大型语言模型

本文介绍了一篇新的论文,提出使用机器生成的指令跟踪数据来调整大型语言模型(LLMs)以执行多模态任务。该论文开发了LLaVA,这是一个大型多模态模型,它结合了视觉编码器和仅限于语言的GPT-4。经过调整后,LLaVA展...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14