漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

CogCoM开源新视觉语言模型,增强视觉推理能力

talkingdev • 2024-02-12

635645 views

CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。

核心要点

  • CogCoM是一种全新的通用视觉语言模型
  • CogCoM具有独特的操作链机制
  • 该模型已经在GitHub上发布

Read more >