SoM开源,多模态语言模型的新进展
talkingdev • 2023-10-23
1104144 views
多模态语言模型(multimodal language models)的发展正日益成熟。最近,一种名为State of Mark prompting的方法在GitHub Repo上引起了广泛关注。该方法首先使用Segment Anything算法对图像进行处理,对检测到的类别进行编号,然后使用这些编号来提示视觉模型。这种方法能够有效地利用图像和文本等多种模态信息,提高语言模型的表现。
核心要点
- State of Mark prompting是一种新的多模态语言模型方法
- 该方法利用图像和文本等多种模态信息来提高语言模型的表现
- State of Mark prompting已经在GitHub Repo上得到了广泛关注