漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

LM4Visual-基于AI文本模型来进行视觉任务

talkingdev • 2023-11-13

897530 views

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI模型可以扩展到处理许多不同的任务,而不仅仅是文本任务。

核心要点

  • 研究人员发现,大型语言模型可以用于处理视觉任务
  • 使用文本训练的模型部分处理图像和视频可以提高结果
  • 基于文本的AI模型可以扩展到处理不同的任务

Read more >