漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

视频问答技术取得突破性进展

talkingdev • 2023-05-16

1418778 views

近几个月来,视觉问答技术得到了广泛的应用和快速发展。这主要得益于像Blip和clip这样的预训练模型的出现。然而,将这些模型应用于视频问答仍然存在巨大的计算需求挑战。为了解决这个问题,研究人员引入了一系列不同的模型,并在不同的时间尺度上进行操作,从而显著提高了这些系统的鲁棒性。他们使用了Blip2,并取得了良好的性能。 ## 主要内容 - 视觉问答技术近期发展迅速 - 在视频问答中应用预训练模型存在巨大计算需求挑战 - 通过不同时间尺度操作,引入一系列不同模型,取得突破性进展