漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Gemini Pro 1.5推出,视频处理成为其杀手级应用

talkingdev • 2024-02-22

606589 views

Gemini Pro 1.5是Gemini系列的一次巨大升级。该模型具有100万令牌上下文大小,远大于Claude 2.1的20万和gpt-4-turbo的12.8万令牌上下文大小。虽然该模型仍然可能漏掉一些东西并产生错误细节,但它能够处理并提取短视频中的文本信息。本文介绍了一个例子,其中Gemini Pro 1.5用于从短视频中提取书名。

核心要点

  • Gemini Pro 1.5是Gemini系列的一次巨大升级
  • 该模型具有100万令牌上下文大小,远大于其他模型
  • 能够处理并提取短视频中的文本信息

Read more >