视频推理的相关内容 - 漫话开发者

2025-04-01 talkingdev

[开源]Video-R1：基于规则的强化学习方法实现高效视频推理

Video-R1项目提出了一种创新的基于规则的强化学习（RL）方法，专门用于视频推理任务。该方法采用了GRPO（Generalized Reinforcement Learning with Policy Optimization）的时间变体，并引入了新的数据集来支持训练...