Meta发布V-JEPA 2视觉世界模型,提升AI物理推理能力
talkingdev • 2025-06-12
8283 views
Meta近日正式推出V-JEPA 2视觉世界模型,该技术突破性实现了AI代理对物理环境的动态推理能力。作为Yann LeCun团队世界模型研究的最新成果,V-JEPA 2通过自监督学习架构,使AI系统能够基于视频输入预测物理交互结果。Meta同步发布了三项专业评测基准,涵盖物体持久性、运动轨迹预测和因果推理等核心维度,首次为视频推理任务建立了标准化评估体系。这项技术将显著提升AR/VR场景下的智能交互体验,并为具身智能、自动驾驶等前沿领域提供底层支持。据悉,该模型已应用于Meta的元宇宙开发生态,预计将推动行业重新定义AI与物理世界的交互范式。
核心要点
- Meta推出新一代视觉世界模型V-JEPA 2,增强AI物理环境推理能力
- 配套发布三项视频推理评测基准,建立行业评估标准
- 技术将应用于元宇宙及具身智能领域,重塑人机交互范式