Ego2World:面向智能体的视频驱动符号仿真环境

项目概述

Ego2World 将真实厨房视频编译为可执行的符号世界,用于具身智能体评测。

系统内容

  • world state 与 belief state 抽象,
  • reset / query / observe / check / step 接口,
  • geometry-aware observation,
  • 动作可行性检查,
  • 失败修复与过程动力学建模。

我的角色

我作为第一作者与核心开发者参与该项目。系统重点评估大模型智能体在部分可观测环境下的长程规划、状态维护与错误恢复能力。