交汇点讯 日前,世界模型国际权威榜单WorldArena更新排名,中国科学院工业人工智能研究所物理智能团队自研的世界模型PAIWorld登顶。该研究所由中国科学院、江苏省、南京市共建,是我国智能制造科学与技术领域首个国家级科研机构。科研成果登顶权威榜单,体现该所在世界模型领域的创新实力。
世界模型,通俗来说,是能够理解物理世界、对未来变化具备预测能力的模型。当前,世界模型已是英伟达、谷歌、OpenAI等全球AI巨头争相布局的赛道之一。WorldArena由清华大学联合普林斯顿大学等顶尖学术机构共同推出,是世界模型领域的权威评测榜单,其评测对象覆盖全球几乎所有头部世界模型。
该榜单从视觉质量、运动质量、内容一致性、物理遵循、三维准确性及可控性六大维度,对世界模型开展全方位评价。在6月19日更新的榜单中,PAIWorld以72.31的总分拔得头筹。
在单项指标上,PAIWorld也有优异表现。例如,在轨迹准确性上,PAIWorld较榜单亚军的得分大幅领先。PAIWorld不仅能生成流畅自然的运动过程,更能在长时序预测中准确保持物体与相机的运动轨迹,减少轨迹漂移和空间错位。中国科学院工业人工智能研究所物理智能团队负责人徐凯举例说,如果用来生成一个时间较长的视频,PAIWorld能“盯住”画面里每个物体的运动路径,并且牢记它们的空间关系,确保画面合理,避免出现汽车突然飘到树上之类的错误画面。
徐凯说:“衡量世界模型的性能,不仅要看模型预测的未来画面是否真实清晰,更要看其预测结果是否符合输入指令和物理规律。在自动驾驶、工业制造等场景中,世界模型的轨迹准确性不仅是性能指标,更是安全指标。”
在运动平滑性上,PAIWorld以95.41分名列第二,意味着该模型能对真实物理世界里的连续运动规律进行精准建模。徐凯解释,在真实世界中,既有刚性物体的运动碰撞,也有软体的不规则形变。理解各种运动中复杂的物理规律,并严格遵循规律准确预测未来变化,是世界模型的核心能力之一,对世界模型的发展及其在工业等领域的落地具有重大意义。例如,工厂里的装配机器人,其“大脑”中必须有一个预测每个装配动作导致的工件姿态、形状变化等情况的世界模型,才能完成装配操作。“当机器人知道它所做的每个动作的‘后果’,能在大脑中进行预演,才能做出更准确、更安全的决策和操作。”徐凯说。
据悉,4月举行的智元世界挑战赛上,PAIWorld在世界模型赛道荣获亚军,并在衡量物理环境理解能力的核心指标——场景一致性上夺得单项第一。
徐凯表示,榜单成绩只是对模型基础能力的肯定,更重要的是模型能在真实场景中兑现能力。接下来,物理智能团队将不断完善PAIWorld,并依托该模型构建一个具身智能机器人虚拟训练场,实现机器人的自我改进和持续进化。
新华日报·交汇点记者 徐冠英

新华报业网
Android版
iPhone版