智元提出 WholeBodyVLA,面向真实世界的人形机器人全身 VLA 框架
智元 AGIBOT 宣布,来自香港大学、智元 AGIBOT、复旦大学和上海创智学院的联合研究团队提出了 WholeBodyVLA,这是一种面向真实世界的人形机器人全身 Vision–Language–Action 框架。
https://opendrivelab.com/WholeBodyVLA/
https://github.com/OpenDriveLab/WholebodyVLA
据介绍,该工作基于智元灵犀X2研究发布,将 VLA 扩展至双足人形机器人的全身控制,验证了其在全身 loco-manipulation 任务中的可行性。
WholeBodyVLA 展示了 VLA 扩展到双足人形机器人自主全身控制的可行路径。通过从人类视频中学习,并结合针对移动操作的RL控制器,WholeBodyVLA 使机器人能够在真实世界中稳定完成行走与操作交织的长时序任务,为推动人形机器人走向制造、服务、物流等复杂场景提供重要基础。


