全球首个真实物理环境多任务基准 RoboChallenge 发布
全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试平台 RoboChallenge 基准测试平台于近日正式发布。
“我们正在构建一个真实世界的机器人测试和评估平台。在这里,研究人员和开发人员可以在统一的环境中验证和比较他们的机器人策略——涵盖从基本任务到复杂的真实场景。”
RoboChallenge 由 Dexmal 原力灵机联合 Hugging Face 共同发起。该测试平台的核心价值在于克服了现有机器人基准测试在真实环境下的性能验证、标准化测试条件和公开可访问测试平台等方面的挑战。
优点:
- 多样化任务:从物体操纵和场景交互到长期规划,涵盖机器人智能的多个维度。
- 多机器人:支持各种机器人形态,包括移动机器人和双手机器人。
- 公开公正:所有结果及排名均在平台上透明展示,确保公平可信。
该基准测试将为视觉语言动作模型(VLAs)在机器人中的实际应用提供更加可靠和可比较的评估标准,从而加速 VLA 模型从模拟环境走向实际物理世界的部署和验证进程。
