千寻智能 Spirit v1.5 登顶 RoboChallenge,同步开源
千寻智能 Spirit v1.5 在具身智能模型评测平台 RoooChallenge 最新榜单中取得了世界第一的排名,成功超越 Pi 0.5。 目前,Spiritv1.5 模型权重、部分公开的微调任务权重以及推理与部署示例内容已实现开源,后续内容则将分阶段持续更新。Spiritv1.5是一个面向真实世界任务的端到端具身智能基础模型,致力于在单一模型框架内统一完成: 泛化性:强大的跨任务与跨本体泛化能力 稳定性:面向真实场景的连续任务能力 准确性:对操作目标与执行结果的稳定精确控制 在模型架构上,Spirit v1.5采用Vision-Language-Action(VLA)统一建模框架,将视觉感知、语言理解与动作生成整合在同一决策流程中,减少多模块串联带来的信息损耗,并提升长程任务中的整体稳定性。 在训练方法上,Spirit v1.5的一个核心特点是不依赖高度精选的“干净”演示数据。千寻智能在技术博客中提出,过度脚本化、受控环境下采集的数据,虽然有利于模型快速收敛,但会限制其在真实世界中的泛化能力。 因此,Spirit v1.5在预训练阶段引入了开放式、多样化的数据采集范式。数据采集不...
