智元发布一体化具身大小脑系统 GenieReasoner
智元具身研究中心宣布推出一体化大小脑系统:GenieReasoner。其聚焦于如何在一个一体化模型中,兼顾高层语义推理和底层精细控制,并开源了全面的基于机器人视角的具身大脑 benchmark—— ERIQ,支持相对应解耦地评测推理性能。 根据介绍,GenieReasoner的设计初衷是建立一套“Action as Language”的统一表达范式,在赋予动作序列大模型级的语义泛化能力的同时,突破离散化表征在执行精度上的物理瓶颈。”改成“GenieReasoner的设计初衷是建立一套Action as Language的统一表达范式,并且在赋予动作序列大模型级的语义泛化能力的同时,突破离散化表征在执行精度上的物理瓶颈。 智元具身研究中心研究发现,现有 VLA 模型在复杂场景中的性能波动,本质上源于模型过度依赖“视觉-动作”的表面统计相关性,而缺乏深层的具身推理(Embodied Reasoning)。然而,提升推理能力与保持执行精度之间往往存在竞争关系:传统的“离散VLM主干 + 连续动作头”架构会因不同目标函数的数学冲突产生梯度干扰,导致模型在“逻辑泛化”与“执行精度”之间被迫取舍。...
