商汤正式发布并开源 SenseNova-SI 系列空间智能大模型
商汤正式发布并开源 SenseNova-SI 系列模型,据称在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。
SenseNova-SI 定位是空间智能大模型,这次开源的系列包括 2B 和 8B 两个规格。最新评测数据显示,SenseNova-SI 系列模型在空间智能多个基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现突出,具体如下:
其中 SenseNova-SI-8B 模型在四个基本评测中获得 60.99 的平均成绩,不仅大幅领先 Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等专门的空间智能模型,还以相对轻量的模型规格实现了对 GPT-5(49.68)、Gemini-2.5-Pro(48.81)等顶级闭源模型的超越。
据介绍,商汤团队采用系统化的方法扩充空间理解数据的规模,首次在空间智能领域验证了“尺度效应”,即通过高质量、大规模数据训练,可显著提升模型的空间认知能力。
商汤表示:
空间智能是世界模型与具身智能理解物理世界的基础能力。今年 7 月,商汤正式发布“悟能”具身智能平台,该平台以商汤“开悟”世界模型为核心引擎,旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。
此次发布的空间智能大模型 SenseNova-SI,与“开悟”世界模型相辅相成,将更好地解决多模态模型从数字空间走向物理世界的基础挑战,并在未来进一步推动 AI 在自动驾驶、机器人等场景的应用。
SenseNova-SI 开源地址:https://huggingface.co/collections/sensenova/sensenova-si
