群核科技发布空间大模型 ,后续将逐步开源
群核科技在首届技术开放日上发布新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,后续将逐步面向全球开发者开源。
根据介绍,本次发布的SpatialLM 1.5是一款基于大语言模型训练的空间语言模型,支持用户通过对话交互系统SpatialLM-Chat进行可交互场景的端到端生成。相比于传统大语言模型对物理世界几何与空间关系的理解局限,SpatialLM 1.5不仅能理解文本指令,还能输出包含空间结构、物体关系、物理参数的“空间语言”。例如,当用户输入简单文本描述时,SpatialLM 1.5可自动生成结构化场景脚本,智能匹配家具模型并完成布局,并支持后续通过自然语言进行问答或编辑。
SpatialLM 1.5生成的场景富含物理正确的结构化信息,且能快速批量输出大量符合要求的多样化场景,可用于机器人路径规划、避障训练、任务执行等场景,这将有效解决当前机器人训练“缺数据”的难题。
SpatialGen是一款基于扩散模型架构的多视角图像生成模型,可根据文字描述、参考图像和3D空间布局,生成具有时空一致性的多视角图像,并支持进一步生成3D高斯(3DGS)场景并渲染漫游视频。
此外,《科创板日报》还获悉,群核科技正在研发一款基于3D技术的AI视频生成产品,并计划在今年内正式发布。
