腾讯混元世界模型1.5发布,首次开源业界最系统、最全面的实时世界模型框架
腾讯混元世界模型1.5(Tencent HY WorldPlay)已正式发布,公告写道: 它是易于创建的: 只需输入文字描述或者图片即可创建专属的互动世界。 它是沉浸式实时交互的: 通过键盘、鼠标或手柄,即可实时控制虚拟相机的移动和转向,让你可以像玩游戏一样自由探索AI生成的世界。 它也是直接可用的: 在腾讯混元3D官网可申请使用(https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。 它还是开源的: 混元世界模型1.5(WorldPlay)首次开源了业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。 混元世界模型1.5具备三大核心能力: 实时的交互生成:通过原创的Context Forcing蒸馏方案以及流式推理优化,模型可以按照24 FPS的速度生成720P的高清视频; 长范围的3D一致性:通过重构记忆机制(Reconstituted Memory),模型支持分钟级内容的几何一致性生成,可用于构建高质量的3D空间模...

