Meta 发布端到端的文本驱动 3D 世界生成系统:WorldGen
Meta 旗下 Reality Labs 近日发布 WorldGen 系统,可通过单条文本指令在约五分钟内生成具备导航与交互能力的3D场景。
WorldGen结合了程序化逻辑推理、扩散模型三维生成技术以及面向对象的场景分解方法,能够构建几何结构严谨、视觉细节丰富的三维场景,可广泛应用于游戏开发、模拟仿真及沉浸式社交环境构建。
据悉,该技术采用模块化流程,依次完成场景规划、几何重建、对象分解与细节增强,输出兼容 Unity 和 Unreal Engine 的标准网格资产。
WorldGen 强调“可通行性”,自动生成导航网格(navmesh),确保场景结构合理、路径畅通,适用于游戏、工业数字孪生及培训模拟等专业场景。
尽管当前版本尚处研究阶段,且存在场景规模与资源复用等限制,其功能性导向已显著区别于仅追求视觉效果的现有方案。
