字节跳动即将发布“世界模型”
根据 The Information 的报道,字节跳动正在筹备自己的“世界模型”(world model),以追随谷歌和 Meta 的步伐。 该项目由字节跳动的“Seed”人工智能研发部门主导,项目负责人是前阿里通义千问(Qwen)核心高管周畅。字节跳动在视频生成领域的积累——尤其是旗下抖音和 TikTok 的海量视频数据,以及近期开源的 EX-4D 框架(可将单目视频转化为4D多视角场景)——为其构建世界模型提供了技术基础和训练资源。 “世界模型”旨在模拟真实环境的物理规律和人类互动方式,未来可用于训练机器人、自动驾驶系统或构建虚拟世界,被视为通向通用人工智能(AGI)的重要路径之一。 近期,谷歌和 Meta 都分别推出了自家新款世界模型——Genie 3 和 V-JEPA 2。世界模型能模拟出真实的环境,旨在获得与真实世界相似的物体运动以及人类与周围环境互动的物理方式,从而用于训练机器人和自动驾驶模型。 相关阅读 谷歌发布世界模型 Genie 3 Meta 发布开源世界模型 V-JEPA 2
