字节跳动开源 4D 视频生成框架 EX-4D
字节跳动旗下PICO-MR团队正式开源了 EX-4D,一款突破性的4D视频生成框架;能够从单一视角(单目)视频生成高质量、多视角的4D视频序列(3D空间+时间维度)。
传统视频生成技术在多视角生成方面面临两大挑战:一是需要昂贵的多视角相机和数据集进行训练;二是难以处理遮挡区域,导致生成的视频在极端视角下出现物体穿帮或细节失真。EX-4D通过创新的深度密闭网格(DW-Mesh)表示和轻量级适配架构,成功解决了这些问题。
DW-Mesh是EX-4D的核心技术,它通过构建全密闭网格结构,记录场景中的可见和隐形面片,无需多视角监督即可统一处理复杂场景拓扑。结合预训练深度预测模型,EX-4D将单帧像素投影到3D空间,形成网格顶点,并根据几何关系精准标记遮挡区域。这种方法确保了生成视频在极端视角(如±90°)下仍能保持物理一致性和细节完整性。
此外,EX-4D引入了两种模拟mask生成策略——渲染 mask 和跟踪mask,通过模拟视角移动和帧间一致性,破解了多视角训练数据的稀缺难题。这些策略使EX-4D仅凭单目视频即可“脑补”全视角数据,极大降低了数据采集成本。
性能测试结果表明,EX-4D在 FID(弗雷歇距离)、FVD(弗雷歇视频距离) 和 VBench 等行业标准指标上全面超越现有开源方法。尤其在极端视角(如接近90°)的生成任务中,EX-4D的性能优势尤为明显,生成的视频在物体细节和遮挡逻辑上表现更为真实。
在一项由50位志愿者参与的主观评估中,70.7%的参与者认为EX-4D在极端视角下的物理一致性远超其他开源方法。
EX-4D基于预训练的WAN-2.1模型,结合 LoRA-based Adapter 架构,在保持计算效率的同时,融入了DW-Mesh的几何先验信息,确保生成视频的几何一致性和帧间连贯性。这种轻量级设计使得EX-4D在资源受限的环境下也能高效运行,适合广泛的开发场景。
字节跳动PICO-MR团队负责人表示,EX-4D是团队在3D重建与4D场景生成领域多年研究的结晶,未来将继续优化模型性能,探索更广泛的应用场景。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DeepEval —— 开源 LLM 评估框架
DeepEval是一个简单易用的开源 LLM 评估框架,用于评估和测试大型语言模型系统。它与 Pytest 类似,但专门用于对 LLM 输出进行单元测试。DeepEval 结合了最新研究成果,基于 G-Eval、幻觉、答案相关性、RAGAS 等指标来评估 LLM 输出,它使用 LLM 和其他各种在本地运行的 NLP 模型进行评估。 无论你的 LLM 应用程序是 RAG pipelines、聊天机器人、AI 代理,还是通过 LangChain 或 LlamaIndex 实现,DeepEval 都能满足你的需求。借助它,你可以轻松确定最佳模型、提示和架构,以改进你的 RAG 管道和代理工作流,防止 prompt drifting,甚至可以自信地从 OpenAI 过渡到托管你自己的 Deepseek R1。 以类似于 Pytest 的方式轻松地“单元测试” LLM 输出。 即插即用 30 多个 LLM 评估指标,其中大多数都有研究支持。 支持端到端和组件级评估。 对 RAG、代理、聊天机器人以及几乎任何用例的评估。 使用最先进的进化技术生成合成数据集。 指标易于定制并涵盖所有用例。 红队,...
- 下一篇
Grok 4 将提供面向编程的「Code」版本
博主「AiBattle」爆料称,其在 xAI 控制台的源代码中发现了 2 个 Grok 4 模型的相关信息。 据悉,本次 Grok 4 将拥有标准版和面向编程的 Code 版: Grok 4:xAI 最出色、最新的旗舰模型,在自然语言、数学和推理方面表现优秀。 Grok 4 Code:专为编程而生,能够咨询代码相关问题,或者将 Grok 4 Code 嵌入代码编辑器中。 另据爆料,Grok 4 的权限已经部分开通,可通过 API 访问。目前,Grok 4 支持文本模态以及视觉、图像生成等功能,其他功能也即将推出。 马斯克近日也透露,Grok 4 计划在今年 7 月 4 日之后发布;并且新模型将尝试从第一性原理出发进行推理,也就是将物理学的方法应用到思维过程中。 相关阅读:Grok 4 将于 7 月 4 日后发布
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- CentOS关闭SELinux安全模块
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8编译安装MySQL8.0.19
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8安装Docker,最新的服务器搭配容器使用
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Docker安装Oracle12C,快速搭建Oracle学习环境