腾讯混元世界模型 1.1 开源，单卡部署，秒级生成-低调大师

腾讯混元世界模型 1.1 开源，单卡部署，秒级生成

2025-10-22 19 89

腾讯混元世界模型 1.1 版本（WorldMirror）正式发布并开源，新增支持多视图及视频输入，单卡即可部署，秒级创造3D世界。“它让3D重建从专业工具变为人人可用的技术——任何人都能在秒级内从视频或图片创造出专业级3D场景。”

公告称，作为一个统一（any-to-any）的前馈式（feedforward）3D重建大模型，混元世界模型1.1解决了1.0版本仅支持文本或单图输入的局限，首次同时支持多模态先验注入和多任务统一输出的端到端3D重建。

此外，混元世界模型1.1还支持额外的相机、深度等多模态先验输入，并基于统一架构实现点云、深度、相机、表面法线和新视角合成等多种3D几何预测，性能大幅超过现有方法。

三大特性

灵活处理不同输入（any input）

传统3D重建方法只能处理原始图像，无法利用现实应用中常见的额外信息。混元世界模型1.1突破性地提出多模态先验引导机制，支持灵活注入：

相机位姿：提供全局视角约束，确保多视图一致性
相机内参：解决尺度歧义，精确投影几何关系
深度图：为纹理缺失区域（如反光面、无纹理区）提供像素级约束

系统采用分层编码策略：紧凑先验压缩为全局语义令牌，稠密先验则以空间对齐方式融合进视觉特征。通过动态先验注入机制，模型能灵活适应任意先验组合——有就用，没有也能工作。

通用3D视觉预测（any output）

以往方法往往为单一任务定制，要么做点云，要么做深度，要么做相机位姿。混元世界模型1.1首次实现了统一，并均取得了SOTA的表现：

点云：密集点云回归
多视角深度图：逐像素深度估计
相机参数：完整位姿和内参预测
表面法线：支持高质量网格重建
3D高斯点：直接用于实时新视角渲染

通过端到端多任务协同训练，各任务相互强化。例如，预测的法线图在Poisson表面重建中能产生更清晰的网格细节，而深度和相机约束则互相校准，提升整体几何一致性。

单卡部署、秒级推理

不同于需要迭代优化的传统方法（可能耗时数分钟甚至数小时），混元世界模型1.1采用纯前馈架构，在单次正向传播中直接输出所有3D属性。处理典型的8-32视图输入，本地耗时仅1秒。

架构设计

更多详情可查看官方公告。

微信关注我们

转载内容版权归作者及来源网站所有！本站原创内容转载请注明来源！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

插件、IDE、CLI、云平台，5 问 AI Coding 工程化

当“补全一个函数”的体验已经变成日常，真正的考验并非模型能否写出代码，而是这些智能能力能不能像编译器、版本控制、CI 一样，成为团队工程化流程的一部分：支持代码质量、可审计、可回溯，并与开发—调试—测试—发布的每一步闭环协作。AI Coding 正从“代码补全”迈向“工程系统”。在这个转折点上，五个问题，或许能决定整个生态的走向。一问：从智能补全到智能协作大模型嵌入 IDE、CLI、插件、云平台后，怎样才能真正“工程化”——不仅会写代码，而能融入团队的开发、调试、测试、发布全流程？过去两年，AI 在 IDE、插件、CLI 里的主要形态，是“写代码”。但在真正的工程语境下，写代码只是最表层的生产环节。一个智能系统能否被纳入工程体系，取决于它能否协同。这意味着它要理解项目上下文、能与版本控制系统打通、能参与测试链路，甚至能在 CI/CD 阶段承担自动化审查的角色。比如，现在越来越多的团队尝试把 AI 的代码建议变成 PR（Pull Request）形式提交，让模型生成的改动也走过代码审查、自动测试和发布验证。这是一个小小的动作，却意味着 AI 被“纳入了管控”。 “...

17

Flyde - 可视化后端逻辑编程工具

Flyde是一个用于原型设计、集成、评估和迭代 AI 密集型后端逻辑的整体解决方案。它是 TypeScript 的可视化扩展，可在代码库中运行，为从事后端 AI 工作流的开发人员和非开发人员之间提供缺失的链接。 Flyde 允许你为 AI 代理、提示链、API 编排和代理工作流等后端服务创建可视化流程，并直接与你现有的代码库集成。它包含一个VSCode 扩展，可与现有的 TypeScript/JavaScript 代码无缝集成。优点：代码库集成直接在你的代码库中运行，并可访问运行时代码和现有的后端框架。与独立工具不同，Flyde 以库的形式集成到你现有的工具和 CI/CD 流水线中。可视化后端 AI 工作流程以可视化的方式对 AI 密集型后端逻辑进行原型设计、集成、评估和迭代。使用可视化界面构建后端 AI 代理、提示链和代理工作流，同时保持对代码的完全控制。降低合作障碍TypeScript 的可视化扩展，弥合了开发人员和非开发人员之间的差距。使你的整个团队都能为后端 AI 工作流开发做出贡献。

14

资源下载

更多资源

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。