小米汽车发布 Xiaomi Auto World Model 框架-低调大师

小米汽车发布 Xiaomi Auto World Model 框架

2026-05-26 60

小米汽车宣布正式发布 Xiaomi Auto World Model 全新框架。

根据介绍，Xiaomi Auto World Model 提出了一个全新的整合框架，将重建模块（WorldRec）与生成模块（WorldGen）深度耦合，让两者在结构上互相约束：

重建侧给生成“打地基”：WorldRec 维护一个随观测增量扩展的 4D Gaussian 全局表示，把这个 3D 几何投影到自车视角后作为渲染先验喂给生成模型。这意味着生成模型在已观测区域不再“自由发挥”，而是被几何约束锁住——车道结构、建筑位置、相机间的一致性都由重建来兜底，生成只负责补全光照、纹理和未观测区域。
生成侧给重建“扩边界”：在重建覆盖不到的时空区域（未来帧、未观测视角、遮挡区），WorldGen 用生成能力把内容补出来，让整个世界模型不再受限于“开过的路”。
两者共同压制长时序漂移：重建提供的确定性几何先验持续校正生成过程，从根源上抑制曝光偏差带来的累积误差，让一分钟级别的长视频生成依然保持稳定。

重建提供 3D 几何作为结构化锚点，约束生成过程的稳定性；生成则把预测能力延伸到观测之外，弥补重建的边界。两者形成闭环、互相增益，从三个关键维度实现了“1+1>2”的协同增益：

高稳定性：WorldRec 的确定性几何约束，有效抑制长时序自回归中的误差累积与内容漂移。
高一致性：4D 场景表征作为跨帧共享记忆，确保不同时刻、不同视角下场景内容全局一致。
高真实性：WorldGen 以 WorldRec 渲染的 RGB 图像为几何骨架，使合成内容既符合物理布局，又贴近真实传感器观测，显著缩小了“仿真-现实”的领域鸿沟。

WorldRec 模块的核心思路是把场景表示从“稠密像素”换成稀疏的三维查询点，实现了重建10秒视频仅需10秒的高效率：

稀疏三维锚点表征：用稀疏查询点替代上亿稠密高斯，每个锚点对应一个唯一的三维位置，从源头消除多视角冲突。
多视角多时刻特征聚合：每个锚点主动到多个相机、多个时刻的图像里采集特征证据，形成跨视角一致的场景表示。
可见性加权融合：遮挡、反光的视角自动降权，干净视角自动加权，让模型聚焦在最可靠的观测上。

WorldGen 能够“自由绘画”的生成引擎。仅需4步去噪，0.19秒就可以生成一帧，支持最长1分钟视频。

第一阶段用全双向时序注意力进行预训练，让模型同时看到全部帧，建立对驾驶场景时空分布的全局理解；
第二阶段进入因果微调，用教师强制（Teacher Forcing）切换因果注意力，再用 ODE 蒸馏把去噪步数从50步压到4步提速12倍，最后用分布匹配蒸馏解决暴露偏差，从根源上抑制长序列漂移。

一些测试结果如下：

微信关注我们

原文链接：https://www.oschina.net/news/446227

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

用 AI 以“更慢”的速度编写更好的代码

Socket工程师Nolan Lawson在个人博客"Read the Tea Leaves"发表文章，分享了一种反直觉的AI编程工作流：用AI写更好、但更慢的代码。他主张，LLM极为灵活，不仅能快速生成代码，也能帮助写出质量更高但速度更慢的代码。 Lawson指出了一个常见误解：许多人认为AI编程的目的就是尽快吐出低质量的代码——快速打开巨大的PR，不经验证就合并。但实际上，用AI写高质量代码需要一种完全相反的策略：慢下来，反复审视。他的核心做法是：让多个AI模型（Claude、Codex、Cursor Bugbot）同时审查PR，分别找出关键级...

2026-05-26

55

Apple于2026年5月11日正式发布macOS Tahoe 26.5版本安全更新，一次性修复超过70个安全漏洞，涵盖内核、WebKit、系统服务及第三方组件等多个层面。此次更新中，多个漏洞可导致应用程序获取root权限、突破沙箱限制或泄露敏感用户数据，建议所有macOS用户尽快升级。本次更新中，Kernel组件修复的漏洞数量最多，且危害程度极高。其中CVE-2026-28951允许应用程序直接获取root权限，这意味着恶意软件可在用户不知情的情况下完全控制系统。该漏洞由安全研究员Csaba Fitzl发现并报告。更令人关注的是CVE-2026-28952，这是一个整数溢出漏洞，由Cal...

2026-05-26

63

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。