智元机器人开源 EVAC 框架与 EWMBench 评测基准-低调大师

智元机器人开源 EVAC 框架与 EWMBench 评测基准

2025-05-20 206

智元机器人宣布开源全球首个基于机器人动作序列驱动的具身世界模型EVAC (EnerVerse-AC)，以及具身世界模型评测基准EWMBench。

根据介绍，EVAC 是一个能够动态复现机器人与环境复杂交互的世界模型，标志着从传统仿真到生成式模拟的跃迁。

EVAC基于前序工作 EnerVerse 架构持续演进，创新型引入多级动作条件注入机制，实现 “物理动作 - 视觉动态” 的端到端生成，其核心能力体现在以下几个方面：

机器人动作与像素的高精度对齐：将机械臂 6D 位姿（x,y,z,roll,pitch,yaw）与末端执行器行程投影为action map，确保物理动作与图像帧的像素级对齐，精准建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速抛掷”、“缓慢摇晃” 等复杂动力学行为；
动态多视图建模：引入Ray Map编码相机运动轨迹，支持头部、腕部等多视角协同生成一致且连贯的视觉场景，赋予机器人更全面的环境生成能力。；
卓越的长时序一致性：采用 Chunk-Wise 自回归扩散架构与稀疏记忆机制（Sparse Memory），EVAC能够实现单视图稳定生成长达 30 个连续片段、多视图下亦可维持 10 个连续片段的无漂移稳定输出，保证了模拟过程在时间轴上的连贯性与真实性；
数据高效利用：融合 Agibot-World 数据集 + 失败轨迹（如抓取滑脱、路径碰撞）提升生成质量，该策略能有效抑制幻觉现象，使模型能更合理、更全面地建模机器人与环境的交互动态。

针对机器人操作场景的复杂性与特殊性，EWMBench构建了立体化的评估体系，从场景一致性、动作合理性与语义对齐与多样性三大核心指标进行分析：

场景一致性Scene Consistency：评估生成场景中背景/物体/视角等稳固度与真实性，采用微调过的DINOv2特征进行量化。
动作合理性Motion Correctness：利用HSD (Symmetric Hausdorff Distance), nDTW (normalized Dynamic Time Warping) 和 Dynamics Score 三重互补指标协同精确评估生成动作的合理性与动力学真实度。
语义对齐与多样性Semantic Alignment & Diversity：结合MLLM(多模态大模型）和CLIP从全局指令对齐度、关键步骤语义准确性、逻辑合理性等多个层次对生成视频进行语义理解评估。

相较于当前主流视频生成评测基准 VBench，EWMBench 在评测结果与人类主观判断的一致性方面表现更优，能够更真实、细致地反映具身世界模型在交互理解、动作还原与视觉一致性等核心维度的实际能力。

微信关注我们

原文链接：https://www.oschina.net/news/350785

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Pyrefly —— Python 的快速类型检查器和 IDE

Pyrefly 是一款快速的 Python 类型检查器，计划在 2025 年底取代 Meta 现有的 Pyre 类型检查器。 Pyrefly 旨在通过 IDE 功能和检查 Python 代码来提高开发速度。主要特点：类型推断：除了函数参数之外，Pyrefly 可以在大多数位置推断类型。它可以推断变量的类型和返回类型。 Flow Types：Pyrefly 可以理解程序的控制流以细化静态类型。增量性：Pyrefly 旨在实现模块级的大规模增量性，并优化检查和并行性。示例： # Example: Basic Type Checking def greet(name: str) -> str: return "Hello, " + name # This works fine since both "World" is a string and greet expects a string message: str = greet("World") # Pyrefly catches this error before runtim...

2025-05-20

257

谷歌推出了名为 Jules 的 AI 编程代理 (Coding Agent)，目前处于公开 Beta 测试阶段，需要申请，用户可以免费使用。 https://jules.google/ Jules 旨在帮助开发者修复错误、更新依赖、迁移代码和添加新功能。它与 GitHub 集成，异步执行任务。用户分配任务后，Jules 会在虚拟机中创建开发环境、安装依赖、编写测试、进行更改、运行测试并提交拉取请求，同时展示工作进展。简单来说，它能帮你解决那些你不想做的编码任务：修复 Bug、更新版本、编写测试、甚至实现新功能。 Jules 目前支持 JavaScript/TypeScript、Python、Go、Java 和 Rust 等语言，但对私有仓库内容不进行训练。用户每天可运行5个任务，并发2个任务。阅读更多：OpenAI 发布编程 Agent「Codex」

2025-05-20

643

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。