宇树科技发布开源世界模型-动作架构:UnifoLM-WMA-0
宇树科技正式推出跨多类机器人本体的开源世界模型-动作(WMA)架构 —— UnifoLM-WMA-0。该架构旨在为通用机器人学习提供统一的技术基础,核心在于一个能够理解机器人与环境交互物理规律的世界模型。
该世界模型具备两大核心功能:
- 仿真引擎:作为交互式仿真器运行,为机器人学习生成合成数据。
- 策略增强:可与动作头对接,通过预测未来与物理世界的交互过程,优化决策性能。
模型接收图像及文本指令,生成与文本指令对应的未来动作视频。
官方介绍,UnifoLM-WMA-0 支持两种运行模式:
- 决策模式:提供机器人与环境物理交互的预测信息,辅助策略生成动作。
- 仿真模式:基于机器人动作生成高保真环境反馈。
在训练方面,团队基于 5 个宇树科技开源数据集完成模型训练,测试结果显示,该模型可根据「当前图像」及一定数量的「机器人未来动作」实现交互可控生成,并具备长程任务的持续交互生成能力。
项目主页:https://unigen-x.github.io/unifolm-world-model-action.github.io/
开源代码网址:https://github.com/unitreerobotics/unifolm-world-model-action

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
OpenAI 重组机器人团队剑指“通用机器人”
OpenAI 正在重返机器人研究领域,这标志着该公司在中断五年之后,重新将物理人工智能(AI)作为其核心关注点。《连线》杂志报道称,OpenAI 正在招聘专门从事人形机器人研究的人员,旨在通过远程操作和模拟训练,打造能够执行通用任务的机器人。 根据招聘信息,新成立的团队将专注于传感和原型设计,其终极使命是创造“通用机器人,以加速通用人工智能(AGI)的实现。虽然该公司尚未正式确认该项目是否针对人形机器人,但种种迹象表明,其研究方向确实与类人系统紧密相关。新加入的团队成员包括斯坦福大学研究员李成书(Chen-Shu Lee),他曾专注于类人家用机器人的基准测试,进一步印证了这一推测。 早在2020年,OpenAI曾因训练数据不足而暂停其机器人研究工作。然而,该公司于今年1月再次发布了多个机器人相关的职位,这表明随着技术和数据的积累,OpenAI已准备好重启这一重要项目,继续探索物理世界中的AI应用。
-
下一篇
OpenAI 发布新编程模型 GPT‑5‑Codex,优化 Agentic Coding 能力
OpenAI 今日凌晨推出全新升级的新模型 GPT‑5‑Codex,这是其在GPT-5基础上专门为软件工程优化的模型版本,进一步提升了Codex中的智能体编程(Agentic Coding)能力。 官方表示,该版本在代码审查、功能开发、大规模重构等场景中表现显著提升,并且“在测试中可连续独立工作超过 7 小时”。以下是本次升级的主要亮点: 工具全面升级:Codex CLI 全面重新设计,IDE 插件支持 VS Code 等主流环境,与 GitHub 深度集成云端与本地环境可无缝切换; 代码审查能力强化:自动在 PR 中发现关键漏洞,减少无效评论,并可直接提出并实现修改建议。 据介绍,GPT‑5‑Codex 已成为 Codex 云端任务与代码审查的默认模型,开发者也可通过 Codex CLI 或 IDE 插件在本地使用。与通用版 GPT‑5 相比,新版本在代码重构任务的准确率从 33.9% 提升至 51.3%,高影响力审查评论比例也从 39.4% 提升至 52.4%。 此外,Codex CLI 与 IDE 插件同步升级,支持在终端直接附加截图、线框图等设计资料,并可在云端自动搭建运行环境...
相关文章
文章评论
共有0条评论来说两句吧...