智元机器人 GO-1 通用具身基座大模型全面开源-低调大师

智元机器人 GO-1 通用具身基座大模型全面开源

2025-09-23 209

智元机器人 GO-1 （Genie Operator-1）通用具身基座大模型宣布全面开源。

“这标志着全球首个采用Vision-Language-Latent-Action (ViLLA)架构的通用具身智能模型向全球开发者免费开放，将极大降低具身智能的技术门槛，推动行业快速发展。”

根据介绍，GO-1采用的Vision-Language-Latent-Action (ViLLA)架构是具身智能领域的重大技术突破。与传统的Vision-Language-Action (VLA)架构相比，ViLLA通过引入隐式动作标记，成功弥合了图像-文本输入与机器人执行动作之间的语义鸿沟。这一创新使得机器人能够更好地理解人类意图，并将其转化为精确的动作执行。

ViLLA架构的核心在于其三层协同设计。VLM多模态理解层基于InternVL-2B构建，能够处理多视角视觉图片、力觉信号、语言输入等多模态信息，为整个系统提供强大的场景感知和指令理解能力。Latent Planner隐式规划器通过预测隐式动作标记，实现了对复杂操作任务的高层次规划和理解。Action Expert动作专家则基于扩散模型，能够生成高频率、高精度的连续动作序列，确保机器人能够执行精细的操控任务。

智元方面表示，虽然GO-1仅基于AgiBot G1机器人数据进行预训练，但该模型已经在松灵机器人、方舟机器人、Franka机械臂等不同本体上进行了充分的验证测试。这些跨本体验证结果表明，GO-1具备良好的可移植性，能够适应不同机器人的运动学特性和控制接口。

在仿真环境测试方面，GO-1在Genie Sim和Libero等主流仿真平台上均取得了领先的性能表现。

针对真机部署场景，GO-1模型提供了Genie Studio一站式开发平台来支持Genie G1本体的数据采集、模型微调和部署，同时特别集成了通用LeRobot数据格式，支持其他机器人本体的数据采集、模型微调和部署。

通过Genie Studio，在Genie G1真机实验中，GO-1相比于其他SOTA模型也取得了领先的性能。

Genie Studio是智元机器人专为具身智能场景打造的一站式开发平台。平台提供开箱即用的GO-1基座模型，集成Video Traning方案和统一训练框架，内置完整的开发工具链，可实现真机一键编译&部署。

微信关注我们

原文链接：https://www.oschina.net/news/373870

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Qwen-Image-Edit-2509 发布: 多图编辑支持，单图一致性提升

阿里通义 Qwen 团队宣布推出 Qwen-Image-Edit-2509，作为 Qwen-Image-Edit 的月迭代版本。相比于8月发布的 Qwen-Image-Edit，Qwen-Image-Edit-2509 的主要特性包括：多图编辑支持: 对于多图输入，Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 结构，通过拼接方式进一步训练，从而进行了支持。提供“人物+人物”，“人物+商品”，“人物+场景” 等多种玩法。单图一致性增强: 对于单图输入，Qwen-Image-Edit-2509 显著提高了一致性，主要体现在以下方面：人物编辑一致性增强: 增强人脸ID保持，支持各种形象照片、姿势变换；商品编辑一致性增强: 增强商品ID保持，支持商品海报编辑；文字编辑一致性增强: 除了支持文字内容修改外，还支持多种文字的字体、色彩、材质编辑；原生支持ControlNet: 包括深度图、边缘图、关键点图等 Qwen-Image-Edit-2509 的首要更新是支持了多图输入。先看一个“人物+人物”的例子：再看一个“人物+场景”的例子：下面是一...

2025-09-23

248

2025年9月20日,“携手奇摩 SmartX 走进邦彦——云 PC 制造业数智化体验日”活动在邦彦技术股份有限公司深圳总部成功举行。近40位制造业企业家与CIO齐聚一堂,围绕数字化转型中的算力升级、数据安全等核心议题展开深入探讨。邦彦云PC凭借其创新技术与显著的应用价值,成为全场焦点。沉浸式探展:直观体验“云上真机” 活动伊始,产品市场部总监钟华程带领嘉宾参观了邦彦技术数字化展厅。他系统梳理了公司十余年的发展历程,并重点阐释了邦彦云PC的研发理念与核心架构,深入剖析了传统PC分散管理及VDI模式性能瓶颈等行业痛点。现场对比Demo演示,让嘉宾直观感受到新一代商用PC在高效、安全与灵活三大维度上的跨越式提升。主题分享:30分钟洞悉邦彦云PC如何赋能制造业数字化新趋势在下午的交流环节,钟华程以《邦彦云PC系统介绍——赋能制造业数字化转型》为题,深入解读了产品如何精准应对制造业数智转型中的核心挑战。他指出,当前制造业对算力的需求已从单纯性能输出转向“性能+安全+效率”的综合诉求,邦彦云PC独创的“云上真机”架构正是应对这一趋势的关键创新。该架构将专属物理计算刀片或准物理虚拟节点集中部...

2025-09-23

221

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。