您现在的位置是:首页 > 文章详情

清华联手上海 AI Lab 发布开源 SimpleVLA-RL 框架

日期:2025-09-16点击:3

清华联手上海AI Lab组建的PRIME-RL团队发布SimpleVLA-RL,这是一个基于强化学习扩展Vision-Language-Action模型训练的轻量框架。

项目受DeepSeek-R1启发,仅用0/1规则奖励即可在仿真环境中完成在线RL,显著提升长时规划能力并超越监督微调基线。该框架利用强化学习扩展视觉-语言-动作模型的训练,有效提升了模型的长时规划能力。

据介绍,SimpleVLA-RL是一个专为VLA模型设计的高效RL框架,基于veRL(Volcano Engine Reinforcement Learning for LLMs)构建。veRL是一个通用的LLM RL框架,通过实现VLA特定的交互式轨迹采样和损失计算,支持端到端的在线基于规则的RL。

为了进一步支持VLA模型的可扩展RL,本方法扩展了veRL,实现了并行多环境渲染以加速采样,并将其适配为一个集成的训练-推理-渲染框架。

开源地址:https://github.com/PRIME-RL/SimpleVLA-RL

原文链接:https://www.oschina.net/news/372593
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章