小红书开源 Relax:面向全模态 Agentic 的异步 RL 训练引擎
小红书 AI 平台团队宣布正式开源 Relax —— 一款面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。 根据介绍,Relax 基于 Megatron-LM 和 SGLang 高性能后端构建,以协同设计为核心理念,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在 Qwen3-Omni-30B 上,Relax 验证了图像、文本、音频和视频四种模态的 RL 训练稳定收敛;在 16xH800 多机下,训练全异步相比 Colocate 基线端到端提速 76%,相比 veRL 的全异步端到端提速 20%。 Relax 将每个 RL 角色(Ac...