字节 veRL 团队宣布开源了一个为通用 Agent 打造的统一训练框架 Uni-Agent,其核心目标是构建一个贯通构建、运行与训练完整流程的系统,旨在:
- 让开发者可以更轻松地构建自己的 Agent;
- 让系统可以稳定地支撑大规模任务运行;
- 让交互过程能够自然接入训练闭环,通过强化学习持续进化。
根据介绍,“Uni”包含两层含义:Unified:将构建(Build)、运行(Run)、训练(Train)融合在同一框架中,让推理与训练能够自然衔接;Universal:框架设计面向更通用、更复杂、更真实的应用场景。
Uni-Agent 将 Agent 的核心能力拆解为三个模块:
- model:负责推理与决策;
- tool:负责感知与行动;
- env:负责执行环境与状态承载。

在这套抽象下,Uni-Agent 在三层都保留了扩展能力:model 层既可以灵活对接外部 API 模型服务,也支持接入用户自部署的 vLLM、SGLang 等推理后端;tool 层作为承载特定任务能力的关键抽象,支持围绕不同任务自由扩展;env 层支持可扩展的执行环境接入。这样一来,用户可以围绕自己的任务去组合和扩展 Agent 能力,以更低成本完成新场景接入。
在运行层,Uni-Agent 基于火山引擎 veFaaS Sandbox 提供了一套面向规模化的远程沙盒执行方案。同时,Uni-Agent 还提供了轻量级的实时仪表盘(Live Dashboard),支持对大规模任务进行实时监控,让每个 Agent 任务的运行状态、日志流和整体进展都清晰可见。

一些测试结果如下:

