Volcano 社区宣布推出新的子项目 AgentCube,一个构建在 Volcano 之上的高性能 AI Agent 编排层。它通过扩展 Kubernetes API,将 Agents 和 Tools(Code Interpreters、BrowserUse等) 提升为集群的一等公民。“它不仅仅是一个 CRD,更是一套面向 Agent 的 Serverless 操作系统。”
AgentCube 引入了两个核心的 CRD 来定义 Agent 工作负载:
1. AgentRuntime: 面向长会话、复杂的对话式 Agent。
2. CodeInterpreter: 面向短任务、高频的代码执行环境。
- 强调“用完即毁”和极致的安全隔离,天然适配 MicroVM(如 Kuasar, Kata Containers, Firecracker)。
AgentCube后续还将提供BrowserUse、ComputerUse、MobileUse等工作负载抽象支持。
AgentCube 关键技术亮点
1. 极速启动
为了消除冷启动的挑战,AgentCube 实现了 Warm Pool(预热池) 机制。系统会预先启动并暂停一组持有基础环境的 MicroVM 沙箱。当 Agent 请求到来时,AgentCube 能够通过 "Claim-and-Go" 的方式,在毫秒级将预热的沙箱分配给会话,实现近乎零延迟的启动体验。
2. 极速调度
借助 Volcano 的 Agent Scheduler,AgentCube显著提升了Agent调度的吞吐和时延。
3. 原生会话管理
AgentCube 引入了 Session ID 作为核心路由标识,便于保证业务上下文的连续性。
-
请求路由: AgentCube Router 能够识别请求中的 x-agentcube-session-id,自动将其路由到对应的活跃沙箱。
-
自动的沙箱激活: 当前会话对应的沙箱处于休眠状态时,AgentCube Router 能够自动激活沙箱。
-
基于会话的端到端隔离: AgentCube 会自动为每个会话分配独立的沙箱环境,确保计算、内存与文件系统的完全隔离,防止跨租户的数据泄露。
4. Serverless 化的弹性伸缩
AgentCube 能够根据会话的活跃度自动管理沙箱生命周期。闲置的沙箱会被自动回收或休眠,释放物理资源供其他高优先级任务使用,真正实现资源按需分配与极致利用。
AgentCube 架构概览
AgentCube 采用了经典的控制面与数据面分离的架构设计,确保了系统的高可用性与扩展性:
![]()
-
数据面 : 由 AgentCube Router 承载。它作为流量入口,负责鉴权、限流以及基于 Session ID 的智能路由。对于新会话,它向控制面申请资源;对于活跃会话,它直接将请求转发至对应的 Sandbox (MicroVM)。
-
控制面 : 核心组件 Workload Manager 负责沙箱的全生命周期管理。它监控预热池 (Warm Pool) 的水位,自动补充 MicroVM 实例,并根据会话活跃度策略(如 TTL)执行沙箱的回收与垃圾清理。
-
调度层: 集成 Volcano Agent Scheduler,通过异步并行调度和乐观锁机制,实现高并发下的毫秒级资源分配。