Rainbond v6.9.0 正式发布。本次版本的主要更新是新增 AI 大模型私有化部署能力,覆盖模型部署、实例管理、OpenAI 兼容调用和模型监控;同时对虚拟机能力进行了一轮增强,并修复了若干已知问题。
以下是本次更新的主要内容。
AI 大模型:在自己的平台上部署和运行模型
v6.9.0 新增 AI 大模型能力,面向企业和团队的大模型私有化部署场景,支持把模型部署在自己的集群和资源中,并通过 OpenAI 兼容接口接入业务系统。启用 AI 大模型插件后,「工作空间」 左侧导航会出现 「AI 大模型」 入口,下面包含模型仓库、模型实例、API 密钥和模型监控四个模块。
模型准备与部署
在 「模型仓库」 中选择需要部署的模型,目前支持以下几种模型来源:
模型状态变为"已下载"后,进入部署配置。文本大模型默认使用 vLLM 引擎;GPU 部署需选择 GPU 型号、数量和目标节点,也支持 CPU 部署(适合做轻量验证)。vLLM 的量化方式、显存利用率、最大上下文长度、额外启动参数等都可以在页面上配置,建议首次部署先使用默认配置完成验证。
当前 GPU 资源识别和分配以 NVIDIA GPU 为主,启用前请确认集群环境。
模型实例管理
部署完成后,进入 「模型实例」 模块管理已部署的模型实例:
API 密钥与 OpenAI 兼容调用
在 「API 密钥」 模块创建密钥,页面提供 OpenAI 兼容的接入示例,包括 base URL、curl 示例和 Python OpenAI SDK 示例。业务系统在原有 OpenAI 调用链路基础上替换 base URL 和 API key 即可接入。请求中按模型名称调用,平台会查找对应的运行中实例。
模型监控
「模型监控」 模块包含两个层面:
虚拟机能力增强
本次版本对虚拟机能力进行了一轮增强,主要更新如下:
-
「qcow2 镜像直接部署」:支持将其他虚拟化工具(如 VMware、KVM 等)导出的 qcow2 镜像直接部署到 Rainbond,便于已有虚拟机资产迁移。
-
「规格热更新」:运行中的虚拟机支持热扩容 CPU 或内存。注意 CPU 和内存不能在同一次操作中同时热更新、仅支持扩容不支持缩容;GPU 直通和 USB 透传虚拟机暂不支持热更新;不满足条件时平台会自动转为重启生效。
-
「多虚拟机应用级编排」:支持把多个虚拟机和其他组件按应用方式统一编排,在拓扑图中查看依赖关系,并保留连接信息、端口、存储等应用级配置。
-
「整套应用模板交付」:编排好的虚拟机应用可以发布成 Rainbond 应用模板,连同虚拟机系统数据一起打包,导出 rainbond-app 安装包后可在新环境导入恢复。发布前需先创建快照并关闭虚拟机;携带虚拟机类型的模板快照不支持回滚升级。
-
「Windows 驱动盘挂载」:在组件存储视图中支持挂载 VirtIO 驱动盘,用于解决 Windows 安装阶段识别不到磁盘或网卡的问题。
-
「监控与配置统一」:组件视图中支持查看虚拟机的 CPU、内存、网络流量、磁盘读写流量与 IOPS、文件系统使用量等指标;CPU、内存、磁盘、网络、GPU 直通、USB 透传等运行配置统一在组件视图中管理。
当前虚拟机仅支持 amd64 架构,arm64 暂不支持。
其他变更
新增功能
-
新增 AI 大模型私有化部署能力,支持模型部署、实例管理、OpenAI 兼容调用和模型与 GPU 监控
-
虚拟机支持 qcow2 镜像直接部署
-
虚拟机支持规格热更新(CPU、内存运行态扩容)
-
虚拟机支持多虚拟机应用级编排
-
虚拟机支持整套应用模板交付(连同系统数据一起打包)
-
虚拟机支持 Windows VirtIO 驱动盘挂载
-
虚拟机组件视图支持监控指标查看与运行配置统一管理
Bug 修复
-
修复 RainAgent 偶发断联、消息发送失败的问题(新增兜底机制和静默重试)
-
修复 RainAgent 接口密钥不修改时无法保存其他配置的问题
-
修复 opencode 使用 RainSkills 时 MCP 第二天过期的问题
-
优化 AI 助手更新提示信息
-
优化删除组件、端口、存储等操作的错误提示和引导
-
优化 RainAgent 错误信息的展示与稳定性
-
优化 RainAgent 操作组件时的识别准确率
-
修复 ROI 一些问题
-
修复快照/模板导入导出伸缩规则不生效
-
修复 UI 滚动条问题
-
修复对接 Harbor 无法展示更多的项目
-
修复 dockercompose 在 ARM 环境下无法构建
-
修复 Helm 默认安装无法选择节点
平台升级
Reference Link
[1] 离线升级文档: https://www.rainbond.com/docs/upgrade/latest-version