MateClaw 1.3.0 正式发布。
MateClaw 是一个基于 Spring Boot / Spring AI Alibaba 的开源自部署多智能体 AI 操作系统,面向团队、企业和开发者场景,提供数字员工、LLM Wiki、记忆系统、MCP/ACP 扩展、多渠道接入、Tool Guard 审批与审计等能力。它的目标不是再做一个聊天框,而是把 AI Agent、知识、工具、工作流和企业治理放在同一个可自部署系统里。
1.3.0 是 MateClaw 的一个关键版本:在 1.2.0 将 Agent 产品化为“数字员工”之后,这一版补上了流程编排、事件触发、知识加工、员工级工具绑定和文档生成能力,让 MateClaw 从“能干活的员工”进一步走向“能跑业务流程的 AI OS”。
工作流:把多个数字员工组装成业务流程
MateClaw 1.3.0 新增 Workflow 工作流能力,可以把多个数字员工和系统动作编排成一条线性业务流程。
工作流采用“线性 step 数组 + mode 字段”的设计,刻意保持轻量,不做复杂画布优先的节点系统。当前支持 7 种 step mode:
-
sequential:顺序执行,上一步输出进入下一步
-
fan_out / collect:并行扇出与结果收口
-
conditional:基于 Pebble 表达式做条件执行
-
await_approval:流程中途暂停并等待审批,服务重启后可恢复
-
dispatch_channel:将结果分发到不同渠道
-
write_memory:将结果写入员工记忆,支持多种合并策略
编辑方式上,MateClaw 1.3.0 同时提供 JSON 优先的 Monaco 编辑器、JSON Schema 校验、Pebble 静态检查,以及基于 @vue-flow/core 的只读流程画布。对于不熟悉 DSL 的用户,也可以通过自然语言生成工作流草稿,再由用户审阅后发布。
这一版还加入了不可变 revision、payload 存储、跨 workspace ACL、运行历史、异步 dispatch 和 GC 调度等工程机制,避免正在运行的流程被草稿修改影响,也让长流程不占用请求线程。
触发器:让事件自动启动流程
有了工作流之后,1.3.0 进一步加入 Trigger 触发器系统,用来把系统事件和自动动作连接起来。
当前支持 6 类触发 pattern:
触发后的动作可以是启动一个工作流,也可以是直接向某个数字员工发送消息。
为了避免企业场景中的“自动化失控”,MateClaw 1.3.0 在触发器中默认加入事件去重、per-trigger rate limit、Bot 自消息过滤、递归循环保护和未知 pattern fail-closed。多实例部署时,cron 触发复用 ShedLock,确保同一任务只执行一次。
Wiki 从搜索索引升级为处理流水线
过去的 LLM Wiki 更接近“知识检索”:文档进入系统后被切块、向量化、检索和引用。
1.3.0 让 Wiki 进一步具备“知识加工”能力。新的 Transformations 引擎允许用户为原始材料或 Wiki 页面配置模板,调用 LLM 生成结构化结果,并将结果保存回 Wiki。
主要能力包括:
1.3.0 还内置了 7 个企业常见模板,包括合同条款抽取、客户情报、风险摘要、KPI 提炼、会议纪要规整、知识页结构化和问答对生成。
这意味着 Wiki 不再只是“被动召回”的向量库,而是可以把原料加工为可检索、可引用、可复用的结构化知识产物。
MCP per-agent 绑定与多模态旁路路由
在旧版本中,连接一个 MCP 服务器后,workspace 中的员工往往会看到同一批工具。1.3.0 改为员工级 MCP 工具绑定:每个数字员工可以独立选择自己可用的 MCP 工具。
工具选择器按 server 分组,并标注 connected、stale、unavailable、orphan 等状态;保存时会校验工具是否真实存在;多个 MCP server 出现同名工具时会自动前缀化,避免运行时歧义。MCP 派生的技能和工具也进入统一的工具选择接口。
多模态方面,1.3.0 新增 sidecar 旁路路由。对于主模型不支持图片的情况,系统可以自动调用配置好的视觉模型生成图片描述,再将描述注入主对话。这样用户不需要理解模型是否支持视觉能力,主对话仍可使用更便宜或更适合文本推理的模型。
从对话直接生成 Office 文件
MateClaw 1.3.0 新增 4 个 JVM 原生文档生成工具:
-
DocxRenderTool:Markdown 转 .docx
-
XlsxRenderTool:Markdown 表格转 .xlsx
-
PptxRenderTool:Markdown 章节转 .pptx
-
PdfRenderTool:Markdown 转 .pdf,支持中文
这些工具运行在 JVM 内,不依赖 npm 子进程,也不要求本机安装 Office。它们和原有 docx 技能分工不同:旧技能更适合编辑已有 Word 文档,新工具更适合从对话结果直接生成新文件。
图像能力也在这一版增强。image_generate 新增 image / images 参数,支持 URL、base64、当前消息附件、历史消息图片引用和多图组合。用户可以直接对历史会话中的图片说“把背景改成红色”,无需重新上传图片。
上下文工程与稳定性改进
1.3.0 还继续打磨长任务上下文工程,包括:
-
压缩历史时锚定首条用户消息
-
不跨 tool_call / tool_response 边界压缩
-
老工具结果保留原文,不改写为有损摘要
-
spill 标记跨多次压缩保持有效
-
前端通过 compact_status SSE 感知压缩状态
-
修复分页边界上的 orphan tool response
-
会话级 spill 文件可按保留策略清理
此外,流式 tool-call 参数会被实时修正为合法 JSON,重复输出会被及时截断,非瞬时错误会显示恢复卡片,TLS / socket 瞬时错误也会自动重试。
其他更新
1.3.0 还包含一批渠道、部署和模型相关改进:
-
企业微信审批卡片 keepalive、群聊多人归属、长消息自适应合并
-
异步工具结果可回流到飞书、钉钉、企微、Slack 等渠道
-
Docker 启动不再强制要求 DASHSCOPE_API_KEY
-
5 个重量级内置技能改为 optional,降低默认启动成本
-
Spring AI 升级到 1.1.6,Spring AI Alibaba 升级到 1.1.2.3
-
OpenAI Whisper STT 可路由到任意 OpenAI-compatible 端点
-
自定义 OpenAI-compatible provider 可不要求 API Key
-
修复对话删除、MCP 中文名、虚拟卡编辑、clipboard 降级、PDF OCR 等问题
快速开始
桌面端用户可以直接从 GitHub Releases 下载安装包,内置 JRE 21,无需本机安装 Java。
源码方式启动:
# 后端cd mateclaw-server mvn spring-boot:run # 前端cd mateclaw-ui pnpm install pnpm dev
Docker 部署:
cp .env.example .env docker compose up -d