Solon AI 迎来 v3.9 重磅更新!本次升级不仅大幅扩充了 Agent 的“技能书”(Skill),更在底层核心(Core)与智能体架构(Agent)上进行了深度进化。从多模态支持到复杂的 HITL(人工干预)机制,Solon AI 正在变得更强、更稳、更丝滑。
助力 Java AI 生态更伟大。
一、 技能生态大爆发 (The Skill Explosion)
v3.9 最重要的变化之一,是我们引入了(框架级的) Solon AI Skills ,并一口气推出了 19+ 核心技能插件,让你的 Agent 瞬间拥有处理现实世界任务的能力:
- 多媒体: 支持图像与视频生成的 GenerationSkill,以及强大的 PdfSkill。
- 生产力: 集成钉钉、飞书、企业微信的 SocialSkill;支持邮件处理的 MailSkill。
- 开发者利器: 引入
Text2SqlSkill;支持 Nodejs、Python、Shell 脚本执行的 SysSkill;以及处理 Redis、文件、Zip 的各类专项技能。
- 自动化: 内置 WebCrawlerSkill(爬虫)与 WebSearchSkill(搜索),让 Agent 实时连接互联网。
还有对接 Claude Code Agent Skills 的 CliSkill
- 通过 CliSkill, Agent 现在可以直接在受控环境中执行终端命令。可以快速定制一个自己的 Claude Code CLI。
以及对接 OpenApi3 和 Swagger2 的 RestapiSkill
- 激活海量的 webapi 存货,快速让 Agent 对接自己的业务。
二、Agent 架构深度优化
- 更懂礼貌的 HITL: 专属的人工干预接口,支持“同意、拒绝、跳过”,让 Agent 在关键决策时听从人类指挥。
- 拒绝幻觉轮询: 优化 ReActAgent,支持主动挂机能力。当 Agent 发现任务无法完成时,不再“一本正经胡说八道”,而是优雅退出。
- 流式输出进化: Agent 全面支持 stream 输出模式,响应体验更实时。
三、模型与方言适配
- 生态扩展: 新增 Claude 方言适配与 Weaviate 向量数据库支持。
- 背压流控: ChatModel.stream 增加背压支持,确保在高并发大数据量下的稳定性。
四、更新清单
新增插件与适配
- 模型方言: solon-ai-dialect-claude, solon-ai-dialect-openai (OpenaiResponses)。
- 存储: solon-ai-repo-weaviate。
- 技能组: cli, data (Redis), file (Zip/ReadWrite), generation (Image/Video), mail, pdf, restapi (OpenApi3/Swagger), social (钉/飞/企), sys (Nodejs/Python/Shell), text2sql, web (Search/Crawler)。
Solon AI Core (核心层)
- 结构化增强: ChatModel 引入 role 和 instruction 支持,对齐现代 Prompt 工程。
- 会话持久化: 新增 FileChatSession 和 RedisChatSession 实现。
- 响应式升级: ChatModel.stream 返回类型由 Publisher 调整为 Flux。
- 灵活操作: Prompt 增加 removeLastMessage 等快捷方法;新增 ChatModel onPrepare 事件钩子。
Solon AI Agent (智能体层)
- 概念简化: 弃用 description + systemPrompt,统一改为 role + instruction。
- 解析增强: ActionTask 舍弃正则匹配,改用 JSON 流式读取,解析更精准高效。
- 链路追踪: ReActTrace 和 TeamTrace 增加 pending 机制,方便按需拦截。
- 协议优化: 重构 ReActProtocol 和 SwarmProtocol,提升团队协作效率。
修复与组件升级
- 修复了 ReActAgent 在新话题开始时 Trace 状态重置不彻底的问题。
- 修复了 SimpleAgent 协作协议勾子丢失的问题。
- 组件升级: qdrant 向量数据库驱动升级至 1.16.2。