基于科学智能上下文协议(Scientific Context Protocol,SCP),上海 AI 智能实验室与北京大学联合科研团队,针对新药筛选工具碎片化难题,构建了多层级技能体系,并推出针对新药筛选与优化的智能体 MolClaw。
根据介绍,该智能体可通过对专业领域数据库、计算软件、预测模型等多类科学工具的统一调度与协同,首次在长程、复杂的药物发现任务中完成多步骤、自主决策式推理与执行,并持续扩展技能,进而提升药物研发流程的自动化水平与协同效率。目前,MolClaw正在北京大学、浙江大学等高校药物研发场景中开展湿实验验证。
多层级技能体系作为MolClaw的知识骨架,承担着规范知识应用、优化任务执行的关键作用,具体分为四层:
- L1工具层:提供60个标准化原子操作模板,为每一个工具调用建立统一动作规范,从源头消除格式转换与重复配置的冗余成本;
- L2工作流层:将原子能力组装为14个端到端流程框架,把虚拟筛选、先导化合物优化等核心任务,封装为具备质量门控与反馈机制的完整流水线,同时支持通过元工作流自动生成新流程,提升适配灵活性;
- L3方法论层:将来自8大领域的26条正式科学原则在任务启动前强制加载,使智能体的决策逻辑、实验规范与报告结构,始终受科学方法论约束——“方法学合规”不再依赖研究者自觉,而是被直接嵌入基础设施本身,强化科学合规性;
- LR研究层:负责文献检索与证据核验,遵循“计算优先、文献辅助”的层级策略,让文献服务于结果验证,而非替代推理过程。
SCP承担着统一连接并调度30余项专业工具(含数据库、计算软件、模型等)的核心作用。它提供标准化访问接口,统一GPU资源调度,管理并发任务队列,同时自动完成工具间的格式转换与权限隔离。无论是ESMFold的蛋白结构预测、GROMACS的动力学模拟,还是QuickVina的对接评分,所有工具均通过同一套协议接入,无需为每个软件单独搭建环境或编写适配逻辑,真正实现“工具无关”的统一编排。
在执行层面,MolClaw采用严格的三阶段控制框架以实现流程规范与结果可靠:
- 准备阶段强制执行任务分级、技能检索与路径规划,保障任务执行的科学性;
- 执行阶段持续触发质量门控、异常检测与交叉验证,及时规避偏差;
- 交付阶段则汇总任务结果,并启动“技能结晶(Skill Crystallization)”机制——即系统自动识别成功执行路径,并沉淀为可复用新技能并写入技能仓库,实现系统能力随执行经验持续生长。该进化属于架构层面可积累、可复刻的自主成长,并非模型随机能力涌现。
目前,MolClaw已在多个大语言模型上完成验证,并兼容OpenClaw与Claude Code两套最新Agent底层框架。

此外,联合科研团队还发布了首个面向药物发现智能体的多维度评测基准MolBench,涵盖分子筛选(Molecular Screening, MS)、分子优化(Molecular Optimization, MO)以及端到端(End-to-End, E2E)药物发现等任务,可系统性评估自主药物发现智能体在复杂科研流程中的综合能力。

