AgentCPM-Explore 正式开源,业内首个 4B 参数量的端侧智能体模型
清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 社区正式开源了业内首个 4B 参数量的端侧智能体模型 AgentCPM-Explore。据称在 GAIA、HLE、BrowserComp 等 8 个主流长程智能体评测中全面突破,不仅拿下同尺寸 SOTA,更越级媲美 8B 模型,甚至比肩部分 30B+ 模型。支持 100+ 轮稳定交互,具备质疑、求真、变通、执着的“类人”探索能力。 AgentCPM-Explore 核心亮点一览 打破参数壁垒:首个具备 GAIA、Xbench、Browsercomp 等 8 个长难智能体任务处理能力的 4B 端侧模型,重新定义小模型性能天花板; 长程深度探索:最高可实现超过 100 轮不重复且稳定的环境交互,持续深度探索直至任务准确完成; 全流程开源:在开源模型的基础上进一步开源配套的工具沙盒统一管理调度平台 AgentDock、全异步强化学习训练框架 AgentRL、智能体能力一键式测评平台 AgentToLeaP,支持社区全流程复现与自定义扩展。 此次开源包含模型权重、模型的 RL 训练框架、评测系统以及工具调度平台。 Githu...

