SE-Agent - 自进化智能体
SE-Agent是一个自进化框架,通过轨迹级进化机制实现推理路径之间的信息交换,突破了单一轨迹的认知局限。该方法扩展了搜索空间,突破了局部最优,并展现了从集体交互中涌现的能力,在SWE-bench Verified上实现了80% 的 Top1 性能,真正实现了基于 LLM 的智能体在复杂推理任务中的自主进化。
性能结果
SE-Agent 实现了三个核心的自我进化操作,改变了代理解决问题的方式:
1. 修订-失败驱动的策略生成
通过深入的自我反思和有针对性的改进,分析单个失败的轨迹。它超越了简单的重试,识别基本方法的局限性,并创建架构上正交的问题解决范式。这包括分析单个轨迹以识别错误、低效或概念盲点,然后促使代理生成完全不同的解决方案来克服这些特定的局限性。
2.重组-跨轨迹知识合成
通过智能地整合多条现有解决方案路径的优势,创建新的轨迹。跨轨迹灵感主要产生于此——SE-Agent 智能地从不同的轨迹中筛选出性能优异的片段,并将它们合并,从而构建出更优的方法。该流程明确地利用了各种尝试之间的相互依赖性,允许一个领域的成功弥补其他领域的不足,从而实现1+1>2 的协同效应,超越单个轨迹的局限性。
3. 细化-风险感知轨迹优化
通过消除冗余,并利用来自整个轨迹池的洞察来提升效率,从而优化有前景的轨迹。新轨迹形成后,此步骤将进一步完善这些轨迹,包括移除不必要的步骤、精简行动顺序,并融入风险感知指导,从而避免从集体探索历史中汲取的系统性盲点和故障模式。



