DeepMind 推出 Evo-Memory 基准与 ReMem 框架
来自伊利诺伊大学香槟分校和谷歌 DeepMind 的研究团队近日提出了 Evo-Memory,这是一种流式基准和智能体框架,旨在弥补当前技术的不足。Evo-Memory 不仅评估智能体在测试时的学习能力,还关注自我演变的记忆,挑战智能体是否能从连续任务流中积累和重用策略,而不仅仅依赖于静态对话记录。 传统的智能体主要依靠对话回忆,存储对话历史、工具使用记录及文档检索,以便在未来查询中重新整合这些信息。然而,这种记忆方式只是被动地缓冲信息,无法主动修改智能体对相关任务的处理策略。相对而言,Evo-Memory 则强调经验重用,将每次交互视为一个包含输入、输出和反馈的经验,评估智能体是否能在后续任务中检索这些经验并将其转化为可重用的策略。 研究团队将记忆增强智能体形式化为一个包含四个部分的元组(F, U, R, C),其中 F 为基本模型,R 为检索模块,C 为上下文构造,U 则是在每一步后写入新经验并演变记忆。Evo-Memory 通过将数据集重新构造成有序任务流,评估智能体在多种环境中的表现。 为了设定基线,研究团队还定义了 ExpRAG 模型,该模型将每次交互转化为结构化的经验文本。...
