AReaL 团队开源 ASearcher 项目,解锁搜索智能体领域的最新突破
AReaL 团队开源 Agentic RL(reinforcement learning,强化学习)方面的开源项目——ASearcher,大规模异步 RL 解锁 Agent 长程工具使用能力。项目地址:https://github.com/inclusionAI/ASearcher论文:https://arxiv.org/abs/2508.07976在大模型智能体(LLM Agent)的发展中,工具使用正成为解决复杂问题的关键能力。其中,搜索引擎作为连接外部世界的核心工具,其使用效果直接影响 agent 的问题解决深度。要真正驾驭搜索工具,agent 需要学会精准查询,深度探索,动态验证,以及长程策略规划。然而,当前的开源强化学习方案却面临两个根本性挑战:轮次限制:现有 online RL 训练限制交互轮次(≤10 轮),阻碍 agent 进行深度探索。数据不足:现有开源 RL 数据规模小、复杂度低,难以激发 agent 的复杂搜索行为。ASearcher 主要有两项核心贡献:使用完全异步 RL 训练(Fully Async RL)在训练高效的同时让 agent 学会长程工具使用(Lo...
