您现在的位置是:首页 > 文章详情

阿里开源 WebSailor,检索性能超 DeepSeek R1、Grok-3 等模型

日期:2025-07-07点击:16

阿里通义开源了网络智能体WebSailor,该智能体具备强大的推理和检索能力,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Grok-3等模型和智能体,一举登顶开源网络智能体榜单。

在构建数据集阶段,通义实验室大规模合成了具有高不确定性的复杂任务数据SailorFog-QA,并基于Qwen模型进行冷启动微调,让模型学到超越人类的复杂推理模式;该团队还提出了高效的强化学习算法 DUPO,基于双阶段动态采样策略,大幅提高了训练效率,确保即使在密集工具交互的情境中,也能快速迭代模型,DUPO 将复杂Agent的强化学习训练速度提升了约2–3倍。

英文版和中文版BrowseComp评测集的实测结果显示,WebSailor跨越了开源和闭源系统之间的鸿沟,WebSailor-32B、WebSailor-72B不仅在开源模型和Agent阵营里实现了断层领先,甚至超越了DeepSeek R1、Grok-3等闭源模型,仅次于闭源的OpenAI DeepResearch。

 

尽管WebSailor仅基于高难度数据训练,但在聚焦普通任务SimpleQA的数据集上,WebSailor的表现也超越了其他方法,展现出极强的兼容性和有效性,验证了WebSailor方法的泛化能力。

自今年以来,通义实验室已开源WebWalker、WebDancer和WebSailor三个检索和推理智能体,并全部斩获 SOTA(State-of-the-Art)。

原文链接:https://www.oschina.net/news/359197
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章