阿里开源 WebSailor,检索性能超 DeepSeek R1、Grok-3 等模型
阿里通义开源了网络智能体WebSailor,该智能体具备强大的推理和检索能力,在高难度智能体评测集BrowseComp上,WebSailor的成绩超越了DeepSeek R1、Grok-3等模型和智能体,一举登顶开源网络智能体榜单。
在构建数据集阶段,通义实验室大规模合成了具有高不确定性的复杂任务数据SailorFog-QA,并基于Qwen模型进行冷启动微调,让模型学到超越人类的复杂推理模式;该团队还提出了高效的强化学习算法 DUPO,基于双阶段动态采样策略,大幅提高了训练效率,确保即使在密集工具交互的情境中,也能快速迭代模型,DUPO 将复杂Agent的强化学习训练速度提升了约2–3倍。
英文版和中文版BrowseComp评测集的实测结果显示,WebSailor跨越了开源和闭源系统之间的鸿沟,WebSailor-32B、WebSailor-72B不仅在开源模型和Agent阵营里实现了断层领先,甚至超越了DeepSeek R1、Grok-3等闭源模型,仅次于闭源的OpenAI DeepResearch。
尽管WebSailor仅基于高难度数据训练,但在聚焦普通任务SimpleQA的数据集上,WebSailor的表现也超越了其他方法,展现出极强的兼容性和有效性,验证了WebSailor方法的泛化能力。
自今年以来,通义实验室已开源WebWalker、WebDancer和WebSailor三个检索和推理智能体,并全部斩获 SOTA(State-of-the-Art)。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
微软停止在欧盟地区 Chrome 官网植入 Edge 广告
微软在两年多前开始在Chrome官方网站上植入Edge广告,当用户通过Edge浏览器下载Chrome浏览器时,页面顶部会出现一个巨大的广告横幅。声称Edge“与Chrome使用相同的技术”,并劝说用户继续使用Edge,这种强行植入的广告不仅干扰了用户体验,还被许多人视为一种不太友好的竞争手段。 不过最近这一情况发生了变化,这些广告以及之前在下载Chrome时弹出的各种附加横幅已经消失。当用户通过Bing搜索Chrome时,不会再看到声称“无需下载其他浏览器(请使用Edge)”的横幅,也不会再有弹窗试图留住用户,巨大的广告横幅也彻底不见了。 不过,这一改变似乎仅限于部分用户,微软仅在《数字市场法》(DMA)适用的国家和地区移除了这些广告,主要是欧洲的一些国家。在欧洲经济区以外的地区,使用Edge下载Chrome的用户仍然会看到大量广告,这种差异化的处理方式显然是为了遵守DMA的规定。 一个月前,微软宣布了一系列Windows更新和功能变更,以符合DMA的要求,包括对Windows处理默认浏览器、Windows搜索以及卸载Microsoft商店的方式进行调整。虽然微软并未明确提及那些令人烦...
- 下一篇
一行代码性能翻倍?Rust开发者不可不知的“内存黑科技”!
在Rust高性能编程圈,大家常常热议Tokio异步框架、SIMD向量化指令、锁分离等“硬核”优化手段。然而,一个常被忽视的底层“神器”——内存分配器(Allocator),却能以极小的改动,带来颠覆性的性能飞跃! 或许你还不知道,仅仅替换掉Rust程序默认的内存分配器,你的程序在高并发、大数据量场景下,吞吐量可以暴涨数倍,延迟更是可能减半! 这并非天方夜谭,而是经过严格实测的数据证明: 权威基准测试数据揭秘: 微软mimalloc官方报告:在Linux多线程严苛环境下,mimalloc相比glibc malloc平均性能提升高达5.3倍,同时内存占用(RSS)显著减少约50%。这意味着同样的资源下,你的服务能处理更多请求,成本更低! jemalloc官方论文:在4核服务器的真实负载测试中,默认的glibc malloc吞吐量仅为jemalloc的15%。对于追求极致并发的服务器应用,性能差距可见一斑! 本文将带你一起揭开内存分配器的神秘面纱,深度剖析其性能差距的根源,并手把手教你如何“一行代码”实现性能飞跃! 1. 🤔 内存分配器:你程序的“隐形大管家” 简单说,就是你程序堆内存的管...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主