阿里开源 WebSailor，检索性能超 DeepSeek R1、Grok-3 等模型-低调大师

阿里开源 WebSailor，检索性能超 DeepSeek R1、Grok-3 等模型

2025-07-07 299

阿里通义开源了网络智能体WebSailor，该智能体具备强大的推理和检索能力，在高难度智能体评测集BrowseComp上，WebSailor的成绩超越了DeepSeek R1、Grok-3等模型和智能体，一举登顶开源网络智能体榜单。

在构建数据集阶段，通义实验室大规模合成了具有高不确定性的复杂任务数据SailorFog-QA，并基于Qwen模型进行冷启动微调，让模型学到超越人类的复杂推理模式；该团队还提出了高效的强化学习算法 DUPO，基于双阶段动态采样策略，大幅提高了训练效率，确保即使在密集工具交互的情境中，也能快速迭代模型，DUPO 将复杂Agent的强化学习训练速度提升了约2–3倍。

英文版和中文版BrowseComp评测集的实测结果显示，WebSailor跨越了开源和闭源系统之间的鸿沟，WebSailor-32B、WebSailor-72B不仅在开源模型和Agent阵营里实现了断层领先，甚至超越了DeepSeek R1、Grok-3等闭源模型，仅次于闭源的OpenAI DeepResearch。

尽管WebSailor仅基于高难度数据训练，但在聚焦普通任务SimpleQA的数据集上，WebSailor的表现也超越了其他方法，展现出极强的兼容性和有效性，验证了WebSailor方法的泛化能力。

自今年以来，通义实验室已开源WebWalker、WebDancer和WebSailor三个检索和推理智能体，并全部斩获 SOTA（State-of-the-Art）。

微信关注我们

原文链接：https://www.oschina.net/news/359197

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微软停止在欧盟地区 Chrome 官网植入 Edge 广告

微软在两年多前开始在Chrome官方网站上植入Edge广告，当用户通过Edge浏览器下载Chrome浏览器时，页面顶部会出现一个巨大的广告横幅。声称Edge“与Chrome使用相同的技术”，并劝说用户继续使用Edge，这种强行植入的广告不仅干扰了用户体验，还被许多人视为一种不太友好的竞争手段。不过最近这一情况发生了变化，这些广告以及之前在下载Chrome时弹出的各种附加横幅已经消失。当用户通过Bing搜索Chrome时，不会再看到声称“无需下载其他浏览器（请使用Edge）”的横幅，也不会再有弹窗试图留住用户，巨大的广告横幅也彻底不见了。不过，这一改变似乎仅限于部分用户，微软仅在《数字市场法》（DMA）适用的国家和地区移除了这些广告，主要是欧洲的一些国家。在欧洲经济区以外的地区，使用Edge下载Chrome的用户仍然会看到大量广告，这种差异化的处理方式显然是为了遵守DMA的规定。一个月前，微软宣布了一系列Windows更新和功能变更，以符合DMA的要求，包括对Windows处理默认浏览器、Windows搜索以及卸载Microsoft商店的方式进行调整。虽然微软并未明确提及那些令人烦...

2025-07-07

287

在Rust高性能编程圈，大家常常热议Tokio异步框架、SIMD向量化指令、锁分离等“硬核”优化手段。然而，一个常被忽视的底层“神器”——内存分配器（Allocator），却能以极小的改动，带来颠覆性的性能飞跃！或许你还不知道，仅仅替换掉Rust程序默认的内存分配器，你的程序在高并发、大数据量场景下，吞吐量可以暴涨数倍，延迟更是可能减半！这并非天方夜谭，而是经过严格实测的数据证明：权威基准测试数据揭秘：微软mimalloc官方报告：在Linux多线程严苛环境下，mimalloc相比glibc malloc平均性能提升高达5.3倍，同时内存占用（RSS）显著减少约50%。这意味着同样的资源下，你的服务能处理更多请求，成本更低！ jemalloc官方论文：在4核服务器的真实负载测试中，默认的glibc malloc吞吐量仅为jemalloc的15%。对于追求极致并发的服务器应用，性能差距可见一斑！本文将带你一起揭开内存分配器的神秘面纱，深度剖析其性能差距的根源，并手把手教你如何“一行代码”实现性能飞跃！ 1. 🤔 内存分配器：你程序的“隐形大管家” 简单说，就是你程序堆内存的管...

2025-07-01

262

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。