蚂蚁发布 ASearcher，面向搜索 Agent 的强化学习开源项目-低调大师

蚂蚁发布 ASearcher，面向搜索 Agent 的强化学习开源项目

2025-08-15 181

蚂蚁 AReaL 团队近日发布“ASearcher”，这是一个 Agentic RL（reinforcement learning，强化学习）方面的开源项目，可大规模异步 RL 解锁 Agent 长程工具使用能力，使开发者能够轻松且经济高效地构建自己的高性能搜索 Agent。

项目地址：https://github.com/inclusionAI/ASearcher
论文：https://arxiv.org/abs/2508.07976

据介绍，ASearcher 专为大规模在线强化学习（RL）训练搜索 Agent 而设计，使命是推进搜索 Agent 达到专家级性能。

ASearcher 主要有两项核心贡献：

1. 使用完全异步 RL 训练（Fully Async RL）在训练高效的同时让 agent 学会长程工具使用（Long-Horizon Tool Use）。训练过程中，基于 QwQ-32B 的 agent 能够自然地学会更多的工具使用轮次和更多输出 token，在 200 步之后学会高达 40 轮次的 tool use，并且生成 token 达到了 150k+。

2. 开源了一个用于构造高质量&高难度数据的 agent。Agent 通过注入外部事实（Fact Injection）以及对题目模糊化（fuzz）来合成问题，同时在每一步合成都进行了非常严格的检验来保证 quality & difficulty 检验。

详情查看 https://mp.weixin.qq.com/s/mzvjcksN1JbWzZv5bnCPvQ

微信关注我们

原文链接：https://www.oschina.net/news/366396

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

IDC：中国生成式 AI 相关网络硬件支出将在 2028 年达到 330 亿元

人工智能应用在工作和生活场景中迅速普及，从企业业务决策到个人数字助理，各行业纷纷引入AI以提升效率和创新。IDC统计，2024下半年中国大模型商用落地日均Tokens消耗量增长近10倍，2024年中国公有云大模型调用量累计114.2万亿Tokens（不包含使用海外MaaS平台的调用量）。生成式AI的快速发展不仅显著提升了企业应用的智能化体验与整体运营效率，同时也对底层数字基础设施提出了全新且更高的要求。随着数据中心内Token用量持续攀升激增，东西向流量大幅增长、通信能耗不断加大，网络正成为AI基础设施的决定性瓶颈。400G-800G-1.6T的网络演进节奏显著加速，传统“先算力、后网络”的升级逻辑已经失效。 AI服务提供商需要把网络规划前置，通过高带宽、高可靠、低能耗的全栈创新，才能真正释放GPU算力红利，并在AI平台竞争中占据领先位置。 2024年，中国高端以太网（≥200G）端口出货量突破600万，未来将保持45.6%的复合增长率，2029年中国高端以太网端口出货量将超过4300万个。IDC预测，中国生成式AI相关网络硬件支出将持续加速，从2023年的65亿元，增加到2028年...

2025-08-15

163

本文导读本文作者参与2025华为开发者大会，带来分享《京东+仓颉:高性能、跨平台鸿蒙应用开发实践分享》。本次创新实践为京东小程序团队与华为鸿蒙突击队合作对京东小程序API调用过程进行解析，通过借力仓颉实现小程序性能提升和便捷的开发体验。欢迎一起交流讨论！ 01 背景介绍京东小程序容器是京东及其关联App的重要组成部分，承载了多种内部和外部业务。其中近期热门的模块秒送外卖、以及常用的买菜、超市店铺、奢侈品店铺等均属于小程序。 02 小程序架构京东鸿蒙版小程序框架整体如下所示：小程序采用双线程架构。即同时存在JS逻辑线程和WebView线程。其中JS逻辑线程(简称JS线程)负责运行JS引擎，执⾏业务逻辑；Webview通常运行在UI主线程，主要包括页面的渲染任务、响应交互事件并发送给JS线程。两个线程可能会启动worker子线程来辅助处理任务。 JS Bridge作为桥梁层，负责处理JS API的调用与派发。整体JS API派发逻辑由Native实现（C++）。当一个JS API调用请求到来后，首先判断该API是否有Native实现，如果没有则调用ArkTS的派发逻辑来调...

2025-08-15

251

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。