千问开源原生语言世界模型 Qwen-AgentWorld-低调大师

千问开源原生语言世界模型 Qwen-AgentWorld

2026-06-24 31

千问宣布正式开源发布 Qwen-AgentWorld —— 首个原生语言世界模型（Language World Model, LWM），能够在七大领域中模拟智能体交互环境：

原生世界建模： 环境建模从继续预训练（CPT）阶段起即为训练目标，贯穿 CPT → SFT → RL 全流程，而非对通用大语言模型的事后适配。
七大领域，一个模型：单一模型同时覆盖文本类环境（MCP、Search、Terminal、SWE）与 GUI 类环境（Web、OS、Android），实现跨领域知识迁移。

具体来说，团队首先构建了智能体环境模拟的基础模型：Qwen-AgentWorld 是首个在单一模型中覆盖七大智能体交互领域（MCP、Search、Terminal、SWE、Web、OS、Android）的语言世界模型，基于超过 1000 万条真实环境交互轨迹，经由 CPT → SFT → RL 三阶段训练而成。

其次是探讨世界建模在智能体训练中的作用，并通过两种互补范式加以验证：作为解耦的环境模拟器，它为智能体强化学习提供了更优的可扩展性与可控性——可控的模拟 RL 能够以真实环境无法实现的方式塑造智能体行为，且显著优于仅在真实环境中训练的 RL；作为统一的智能体基础模型，LWM 预热训练可有效迁移至涵盖七个基准（其中三个完全未出现在训练集中）的多轮智能体任务，且无需在智能体任务上进行任何 RL 微调，初步验证了语言世界模型能够作为构建更强智能体模型的基础。

同步发布的还有一个覆盖七大领域的语言世界模型评测基准 AgentWorldBench，每条测试样本均配备真实环境执行所得的真实环境观测数据。

Qwen-AgentWorld-397B-A17B 在 AgentWorldBench 上取得最高的整体均分（58.71），超越 GPT-5.4（58.25）及所有其他前沿模型。优势在 Terminal 和 SWE 两个领域最为显著，这两个领域的预测需要准确建模代码执行状态和工具 API 行为。

在 35B-A3B 规模上，三阶段训练流水线将整体均分提升了 +8.66（47.73 → 56.39），使 Qwen-AgentWorld-35B-A3B 超过 Claude Sonnet 4.6（56.04）。这一提升在文本类和 GUI 类领域上均保持一致。

微信关注我们

原文链接：https://www.oschina.net/news/466541

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Linux 嵌入式系统构建工具 Yocto 的二十年统治面临“yoe”挑战

嵌入式 Linux 的世界里有两个「老家伙」：Buildroot 诞生于 2001 年，OpenEmbedded/Yocto 诞生于 2003 年。二十多年来，它们几乎是所有嵌入式 Linux 设备的构建系统标配，从路由器到汽车中控，从工业控制到 IoT 网关，几乎每个 SoC 和核心板厂商都会优先提供 Yocto 或 Buildroot 的 BSP。但在 2026 年，一个名为 yoe 的新项目站了出来，提出了一个直白的问题：是时候换一套新的构建系统了。提出这个问题的是 yoe build 项目的作者——一位在嵌入式领域有超过 20 年经验的工程师。他在 6 月 1...

2026-06-24

24

2026 年 4 月，Meta 在美国办公室悄然上线了一个名为「模型能力计划」（Model Compatibility Initiative，简称 MCI）的内部项目。项目的目的听起来颇具未来感：通过记录员工的键盘输入、鼠标移动轨迹、点击位置和屏幕截图，来训练 AI 系统像人类一样操作计算机软件。Meta 高管的逻辑是：最好的 AI 训练数据，来自观察最优秀的员工如何工作。两个月后，这个项目以一种近乎黑色幽默的方式翻车了——约 4.5 万张包含员工私人数据的数据表因访问控制配置错误，被暴露给了公司内部任何可能搜索到它们的人。6 月 22 日，Meta 宣布无限期暂停 ...

2026-06-24

23

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。