OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux
OpenAGI 基金会近日发布了其首个“computer-use”基座模型,名为 Lux。官方称它是“世界上最好、最快、最便宜的 computer-use 模型”,并且已经通过其 SDK 对外开放,因此任何开发者或公司都可以使用它来构建自动化、代理式应用。
Lux 提供了三种运行模式,以适应不同类型的任务。
- Actor 模式:适合明确、简单、单步任务。执行速度快。
- Thinker 模式:适合模糊、多步、复杂目标 — 模型会将大目标拆解成多个子任务并逐步执行。
- Tasker 模式:用户可传入一组具体的步骤(Python 列表形式),Lux 会逐步执行,遇失败会重试直到完成 — 对复杂、需要精准控制的任务最为适合。
Lux 支持多种 Agent 应用:自动化软件质量保证工作流程、深度研究、社交媒体管理、在线商店管理、数据录入和批量操作等等。
在“Online-Mind2Web benchmark”(涵盖超过 300 个现实、基于 Web 的 computer-use 任务)测评中,Lux 获得了 83.6 的成绩。相比之下,它超过了来自其他主要 AI 实验室的模型:例如 Gemini CUA(69.0)、 OpenAI Operator(61.3) 和 Claude Sonnet 4(61.0)。
此外在速度和成本上也有优越表现:Lux 每一步操作约需 1 秒,而其他模型通常约 3 秒;而且据称其成本比传统模型低 10 倍。
与传统的大语言模型(LLM)主要通过被动「阅读」互联网内容不同,Lux 的训练采用了一种被称为“Agentic Active Pre-training”(主动代理式预训练) 的方法。模型通过主动在数字环境中“做事”、与环境交互、探索并学习,而不是单纯记忆文本。这样训练出的模型在实际操作任务时更有效、更“懂动作”。
OpenAGI 基金会已将用于训练 Agent 模型的数据引擎和基础设施 OSGym 开源。OSGym 具有极高的可扩展性,能够泛化到各种计算机使用任务,并行运行数千个操作系统副本,每分钟生成超过一千个数据点。
详情参见技术报告和 GitHub 代码库。


