OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux
OpenAGI 基金会近日发布了其首个“computer-use”基座模型,名为 Lux。官方称它是“世界上最好、最快、最便宜的 computer-use 模型”,并且已经通过其 SDK 对外开放,因此任何开发者或公司都可以使用它来构建自动化、代理式应用。 Lux 提供了三种运行模式,以适应不同类型的任务。 Actor 模式:适合明确、简单、单步任务。执行速度快。 Thinker 模式:适合模糊、多步、复杂目标 — 模型会将大目标拆解成多个子任务并逐步执行。 Tasker 模式:用户可传入一组具体的步骤(Python 列表形式),Lux 会逐步执行,遇失败会重试直到完成 — 对复杂、需要精准控制的任务最为适合。 Lux 支持多种 Agent 应用:自动化软件质量保证工作流程、深度研究、社交媒体管理、在线商店管理、数据录入和批量操作等等。 在“Online-Mind2Web benchmark”(涵盖超过 300 个现实、基于 Web 的 computer-use 任务)测评中,Lux 获得了 83.6 的成绩。相比之下,它超过了来自其他主要 AI 实验室的模型:例如 Gemini CU...

