智谱开源“会操作手机的 AI Agent”:AutoGLM
智谱宣布开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。 我们开源的,是一整套可以「拿来就用」的能力,而不仅仅是一份概念说明。 具体包括: 训练好的核心模型; Phone Use 能力框架与工具链; 可直接跑通的 Demo,覆盖 50+ 高频中文 App; 针对 Android 的适配层与示例工程; 文档、快速上手指南。 模型会以MIT 开源许可证的形式开放,而所有代码会以Apache-2.0 开源许可证的形式,托管在 GitHub 仓库(github.com/zai-org/Open-AutoGLM)中。 此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。 目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。
