智谱开源“会操作手机的 AI Agent”:AutoGLM
智谱宣布开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。
我们开源的,是一整套可以「拿来就用」的能力,而不仅仅是一份概念说明。
具体包括:
- 训练好的核心模型;
- Phone Use 能力框架与工具链;
- 可直接跑通的 Demo,覆盖 50+ 高频中文 App;
- 针对 Android 的适配层与示例工程;
- 文档、快速上手指南。
模型会以 MIT 开源许可证的形式开放,而所有代码会以 Apache-2.0 开源许可证的形式,托管在 GitHub 仓库(github.com/zai-org/Open-AutoGLM)中。
此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。
目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。



