一位中国开发者近日在GitHub发布了OpenCyvis Phone项目,全称"Open Cyber Jarvis",试图打造商业AI手机的开源透明替代品。
与Rabbit R1、AI Pin等封闭硬件不同,OpenCyvis Phone直接基于Android AOSP系统运行,无需额外购买设备。其核心思路是将手机变成能听懂自然语言、自主操作应用的AI Agent——AI可以实时截屏、解析UI元素树,像真人一样点击、滑动、填写表单,帮用户完成跨应用任务。

项目最大的架构亮点是"虚拟显示隔离"。AI在后台虚拟屏幕上工作,用户仍能正常使用手机,还能随时观察AI的操作过程、一键接管控制权。这种设计既保证了AI的自主性,又避免了对用户日常使用的干扰。
┌─────────────────────┐ ┌─────────────────────┐
│ 你的屏幕 │ │ 虚拟显示器 │
│ │ │ (AI 在这里工作) │
│ 刷微博、聊微信、 │ │ │
│ 看视频—— │ │ 订机票、发消息、 │
│ 手机照常用 │ │ 下单购物 │
│ │ │ │
└─────────────────────┘ └─────────────────────┘
你用这个 AI 用这个
在技术选型上,OpenCyvis Phone采用Kotlin开发,兼容OpenAI、Claude、Qwen、Llama等多种模型,也可通过Ollama完全本地部署。语音交互方面内置Sherpa-ONNX端侧语音识别,识别过程在内存中完成、不落盘,兼顾了便利与隐私。

功能层面,项目已规划了相当完整的特性:遇到歧义时暂停询问而非盲目操作、重复操作检测、敏感操作确认等安全防护机制都有涉及。官方Demo展示了跨应用比价、查航班订机票、批量系统设置等场景。
不过项目目前仍处于极早期阶段——GitHub仓库仅1个commit,主要由开发者@flankerhqd一人维护。它更像是一个架构验证和概念演示,距离真正日用尚有距离。尽管如此,OpenCyvis Phone代表了一种值得关注的路线:不造新硬件、不绑死模型、代码完全开源可审计,让AI Agent真正成为用户手机的"数字替身"而非黑盒服务。
参考来源:https://github.com/opencyvis/opencyvis-phone/