把 Android 变成可编程的「AI 远程执行终端」
Open-AutoGLM-Pro 基于视觉语言模型:看懂屏幕、规划动作、执行到完成。
提供 Web 实时预览(scrcpy 主链路)、多设备切换、Telegram Bot、定时任务和邮件报告。
默认用稳定的 ADB 注入,高级开关可切到 scrcpy 控制注入,失败自动回退。
🗣️ 下指令 → 👀 看画面 → 🧠 AI 决策 → ✋ 执行动作 → ✅ 完成
核心特性
默认稳、按需强:先保证生产可用,再按场景开启高级能力。
设备预览与控制(重点)
Web 实时预览(scrcpy 主链路),支持鼠标/触控/键盘控制;多设备快切,后端保活流会话。
AI 驱动的“看懂并操作”
模型理解页面并规划动作:打开、搜索、填写、提交、返回、等待,全流程自动执行。
高级控制注入
侧边栏开启 scrcpy 控制注入,可保留 down→move→up 连续轨迹;失败自动回退 ADB。
远程调试与多入口
支持 Web 多用户远程访问、Cloudflare Tunnel 一键公网、CLI、Python API 和 Telegram Bot。
定时任务 + 邮件报告
支持单次/每日/每周自动执行;结束自动发报告,适合无人值守。
规则引擎 & 可扩展
可自定义应用映射、动作规则和提示词,把 SOP 固化为可复用能力。
为什么更稳:纯 scrcpy 链路 + 双注入路径
预览链路仅使用 scrcpy,减少多链路分支复杂度; 输入默认走 ADB,高级开关可切 scrcpy 控制注入,失败自动回退。
预览链路(单链路)
scrcpy + ffmpeg(视频)
scrcpy control socket(控制)
scrcpy audio socket(音频直通)
输入注入(双路径)
默认:ADB tap/swipe/keyevent(稳定)
高级:scrcpy 控制通道注入(连续轨迹)
失败:自动降级回 ADB,不影响基本功能
异常恢复与保活
流会话可保活、切换更快;先起流再解锁;模拟器黑屏有提示;异常输入可快速 fallback。
与业界类似工具对比
投屏/远控工具偏终端产品,Appium 等偏测试框架; Open-AutoGLM-Pro 更像可编排、可接入、可远程下发任务的 Agent 平台。
| 方案 | 定位 | 优势 | 短板 | 适合谁 |
|---|---|---|---|---|
| Open-AutoGLM-Pro Free & Open Source |
AI 远程安卓控制 Agent 平台 |
Web 实时预览
多设备
Telegram/CLI/API
定时 + 报告 默认 ADB 稳定注入;可手动开 scrcpy 控制注入(连续轨迹);失败自动回退。 |
需具备基础 ADB/设备调试能力;高级注入依赖 scrcpy 会话稳定性(已做 fallback)。 | 做业务自动化、远程运营、客服流程、工具平台化的人 |
| scrcpy Open Source |
低延迟投屏 + 电脑控制手机 |
极低延迟
轻量稳定
控制通道注入 作为底层能力非常优秀。 |
偏工具本体,不提供任务编排、AI理解、多入口、报表、规则引擎等平台能力。 | 开发者日常投屏、调试、手动操作 |
| Vysor / AirDroid / TeamViewer Commercial |
远程控制/设备管理(偏产品) | 开箱即用、跨网远控、界面友好,适合非技术用户。 | 多为闭源/付费;可编程与深度自动化能力有限;难把 SOP 直接做成 Agent 工作流。 | IT 运维、远程协助、非开发团队 |
| Appium / UIAutomator Open Source |
测试自动化框架 |
自动化成熟
元素级定位 适合 CI 测试与回归。 |
配置和维护成本高;多应用和变化 UI 需要持续工程投入; 不等同于 AI 看屏 Agent 模式。 | QA/自动化测试团队 |
| 纯 ADB 脚本 Free |
命令行注入/脚本控制 | 简单直接、兼容广、易落地。 | 轨迹能力弱(tap/swipe 两端点),复杂场景和 UI 变化适应差;缺少平台能力与可视化。 | 轻量自动化、小工具脚本 |
它能帮你做什么(更接近“赚钱/降本”的场景)
以下场景都强调合规自动化:提效、降本、减少误操作。涉及平台互动请遵守平台规则与法律法规。
客服与售后:更快响应
自动打开聊天应用或客服后台,按规则回复常见问题并收集订单号; 复杂问题可触发 Take_over 交给人工。
接单与履约:少漏单
定时检查订单/私信/通知,自动确认和登记派发;结束发送邮件报告。
内容运营:标准化流程
按 SOP 发布内容、补标签、检排版、传素材、定时发布; 互动仅做合规协助,避免刷量和虚假互动。
App 级流程自动化
自动登录/跳转/搜索/筛选/填写/提交/返回,适合高频重复操作; UI 改版时可用视觉理解做适配。
数据收集与稽核
通过实时预览和任务回放抓取关键截图与状态,生成审计报告; 适合巡检、价库存检查和流程稽核。
远程协助/父母手机支持
远程协助家人处理手机问题,或让 AI 控制父母手机完成设置与排障;过程画面可见、操作可控,解决问题看得见摸得着。
项目用于研究和效率提升,不用于非法获取信息、干扰系统或违规操作。 可在官网底部保留免责声明与使用条款入口。
快速开始(最短路径)
三步启动:装依赖 → 连设备 → 起 Web。高级注入默认开启,按需关闭。
安装 & 依赖
git clone <YOUR_REPO_URL>
cd Open-AutoGLM-Pro
python -m venv venv
# Windows: venv\Scripts\activate
source venv/bin/activate
pip install -r requirements.txt
pip install -e .
连接设备(Android)
# 手机开启 USB 调试
adb devices
# 看到: XXXXXXXX device
# WiFi 调试:
adb connect 192.168.1.100:5555
启动 Web(推荐)
python run_web.py
# 访问:
http://localhost:8080
# API 文档:
http://localhost:8080/docs
默认:ADB 注入(稳定)
开启后:触控/滚轮/按键优先走 scrcpy 控制通道(连续轨迹更顺)
失败:自动回退 ADB(不影响基本操作)