免费开源 · 强大可控 · 可嵌入

把 Android 变成可编程的「AI 远程执行终端」

Open-AutoGLM-Pro 基于视觉语言模型:看懂屏幕、规划动作、执行到完成。
提供 Web 实时预览(scrcpy 主链路)、多设备切换、Telegram Bot、定时任务和邮件报告。
默认用稳定的 ADB 注入,高级开关可切到 scrcpy 控制注入,失败自动回退。

Web UI CLI Python API Telegram Bot Android / HarmonyOS / iOS
WHY IT FEELS DIFFERENT
不是“投屏工具”,而是“可执行 Agent 平台”
默认稳定 · 手动增强
scrcpy
主链路实时预览 + 低延迟交互(纯 scrcpy)
CI 开关
侧边栏启用 scrcpy 控制注入(默认开启)
多设备
快速切换、可保活、切回不冷启动
自动化
定时任务 + 报告 + 规则引擎 + 远程调试
🗣️ 下指令 → 👀 看画面 → 🧠 AI 决策 → ✋ 执行动作 → ✅ 完成

核心特性

默认稳、按需强:先保证生产可用,再按场景开启高级能力。

查看部署方式
🎮
设备预览与控制

设备预览与控制(重点)

Web 实时预览(scrcpy 主链路),支持鼠标/触控/键盘控制;多设备快切,后端保活流会话。

🧠
AI看懂并操作

AI 驱动的“看懂并操作”

模型理解页面并规划动作:打开、搜索、填写、提交、返回、等待,全流程自动执行。

🧩
高级控制注入

高级控制注入

侧边栏开启 scrcpy 控制注入,可保留 down→move→up 连续轨迹;失败自动回退 ADB。

🛰️
远程调试与多入口

远程调试与多入口

支持 Web 多用户远程访问、Cloudflare Tunnel 一键公网、CLI、Python API 和 Telegram Bot。

⏱️
定时任务与报告

定时任务 + 邮件报告

支持单次/每日/每周自动执行;结束自动发报告,适合无人值守。

🔧
规则引擎可扩展

规则引擎 & 可扩展

可自定义应用映射、动作规则和提示词,把 SOP 固化为可复用能力。

为什么更稳:纯 scrcpy 链路 + 双注入路径

预览链路仅使用 scrcpy,减少多链路分支复杂度; 输入默认走 ADB,高级开关可切 scrcpy 控制注入,失败自动回退。

📺
预览链路

预览链路(单链路)

scrcpy + ffmpeg(视频)
scrcpy control socket(控制)
scrcpy audio socket(音频直通)

🖱️
输入注入双路径

输入注入(双路径)

默认:ADB tap/swipe/keyevent(稳定)
高级:scrcpy 控制通道注入(连续轨迹)
失败:自动降级回 ADB,不影响基本功能

🧯
异常恢复与保活

异常恢复与保活

流会话可保活、切换更快;先起流再解锁;模拟器黑屏有提示;异常输入可快速 fallback。

与业界类似工具对比

投屏/远控工具偏终端产品,Appium 等偏测试框架; Open-AutoGLM-Pro 更像可编排、可接入、可远程下发任务的 Agent 平台

对比维度:开源/可编程/实时预览/注入轨迹/多入口/自动化能力
方案 定位 优势 短板 适合谁
Open-AutoGLM-Pro
Free & Open Source
AI 远程安卓控制 Agent 平台 Web 实时预览 多设备 Telegram/CLI/API 定时 + 报告
默认 ADB 稳定注入;可手动开 scrcpy 控制注入(连续轨迹);失败自动回退。
需具备基础 ADB/设备调试能力;高级注入依赖 scrcpy 会话稳定性(已做 fallback)。 做业务自动化、远程运营、客服流程、工具平台化的人
scrcpy
Open Source
低延迟投屏 + 电脑控制手机 极低延迟 轻量稳定 控制通道注入
作为底层能力非常优秀。
偏工具本体,不提供任务编排、AI理解、多入口、报表、规则引擎等平台能力。 开发者日常投屏、调试、手动操作
Vysor / AirDroid / TeamViewer
Commercial
远程控制/设备管理(偏产品) 开箱即用、跨网远控、界面友好,适合非技术用户。 多为闭源/付费;可编程与深度自动化能力有限;难把 SOP 直接做成 Agent 工作流。 IT 运维、远程协助、非开发团队
Appium / UIAutomator
Open Source
测试自动化框架 自动化成熟 元素级定位
适合 CI 测试与回归。
配置和维护成本高;多应用和变化 UI 需要持续工程投入; 不等同于 AI 看屏 Agent 模式。 QA/自动化测试团队
纯 ADB 脚本
Free
命令行注入/脚本控制 简单直接、兼容广、易落地。 轨迹能力弱(tap/swipe 两端点),复杂场景和 UI 变化适应差;缺少平台能力与可视化。 轻量自动化、小工具脚本
注:对比为“产品形态与能力覆盖”角度总结,实际效果会因设备/ROM/网络/权限策略而异。

它能帮你做什么(更接近“赚钱/降本”的场景)

以下场景都强调合规自动化:提效、降本、减少误操作。涉及平台互动请遵守平台规则与法律法规。

自动化 ≠ 违规刷量
💬
客服与售后

客服与售后:更快响应

自动打开聊天应用或客服后台,按规则回复常见问题并收集订单号; 复杂问题可触发 Take_over 交给人工。

🧾
接单履约

接单与履约:少漏单

定时检查订单/私信/通知,自动确认和登记派发;结束发送邮件报告。

📣
内容运营流程

内容运营:标准化流程

按 SOP 发布内容、补标签、检排版、传素材、定时发布; 互动仅做合规协助,避免刷量和虚假互动。

🧰
App流程自动化

App 级流程自动化

自动登录/跳转/搜索/筛选/填写/提交/返回,适合高频重复操作; UI 改版时可用视觉理解做适配。

📊
数据收集与稽核

数据收集与稽核

通过实时预览和任务回放抓取关键截图与状态,生成审计报告; 适合巡检、价库存检查和流程稽核。

🧪
远程协助父母手机

远程协助/父母手机支持

远程协助家人处理手机问题,或让 AI 控制父母手机完成设置与排障;过程画面可见、操作可控,解决问题看得见摸得着。

COMPLIANCE NOTE
我们坚持“可控合规”的自动化

项目用于研究和效率提升,不用于非法获取信息、干扰系统或违规操作。 可在官网底部保留免责声明与使用条款入口。

快速开始(最短路径)

三步启动:装依赖 → 连设备 → 起 Web。高级注入默认开启,按需关闭。

python run_web.py http://localhost:8080 /docs
1
安装依赖

安装 & 依赖

git clone <YOUR_REPO_URL>
cd Open-AutoGLM-Pro
python -m venv venv
# Windows: venv\Scripts\activate
source venv/bin/activate
pip install -r requirements.txt
pip install -e .
2
连接设备

连接设备(Android)

# 手机开启 USB 调试
adb devices
# 看到: XXXXXXXX device
# WiFi 调试:
adb connect 192.168.1.100:5555
3
启动Web

启动 Web(推荐)

python run_web.py
# 访问:
http://localhost:8080
# API 文档:
http://localhost:8080/docs
ADVANCED
侧边栏高级开关:scrcpy 控制注入(默认开启)

默认:ADB 注入(稳定)
开启后:触控/滚轮/按键优先走 scrcpy 控制通道(连续轨迹更顺)
失败:自动回退 ADB(不影响基本操作)

SCRCPY_FIRST_FRAME_TIMEOUT=40 SCRCPY_AUTO_UNLOCK_ON_START=1 SCRCPY_CONTROL_DEBUG=1