概述
PokeClaw,亦称PocketClaw,是一款开源的Android应用程序,能够实现完全本地化的AI驱动手机控制。该应用由一位独立开发者在谷歌Gemma 4模型发布后迅速构建完成,允许用户通过自然语言指令操控设备端的AI代理——该代理可导航手机界面、与应用程序交互并执行复杂任务,且全程无需向云端传输任何数据。
“Poke”是“Pocket”的缩写,突显其便携、私密且完全在设备端运行的特性。
核心特性
-
完全设备端AI:通过LiteRT-LM运行时在本地运行Google的Gemma 4模型。无需网络连接、无需API密钥,首次模型下载后无后续费用。
-
手机自动化代理:AI可理解指令并执行真实操作,如打开应用、点击元素、输入文字、滚动页面及处理多步骤工作流。
-
隐私优先设计:所有处理均在您的安卓设备上完成。特别适合关注数据隐私与安全的用户。
-
开源透明:完整代码库已在GitHub公开,欢迎社区贡献与自定义开发。
-
任务规划与执行:支持基于本地大语言模型的复杂多步骤任务规划能力。
-
便捷APK安装:可直接从GitHub发布页面下载最新签名版APK。
技术细节
- 模型:Google Gemma 4(针对设备端推理优化)
- 运行时:LiteRT-LM(前身为 TensorFlow Lite 或类似设备端大语言模型运行时)
- 平台:Android(原生应用)
- 架构:在闭环智能体系统中结合屏幕理解、动作预测与执行
- 开发:作为原型从零开始构建耗时约两天,现正结合社区反馈持续演进
安装步骤
- 访问 GitHub 仓库
- 进入 Releases 版本发布区
- 下载最新的 APK 文件
- 在您的安卓设备上安装(如需要请启用“允许未知来源安装”)
- 下载 Gemma 4 模型(应用内会自动处理或按指引操作)
注意:若您从旧的调试版本更新,请先卸载旧版再安装新的签名版 APK。
使用场景
- 日常个人自动化(例如“查看我的消息并回复紧急内容”)
- 为行动或视觉障碍用户提供无障碍辅助
- 云端智能体不可接受的隐私敏感型工作流
- 在移动硬件上试验本地大语言模型智能体
- 直接在设备上自动化重复任务,如表单填写、导航或内容整理
对比与背景
PokeClaw 经常被拿来与基于云端或混合型的手机代理(包括 OpenClaw 等项目)进行比较。它的主要优势在于真正的设备端运行,为支持的任务提供更低的延迟、完全的隐私保护以及零持续成本。
链接
- GitHub 仓库:https://github.com/agents-io/PokeClaw
- 项目主页:https://agents-io.github.io/PokeClaw/
- 版本发布与APK下载:请在GitHub仓库中获取
PokeClaw代表了迈向真正私有、便携式AI智能体的激动人心一步,这些智能体将直接存在于您的口袋之中。
Tags
安卓AI代理设备端AIGemma 4本地LLM手机自动化开源无障碍工具调用PocketClaw
