基于 agent-browser 和 CDP 的浏览器 workflow 自动化 skill。
将浏览器操作沉淀为可复用的 workflow 文件:通过对话逐步走通流程,记录每一步的精确命令 + 自然语言描述 + 验证条件,后续一键执行。执行时命令失败会自动兜底,AI 会根据描述 + 当前页面状态自主恢复。
| 能力 | 说明 |
|---|---|
| 创建 workflow | 对话式逐步走通流程,自动记录为结构化 workflow 文件 |
| 执行 workflow | 按步骤自动执行,command → verify → AI 兜底,全程自适应 |
| 维护 workflow | 执行中自动更新失效命令,页面改版时重新创建 |
| 双模式浏览器 | agent-browser(snapshot/ref 交互)+ CDP Proxy(精确 DOM 控制) |
| 站点经验 | 按域名积累操作经验,跨 session 复用 |
| 参数化 | workflow 支持动态参数,每次执行传入不同输入 |
npx skills add https://github.com/coderPerseus/auto-flow列出仓库内可安装的 skill:
npx skills add https://github.com/coderPerseus/auto-flow --list只安装 auto-flow:
npx skills add https://github.com/coderPerseus/auto-flow --skill auto-flow如果要安装到全局目录:
npx skills add https://github.com/coderPerseus/auto-flow --skill auto-flow --global- Node.js 22+
- Chrome 开启远程调试:地址栏打开
chrome://inspect/#remote-debugging,勾选 Allow remote debugging for this browser instance。skill 会自动发现并缓存调试端点,不需要手动告诉它127.0.0.1:9222 - agent-browser:
npm i -g agent-browser
安装后运行环境检查:
bash ~/.claude/skills/auto-flow/scripts/check-deps.sh如果检查失败,只需要开启 Chrome 调试并重新执行检查;不要再要求用户手动报告服务地址或端口。
# 创建 workflow
"帮我创建一个 workflow:在千牛后台上传素材"
# 执行 workflow
"执行千牛上传素材的 workflow"
# 列出 workflow
"有哪些 workflow?"
# 更新 workflow
"重新走一遍千牛上传素材的流程,更新 workflow"
每个 step 同时记录精确命令和自然语言描述:
command 成功 → verify 通过 → 下一步
command 失败 ──┐
verify 不通过 ─┤→ AI 读取 description + snapshot → 自主操作 → 再 verify
命令优先保证速度和确定性,自然语言兜底保证适应性。
SKILL.md # Skill 主文件
workflows/ # Workflow 文件
_template.md # 模板
qianniu-upload-material.md # 示例:千牛上传素材
scripts/
check-deps.sh # 环境检查
cdp-proxy.mjs # CDP Proxy 服务
references/
cdp-api.md # CDP API 参考
agent-browser.md # agent-browser 踩坑经验
site-patterns/ # 站点经验
- web-access — CDP Proxy 的灵感来源
- agent-browser — 核心浏览器交互引擎
MIT