Skip to content

v1.9.0 — Computer Use 协议 + 权限系统

Choose a tag to compare

@opc007 opc007 released this 17 Jun 13:50
· 8 commits to main since this release

v1.9.0 — Computer Use 协议 + 权限系统

发布日期:2026-06-17

🎯 主题

对齐 MiniMax 官方 Computer Use 协议(5.27 v1.9.1 校正)+ Codex 风格 App 权限系统(5.28)。

✨ 新增

5.27 截图 + 相对坐标协议(v1.9.1 校正)

  • 关键校正:M3 官方协议是 0.0-1.0 float 相对坐标,不是 0-1000 整数
  • 新增 crate screenshot(6/6 测试通过)
  • 核心换算:
    • M3 输出 {"x": 0.0-1.0, "y": 0.0-1.0} → 物理像素 → logical pixel
    • 边界 clamp(防 M3 越界值)
    • Retina/HiDPI scale 换算
    • 多屏:基于 display origin
  • 6 个 Tauri 命令:
    • screen_list / screen_primary — 显示器列表
    • screen_to_absolute — 相对坐标 → 绝对坐标
    • screen_multi_to_absolute — 多屏换算
    • screen_screenshot — 截图(占位 base64)
    • screen_protocol_prompt — M3 system prompt 注入

5.28 App 白名单 + 权限系统(对齐 Codex)

  • 新增 crate desktop_perm(6/6 测试通过)
  • 三态机Allow / Ask / Deny
  • 强制黑名单(5.5.7,不可移除):
    • 银行类(icbc/ccb/boc/...)
    • 支付类(alipay/wepay/wechatpay)
    • 证券类(securities/stock/futures)
    • 密码管理(1password/lastpass/bitwarden/keepass)
    • 2FA(yubico/authy/authenticator)
  • 默认白名单:Finder / Explorer / Notepad / TextEdit / Safari / Chrome / Firefox / VSCode / Terminal
  • 默认 ask:WeChat / DingTalk / Lark / Feishu
  • 持久化:~/.agentshell/desktop-apps.json
  • 7 个 Tauri 命令:
    • perm_get_list / perm_add_allow / perm_add_deny / perm_clear_allow
    • perm_decide / perm_is_blacklisted / perm_decide_request

4 个新 slash 命令

  • /screenshot / /ss — 截图(演示版 base64 PNG)
  • /coord <x> <y> — 0.0-1.0 相对坐标 → 绝对坐标换算
  • /perm list / /perm allow <name> / /perm deny <name> / /perm clear / /perm protocol — 权限管理

📦 安装

下载 Codex gx_1.9.0_aarch64.dmg (43MB) → 双击 → 拖入 Applications

🧪 验证

# 1. 坐标换算测试
# M3 输出 {"x": 0.5, "y": 0.5} → /coord 0.5 0.5
#   physical:  (960, 540)
#   logical:   (960, 540)  (标屏 scale=1)

# 2. 权限测试
# /perm list                — 看白名单
# /perm allow Slack         — 永久允许 Slack
# /perm deny WeChat         — 永久拒绝 WeChat
# /perm protocol            — 看 M3 协议

🔧 Tech

  • 新增 crates:screenshot(6 测试)+ desktop_perm(6 测试)
  • 13 个新 Tauri 命令(screenshot 6 + perm 7)
  • 4 个新 slash 命令
  • TypeScript: 0 errors
  • Rust 编译: 0 errors

📋 下一步(v1.9.x 候选)

  • 5.29 Pocket — 消息 App 触发任务(飞书/企微/钉钉)
  • 5.30 Mobile Remote — 移动 App 远程监控/遥控
  • 5.31 Vision 多模态(图像/视频理解)