Skip to content

ahydchh/ForegroundTaskMonitor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

前台任务监控

English README

这是一个用于“前台长驻监控”的小型仓库,整理了可复用的 prompt 模板与 Codex skill,适合监控安装、下载、训练、评测等长任务,并要求 agent 在满足终止条件前不要结束当前回合。

仓库结构

  • skill/SKILL.md: Codex skill 定义
  • docs/prompt-template.en.md: 英文提示词模板
  • docs/prompt-template.zh-CN.md: 中文提示词模板
  • examples/: 可直接复制使用的示例

快速开始

  1. 如果你想把它作为本地 Codex skill 使用,把 skill/SKILL.md 放到你的技能目录。
  2. docs/ 复制一个提示词模板。
  3. 填入任务会话、日志路径、终止条件和允许动作。
  4. 把 prompt 发给 agent,并保持当前回合持续,直到满足终止条件。

最小示例:

请监控 tmux 会话 `train_run`,每 15 分钟检查一次,训练结束就停。
允许查看日志、查看进程、重启 tmux、以隔离方式修复环境。
不要修改原始训练配置。
在满足终止条件之前,不要结束当前回合。

安装为本地 Skill

mkdir -p ~/.codex/skills/foreground-task-monitor
cp skill/SKILL.md ~/.codex/skills/foreground-task-monitor/SKILL.md

使用要点

  • 这个工作流禁止把监控责任转交给后台 watchdog 或独立轮询进程。
  • agent 可以在两次检查之间 sleep,但不能把循环外包给其他进程。
  • 如果修复可能改变实验语义,必须用隔离环境、隔离脚本或新会话处理。
  • 最终总结应明确写出所有有效修复,以及每项修复解决了什么问题。

适用场景

当你希望 agent:

  • 保持当前回合不结束
  • 主动监控一个长时间运行的任务
  • 定期查看日志、tmux、进程状态
  • 在不改变实验语义的前提下修复安全问题

就适合使用这个工作流。

典型任务包括:

  • 环境配置
  • 数据下载
  • 模型训练
  • 模型评测
  • 长时间推理任务

使用步骤

  1. skill/SKILL.md 安装到你的 Codex 技能目录,或直接复制其中内容。
  2. 正常启动长任务,最好放在有名字的 tmux 会话里。
  3. docs/prompt-template.zh-CN.mdexamples/ 复制一段 prompt。
  4. 填入会话名、日志路径、终止条件和允许动作。
  5. 把 prompt 发给 agent。

推荐写法

建议明确写出:

  • 准确的 tmux 会话名
  • 日志文件路径
  • 清晰的停止条件
  • 允许的修复动作
  • 是否禁止修改 repo 代码

安全边界

  • 所谓“前台监控”,是指 agent 本体自己负责监控循环。
  • 两次检查之间可以 sleep。
  • 不允许另外起一个独立轮询进程替代 agent。
  • 如果修复可能影响实验语义,必须隔离处理。

进阶示例

请监控 tmux 会话 `eval_run`,每 10 分钟检查一次。评测完成且结果文件存在时停止。
允许查看日志、查看 tmux、查看进程;如果 tmux 崩了,可以重启会话。
如果需要修复环境,只能用隔离环境,不要修改原环境。
不要修改 repo 代码。

About

这是一个用于“前台长驻监控”的小型仓库,整理了可复用的 prompt 模板与 Codex skill,适合监控安装、下载、训练、评测等长任务,并要求 agent 在满足终止条件前不要结束当前回合

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors