这是一个用于“前台长驻监控”的小型仓库,整理了可复用的 prompt 模板与 Codex skill,适合监控安装、下载、训练、评测等长任务,并要求 agent 在满足终止条件前不要结束当前回合。
skill/SKILL.md: Codex skill 定义docs/prompt-template.en.md: 英文提示词模板docs/prompt-template.zh-CN.md: 中文提示词模板examples/: 可直接复制使用的示例
- 如果你想把它作为本地 Codex skill 使用,把
skill/SKILL.md放到你的技能目录。 - 从
docs/复制一个提示词模板。 - 填入任务会话、日志路径、终止条件和允许动作。
- 把 prompt 发给 agent,并保持当前回合持续,直到满足终止条件。
最小示例:
请监控 tmux 会话 `train_run`,每 15 分钟检查一次,训练结束就停。
允许查看日志、查看进程、重启 tmux、以隔离方式修复环境。
不要修改原始训练配置。
在满足终止条件之前,不要结束当前回合。
mkdir -p ~/.codex/skills/foreground-task-monitor
cp skill/SKILL.md ~/.codex/skills/foreground-task-monitor/SKILL.md- 这个工作流禁止把监控责任转交给后台 watchdog 或独立轮询进程。
- agent 可以在两次检查之间 sleep,但不能把循环外包给其他进程。
- 如果修复可能改变实验语义,必须用隔离环境、隔离脚本或新会话处理。
- 最终总结应明确写出所有有效修复,以及每项修复解决了什么问题。
当你希望 agent:
- 保持当前回合不结束
- 主动监控一个长时间运行的任务
- 定期查看日志、tmux、进程状态
- 在不改变实验语义的前提下修复安全问题
就适合使用这个工作流。
典型任务包括:
- 环境配置
- 数据下载
- 模型训练
- 模型评测
- 长时间推理任务
- 把
skill/SKILL.md安装到你的 Codex 技能目录,或直接复制其中内容。 - 正常启动长任务,最好放在有名字的
tmux会话里。 - 从
docs/prompt-template.zh-CN.md或examples/复制一段 prompt。 - 填入会话名、日志路径、终止条件和允许动作。
- 把 prompt 发给 agent。
建议明确写出:
- 准确的 tmux 会话名
- 日志文件路径
- 清晰的停止条件
- 允许的修复动作
- 是否禁止修改 repo 代码
- 所谓“前台监控”,是指 agent 本体自己负责监控循环。
- 两次检查之间可以 sleep。
- 不允许另外起一个独立轮询进程替代 agent。
- 如果修复可能影响实验语义,必须隔离处理。
请监控 tmux 会话 `eval_run`,每 10 分钟检查一次。评测完成且结果文件存在时停止。
允许查看日志、查看 tmux、查看进程;如果 tmux 崩了,可以重启会话。
如果需要修复环境,只能用隔离环境,不要修改原环境。
不要修改 repo 代码。