此仓库提供一套面向深度学习基线项目的 .codex 模板,目标是持续产出能够支撑 oral 级论文的方法与实验内容。
核心入口只有三个 skill:
idea-discoveryidea-executionidea-review
-
将
.codex、AGENTS.md、experience.md复制到目标基线仓库。 -
记录一次基线锚点:
git rev-parse HEAD > .codex/baseline_commit.txt -
如有需要,创建
direction.md,写入任务目标、数据集、硬约束、已有判断。 -
按顺序启动第一轮:
$idea-discovery$idea-execution$idea-review
根 AGENTS.md 只负责介绍仓库用途、运行时文件和入口 skill。
完整规则统一放在:
.codex/idea-workflow/workflows/idea-discovery.md.codex/idea-workflow/workflows/idea-execution.md.codex/idea-workflow/workflows/idea-review.md
三份 SKILL.md 只负责把入口 skill 连接到这些规则文件。
每一轮新 idea 都从 $idea-discovery 开始。
这一阶段会写出:
- 一条主线
- 三个协同创新点
- 最多两个主要超参数
- 完整实验方案
- 第一批正式实验
$idea-discovery 会先读取本地材料,再按固定顺序调用三个 discovery 子代理:
paper-architecttheorem-architectexperiment-designer
其中:
- 主代理先负责仓库勘查、失败经验比对、基线契约恢复、必要时 Exa 补证、以及一次澄清
paper-architect专门负责生成Method的主体,并在Theory hook中写出 theorem 目标与现象说明,供下一阶段 theorem 补全方法部分中的理论段,结束后立即写入.codex/active_idea.mdtheorem-architect专门负责围绕上一阶段已经写出的Method -> Theory hook,生成两个与该 idea 同一主线相关的非平凡 theorem 及其完整证明,覆盖Method -> Theory hook,结束后立即写入.codex/active_idea.mdexperiment-designer专门负责生成Experiment Plan与Current Batch,同时把两条 theorem 映射到分析项,结束后立即写入.codex/active_idea.md- 三个子代理完成后,主代理依据基线契约、
experience.md、以及已经接受的 proposal 内容写出Outcome Bar与Review Notes,并完成最终写回
discovery 期间,三个子代理的有效输出只保留在 .codex/active_idea.md 对应 section 中;如果后续阶段失败,discovery 会将 .codex/active_idea.md 重置为空模板,再返回阻塞项。
如果仓库证据不足、基线字段仍无法确定、任一关键子代理失败、两条 theorem 缺项、theorem 缺少完整证明、或者主代理无法写清 Outcome Bar / Review Notes,$idea-discovery 会停止并指出缺失项,不会写出薄弱 idea。
$idea-execution 只负责当前批次。
这一阶段会:
- 按
Current Batch实现代码 - 创建一个新的实验脚本
- 用
request_user_input披露实验数量、实验内容、分析项 - 用
screen发起正式实验
只要正式实验已经发起,下一步就进入 $idea-review。
$idea-review 面向已经跑完的正式批次。
如果实验仍在运行,或者结果文件还没有写全,$idea-review 只会提示“当前批次还不能评审”,随后等待再次运行,不会写出正式评审结果。
当批次已经完整时,评审结果只有三类:
含义:
- 当前 idea 还有继续深挖的空间
- 当前批次已经暴露出下一步可研究的问题
- 论文故事还没有完整收口
处理顺序:
$idea-review先总结当前最好指标、与基线的差值、以及最重要的实验现象。$idea-review使用request_user_input发起多轮沟通,确认下一步改进方向,以及采用该方向的原因。- 沟通内容至少覆盖:
- 当前主要缺口或异常现象
- 改进假设
- 采用该假设的理由
- 下一批正式实验
- 下一批分析项
- 沟通完成后,
$idea-review会把“当前批次结果摘要 + 选择该改进方向的原因 + 新一批实验设计”写回.codex/active_idea.md。 - 然后回到
$idea-execution,实现并运行下一批正式实验。
improve 不会产生 git 提交。
含义:
- 当前 idea 已经没有可信的继续空间
- 或者现有证据已经说明目标提升难以成立
处理顺序:
$idea-review将失败记录追加到experience.md- 清理当前 idea 的日志、实验产物、实验脚本、代码修改
- 将
.codex/active_idea.md重置为空模板 - 回到
$idea-discovery,开始下一个 idea
abandon 不会产生 git 提交。
含义:
- 当前方法效果已经足够强
- 已经观察到不平凡且可解释的实验现象
- idea 本身已经足够支撑
oral级论文的方法部分与实验部分
处理顺序:
$idea-review将最好结果、关键实验现象、以及“为何已经足够停止”写入.codex/active_idea.md- 生成一次正式 git 提交
- 停止当前 idea
只有 finish 允许 git 提交。
$idea-discovery$idea-execution$idea-review- 如果批次未完成,稍后再次运行
$idea-review - 如果结果是
improve,由$idea-review完成多轮沟通与写回,再运行$idea-execution - 如果结果是
abandon,回到$idea-discovery - 如果结果是
finish,停止当前 idea
每个 idea 都应满足下面的结构要求:
- 一条主线
- 三个相互配合的创新点
- 最多两个主要方法超参数
- 足以支撑论文方法部分的方法细节
- 足以支撑论文实验部分的实验与分析内容
.codex/baseline_commit.txt:基线锚点.codex/active_idea.md:当前 idea 的唯一状态文件.codex/logs/:当前正式实验日志experience.md:被放弃 idea 的长期记录
.codex/active_idea.md 现在采用两层结构:
- 精简 frontmatter,只保存运行状态与评审结果
- 正文保存
Baseline Contract、Method、Experiment Plan、Current Batch、Outcome Bar、Review Notes Method -> Theory hook固定保留两条 theorem block,每条 theorem 都包含Assumptions、Claim、Why non-trivial、Full proof、Empirical consequence
- 主代理:补基线契约、仓库现象、thesis seed、失败经验比对、必要时 Exa 补证
paper-architect:生成Methodtheorem-architect:围绕已经写出的Method生成两个非平凡 theorem 与完整证明,并定稿Method -> Theory hookexperiment-designer:生成Experiment Plan、Current Batch、运行命令与产物字段,并把 theorem 映射到分析项- 主代理收尾:写出
Outcome Bar与Review Notes result-judge:根据完整结果判断improve、abandon、finishimprovement-planner:基于当前结果提出下一轮改进方向、理由和沟通重点