Skip to content

End to End Workflow zh

shencong edited this page Jun 1, 2026 · 1 revision

🌐 English · 中文 · 🏠 首页

从一个模糊念头到投稿:写一篇论文的全流程

市面上大多数 AI 写作工具,是在你句子写到一半时才介入的。人文学科写作伙伴不一样——它从你还只有一个念头的时候就开始陪你,一直陪到你点下"投稿"那一刻。这一页讲的,就是这条完整的弧线:拿一篇人文论文,从一个模糊的直觉,一路推到一份可以投出去的成稿,按照真实项目里通常需要的顺序,依次调用各个模式。

为了讲得具体,我们跟着一个研究生走一遍——就叫她小林吧。她在写一篇技术哲学/科学史方向的期刊论文。她的起点,不过是这么一句话:"我觉得斯蒂格勒的'药'(pharmakon)这个概念挺有意思,我感觉它能说点关于 AI 的事。" 这还不是一篇论文。但读完这一页,它会是。

每个模式的完整说明,请看 11 个工作模式。这一页关心的是那段旅程——每个阶段你做什么、哪个模式接手、你拿回来什么。

开始前先说一句:这些模式不是一条死板的流水线。技能会在它们之间随时升档与降档——如果规划阶段的对话里冒出了论证漏洞,它会把你横向拽进"魔鬼代言人";如果一段草稿需要的是重写而不是微调,它会从"修订"切回"构思"。下面这条顺序是主干,真实的项目都会打环。


第 0 站 · 第一次接触(onboarding)

在任何字母模式跑起来之前,第一轮对话先把工作环境搭好。小林说"我想写一篇关于斯蒂格勒和 AI 的论文",技能随即问出那几个决定下游一切的问题:

  • 你在写什么?什么学科? 这是承重的问题。在这里,学科不是元数据,而是一个路由变量。小林做的是用哲学论证方式展开的思想史,于是它同时继承"史学"和"哲学"两套批判维度。这条声明会写进 _writing-config/discipline.md(学科档案),之后每一次批判都会回头查它。
  • 引用格式? 芝加哥格式,投人文期刊。
  • 目标读者? 一位技术哲学方向的审稿人——对斯蒂格勒抱有同情,但对松垮的概念挪用极其过敏。这会写进读者档案,而且稍后它会变成一个具名的对手
  • 有没有已有的文字? 小林贴进来两段旧讨论课论文的段落。技能读它们,建出一份写作风格档案:她那种逗号一路流下去的长句、她的第一人称口吻、她偏好把某些希腊词保留原文不译的习惯。

学科档案、读者档案、风格档案这三份文件,是记忆的主干。它们跨会话留存——所以三周后小林回来说"接着写斯蒂格勒那篇吧",什么背景都不用重讲一遍。

字母旅程,正式开始。


第 1 站 · 把问题磨锋利 —— 模式 H

小林做的: 带着一个兴趣来,而不是一个问题。 她拿回来的: 一句她愿意为之辩护的、锋利的话。

小林那句开场白——"药这个概念能说点关于 AI 的事"——是个题目,不是研究问题。模式 H 存在的意义,恰恰就是拒绝这种说法,逼你往前再走一步。关键在于,它不会像一个通用 AI 选题工具那样做这件事:没有 PICO,没有假设检验,没有那套 STEM 味儿的"变量"。人文问题有它自己的形状,模式 H 认得这些形状。

在六七轮苏格拉底式的来回里,技能是小林一起、而不是小林走完这张清单的:

  • 谜题在哪? 不是问"什么有意思",而是"什么是有争议的、被理论化不足的、还是已经写烂了的?"小林意识到,"AI 是把双刃剑"正是那个写烂了的说法——人人都这么讲。而被理论化不足的,是斯蒂格勒讲"药"时真正的意思——它比那句陈词滥调更锋利、也更古怪。
  • 这是哪一类问题? 技能点出人文问题的三种形状——重读一个经典(逆着主流读法)、重构一个传统、或介入一场当下的争论。小林这篇是介入:把斯蒂格勒的概念装置带进关于 AI 的活的争论里。
  • "那又怎样"测试。 小林得把这句话补完整:"如果我答出了这个问题,那么 ___。"她头一回填得稀里糊涂。技能不批准这个问题,直到她能把空填得很具体——最后她填出来了:那么伦理学文献里占主导的"小心使用 AI"这套说法,就被揭穿为建立在一个"使用者"概念之上,而这个概念恰恰被"药"消解掉了。
  • 谁是真正的对话者? 这是技能反复强调最要紧的一步。没有对话者的问题,是题目,不是研究问题。 小林的对话者,原来正是 onboarding 里那位读者:那个认定"谨慎使用就是答案"的技术伦理学家。
  • 把动词磨利。 "探讨""考察"被禁用。小林承诺用"我将论证……"。

最后落进 _writing-config/研究问题.md(research-question)的,不再是一种感觉,而是这样一句话:"我论证:'负责任地使用 AI'这套主流说法预设了一个站在技术之外的使用者——而斯蒂格勒的'药'在结构上恰恰封死了这个位置。" 这句话,会管住接下来的一切。


第 2 站 · 把你读过的文献画成地图 —— 模式 I

小林做的: 列出她真正读过的 12 部作品。 她拿回来的: 一张各阵营的地图,以及一份关于她到底站在哪儿的诚实判断。

现在,这个问题需要被安放进一场对话里。模式 I 有一条铁律,开篇就讲、反复强调:它不替你检索文献。 让 AI 找文献,正是制造幻觉引用、并跳过"读"这件不可省略的功夫的捷径。模式 I 严格处在读之后——它整理的,是已经在小林脑子里的东西。

小林列出她那十几部文献。(要是她列得少于 8 部,这个模式会拒绝往下走,把她打发回去多读——它绝不替"读得不够"打掩护。)接着技能做那件真正难的事:把学者们按思想谱系而非按话题归类。谁会赞同地引用谁?谁与谁对立?它勾出各阵营——斯蒂格勒一脉的器官学读法、主流 AI 伦理的"负责任使用"阵营、那些技术上根本不在同一套语言游戏里的后人类能动性论者。

有两个瞬间,让这一站值回票价:

  1. 它诚实地给小林定位。以为自己是从斯蒂格勒阵营在写。但技能温和地点出,她实际的好几个动作——那些诉诸"使用者责任"的论证——其实把她推向了她本想批判的那个阵营。早早把这点摆到台面上,省得日后审稿人来做这件事,而且做得不会这么客气。
  2. 找空缺,但绝不编造。 技能注意到她引了一位器官学学者,却没引那位通常会一起读的明显的同伴——于是它问她这是不是有意为之。它从不断言那部缺席的作品说了什么(那就是幻觉);它只问她考虑过没有。要是她没读过,她就去读。AI 不替她填空。

这一站还藏着一个不错的可选钩子:因为小林引了斯蒂格勒五次、他的框架是承重的,技能建议她生成一个专门的 stiegler-perspective(斯蒂格勒视角)镜片,稍后可以在魔鬼代言人阶段把它当成一位审稿人来用。

产出 _writing-config/文献地图.md(literature-map),记下各阵营、她的位置、她这篇要加入的具体争论,以及一份诚实的"我还该多读些什么"清单。


第 3 站 · 规划全文——但先别写 —— 模式 J

小林做的: 要一个结构。 她拿回来的: 一份逐节的提纲,每一节都有自己的活儿、而不只是一个话题——而且一段正文都没写。

技能的"克制"在这里显出来了。模式 J 是只规划、不写作,而且它说到做到。要是小林说"顺手把第一段也写了吧",它会拒绝,并提议切换到写作模式。模式 J 的全部价值,就在于"不写"这份纪律——在动手添肉之前,先盯着骨架看清楚。

它读她的学科档案,套用一条学科专属的论证弧。因为她做的是思想史,模板大致是:方法声明 → 语境重构 → 文本分析 → 概念迁移叙事。 小林可以偏离,但现在任何偏离都是一个选择,不是一次疏忽。

接着它逐节搭提纲,每一节都被逼着交出四样东西:(a) 它在论证里的功能——"打开谜题""确立空缺",而不是"讨论斯蒂格勒";(b) 核心论点;(c) 关键证据或文本;(d) 一个大致的字数目标。功能在这里就是纪律:这一节为论证做了什么,而绝不是它覆盖了什么话题

最后,它拿提纲和第 1 站的研究问题对账:每一节都服务于这个问题吗?有没有哪一节看着像题目、却没推进论证?(砍掉。)论证需要的步骤,有没有还没进提纲的?(补上。)成果落进 _writing-config/论文大纲.md(outline),底部附一条"论证轨迹"——论点 1 支撑论点 2、论点 2 支撑主论点——逻辑主干一眼可见。


第 4 站 · 先构思,再写新内容 —— 模式 C

小林做的: 把每一段真正想说的东西讲出来。 她拿回来的:她自己的声音写出的草稿段落,并被明确标记为"供她做主的草稿"。

现在,终于到正文了。模式 C 是真正动笔写作的入口,它定义性的姿态被讲得很直白:AI 是接生婆,不是建筑师。 它先听。

任何起草之前,模式 C 有一个独有的澄清步骤。技能会逼问:"如果这一节只能留下一句话,是哪一句?"它区分一种感觉和一个可辩护的论点。它给出两三条可能的论证路径,而不是替她挑一条。

然后是协作起草的流程,这正是"我手写我口"的核心:

  1. 小林先开口。 哪怕粗糙——"这一段,我想说斯蒂格勒是从德里达对《斐德罗篇》的解读里拿来'药'这个概念的,重点在于:解药和毒药是同一个东西、在同一时刻,不是一个可供选择的选项。"
  2. 技能把这段话扩写成一个学术段落——用她的风格档案(逗号长句、第一人称、不译的希腊词),给每一处引用都标上出处,并把整段盖上 [AI 草稿 —— 待作者审阅]。凡是它对某个概念或某处引用拿不准的地方,就用 >>> 把这个点标出来,而不是含糊带过这份不确定。
  3. 小林修订。 她重写,技能则悄悄把她改动的模式记成 [作者微调]——日积月累,学着越来越像她。
  4. 风格校验收尾。

技能反复念叨的原则是:它起草的文字越多,小林审阅的负担就越重。它绝不能悄悄替换她的思考。一段起草出来的文字是一个提案,不是一份成品。

到这里,小林手上有了一节真正的初稿——长在她自己的表述之上,用着她自己的节奏,每一个借来的想法都标了出处。


第 5 站 · 把这一章作为整体来读 —— 模式 B

小林做的: 说"把这整节读一遍"。 她拿回来的: 一份自上而下、四层诊断、并归入分诊报告的反馈。

草稿有了,现在该好好一遍。模式 B 跑的是技能的招牌四层批判,严格自上而下:

第 1 层 · 根基   学术上立得住吗?
第 2 层 · 结构   论证是怎么展开的?
第 3 层 · 段落   这一段在做什么?
第 4 层 · 句子   这句话对吗?说得好吗?

头号规则:上层未解决,绝不在下层使劲。 如果一段的前提是坏的(第 1 层),技能不会去给它的逗号抛光(第 4 层)——它先诊断根基,等小林定了方向,才往下走。

来看这条规则在实战里咬人的样子。假设小林某一段还是这么写的:

斯蒂格勒的"药"表明,技术既是毒也是药。所以 AI 也是一剂药。我们必须谨慎使用 AI。正如斯蒂格勒所说,技术是一把双刃剑。

技能的回应停在第 1 层,并拒绝往下:

🔴 第 1 层 · 根基 —— 论证能否成立
  这一段把"药"等同于"双刃剑"。斯蒂格勒明确拒绝这一点:药是治愈
  的、同时也是毁灭的——在同一时刻;而且毁灭之力与治愈之力成正比。
  "双刃剑"偷偷塞进了一个"由使用者选择"的框架;而"药"命名的是一种
  先于使用者选择的结构性处境。这个区别,正是这个概念值得借用的全部
  理由。
  判定:根基已坏。修好之前,不进入下层。

🟡 第 2 层 · 结构 ——(待第 1 层修好后再议)
🟢 第 3 层 · 段落 ——(暂缓)
⚪ 第 4 层 · 句子 ——(暂缓)

反馈报告存进 _feedback/,并把所有问题归入借自代码评审的四档——🔴 阻断、🟡 重要、🟢 次要,以及那个关键的 ❓ 待讨论(不该由 AI 来定的事,比如要不要拓宽核心论点的范围)。而且因为技能照顾注意力,它不会一口气甩你二十条:它先给出总数和分类概览,从"速赢"开刀,每轮处理 3–5 条。


第 6 站 · 像敌意审稿人那样压力测试 —— 模式 D

小林做的: 问"审稿人会怎么攻击这篇?" 她拿回来的: 一个真正的对手——按她今天能扛多少来校准强度——而且不会因为她一顶嘴就软下来。

这是技能自称最有价值、也最需要勇气的模式。模式 D 模拟一个答辩委员会——三位审稿人,外加一位好意但糊涂的读者:

  • 审稿人 A · 理论严苛型 —— 检验概念的锋利度。你对"药"的读法和标准读法有何本质不同?你的综合是真综合,还是一盘沙拉?
  • 审稿人 B · 史料实证型 —— 检验历史叙事的根基。当事人自己用过这些词吗?一手还是二手史料?
  • 审稿人 C · 方法论怀疑型 —— 检验你横跨"史学/哲学"时的连贯性。你跨的每个领域里,功力够深吗?
  • 读者 D · 好意但糊涂型 —— 不带敌意,只是跟不上。这里的独到设计在于: 一个善意读者绊倒的地方,往往正是真正的薄弱点——比任何攻击都更能暴露问题。

有两个特性,让这远不止是一场表演:

强度校准(1–5 级)。 启动前,技能会问小林今天想被打多狠。1 级是给脆弱的早期草稿的温和读者;3 级(默认)是标准的同行评审;5 级是会把你往"挂掉"里逼的敌意委员——用于答辩演练,好让她在私下里挂、而不是在公开场合挂。她可以在中途调低("轻点,我顶不住了"),技能立刻照办,没有讨价还价。因为 onboarding 那份读者档案被载入了,审稿人 A 不是泛泛之辈——它就是小林在第 0 站点名的那位具体的技术伦理学家。

反谄媚。 大语言模型一被顶嘴就容易缴械。模式 D 正是冲着这个毛病造的。当小林反驳一条挑战时,技能只在至少满足 5 个实质条件中的 2 个时才让步——她援引了具体证据、重新界定了概念的边界、表明她已在脚注里处理过,诸如此类。"我就是不同意"或"这是我的风格"不算数。(到 5 级,门槛收紧到 5 中取 3。)每一条被化解的挑战都会记录在案——"挑战 → 回应 → 已解决"——这样当真审稿人提出同一点时,小林手上已经备好了答案。

它还有一个方法论聚焦子模式,只攻击她的动作、而不攻击她的论点——这种攻击能挖出根因,而不只是症状。对小林这篇思想史,它会逼问:概念史(Begriffsgeschichte)还是剑桥学派?你是不是在用当下的关切去评判斯蒂格勒?把这个概念跨时代迁移的代价,你付了吗?


第 7 站 · 冲过写作瓶颈 —— 模式 E

小林做的: 承认"我卡住了——这一节我已经绕了一个钟头"。 她拿回来的: 不是塞给她一段成品,而是一条重新动起来的路。

学术写作里最常见的状态,不是"帮我改段落",而是"我写不下去了"。模式 E 把"卡住"本身当成要解决的问题,提供五种破局策略,挑合适的那个用:

  • 降维 —— 放下那个答不出的大问题("这一节该写什么?"),换成一个小问题:"你最想让读者从这一节里带走的那一件事是什么?"
  • 先说出来 —— 小林口头讲,技能记录,然后一起把口语变成书面文字。(这正是模式 C 里"我手写我口"的那一招,被改造成破局工具。)
  • 逆向工程 —— 从结论倒推,一步步回到能抵达它的那些步骤。
  • 换一条路 —— 如果当前这条线真的堵死了,就在 _drafts/ 里开一个新文件,试一个完全不同的角度。这相当于写作版的 feature branch:尽管去试,不碰主稿。
  • 补充阅读 —— 有时卡住只是因为输入还不够,解法是回到文献里去。

小林卡住的那一节,靠"逆向工程"破了局:她一旦说清这一节必须抵达的结论,那三个中间步骤就变得显而易见,她又写起来了。


第 8 站 · 两版对照,修订草稿 —— 模式 F

小林做的: 拿来一章她不完全信得过的"AI 润色版",连同她的原稿。 她拿回来的: 一份修订——既保住了真正的改进,又外科手术般剔除了那些不再像她的部分。

不知什么时候,小林把早先一章丢进了某个通用润色工具,现在读着是顺了,却不知怎么就不像她了。模式 F 正是为这件事设的专门流程:它同时处理两个版本——润色稿和她的原始早稿——而它全部的挑战,就是在保住结构性改进的同时,剥掉 AI 痕迹、还原她的声音。

逐章地,它对照两版,逐一判定每一处改动:这是一处改进(结构更清楚、引用格式更规范),还是一处异化(声音丢了、引进了陈词滥调)?改进留下。异化则回退到她的原始措辞,或用她的节奏重写。它逐条跑 AI 痕迹清单——猎那些破绽:"值得注意的是"、堆叠起来的没有功能的"此外"、那种人文文字根本不会自然长出来的过分工整的排比、她的第一人称被悄悄换成客体化的"本文"。然后是朗读测试:改后的段落,听起来像小林吗?

它还有一个教学变体——模式 F.coach,给小林说"教我自己看出这些毛病"的时候用。技能不直接把改法递给她,而是在对应的层级抛出 3–5 个诊断问题("读出声——你的气在哪儿停?标点对得上吗?"),等她回答,然后才提出修订——而到那时,她通常已经自己看出来了。它故意更慢。这笔交易是:五年后,她应该完全不再需要这个技能。


第 9 站 · 盲读——这篇兑现了它的承诺吗? —— 模式 G

小林做的: 说"在我宣布完工前,盲读一遍"。 她拿回来的: 一份冷冰冰、机械的清单——这篇做过的每一个承诺,对上它实际兑现了什么。

这个模式和其他所有模式都不一样,而且是刻意的:技能关掉它的学术判断。它不评价质量。它不读风格档案、也不读任何 _writing-config/ 文件——它故意走出小林的内部视角。它只做一件事:检查这篇有没有做到它说要做的事。

长时间写作会引起承诺漂移——引言里许下的问题,悄悄被作者论证途中的发现替换掉了,而作者感觉不到这件事正在发生。模式 G 就是那面镜子。它机械地抽取每一个承诺("本文将……""我将在结论中回到 X 的批评""本节分三部分展开:A、B、C"),然后逐条核对兑现情况,完全不评判兑现得有多好

=== 盲读 · 斯蒂格勒/AI 论文 ===

✅ 已兑现的承诺
  - "我将论证'负责任使用'这套说法预设了一个外部使用者"(引言 ¶3)
    → 已兑现:§4 ¶2–4 直接消解了那个使用者位置

⚠️ 部分兑现
  - "本节分三部分作答:A、B、C"(§3 ¶1)
    → A 在 §3.1,B 在 §3.2 —— 没有对应 C 的部分

❌ 未兑现
  - "我将在结论中回到那位技术伦理学家的反对意见"(引言 ¶5)
    → 没找到 —— 结论从未绕回

🤔 隐含承诺(AI 推断,可能有误)
  - §2 引入了"器官学"却从未回到它 —— 是否该有个收束?

要紧的是,它替小林补那些缺失的部分,也告诉她该留哪个承诺。它只是把那道缺口举到你眼前。要加上兑现、还是撤回承诺,由她来定。小林一眼就发现,她把"结论里回到对话者"那一笔给丢了——而这恰恰是审稿人会一口咬住的地方。


第 10 站 · 生成 AI 使用披露 —— 模式 K

小林做的: 问"投这家期刊,AI 使用我该怎么写?" 她拿回来的: 一份诚实、与档级相符的披露声明——而且,如果她想投的期刊不接受她的实际档级,它会发出警告。

论文完成了。还剩最后一步,而大多数通用工具完全忽略它:人文期刊越来越要求附上 AI 使用披露,而且它们的政策通常比 STEM 期刊更严——许多直接禁止 AI 共同署名,并要求明确申报档级。

模式 K 审计真实的记录——交互日志、修订日志、小林真正用过的那些模式——并按一套人文专属的四档方案给她的 AI 参与定级:

  • 第 1 档 —— 仅校对/翻译/格式。几乎处处接受。
  • 第 2 档 —— AI 作为思想伙伴和魔鬼代言人,但投稿里没有 AI 起草的正文。 多数人文期刊在披露后接受。
  • 第 3 档 —— 部分正文由 AI 起草、再经作者修订。若干期刊对此有限制;披露必须具体。
  • 第 4 档 —— 大量 AI 生成的正文。许多顶级期刊完全禁止——技能会警告她。

小林用了模式 C 起草(再大改)和模式 D 对话,这把她放在第 2–3 档。技能生成一段披露文字,点名每一处具体用途——研究问题上的苏格拉底式工作、§3 的魔鬼代言人压力测试、对那一章润色稿的 AI 痕迹清理——并在有 AI 起草正文的地方,明确说清在哪儿、有多少。

它的硬约束很有锋芒。不许少披露: 如果小林想把声明写软一点,技能会问她具体想删什么、为什么——并指出,那个答案往往暴露的是一个伦理问题,而不是一个措辞问题。也不许夸大 AI 的本事,因为期刊会把"AI 做出了关键贡献"读成一份共同署名的自白。它每次都提醒她那条底线:无论哪一档,投稿里的一切,责任都在作者。 声明存进 _meta/AI 使用披露.md(AI-use-statement),小林投稿。


这条生命周期,是会打环的

这就是主干,从头到尾。但你注意到了吗,真实的路径多么频繁地在打环:第 5 站的评审升档成了第 6 站的压力测试;第 6 站的方法论攻击把小林短暂地送回去磨一个论点;第 7 站的瓶颈又复用了第 4 站的起草招式。技能生来就能在对话中途于各模式间穿行——当一个局部问题原来是结构性的,就从段落升档到整章;方向定了,就从评审降档回修订——并且在它切换时告诉你,让你始终知道它此刻在哪个高度上干活。

贯穿这十站的,是同一个有立场的态度:AI 替你读,不替你写。 它磨利问题却不替你回答,画出文献地图却不凭空编造,只起草你已经说出口的东西,攻击你却绝不缴械,披露事实却绝不奉承。文字即论证——所以,声音始终是你的。


生命周期速查表

阶段 你(作者)做… 模式 你拿回来…
0 · Onboarding 声明学科、引用格式、读者,贴一段写作样本 跨会话留存的 学科/读者/风格 档案
1 · 把问题磨锋利 带着一个模糊兴趣来 H 一句锋利、可辩护的问题 + 具名对话者
2 · 画文献地图 列出你真读过的 8–15+ 部作品 I 一张各阵营地图 + 关于你位置的诚实判断
3 · 规划全文 要一个结构(先别写) J 逐节提纲;每一节都有自己的活儿
4 · 构思与起草 用你自己的话说出每段的意思 C 用你的声音写的草稿段落,标着 [AI 草稿]
5 · 整章评审 "把这整节读一遍" B 自上而下四层分诊报告(阻断/重要/次要/❓)
6 · 压力测试 "审稿人会怎么攻击?" D 一个可校准(1–5 级)、不缴械的对手
7 · 破瓶颈 "我卡住了" E 五种重新动起来的策略
8 · 修订草稿 拿来润色版 + 原始版 F 保住改进、剥掉 AI 痕迹、还原声音
9 · 盲读 "它兑现承诺了吗?" G 机械的"承诺对兑现"清单
10 · 披露 "AI 使用我该怎么写?" K 与档级相符的披露声明

每个模式的详细规格——校准等级、四个批判层、反谄媚的那几个条件、学科路由规则——请看 11 个工作模式

Clone this wiki locally