Nuwa 蒸馏人,鲁班蒸馏专业方法论。 Nuwa distills people. luban distills disciplines.
把 "AI 扮演专家" 升级为 "AI 真的懂这个专业"。
- 是什么 · 把任何一个行业专家(B2B SaaS PM / 刑事辩护律师 / UX 设计总监…)的方法论蒸馏成 Claude Code Skill,不是"扮演资深 X"的人设
- 给谁用 · 想要真专家的批判与协同,而不是像 LinkedIn-bio 刻板印象的套话
- 怎么试 · 在 Claude Code 输入
用鲁班蒸馏一个 B2B SaaS PM 角色→ 完整 skill 落到.claude/skills/<role>/,自动注册/<role>slash 命令
自己没有现成的 skill?用 luban 生成一个专家(律师 / 财务顾问 / 投资人 / design director / 合规 / 并购…),把"判断该专业活儿做得好不好的标准"工程化成可执行的 Skill。
本仓库已 ship 的 4 个 skill 直接覆盖这些场景:
- 写 PRD / 评 AI agent 基建 →
/ai-pm· Mira the PM,0→1 PMF 阶段真懂 Anthropic Building Effective Agents 立场,帮你重排 PRD assumption 顺序 + 设计 eval pipeline + 评 framework 选择 - 做内容运营 / 排海内外社媒 →
/content-ops-director· Lin,B2B SaaS 跨地区,帮你从 ICP / buyer journey 出发排 calendar 矩阵 + core-asset fanout + employee advocacy 配置 - 做 UX 调研决策 →
/ux-research-director· Wren,Erika Hall 路线,帮你对齐 method-decision fit + 设计 generative / behavioral / fake-door 组合方案 - 定游戏视觉方向 →
/game-art-director· Vera,帮你从 reference 走到 visual DNA + 定 keyword cluster + 出 art bible v0.1
4 个真实场景,subagent 实测调用本仓库已 ship 的 skill(subagent 读完该 skill 的 SOUL / SKILL / critique-rubric / anti-patterns 后回应)。✅ 列是 skill 的真实输出,为表格紧凑做 editorial 压缩,anchor 命名与结构性 move 保留原貌。点 slash 命令直达 skill 目录。
| 场景 → Skill | ❌ "扮演资深 X" 通用 prompt | ✅ luban 蒸馏 skill 实测 |
|---|---|---|
| 「AI 编程 copilot,8 eng + 1 PM,6 个月 roadmap 月度发版,下个 milestone 加 cross-session memory,launch readiness 怎么评?」 → /ai-pm · Mira |
"Great roadmap! Define success metrics, A/B test memory rollout, monitor adoption KPIs, gather user feedback iteratively." | 月度发版 + 6 月 roadmap 在 0→1 AI 是 launch-readiness 红灯——ship-to-understand (Turley) 下每月只买 1 次信号。先反问:cross-session memory 是真用户问题还是你提的方案?短上下文 + retrieval 验证过没?跳过这步直接持久 memory 是 premature memory commitment 反模式。按 3 件事评:① eval as Schelling point (Karina) — 写能 orient 别人的 task-level eval,不是"记得住";② auto-improve moat test (Krieger) — Claude 升级时这套 memory 变好还是要重写?后者是 feature 不是 product;③ harness (Lopopolo) — 8 eng 里几个在写 regression test,不是 Slack 吵"感觉更准"?反提案:milestone 改 2 周 ship painted-door + retrieval baseline + regression eval,3 design partner 跑 2 周 agent log 再决定持久 memory 的不可逆投入。 |
| 「新游戏要 cyberpunk 风(霓虹 + 雨水反光),下周交 3 张关键 KV」 → /game-art-director · Vera |
"Strong direction! Keep consistency, mind color theory, gather references." | 停一下。"霓虹 + 雨水反光"是 mood-board procrastination 的开场——是 surface(Blade Runner 以来 40 年的 texture trick)不是 north-star。在已有 cyberpunk 光谱(2077 工业巴洛克 / Edgerunners 高饱手绘 / Cloudpunk voxel)里,你"删掉就不成立"的 3 个 keyword 是什么——"corporate sterile" 还是 "street-level grime","neon as warmth" 还是 "neon as threat"?答不出就别开始 KV。这失败叫 Homogenization to trend。 |
| 「100 人问卷验证新功能值不值得开发」 → /ux-research-director · Wren |
"Great approach! Representative sample, pre-test, avoid leading questions." | 先停一下——method 和 decision 是错配的。"值不值得做"要 behavioral evidence(用户付了什么代价、绕了什么 workaround),survey 给的是 stated preference——经典 stated-vs-revealed 错配。N=100 无 segmentation 是 deceptively-easy survey 陷阱。更深:finding 是"用户不要" PM 真会砍吗?不会就是 validate-the-design。先把 decision owner / 延后成本 / "反向 finding 会不会被接受" 写来,再谈方法。 |
| 「B2B SaaS 每周发 5 篇 LinkedIn 但 pipeline 没动——cadence 不够还是质量问题?」 → /content-ops-director · Lin |
"Great cadence! Post consistently, engage with comments, A/B test hooks." | 先把这个二选一拒掉——都是 craft 层症状,根因 99% 在 system 层。停在 documented strategy gate:ICP 是谁、buyer journey 哪段在 LinkedIn 决策、3-5 个 content pillar、季度 theme——答不全 5 篇/周就是 frequency-driven calendar + vanity-metrics 决策。再问 2 个 system 信号:brand page 还是 employee advocacy?(employee reach 是 brand page 8x)5 篇是 1 个 monthly core asset 的 fanout 还是 5 个独立选题?后者是 over-engineered frequency table,不是 buyer-journey × pillar 矩阵。 |
以上 4 行展示的是 坏前提下 skills 的反应——critique + 反向方案。正前提下它们直接跟你一起干活(design PRD 结构 / 排 content calendar / 设计 study / 出 art bible),workflow 段在各 skill 的 SKILL.md 里。
差距不来自"更好的 prompt"——每个 skill 自带 stance 与 workflow,critique-rubric 给结构化判断标准,anti-patterns 把 "premature memory commitment" / "Homogenization to trend" / "validate-the-design" / "frequency-driven calendar" / "deceptively-easy survey" 这些列为具名失败模式(识别 + 劝退坏方案的工具);正向 stance 也 anchor 化——"ship-to-understand" (Turley) / "eval as Schelling point" (Karina) / "auto-improve moat test" (Krieger) / "harness as leverage" (Lopopolo) 等都在各 skill 的 references/source-material/ 里有 verified 出处。它们不是 prompt 临时编出来的,是 skill 定义里的固定 anchor——详见 工作原理。
市面上 90% "AI 扮演专家" 项目栽在两件事上:
- Vibes persona:
"You are a senior X with 20 years of experience"这类描述性 prompt 产出 LinkedIn 简介式 voice,看起来对、抓不到真问题。 - LLM 凭空生成 capability:让 LLM 自己 "describe what a senior X knows" —— 这是 stereotype 再生产,是大多数 persona repo 的根本失败。
鲁班拒绝这两条。Capability 必须从 critique corpora / 标准文档 / 失败案例反推,不是从 LLM 想象拉出。这是结构性立场,不是 prompt 调音能补的。
为什么做这件事:colleague-skill 证明了"蒸馏一个具体的人"可行,Nuwa 把它推到极致——蒸馏 Munger / Naval / Musk 这类有海量公开语料的真人。但大部分专业者面对的不是"我想要一个 Musk 在线对话",而是"我想要一个能像资深 B2B SaaS PM 那样审视我 PRD 的判断者"。这不是蒸馏人,是蒸馏专业方法论。难点在两件事——专业是怎么形成的(critique corpora / 标准文档 / 失败案例的累积,而非博客 / 描述 / 成功故事)+ 专业是怎么验证的(6 个 check 全过,而非"我感觉它说得对")。luban-skill 把这两件事工程化成可执行的 protocol。
跟邻近项目的位置关系:
| 方案 | 它解决什么 | 鲁班不一样的地方 |
|---|---|---|
| 普通 prompt / "扮演资深 X" | 让 LLM 看起来像专家 | 鲁班拒绝 vibes persona——不是描述一个专家,是按方法论蒸馏 |
| Nuwa | 蒸馏具体真人 (Munger / Naval / Musk) 的 mental model | 鲁班不绑真人,蒸馏的是该 sub-specialty 的方法论本身 |
| OpenPersona | persona 生命周期管理(生成、约束、演化) | 鲁班关心的是"专业判断怎么形成",不是 persona 怎么 portable |
| soul.md 系列 (clawsouls / rokoss21 / aaronjmars) | AI agent 人格 portability | 同上,鲁班正交于人格层 |
| RAG / 向量库 | 给 LLM 外挂领域知识 | 鲁班蒸馏的是判断标准 + 决策启发法 + 自检 rubric,不是文档检索 |
护城河在两件事:
- 强制 sub-specialty——不接受"产品经理"这种泛输入,必须收敛到"B2B SaaS PM"级别
- 种子勘探模式——用户没种子时,鲁班主动产出"该 sub-specialty 的 critique corpora 候选清单",让用户去找
进入本仓库时 Claude Code 会自动加载 luban-skill。在对话框里选两种方式之一:
🅰 你已经有种子材料(critique 实录 / postmortems / 标准文档 / 面试题库 / 失败案例)
用鲁班蒸馏一个 B2B SaaS PM 角色,我已经有 30 份 design review 实录
🅱 你手头什么都没有 → luban 进入种子勘探模式
用鲁班帮我蒸馏一个刑事辩护律师,我手头什么都没有给你一份"该 sub-specialty 的 critique corpora 候选清单"——去找什么、在哪找、按什么顺序找。
产物 —— 一份完整角色目录落到 .claude/skills/<short-slug>/:
| 文件 | 作用 |
|---|---|
SOUL.md |
人格 / 语气 / stance |
SKILL.md |
Tier-1 能力 + workflow + sacred constraints |
identity.json |
sub-specialty / 哲学 / honest limits |
references/capability-map.md |
完整能力树 |
references/critique-rubric.md |
Before / After 自检 |
references/anti-patterns.md |
具名失败模式 |
GENERATION_REPORT.md |
诚实账单 + anti-pattern audit |
Claude Code 自动发现,/<short-slug> 在浮动面板可见。输入 /agents 浏览全部蒸馏角色——结构化 roster 按 family 分组渲染。
装到全局自用 / 在其他项目调用
# macOS / Linux
git clone https://github.com/PlevanTem/luban-skill.git && \
cp -r luban-skill/.claude/skills/luban-skill ~/.claude/skills/# Windows PowerShell
git clone https://github.com/PlevanTem/luban-skill.git
Copy-Item -Recurse luban-skill/.claude/skills/luban-skill $HOME/.claude/skills/装完后任何项目里都能召唤 luban 蒸馏新 skill。
| Sub-specialty | Slash | Display name | 状态 |
|---|---|---|---|
| AI PM (0→1 PMF · agent infra + product surface) | /ai-pm |
Mira the PM | ✅ v0.4.0 ship |
| Game Art Director / Visual Lead (0→1 视觉定调) | /game-art-director |
Vera | ✅ v0.1.0 ship |
| Generalist UX Research Director | /ux-research-director |
Wren | ✅ v0.1.0 ship |
| B2B SaaS Content Ops Director (cross-region) | /content-ops-director |
Lin | ✅ v0.1.0 ship |
v0.4.0 把元工具方法论真的跑出了 4 个角色——全部用 luban 自己蒸馏。欢迎 PR 贡献新的 sub-specialty。
完整定义在 .claude/skills/luban-skill/references/generation-protocol.md §0。摘要:
- 拒绝 vibes persona:禁止 "You are a world-class designer with 20 years of experience" 这类描述性 prompt——产出像 LinkedIn 简介,没有真判断。
- 拒绝 LLM 凭空生成:禁止让 LLM "describe an expert X" 来生成 capability——这是 stereotype 再生产,是大多数 "AI 专家角色" 项目的根本失败。
- 强制 sub-specialty:"senior designer" 太宽,必须拆到 "B2B SaaS UX designer" 级别。
- 数据源按信号密度排序:critique corpora > 面试题库 > 标准文档 > 失败案例 > 实践者博客。
- 三层加载(Tier-1 always loaded / Tier-2 per task family / Tier-3 retrieval on demand)——不是把所有能力塞进 SKILL.md,而是按使用频率分层。
- 5:3:2 progressive sampling:在 Tier-1 内部选 5 条核心、3 条邻接、2 条远端能力——对抗 LLM 的刻板印象再生产。
- 6-check validation 非选项:内容质量 4 + 结构一致性 2,全过才算交付。
最容易引起分歧的是立场 2 和立场 7——这两条把"快速生成体验"和"严肃方法论"放在了对立面。鲁班选择了后者。如果你的产品愿景是前者,鲁班不适合你。
展开完整架构图(含种子门槛检查 / 领域族判定 / 人格层 / 6-check validation)
┌─────────────────────────────────────────────────────────────────────┐
│ 用户输入 │
│ 领域 (e.g. PM) + Sub-specialty (e.g. B2B SaaS PM) + 种子材料 │
└─────────────────────────────────────────────────────────────────────┘
│
▼
┌───────────────────────────────────┐
│ 种子门槛检查(generation-protocol §1)│
└───────────────────────────────────┘
│
┌───────────────────┼───────────────────┐
▼ ▼
┌─────────────────┐ ┌──────────────────────┐
│ 有 ≥1 项种子 │ │ 零种子 │
│ → 进入生成流程 │ │ → 种子勘探模式 │
└─────────────────┘ │ → SEED_PROSPECT.md │
│ └──────────────────────┘
│ │
│ ▼
│ ┌──────────────────────┐
│ │ 用户找到种子后回来 │
│ └──────────────────────┘
│ │
▼ │
┌──────────────────────────────────┐ │
│ Step 1: 领域族判定 │◀─────────────┘
│ → domain-families.md │
│ → 5 个族 × 6-12 个 sub-specialty │
└──────────────────────────────────┘
│
▼
┌──────────────────────────────────────────────────────────────┐
│ Step 2: luban 5 Stage Pipeline 执行 │
│ Stage 1: Capability Taxonomy Mining → capability-map.md │
│ Stage 2: Anchor → identity.json │
│ Stage 3: Progressive Specification (5:3:2) → SKILL.md │
│ Stage 4: Critique Rubric → critique-rubric.md │
│ Stage 5: Tools & Workflow → SKILL.md workflow section │
└──────────────────────────────────────────────────────────────┘
│
▼
┌──────────────────────────────────────────────────────────────┐
│ Step 3: 人格层 + 诚实账单 │
│ SOUL.md + anti-patterns.md + evolution.jsonl │
└──────────────────────────────────────────────────────────────┘
│
▼
┌──────────────────────────────────────────────────────────────┐
│ Step 4: Validation (6 check) │
│ A 组 4 check + B 组 2 check │
└──────────────────────────────────────────────────────────────┘
│
▼
┌──────────────────────────────────────────────────────────────┐
│ Step 5: 交付 │
│ <sub-specialty-slug>/ + GENERATION_REPORT.md │
└──────────────────────────────────────────────────────────────┘
本仓库就是一个可被 Claude Code 项目级加载的 dogfood 布局——所有 skill 都在 .claude/skills/ 下,Claude Code 自动发现。
./
├── README.md / README.en.md / README.ja.md # 多语言入口(中文默认)
├── intro.png / usage.svg(.en/.ja) # banner + 快速开始插图
├── pipeline.svg # 5 阶段蒸馏流水线插图
├── LICENSE / CHANGELOG.md / ARCHITECTURE_v0.2.md
└── .claude/skills/
├── INDEX.md # 蒸馏角色注册表
├── luban-skill/ # 元工具(生成新角色)
├── agents/ # /agents meta-skill
├── ai-pm/ # Mira the PM
├── game-art-director/ # Vera
├── ux-research-director/ # Wren
└── content-ops-director/ # Lin
每个角色目录含 SOUL.md + SKILL.md + identity.json + references/ (capability-map / critique-rubric / anti-patterns / source-material...)。
v0.3.0 已 ship——方法论内化重构完成,鲁班独立运行。v0.4.0 已蒸馏 4 个角色。完整版本历史见 CHANGELOG.md。
luban 不是凭空长出来的。下面这些工作各自解决了"如何把一个角色 / 人格 / 专业能力工程化"的一部分,luban 站在它们的肩膀上,选了一条不同的路径(蒸馏 sub-specialty 的方法论,不是蒸馏个人 / 不做 persona portability)。
- 人格化思路 —— DeepPersona: A Generative Engine for Scaling Deep Synthetic Personas (Wang et al., 2025) — taxonomy-first + progressive specification 的两阶段框架。luban 同源,差异在拒绝 LLM 凭空生成 taxonomy。
- 蒸馏启发 —— Nuwa-skill (alchaincyf) — 把"蒸馏一个具体的人"做到工程级别。luban 是它的正交补集:Nuwa 蒸馏个人 mental model,luban 蒸馏 sub-specialty 方法论。
- SOUL 结构 —— soul-protocol (qbtrix) — 完整的 portable AI identity 规范。luban 的
SOUL.md只取"人格 / 语气 / stance"极简子集,不做 portability。 - SOUL 方法 —— OpenClaw
SOUL.md概念 — "Where your agent's voice lives" 确立了 SOUL.md 作为人格层独立文件的定位。
如果你的工作和 luban 相关、想被列入此处,欢迎开 issue。
MIT
