简体中文 | English | 快速开始 | License
把论文、图注、开题材料、研究方案和参考图,编译成可复制、可校对、可控的 AI 科研绘图 prompt。
happy-figure-skill 是 Happy Figure 的 Agent Skill。它不直接生成图片,而是让 Claude Code / Codex 这类 Agent 先读懂科研内容,再按 领域 x 图类型 x 绘图模型特性 生成适合 Nano Banana Pro、Nano Banana 2、Qwen Image 2 / 2 Pro、GPT Image 2 等模型执行的结构化绘图提示词。
一句话:它不是“再给你一段万能 prompt”,而是一个面向科研插图的 提示词路由器 + 图形结构编译器。
我们挑选了 5 类典型科研绘图任务交给 Happy Figure Skill,下面是用它生成的提示词分别在 5 个模型上跑出的结果。
这个 showcase 想先证明一件事:Happy Figure Skill 可以覆盖不同领域、不同图类型,而不是只会写某一种“科研风”提示词。顺带你也能看到,同一套 prompt 换到不同模型后,默认画风、文字稳定性和结构习惯会怎样分化。
- 它能把 CS/ML、材料化学、生物医学、地球科学等内容,整理成可执行的绘图 prompt。
- 它能让你按领域、图类型和模型特性选择更合适的出图路线。
🔎 完整提示词和 5 x 5 映射表放在 showcase assets 里,主仓库只保留 Skill 本体。
💡 TIPS:同系列模型通常会保留相近的默认画风。Qwen 2 系列有独特的科研插图质感,适合低成本多抽卡,但复杂图可能破碎,文字越多错字率越高;Nano 系列更像平面科研插画,AI 味更明显,容易把
ZONE这类结构词画进图里;GPT Image 2 的文字和结构更稳,画风更偏干净矢量底稿,和 Nano / Qwen 不是同一路线。
⚠️ Warning:这些图是模型输出示例,不是投稿终稿。正式发表前仍建议作者人工校对科学结构、图中文字、箭头关系、数据边界,并按期刊要求重绘、矢量化或重新排字。
普通提示词经常只会说“生成一张科研示意图”。Happy Figure Skill 会先做三层判断:
| 判断层 | 它会看什么 | 结果是什么 |
|---|---|---|
| 研究领域 | CS/ML、材料化学、生物医学,或未知/交叉领域 | 选择对应领域母版,决定科学对象、期刊语境和视觉语言 |
| 图类型 | 技术路线图、实验系统图、机制图、多面板比较图、Graphical Abstract、汇报总览图、Cover Art | 约束布局、区域、箭头、面板、可见文字和失败边界 |
| 绘图模型 | Nano Banana Pro、Nano Banana 2、Qwen Image 2 / Pro、GPT Image 2 | 轻量适配标签密度、结构约束、审美目标和文字策略 |
这意味着你可以说:
使用 $happy-figure-skill,读取这段 methods,生成一张材料化学机制解释图 prompt。
目标模型是 Nano Banana Pro,图中文字只保留英文短标签。
它不会把“材料机制图”写成通用流程图,也不会把“模型架构图”套成 Nature/Cell 生物医学风格。领域母版负责科学语义,图类型负责表达任务,模型卡负责最后的执行适配。
这不是一个“哪个模型绝对最强”的排名。更准确的说法是:不同模型适合不同出图目标。
| 你更看重 | 优先尝试 | 原因 |
|---|---|---|
| 高完成度 graphical abstract、第一眼质感 | Qwen Image 2 Pro、Nano Banana Pro | 更容易生成有层次、有设计感的科研主视觉 |
| 复杂结构稳定、最终候选稿 | Nano Banana Pro | 更适合多区域、强层级、箭头关系明确的结构图 |
| 多轮快速试图、找构图方向 | Nano Banana 2、Qwen Image 2 | 适合先跑多个候选,再挑结构和风格 |
| 中文或中英混排的风格候选稿 | Qwen Image 2、Qwen Image 2 Pro | 中文语义和科研术语理解友好,但图中文字要尽量少 |
| 模块关系清楚、文字较多、后期重绘底稿 | GPT Image 2 | 结构底稿、系统框架和 text-rich diagram 更可控,文字相对更稳 |
你也可以参考上面的 showcase,按各个模型的实际效果挑选适合自己的风格。如果还是不知道选哪个,先让 Skill 生成一版模型中性的结构化 prompt;等你拿到第一批图,再按“更漂亮 / 更清晰 / 更少文字 / 更像正文图 / 更像主视觉”继续改。
| 图类型 | 适合内容 | Skill 会重点控制 |
|---|---|---|
| 技术路线图 / 研究流程图 | methods、研究方案、开题技术路线、数据处理流程 | 步骤数量、阅读方向、分支/反馈、输入输出 |
| 实验系统 / 装置结构示意图 | 实验平台、仪器结构、采集系统、样品流转 | 真实部件、连接关系、物料流/信号流/数据流 |
| 机制解释图 | 反应路径、调控通路、材料演化、疾病机制 | 实体形态、因果链、促进/抑制/转化箭头 |
| 多面板比较图 | 对比实验、组别差异、消融、工况设置 | 面板统一性、尺度、组别名、数据边界 |
| 图形摘要 / 论文主图 | 论文核心贡献、项目主页图、投稿摘要图 | 研究问题、核心方法、关键过程、主视觉层级 |
| 开题 / 答辩 / 汇报总览图 | 课题结构、研究模块、预期成果、组会汇报 | 总览层级、模块关系、演示可读性 |
| 期刊封面图 / Cover Art | cover art、teaser、宣传主视觉 | 视觉隐喻、强中心对象、禁止伪造刊名/卷期/logo |
| 领域 | 典型视觉语言 | 适合任务 |
|---|---|---|
| 计算机科学 / 机器学习 | ACM/IEEE/NeurIPS/ICML/CVPR/ACL 等论文图语境,模块、数据流、token、KG、pipeline、系统边界 | 模型架构图、LLM pipeline、知识图谱系统、信息检索、数据库、文档处理系统 |
| 材料与化学 | Nature Materials / Advanced Materials 风格,晶格、界面、离子迁移、溶剂化壳层、反应路径 | 电化学、催化、晶体/界面机制、多尺度材料结构、反应路径图 |
| 生物与医学 | BioRender / Cell / Nature 风格,细胞、蛋白、通路、组织微环境、药物作用机制 | 信号通路、疾病机制、临床流程、药物作用、细胞微环境 |
| 未知或交叉领域 | 自适应领域母版,从参考材料和领域语义生成新母版草案 | 地球科学、环境、能源系统、农业、心理学、公共卫生、政策建模等 |
| 参考图风格迁移 | 只抽取可迁移的布局、配色、线条、字体和层级,不复制科学内容 | “按这张图的风格画”,但保持本论文自己的科学结构 |
npx skills add BAIKEMARK/happy-figure-skill安装后,在 Claude Code / Codex 里直接说:
使用 $happy-figure-skill,读取下面这段论文摘要,生成一张适合 Nano Banana Pro 的图形摘要 prompt。
也可以把安装任务交给有 shell 权限的 Agent:
帮我安装 Happy Figure Agent Skill:
1. 从 GitHub 克隆 BAIKEMARK/happy-figure-skill。
2. 按 Codex/Claude Skills 的本地规范安装这个 Skill。
3. 安装完成后检查目录中是否包含 SKILL.md、README.md、references/ 和 scripts/。
4. 给我一条可以直接测试的调用示例。
指定图类型:
使用 $happy-figure-skill,根据这段 methods 生成一个技术路线图 prompt。
图中文字只保留英文短标签,不要生成长句解释。
指定领域和期刊语境:
使用 $happy-figure-skill,把这段材料化学机制描述转成 Nature Materials 风格的机制示意图 prompt。
目标模型是 Qwen Image 2 Pro。
指定模型特性:
使用 $happy-figure-skill,基于这篇 CS/ML 论文生成模型架构图 prompt。
目标是 GPT Image 2,优先保证模块关系和较多文字标签清晰。
只要最终 prompt:
使用 $happy-figure-skill,只输出最终绘图 prompt,不要解释过程。
使用文件:
使用 $happy-figure-skill,读取 ./paper.pdf,提取摘要、方法、图注和结论,生成一张 Graphical Abstract prompt。
- 读取科研内容:支持摘要、methods、图注、研究方案,也支持
.pdf、.docx、.tex、.md、.txt等文件。 - 形成 Figure Brief:判断研究主题、领域、图类型、目标模型、图中文字语言和科学边界。
- 选择母版:领域母版决定科学对象和学科视觉语言,图类型母版决定表达任务和布局结构。
- 适配模型:根据模型偏置调整标签密度、结构约束、文字策略和风格词强度。
- 输出最终 prompt:包含可见文字白名单、禁止编造内容、箭头语义、区域结构和渲染风格。
- 简短审查:提醒作者检查科学结构、标签、箭头、数据边界和期刊要求。
这个 Skill 专注于“从科研文档生成绘图提示词”,因此它不会假装解决所有科研绘图问题。
| 不适合 | 原因 |
|---|---|
| 真实数据图、统计曲线、显著性标记 | 不能让图像模型编造数据、坐标、p 值或实验结果 |
| 显微图、实验照片、真实设备照片 | 这些属于证据图像,不应由生成模型伪造 |
| 需要严格几何尺寸或工程制图的图 | 生成图适合构图参考,不适合作为精确工程图 |
| 直接投稿原始 PNG | 投稿前仍需人工校对、重绘、矢量化或重新排字 |
| 去水印、仿真实期刊封面元素 | 不生成刊名、logo、卷期号、条形码等可能误导的出版物元素 |
Happy Figure 教程讲方法论,覆盖:如何理解科研绘图、如何设计提示词、如何控图、如何后处理 AI 生成的插图,以及如何处理学术合规。学懂 Happy Figure,你就能系统掌握可控、可校对、可发表级别的 AI 科研绘图流程。
happy-figure-skill 把其中“撰写科研绘图提示词”的方法变成了支持 Agent 调用的 Skill:读论文内容,判断图类型,选择领域视觉语言,适配模型特性,生成可复制的绘图 prompt。
教程负责让你理解为什么这样画;Skill 负责让你更快开始画。
如果它帮你把“我知道论文该画什么,但不知道怎么写成图像模型能执行的 prompt”这件事推进了一步,欢迎 Star。
接下来会继续补更多真实论文案例、更多领域母版、更多模型对比和更完整的科研绘图质量检查规则。
This project is licensed under CC BY-NC-SA 4.0. See LICENSE for details.