Light 是什么 · 为什么用它 · 快速上手 · 技能总览 · 完整链路 · 知识库 · API key · 常见问题 · 参与贡献 · 引用
Light 把科研全流程拆成 27 个互相衔接的 AI 技能,装进你的 Claude Code 和 Codex。从找文献、理数据、想创新点,到写论文、画图、排版、投稿、返修,再到软著专利、答辩 PPT、竞赛申报——每一步都有专门的技能接手,背后还垫着 9 个可溯源的知识库。
它不是一堆提示词,也不是 MCP 或插件——而是一套装进客户端的技能包:每个技能都带能跑的脚本、能套的模板、真实的范例,对外接口经过实测,统计代码与 scipy/sklearn 逐位对齐。不编文献、不造数据、不臆想出处和数据来源——这是不可逾越的底线。
一句话:把一位真正懂科研工具的资深伙伴,装进你的编辑器。
市面上的"科研 AI"大多止于聊天问答。Light 不一样,它有三个硬核区别:
| 普通提示词 / 助手 | Light | |
|---|---|---|
| 产出 | 一段文字建议 | 能跑的脚本 + 能套的模板 + 真实范例 |
| 可信 | 可能编造文献、数据、DOI | 写进规约的硬底线:不编造,核不实标"待核查" |
| 协同 | 单点回答,前后脱节 | 27 个技能沿一条主线衔接,9 个知识库共享术语与方法 |
| 质量 | 一次成型 | 对抗式自检:独立"挑刺" + 权威库交叉验证 |
| 记忆 | 关掉就忘 | 跨会话项目记忆,记住做到哪一步 |
适合:要把项目真正做成论文/软著/专利/竞赛成果的本科生、研究生、独立研究者,尤其是导师资源有限、需要一个靠谱搭子全程兜底的人。
前置:已安装 Claude Code 或 Codex,本机有
git。
Important
27 个技能共用根目录下的 9 个知识库与 code_assets/(靠相对路径引用),所以整个仓库必须放在一起。安装脚本会把技能和共享库一并链接到客户端的技能目录,请勿只挪单个技能。
1. 克隆仓库(放哪都行):
git clone https://github.com/Light0305/Light.git
cd Light2. 运行安装脚本:
# Windows (PowerShell)
powershell -ExecutionPolicy Bypass -File install.ps1 # 两端都装
powershell -ExecutionPolicy Bypass -File install.ps1 -Client claude # 只装 Claude Code
# macOS / Linux
./install.sh # 两端都装
./install.sh claude # 只装某一端脚本幂等、可重跑,把技能链接进 Claude Code 的 ~/.claude/skills/ 与 Codex 的 ~/.agents/skills/。
3. 重启客户端,开说:
帮我把这个方向做一遍文献调研
这篇论文该投哪个期刊?
帮我把实验结果做显著性检验,出一张出版级的图
相关技能会自动触发(根据你的需求智能匹配,无需记命令);也可以用 / 点名调用 17 个手动技能。Codex 端还需一步小配置,详见 .codex/INSTALL.md。
卸载:删掉客户端技能目录下对应的链接即可,不影响源仓库。
27 个技能分两类:17 个手动技能可直接用 / 点名调用,也会在相关任务里自动触发;10 个常驻技能只在后台自动生效(不出现在 / 菜单,但照常工作)。
| 阶段 | 技能 | 做什么 |
|---|---|---|
| 📚 资料调研 | light-literature-search |
多源检索文献、去重、判可信度、排重要性、搭综述骨架 |
| 🧹 数据处理 | light-data-engineering |
体检数据、防泄漏划分、校验质量门、规划自建数据集 |
| 💡 创新提案 | light-idea-generation ⇄ light-idea-critique |
提创新点 ↔ 以审稿人视角对抗挑刺,成对循环到站得住 |
| 🗺️ 方案设计 | light-research-plan |
定技术路线、排实验矩阵、评可行性、保可复现 |
| 📊 结果分析 | light-result-analysis |
跑 EDA、做显著性检验、算效应量、溯因异常、挖规律 |
| ✍️ 论文写作 | light-paper-drafting ⇄ light-paper-polishing |
分模块成稿 ↔ 以审稿人视角打磨逻辑·结构·语言 |
| 📈 图表 | light-figure-planning ⇄ light-figure-drawing |
规划做什么图、放哪 ↔ 按刊物规格出版级绘图 |
| 🔖 引用排版 | light-citation · light-typesetting |
核验 DOI、生成多格式参考文献 · 用 LaTeX/Word 排版导出 PDF |
| 📮 投稿返修 | light-venue-matching · light-review-rebuttal |
分层定位投稿(冲刺/稳妥/保底)· 模拟审稿、逐条返修 |
| 🏆 成果转化 | light-ip-application · light-slides · light-competition |
写软著专利 · 做答辩路演 PPT · 备竞赛申报材料 |
无需调用,在相关任务中自动生效,贯穿全程保障质量:
| 技能 | 职责 |
|---|---|
light-file-reading |
读 PDF/Word/PPT/Excel/CSV/图片/代码/压缩包,理解结构而非只提字 |
light-memory-pm |
跨会话项目记忆、阶段拆解、里程碑与版本记录 |
light-backend-coding |
实验/模型/数据/可视化/后端代码,TDD 与系统化调试 |
light-system-design |
系统架构、数据库、接口、权限、部署设计 |
light-frontend-design |
前端界面与可视化大屏,审美统一、可演示 |
light-project-structure |
规范项目目录与命名,便于复现与成果整理 |
light-consistency |
术语/指标/创新点跨论文·PPT·软著一致 |
light-self-review |
逻辑/事实/格式/夸大自审,产出前先迭代 |
light-tool-selection |
按任务选最合适的工具与方法 |
light-research-ethics |
学术伦理、合规、防造假与过度包装的底线 |
技能不是孤立工具,而是沿一条科研主线相互交接:
立项 → literature-search 找方向与 gap → data-engineering 数据体检与防泄漏划分
→ idea-generation ⇄ idea-critique 提创新点、对抗挑刺,循环到站得住
→ research-plan 定技术路线与实验矩阵 → backend-coding 落地实验(TDD)
→ result-analysis 显著性检验 + 效应量 + 出版级图
→ paper-drafting ⇄ paper-polishing 成稿与润色
→ citation / figure-drawing / typesetting 引用核验、出图、排版
→ venue-matching 选刊投稿 → review-rebuttal 返修回复
→ ip-application 软著专利 · slides 答辩 PPT · competition 竞赛申报
全程 10 个常驻技能在后台兜底:file-reading 吃进任意材料,memory-pm 记住做到哪一步,consistency 盯跨材料一致,self-review 每次产出前自审,research-ethics 守住诚信底线。
Resampling Silently Degrades Probability Calibration in Tree Ensembles —— 完全用 Light 走完全流程的端到端实证研究:从找文献、提 idea、对抗严审,到真跑实验、出图、写成 6 页 IEEE 论文。所有数字都来自真实运行,不造一个数据。
点击论文首页预览打开完整 PDF · 阅读 PDF · LaTeX 源码
- 5 个 OpenML 数据集(不平衡比 1.9–70)· 2 个树集成 · 7 种处理 · 10 个随机种子 · 配对统计检验
- 核心发现:重采样(SMOTE/过采样/欠采样)会系统性破坏概率校准,而 F1/AUC 等常看的指标几乎不动——所以这个代价是"隐形"的
- 一步事后校准可把 ECE 降约 66%,AUC 仅损 0.003
这个项目还推动了技能包自身的进化:它如实承认核心结论与前作重叠,并据此强化了 idea/审稿/自审环节的"新颖性撞车检查"。完整经过见项目 README。
同一份真实数据,九种各不相同的图——一图一个角度,拼成完整故事。完整大图见项目 README。
![]() 🕸 五指标权衡雷达 |
![]() 🎻 ECE 分布小提琴 |
![]() 📉 校准修复斜率图 |
![]() 🫧 不平衡比×损害气泡 |
![]() |
![]() 🔥 条件×数据集热力图 |
![]() 🏔 ECE 密度山脊图 |
![]() 📈 累积分布 ECDF |
![]() 🍭 数据集损害排行 |
技能背后垫着 9 个共享知识库(databases/),内容均经核查、可溯源:
| 库 | 内容 |
|---|---|
db01 期刊会议 |
期刊/会议元数据、审稿周期、代表作、分层(含真实 ISSN 与替代指标) |
db02 模板 |
各阶段产出的可套用模板 |
db03 方法 |
方法卡:任务/输入输出/优劣/基线/评测/代表作与实现仓库 |
db04 数据集 |
数据集卡:规模/许可/已知问题/下载方式 |
db05 设计系统 |
前端/可视化设计规范 |
db06 幻灯主题 |
PPT 主题与配色 |
db07 科研图表 |
顶刊顶会图表案例:审美/布局/配色/组图逻辑 |
db08 知识产权与竞赛 |
软著专利、竞赛申报材料骨架与评审维度 |
db09 项目状态 |
跨会话项目记忆:项目卡/术语表/决策日志 |
另有 code_assets/ 收录经对抗验证的统计与指标代码(一致性 κ/QWK 对照 sklearn,Welch t/BH-FDR/Wilson 对照 scipy,MOTA/IDF1、CORAL 序数损失、长尾重采样),数值与权威库逐位对齐,并由 CI 持续校验。
Note
绝大多数功能开箱即用,无需任何 API key。 文献检索默认走免费、免注册的 OpenAlex / Crossref。
只有一种情况需要你自备 key:用 light-ip-application 做专利检索时,调用商用专利库需要各自的凭证。Light 不内置、也不会替你保存任何 key,只在你提供时才发起请求。
| 服务 | 用途 | 是否必需 | 怎么获取 |
|---|---|---|---|
| OpenAlex / Crossref | 学术文献检索 | 免 key,默认 | 无需注册 |
| The Lens | 专利↔论文关联检索 | 选用 | 注册申请,学术用途多数免费授权 |
| EPO OPS | 欧洲专利官方数据 | 选用 | 注册拿 consumer key/secret |
| USPTO ODP | 美国专利数据 | 选用 | 注册申请 API key |
key 通过环境变量提供,不要写进代码或提交到仓库。Light 的安全约定见 SECURITY.md。
- 诚实优先 — 不编造文献、数据、出处、数据来源;核不实的明确标注"待核查",并区分"已验证"与"推测";受版权材料只保留元数据与链接。
- 能跑,不空谈 — 技能内置真实可运行的脚本、可套用的模板、完整的范例,而非一段段抽象指令。
- 对抗式自检 — 关键产出都经过独立"挑刺"和权威工具的交叉验证(统计结果对照
scipy/sklearn,对外接口逐一实测)。 - 全流程协同 — 27 个技能围绕一条科研主线衔接,共享 9 个知识库的术语、方法与投稿信息。
Light/
├── skills/ # 27 个技能,每个含 SKILL.md + references,按需带 scripts/templates/examples
├── databases/ # 9 个知识库(db01–db09)
├── code_assets/ # 经对抗验证、CI 持续校验的统计与指标代码
├── projects/ # 端到端示例项目(dairygoat-detect-track,跑通完整链路)
├── _verification_log/ # 二次核实证据链(API 字段/库行为/技能来源,带真实 HTTP 码)
├── assets/ # LOGO、图片
├── install.ps1 / .sh # 一键安装脚本(幂等可重跑)
├── CONVENTIONS.md # 全局规约(诚实底线、产出规范)
├── ROUTER.md # 技能路由逻辑
├── AGENTS.snippet.md # Codex 路由片段
├── .claude-plugin/ # Claude 插件清单(plugin.json)
├── .codex-plugin/ # Codex 插件清单
├── CONTRIBUTING.md · CODE_OF_CONDUCT.md · SECURITY.md # 贡献/行为准则/安全策略
├── CHANGELOG.md · CITATION.cff · LICENSE # 更新日志/引用信息/许可
├── README.md · README.en.md # 中 / 英文档
├── .github/ # issue/PR 模板、CI、赞助配置
└── .codex/INSTALL.md # Codex 安装说明
它和直接用 ChatGPT/Claude 聊有什么区别?
Light 给的是能跑的脚本、能套的模板和真实范例,且有"不编造"的硬底线和对抗式自检;还能跨会话记住你的项目进度。不是一次性问答。
需要配置 API key 吗?
绝大多数功能免 key,文献检索默认走免费的 OpenAlex / Crossref。只有用 light-ip-application 做专利检索时,才需自备 Lens/EPO/USPTO 的凭证。详见 关于 API key。
常驻技能为什么在 / 里看不到?
这 10 个技能设计为后台自动生效,无需手动唤起,所以不占用 / 菜单。17 个手动技能则照常用 / 调用。
必须两端都装吗?
不必。install.ps1 -Client claude 或 install.sh claude 只装一端。
会把我的数据上传到第三方吗?
不会,除非任务本身需要(如检索文献会访问公开学术 API)。涉及上传的操作会提示。详见 SECURITY.md。
Light 会替我写论文、造数据吗?
不会。它辅助你做研究、组织表达,但严守学术伦理(见 light-research-ethics):不造数据、不编文献、不过度包装。
欢迎修 bug、加技能、扩知识库、改文档。请先读 CONTRIBUTING.md 与 CONVENTIONS.md(尤其是诚实底线),并遵守 CODE_OF_CONDUCT.md。安全问题请按 SECURITY.md 私下报告。
Light 由一个人利用业余时间打磨。如果它帮你省下了时间、让科研更顺手,欢迎请作者喝杯咖啡——你的支持是持续更新的最大动力。
- 问题反馈 / 功能建议:在本仓库提 Issue(有 bug / 功能模板)
- 使用交流:欢迎到 Discussions
- 改进贡献:Fork 后提 Pull Request
- 邮件联系:1833058953@qq.com
如果 Light 对你的研究有帮助,可按 CITATION.cff 引用,或在 GitHub 仓库页点击 "Cite this repository"。
MIT License © 2026 Light









