一个 AI Agent Skill,用 AI 辅助检测学术论文中的数据造假、图片复用、统计异常等学术不端行为。
灵感来源于 B 站 UP 主耿同学讲故事,他在 36 天内揭露了同济、南开、中山、上海大学 4 所高校的 5 位杰青学术造假,被网友称为"学术圈海瑞"。
npx skills add https://github.com/wooly99/geng-academic-fraud-detector安装后 Skill 会被添加到你的 Agent skills 目录中。
安装后,在 AI Agent 对话中直接说:
帮我打假这篇论文 /path/to/paper.pdf
Agent 会读取论文 PDF,按照"耿同学六式"逐一检测,最终输出一份结构化的打假报告。
| 式 | 名称 | 检测内容 | 灵感来源 |
|---|---|---|---|
| 一 | 图片复用 | 同一图片被旋转/翻转/裁剪后用于不同实验 | 耿同学最经典的手法 |
| 二 | 数据造假 | 数值分布异常、标准差不合理、数据太完美 | 同济王平 Nature 论文 |
| 三 | 图片拼接 | Western blot 泳道拼接、背景不一致 | 中山康铁邦案 |
| 四 | 统计异常 | p-hacking、样本量不匹配、选择性报告 | — |
| 五 | 产出异常 | 不合理的发表频率、切片发表 | "硕士3年84篇SCI" |
| 六 | 方法矛盾 | 实验描述内部矛盾、时间线冲突 | — |
我用一篇已被 PLOS ONE 撤稿的论文(doi:10.1371/journal.pone.0313446)进行了测试。
Skill 成功检出:
- 图片复用:Figure 1D/4A、Figure 2A/5A 面板重复
- 数据造假:Figure 1E/4B 的原始数据完全相同(两批"独立实验"数据一模一样)
- 方法矛盾:双侧处理的伦理问题 + 实验设计逻辑矛盾
完整报告见 test/example-report.md
# 🔍 耿同学打假报告
## 综合评定:🔴 实锤
### 发现 1:数据复用
- 位置:Figure 1E vs Figure 4B
- 描述:两批"独立实验"的原始计数数据完全相同
- 严重程度:🔴
## 耿同学辣评
"同一组小鼠的视网膜细胞,在两个'独立实验'里数出了一模一样的数量
——这不是科学,这是 Ctrl+C Ctrl+V。"- 图像分析:基于视觉理解而非像素级分析,无法进行 ELA(Error Level Analysis)
- 依赖文本:对纯图片型论文(如大量显微镜图)的检测能力有限
- 无法验证原始数据:只能基于论文中呈现的信息进行分析
- 可能误报:单一异常点不应作为定性依据
- 本工具仅供学术讨论和教育用途
- AI 分析存在误报和漏报的可能
- 学术不端的最终认定需要专业机构调查
- 请勿将本工具的输出作为指控他人的唯一证据
致敬耿洪伟(耿同学讲故事),一个用勇气、严谨、公心和幽默守护学术净土的孤勇者。
"我不是什么英雄,我只是个退学的博士生,恰好会看图。"
MIT