降低学术论文 AIGC 查重率的 Claude Code Skill,同时增量兼容 Codex。
基于知网 3.0、万方、PaperPass、PaperPure 等主流检测器的技术原理,结合 humanizer skill(源自 Wikipedia "Signs of AI writing")的 AI 痕迹识别方法论,通过三轮降重协议(去除痕迹 → 注入人类特征 → 自检审计)让文本呈现「人类写作」的统计特征。
Claude Code 是本 skill 的原始目标环境,推荐安装到:
git clone https://github.com/xiaofenggan01/aigc-reduce.git ~/.claude/skills/aigc-reduce安装后,当你在 Claude Code 中提到「降 AI 味」「降 AIGC 率」「去 AI 检测」等关键词时,该 skill 会自动触发。
Codex 可安装到 Codex 可发现的 skills 目录:
git clone https://github.com/xiaofenggan01/aigc-reduce.git ~/.agents/skills/aigc-reduce如果你的环境使用 $CODEX_HOME/skills:
git clone https://github.com/xiaofenggan01/aigc-reduce.git "$CODEX_HOME/skills/aigc-reduce"Codex 通过 SKILL.md frontmatter 识别触发条件,通过 agents/openai.yaml 读取 UI 元数据。Claude Code 可以忽略 agents/openai.yaml。
AIGC 检测器已经在各大高校强制使用。但检测技术存在根本性局限:
- 写得好 = 判 AI? 高质量流畅论文假阳性率 6.5%,有口语化瑕疵的论文仅 1.8%
- 跨平台结果不一致: 同一篇论文知网 AI 率 35%,万方仅 12%
- 术语密集型论文受害: 术语密度 >20% 时假阳性率 8-12%
- 检测器依赖浅层特征: DPO 训练可使检测准确率下降 60%
核心思路:不是帮人作弊,而是帮本来是人写的论文降低被误判的风险。
- 禁止 AI 全量重写 — AI 重写 AI 文本 = 叠加 AI 指纹(PaperPure 实测:重写后检测率升至 100%)
- 修改率必须 >40% — 轻度修改(<20%)仅 15-25% 规避率,深度修改(>40%)可达 60-80%
- 确定性替换 — 每次只改一小处,不经过 LLM 的 token 采样
扫描文本 → 词级替换 → 句级重构 → 段落调整,确保修改率 >40%。
替换操作覆盖三个层级:
- 词级(10-15%):模板词、72 个中文 AI 高频词、动词的系统性替换
- 句级(15-20%):语序重组、长句拆分、被动改主动、主语更换
- 段落级(10-15%):对称段长打破、段间过渡、语义注入
源自 humanizer skill 的核心洞察:只去除 AI 痕迹不够,干净但无灵魂的文本和 AI 文本一样容易被检测。
- 节奏工程:故意制造长短句交错,目标突发性 CV > 0.45
- 不确定性注入:"推测…""猜测…""不过还需要更多数据支持"
- 操作细节补充:加入实验观察、参数波动、异常说明
- 声音校准:如果用户提供参考文本,分析并匹配其写作风格
审视文本,回答"这段话为什么还像 AI 写的?",逐项排查 10 种深度 AI 痕迹模式:
- 重要性膨胀("至关重要""不可忽视")
- 同义词轮换(同一概念被叫了 3 个以上名字)
- 三板斧强迫症(连续出现"A、B和C"三件套)
- 系词回避(AI 不用"是",偏用"作为/体现/代表")
- 模糊归因("有研究表明"无引用)
- 公式化挑战段("尽管…但仍存在局限性")
- 悬浮式分析(一句话挂了 2+ 个"从而/进而")
- 空洞结论("具有良好的应用前景")
- 破折号过度使用
- 虚假范围("从宏观到微观")
内置 aigc_scan.py 脚本,自动扫描文本的 7 个 AI 特征维度:
python3 scripts/aigc_scan.py your_paper.txt| 维度 | 对应检测器 |
|---|---|
| 模板句式密度 | 知网语义指纹 |
| 突发性 CV | GPTZero 核心算法 |
| 段落对称性 | 知网格式规范性校验 |
| 嵌套编号 | 统计检测 |
| 冒号并列 | 知网逻辑断层检测 |
| 被动语态 | Turnitin 句式特征分析 |
| 标点规律 | 万方 BERT 语义分析 |
aigc-reduce/
├── SKILL.md # Skill 核心(120行,渐进式披露 Level 2)
├── README.md # 本文件
├── agents/
│ └── openai.yaml # Codex UI 元数据,Claude Code 可忽略
├── references/
│ ├── replacement-tables.md # 替换表 + 72 词中文 AI 高频词清单
│ ├── ai-patterns.md # 10 种深度 AI 痕迹识别模式
│ └── detection-principles.md # 检测器技术原理与弱点
└── scripts/
└── aigc_scan.py # 自动化扫描脚本(7 维度)
| 产品 | 综合准确率 | 假阳性率 | 核心检测维度 |
|---|---|---|---|
| 知网 3.0 | 98.6% | 1.2% | 语义指纹、格式规范性 |
| 万方 | ~95% | ~3% | 多模型融合 |
| PaperPass | ~97% | 0.3% | 语言风格一致性 |
| 产品 | 综合准确率 | 假阳性率 | 中文支持 |
|---|---|---|---|
| Turnitin | 98%(英文)/ 85%(中文) | 2.1% | 一般 |
| GPTZero | 90-99% | 16% | 良好 |
| Copyleaks | 99%+ | 未公开 | 良好 |
方法论综合了以下来源的实证研究:
- 《论文AIGC查重检测方法与原理深度研究报告》(2026-05)
- Wikipedia "Signs of AI writing"(WikiProject AI Cleanup 维护)
- Humanizer skill — AI 痕迹识别 + 二次自检方法论
- LINUX DO 论坛社区验证的 Prompt 工程
- 微博博主"厄加特特"的句式变换方法论
- 火山引擎开发者社区发布的降重 Prompt
- GitHub 开源项目:BypassAIGC、Humanizer-zh、humanize-chinese
- PaperPure 实测反馈
MIT