Skip to content

xiaofenggan01/aigc-reduce

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AIGC Reduce

降低学术论文 AIGC 查重率的 Claude Code Skill,同时增量兼容 Codex。

基于知网 3.0、万方、PaperPass、PaperPure 等主流检测器的技术原理,结合 humanizer skill(源自 Wikipedia "Signs of AI writing")的 AI 痕迹识别方法论,通过三轮降重协议(去除痕迹 → 注入人类特征 → 自检审计)让文本呈现「人类写作」的统计特征。

安装

Claude Code

Claude Code 是本 skill 的原始目标环境,推荐安装到:

git clone https://github.com/xiaofenggan01/aigc-reduce.git ~/.claude/skills/aigc-reduce

安装后,当你在 Claude Code 中提到「降 AI 味」「降 AIGC 率」「去 AI 检测」等关键词时,该 skill 会自动触发。

Codex

Codex 可安装到 Codex 可发现的 skills 目录:

git clone https://github.com/xiaofenggan01/aigc-reduce.git ~/.agents/skills/aigc-reduce

如果你的环境使用 $CODEX_HOME/skills

git clone https://github.com/xiaofenggan01/aigc-reduce.git "$CODEX_HOME/skills/aigc-reduce"

Codex 通过 SKILL.md frontmatter 识别触发条件,通过 agents/openai.yaml 读取 UI 元数据。Claude Code 可以忽略 agents/openai.yaml

为什么需要这个工具?

AIGC 检测器已经在各大高校强制使用。但检测技术存在根本性局限:

  • 写得好 = 判 AI? 高质量流畅论文假阳性率 6.5%,有口语化瑕疵的论文仅 1.8%
  • 跨平台结果不一致: 同一篇论文知网 AI 率 35%,万方仅 12%
  • 术语密集型论文受害: 术语密度 >20% 时假阳性率 8-12%
  • 检测器依赖浅层特征: DPO 训练可使检测准确率下降 60%

核心思路:不是帮人作弊,而是帮本来是人写的论文降低被误判的风险。

三条铁律

  1. 禁止 AI 全量重写 — AI 重写 AI 文本 = 叠加 AI 指纹(PaperPure 实测:重写后检测率升至 100%)
  2. 修改率必须 >40% — 轻度修改(<20%)仅 15-25% 规避率,深度修改(>40%)可达 60-80%
  3. 确定性替换 — 每次只改一小处,不经过 LLM 的 token 采样

三轮降重协议

第一轮:去除 AI 痕迹(减法)

扫描文本 → 词级替换 → 句级重构 → 段落调整,确保修改率 >40%。

替换操作覆盖三个层级:

  • 词级(10-15%):模板词、72 个中文 AI 高频词、动词的系统性替换
  • 句级(15-20%):语序重组、长句拆分、被动改主动、主语更换
  • 段落级(10-15%):对称段长打破、段间过渡、语义注入

第二轮:注入人类特征(加法)

源自 humanizer skill 的核心洞察:只去除 AI 痕迹不够,干净但无灵魂的文本和 AI 文本一样容易被检测。

  • 节奏工程:故意制造长短句交错,目标突发性 CV > 0.45
  • 不确定性注入:"推测…""猜测…""不过还需要更多数据支持"
  • 操作细节补充:加入实验观察、参数波动、异常说明
  • 声音校准:如果用户提供参考文本,分析并匹配其写作风格

第三轮:Anti-AI 审计(自检)

审视文本,回答"这段话为什么还像 AI 写的?",逐项排查 10 种深度 AI 痕迹模式:

  1. 重要性膨胀("至关重要""不可忽视")
  2. 同义词轮换(同一概念被叫了 3 个以上名字)
  3. 三板斧强迫症(连续出现"A、B和C"三件套)
  4. 系词回避(AI 不用"是",偏用"作为/体现/代表")
  5. 模糊归因("有研究表明"无引用)
  6. 公式化挑战段("尽管…但仍存在局限性")
  7. 悬浮式分析(一句话挂了 2+ 个"从而/进而")
  8. 空洞结论("具有良好的应用前景")
  9. 破折号过度使用
  10. 虚假范围("从宏观到微观")

自动化扫描

内置 aigc_scan.py 脚本,自动扫描文本的 7 个 AI 特征维度:

python3 scripts/aigc_scan.py your_paper.txt
维度 对应检测器
模板句式密度 知网语义指纹
突发性 CV GPTZero 核心算法
段落对称性 知网格式规范性校验
嵌套编号 统计检测
冒号并列 知网逻辑断层检测
被动语态 Turnitin 句式特征分析
标点规律 万方 BERT 语义分析

文件结构

aigc-reduce/
├── SKILL.md                            # Skill 核心(120行,渐进式披露 Level 2)
├── README.md                           # 本文件
├── agents/
│   └── openai.yaml                     # Codex UI 元数据,Claude Code 可忽略
├── references/
│   ├── replacement-tables.md           # 替换表 + 72 词中文 AI 高频词清单
│   ├── ai-patterns.md                  # 10 种深度 AI 痕迹识别模式
│   └── detection-principles.md         # 检测器技术原理与弱点
└── scripts/
    └── aigc_scan.py                    # 自动化扫描脚本(7 维度)

检测器参考数据

国内产品

产品 综合准确率 假阳性率 核心检测维度
知网 3.0 98.6% 1.2% 语义指纹、格式规范性
万方 ~95% ~3% 多模型融合
PaperPass ~97% 0.3% 语言风格一致性

国际产品

产品 综合准确率 假阳性率 中文支持
Turnitin 98%(英文)/ 85%(中文) 2.1% 一般
GPTZero 90-99% 16% 良好
Copyleaks 99%+ 未公开 良好

致谢

方法论综合了以下来源的实证研究:

  • 《论文AIGC查重检测方法与原理深度研究报告》(2026-05)
  • Wikipedia "Signs of AI writing"(WikiProject AI Cleanup 维护)
  • Humanizer skill — AI 痕迹识别 + 二次自检方法论
  • LINUX DO 论坛社区验证的 Prompt 工程
  • 微博博主"厄加特特"的句式变换方法论
  • 火山引擎开发者社区发布的降重 Prompt
  • GitHub 开源项目:BypassAIGC、Humanizer-zh、humanize-chinese
  • PaperPure 实测反馈

License

MIT

About

降低学术论文 AIGC 查重率的 Claude Code Skill | A Claude Code skill for reducing AIGC detection rates in academic papers

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages