中文 | English
deep-reading-coach 是一个 Codex skill,用来帮助你更认真、更有方法地读书、读 PDF、读文章,或者围绕一个主题比较多份资料。
它不是普通的“总结器”,更像一个阅读教练。它会先帮你判断资料怎么读,再帮你拆结构、抓概念、看论证,最后把阅读结果和你的目标联系起来。
适合用来:
- 快速判断一本书值不值得读
- 给一本书或 PDF 制定阅读路线
- 提炼一本书的主题、结构、重点章节
- 深度拆解作者的问题、概念、主张和论证
- 生成结构化读书笔记
- 围绕一个主题比较多本书或多篇文章
- 把阅读结果转成问题清单、洞察或行动建议
在 Codex 里直接说:
使用 deep-reading-coach 帮我读这本书。
如果你有文件路径,可以这样说:
使用 deep-reading-coach 阅读 <PDF_PATH>,先帮我看看这本书该怎么读。
你不需要知道“检视阅读、分析阅读、主题阅读”这些术语。这个 skill 会根据你的说法自动选择合适的方式。
你不需要把指令写得很标准。很口语的说法也可以:
帮我看看这个。
这讲啥?
帮我消化一下。
我想搞懂这本书,但不知道从哪里开始。
这个 skill 会自动判断应该先做快速预览、简明总结、深度拆解、主题研究,还是阅读计划。如果实在判断不出来,它应该只问一个简短问题,而不是让你选择专业术语。
这个 skill 适合“读懂、总结、分析、评价、比较、做笔记”。如果你只是做机械文件处理,不一定需要它。
不适合只用它处理:
- 提取某一页文字
- 只做 OCR
- 把 PDF 转成 Word/Markdown
- 搜索某个关键词
- 导出表格到 Excel
- 统计字数、页数、图片数
- 列出 PDF 里的图片或元数据
- 只翻译某一页或某一段
如果你同时要求理解,就适合用它:
把这个 PDF OCR 后帮我读懂。
提取文字并整理核心观点。
把这一章转成读书笔记。
当你提供 PDF 时,这个 skill 应该先检查 PDF 是否能可靠读取,而不是直接开始分析。
它自带一个辅助脚本:
scripts/pdf_intake.py
这个脚本会诊断:
- 页数
- 是否能直接提取文字
- 是否像扫描版或图片版 PDF
- 空页或低质量页面
- 是否有乱码/异常提取
- 是否识别到目录
- 哪些页面需要复查
- 建议读取方式
典型命令:
python scripts/pdf_intake.py path/to/file.pdf --out work/pdf-intake
如果 PDF 是文本型,skill 会保留页码并读取提取文本。如果 PDF 是扫描版或混合型,skill 会先标明证据等级:哪些是已确认,哪些是根据目录和结构做出的合理推断,哪些需要 OCR 或重读确认,而不是假装已经完整读懂。
在 Windows 上,优先使用系统内置 OCR,不需要 Poppler/Tesseract:
python scripts/windows_ocr_pdf.py path/to/file.pdf --out work/windows-ocr --lang zh-Hans-CN
它会尝试直接从 PDF 抽取页面图片,再调用 Windows OCR 识别中文,并生成逐页文本。
如果你想使用 AI 视觉模型识别页面图片,可以先导出视觉 OCR 输入包:
python scripts/prepare_vision_ocr.py path/to/file.pdf --out work/vision-ocr-input
它会导出页面图片、manifest、批处理 JSON 和 vision_ocr_prompt.md。这条路线适合 Windows OCR 效果差、旧书扫描复杂,或者你准备使用支持视觉的模型时。
如果本机有 pdftoppm 和 tesseract,也可以用 Tesseract fallback:
python scripts/ocr_pages.py path/to/file.pdf --out work/pdf-ocr
它会生成 ocr_report.md、ocr_pages.jsonl 和逐页 OCR 文本。如果缺少 OCR 工具,它会写出缺失工具诊断,不会偷偷安装任何东西。
适合你想先知道一本书讲什么、值不值得读、该怎么读。
Quick Preview / 检视阅读是一轮快速定向,帮助你判断这本书表面上讲什么、值不值得读、该怎么读。它对应《如何阅读一本书》里的检视阅读,包括两个动作:有系统的略读或粗读 和 粗浅的第一遍阅读。
它不是完整分析阅读,不负责正式解释关键概念、主旨和论证。它只做暂定观察和阅读决策:初步判断书的类型、表层结构、哪些部分值得读、哪些问题要带入下一轮。同时,它也必须暂定回答四个基本问题:整体在谈什么、细部说了什么和怎么说、是否初步看来有道理、跟读者有什么关系。如果你想真正读懂一本书,应继续进入 Deep Breakdown / 分析阅读。
使用 deep-reading-coach 帮我快速看一下这本 PDF,告诉我它讲什么、适合谁、哪些章节值得细读。
这本书我还没决定要不要读,先帮我判断值不值得读。
默认会输出完整检视阅读报告。只有你明确要求“简短版”“压缩版”“只要大概”时,才会使用短版。
通常会输出:
- 来源/PDF 读取情况
- 目录是否可见
- 阅读决策:跳过、略读、选读、精读,还是作为参考资料
- 暂定书籍类型,以及为什么影响读法
- 这本书大概像是在讲什么
- 表层结构地图
- 四个基本问题的暂定回答
- 有系统略读记录
- 粗浅第一遍阅读记录
- 针对不同目标的阅读路线
- 哪些部分应精读、略读或暂时跳过
- 带入分析阅读的问题
- 是否进入分析阅读、阅读计划、主题研究,或暂停
适合你想真正读懂一本书,而不只是看摘要。这个模式对应《如何阅读一本书》里的分析阅读,会按 15 条规则分三阶段处理。第一阶段会特别重视“透视一本书”:用证据分类、写出可检验的全书大意、拆出分析阅读式全书大纲,并整理作者的问题树。
分析阅读式全书大纲不是目录摘要。它要找出作者的统摄性问题、全书推进公式、功能性大部分、各章在论证中的作用,以及这些判断是怎样从书名、副标题、目录、章节标题、序言、结尾或正文证据中推出来的。
第二阶段会按章节或关键部分诠释内容:先建立阅读单元地图,再分别找出全书关键词、局部关键词、关键句、主旨、局部论述链,最后合成为全书论述地图,并回到第一阶段的问题树判断作者解决了什么。
第三阶段会做公正评论:先证明已经理解作者,再按范围判断同意、部分同意、不同意或暂缓评论。批评必须绑定具体主旨、论述或未回答的问题,并区分知识判断和个人偏好。
使用 deep-reading-coach 帮我深度拆解这本书,重点看作者想解决什么问题、核心概念、主要主张和论证结构。
我想认真读懂这本书,不只是总结。请帮我做一份深度阅读笔记。
默认会输出完整分析阅读 / 深度拆解。只有你明确要求“简短版”“压缩版”“先给我大概”时,才会使用短版。
通常会输出:
- 这本书整体在谈什么
- 正式分类、分类证据、读法后果与书类适配器
- 一句话全书大意,以及对象、核心问题、主要回答、展开方式
- 分析阅读式全书大纲:统摄性问题、全书推进公式、功能性大部分、各章功能表、各部分之间的转接关系
- 大纲构造说明:哪些来自文本证据,哪些是合理推断,哪些需要 OCR、重读或查证
- 作者想解决的问题树:主问题、次问题、先后顺序、对应章节
- 阅读单元地图:哪些章节 / 部分被精读,哪些暂缓
- 全书核心关键字、局部关键字与共通词义
- 按章节 / 部分找出的关键句与主旨 / 命题
- 局部论述链、论述之间的关系、全书总论述地图
- 回到问题树判断作者解决了什么,部分解决了什么,没解决什么
- 评论资格检查:先确认理解,再进行同意、不同意或暂缓评论
- 作者观点的最强版本,以及我的判断是否需要调整
- 四种严格批评:作者知识不足、知识错误、不合逻辑、分析不完整
- “这本书说得有道理吗”的综合判断
- 这本书对你的理解、判断、行动、研究和个人目标有什么关系
- 这本书的使用边界和误用风险
如果你想检查生成报告是否遗漏结构,可以运行:
python scripts/check_report.py path/to/report.md --type analytical
不同种类的书不会被用同一把尺子硬套。例如:
- 实用书重点看目标、手段、是否可执行,以及读者同意后要采取什么行动。
- 文学作品重点看整体经验、人物、情节、意象、形式,不会强行把小说或诗当成论证文章。
- 历史书重点看史料、选择、解释、因果关系,以及是否需要比较多本历史书。
- 科学和数学书重点看定义、假设、实验、证明、图表、公式和证据范围。
- 哲学书重点看问题、关键概念、区分、前提、推理和结论。
- 社会科学书重点看术语定义、方法、数据、价值立场,并经常建议进入主题研究。
适合你围绕一个主题比较多本书、多篇文章、多个章节或多段资料。它不是把资料分别摘要后并排比较,而是让“你要研究的问题”成为中心,所有资料都服务于这个问题。
主题研究通常分两步:
- 准备阶段:先建立试验性书目或资料池,快速检视资料,判断哪些真正相关,并在必要时修订研究问题。
- 正式主题阅读:找出相关章节 / 段落,建立中立词汇,厘清共同问题,从不同回答中界定议题,再客观排列整个讨论。
使用 deep-reading-coach 帮我围绕“学习方法”做主题研究,列出应该比较的问题和书单。
我有三本关于投资的书,帮我比较它们对风险、复利和资产配置的看法。
通常会输出:
- 起始研究问题,以及检视后是否需要修订
- 试验性书目 / 资料池
- 检视筛选表:纳入、排除、暂缓及理由
- 每份资料真正相关的章节、段落、页码或论述
- 中立词汇表:避免直接采用某一个作者的术语
- 共同问题表:哪些问题是多份资料都能回答的
- 不同资料对同一问题的直接回答、间接回答或沉默
- 议题地图:主要分歧在哪里、各自站在哪一边
- 四个基本问题的跨资料比较
- 共识、分歧与沉默
- 辩证客观检查:是否公平排列讨论,没有过早站队
- 综合判断:你现在可以合理得出什么结论
- 还没解决的问题
适合你不知道该怎么读,或者时间有限。
我不知道怎么读这本书,使用 deep-reading-coach 帮我制定一个一周阅读计划。
我只有两个小时,帮我安排这本书的阅读顺序。
通常会输出:
- 阅读目标
- 时间分配
- 先读哪些章节
- 哪些内容可以跳过或略读
- 读书笔记模板
- 后续深读建议
最舒服的用法通常是:
- 先让它做快速预览。
- 你挑出最重要的章节或问题。
- 再让它做深度拆解。
- 如果需要,再扩展到相关书籍做主题研究。
例如:
使用 deep-reading-coach 先快速预览这本 PDF,告诉我哪些章节最值得深读。
然后继续说:
好,接下来深度拆解第 2、3、5 章。
这个 skill 不适合用来:
- 大段复制受版权保护的书籍内容
- 在没有资料的情况下假装读过某本书
- 替代你自己的判断
- 对明显只需要略读的资料强行写长篇分析
如果你只是想要非常短的摘要,也可以用它;但它可能会提醒你,摘要只是第一步,真正读懂还需要看结构、概念、论证和与你自己的关系。
用户级 Codex skill 通常放在:
%USERPROFILE%\.codex\skills\deep-reading-coach
安装或修改后,请重启 Codex,让新线程加载这个 skill。
推荐的 GitHub 仓库结构:
skills/
deep-reading-coach/
SKILL.md
README.md
README_EN.md
references/
routing.md
templates.md
pdf-intake.md
scripts/
pdf_intake.py
从 GitHub 安装或手动复制时,请安装/复制整个 deep-reading-coach 文件夹,而不是只复制 SKILL.md。references 和 scripts 都是这个 skill 的一部分。