Deep Reading Coach

中文 | English

deep-reading-coach 是一个 Codex skill，用来帮助你更认真、更有方法地读书、读 PDF、读文章，或者围绕一个主题比较多份资料。

它不是普通的“总结器”，更像一个阅读教练。它会先帮你判断资料怎么读，再帮你拆结构、抓概念、看论证，最后把阅读结果和你的目标联系起来。

它能做什么

适合用来：

快速判断一本书值不值得读
给一本书或 PDF 制定阅读路线
提炼一本书的主题、结构、重点章节
深度拆解作者的问题、概念、主张和论证
生成结构化读书笔记
围绕一个主题比较多本书或多篇文章
把阅读结果转成问题清单、洞察或行动建议

快速开始

在 Codex 里直接说：

使用 deep-reading-coach 帮我读这本书。

如果你有文件路径，可以这样说：

使用 deep-reading-coach 阅读 <PDF_PATH>，先帮我看看这本书该怎么读。

你不需要知道“检视阅读、分析阅读、主题阅读”这些术语。这个 skill 会根据你的说法自动选择合适的方式。

模糊说法也可以

你不需要把指令写得很标准。很口语的说法也可以：

帮我看看这个。

这讲啥？

帮我消化一下。

我想搞懂这本书，但不知道从哪里开始。

这个 skill 会自动判断应该先做快速预览、简明总结、深度拆解、主题研究，还是阅读计划。如果实在判断不出来，它应该只问一个简短问题，而不是让你选择专业术语。

什么时候不该用它

这个 skill 适合“读懂、总结、分析、评价、比较、做笔记”。如果你只是做机械文件处理，不一定需要它。

不适合只用它处理：

提取某一页文字
只做 OCR
把 PDF 转成 Word/Markdown
搜索某个关键词
导出表格到 Excel
统计字数、页数、图片数
列出 PDF 里的图片或元数据
只翻译某一页或某一段

如果你同时要求理解，就适合用它：

把这个 PDF OCR 后帮我读懂。

提取文字并整理核心观点。

把这一章转成读书笔记。

PDF 读取

当你提供 PDF 时，这个 skill 应该先检查 PDF 是否能可靠读取，而不是直接开始分析。

它自带一个辅助脚本：

scripts/pdf_intake.py

这个脚本会诊断：

页数
是否能直接提取文字
是否像扫描版或图片版 PDF
空页或低质量页面
是否有乱码/异常提取
是否识别到目录
哪些页面需要复查
建议读取方式

典型命令：

python scripts/pdf_intake.py path/to/file.pdf --out work/pdf-intake

如果 PDF 是文本型，skill 会保留页码并读取提取文本。如果 PDF 是扫描版或混合型，skill 会先标明证据等级：哪些是已确认，哪些是根据目录和结构做出的合理推断，哪些需要 OCR 或重读确认，而不是假装已经完整读懂。

在 Windows 上，优先使用系统内置 OCR，不需要 Poppler/Tesseract：

python scripts/windows_ocr_pdf.py path/to/file.pdf --out work/windows-ocr --lang zh-Hans-CN

它会尝试直接从 PDF 抽取页面图片，再调用 Windows OCR 识别中文，并生成逐页文本。

如果你想使用 AI 视觉模型识别页面图片，可以先导出视觉 OCR 输入包：

python scripts/prepare_vision_ocr.py path/to/file.pdf --out work/vision-ocr-input

它会导出页面图片、manifest、批处理 JSON 和 vision_ocr_prompt.md。这条路线适合 Windows OCR 效果差、旧书扫描复杂，或者你准备使用支持视觉的模型时。

如果本机有 pdftoppm 和 tesseract，也可以用 Tesseract fallback：

python scripts/ocr_pages.py path/to/file.pdf --out work/pdf-ocr

它会生成 ocr_report.md、ocr_pages.jsonl 和逐页 OCR 文本。如果缺少 OCR 工具，它会写出缺失工具诊断，不会偷偷安装任何东西。

常见用法

1. Quick Preview / 检视阅读

适合你想先知道一本书讲什么、值不值得读、该怎么读。

Quick Preview / 检视阅读是一轮快速定向，帮助你判断这本书表面上讲什么、值不值得读、该怎么读。它对应《如何阅读一本书》里的检视阅读，包括两个动作：有系统的略读或粗读 和 粗浅的第一遍阅读。

它不是完整分析阅读，不负责正式解释关键概念、主旨和论证。它只做暂定观察和阅读决策：初步判断书的类型、表层结构、哪些部分值得读、哪些问题要带入下一轮。同时，它也必须暂定回答四个基本问题：整体在谈什么、细部说了什么和怎么说、是否初步看来有道理、跟读者有什么关系。如果你想真正读懂一本书，应继续进入 Deep Breakdown / 分析阅读。

使用 deep-reading-coach 帮我快速看一下这本 PDF，告诉我它讲什么、适合谁、哪些章节值得细读。

这本书我还没决定要不要读，先帮我判断值不值得读。

默认会输出完整检视阅读报告。只有你明确要求“简短版”“压缩版”“只要大概”时，才会使用短版。

通常会输出：

来源/PDF 读取情况
目录是否可见
阅读决策：跳过、略读、选读、精读，还是作为参考资料
暂定书籍类型，以及为什么影响读法
这本书大概像是在讲什么
表层结构地图
四个基本问题的暂定回答
有系统略读记录
粗浅第一遍阅读记录
针对不同目标的阅读路线
哪些部分应精读、略读或暂时跳过
带入分析阅读的问题
是否进入分析阅读、阅读计划、主题研究，或暂停

2. Deep Breakdown / 分析阅读

适合你想真正读懂一本书，而不只是看摘要。这个模式对应《如何阅读一本书》里的分析阅读，会按 15 条规则分三阶段处理。第一阶段会特别重视“透视一本书”：用证据分类、写出可检验的全书大意、拆出分析阅读式全书大纲，并整理作者的问题树。

分析阅读式全书大纲不是目录摘要。它要找出作者的统摄性问题、全书推进公式、功能性大部分、各章在论证中的作用，以及这些判断是怎样从书名、副标题、目录、章节标题、序言、结尾或正文证据中推出来的。

第二阶段会按章节或关键部分诠释内容：先建立阅读单元地图，再分别找出全书关键词、局部关键词、关键句、主旨、局部论述链，最后合成为全书论述地图，并回到第一阶段的问题树判断作者解决了什么。

第三阶段会做公正评论：先证明已经理解作者，再按范围判断同意、部分同意、不同意或暂缓评论。批评必须绑定具体主旨、论述或未回答的问题，并区分知识判断和个人偏好。

使用 deep-reading-coach 帮我深度拆解这本书，重点看作者想解决什么问题、核心概念、主要主张和论证结构。

我想认真读懂这本书，不只是总结。请帮我做一份深度阅读笔记。

默认会输出完整分析阅读 / 深度拆解。只有你明确要求“简短版”“压缩版”“先给我大概”时，才会使用短版。

通常会输出：

这本书整体在谈什么
正式分类、分类证据、读法后果与书类适配器
一句话全书大意，以及对象、核心问题、主要回答、展开方式
分析阅读式全书大纲：统摄性问题、全书推进公式、功能性大部分、各章功能表、各部分之间的转接关系
大纲构造说明：哪些来自文本证据，哪些是合理推断，哪些需要 OCR、重读或查证
作者想解决的问题树：主问题、次问题、先后顺序、对应章节
阅读单元地图：哪些章节 / 部分被精读，哪些暂缓
全书核心关键字、局部关键字与共通词义
按章节 / 部分找出的关键句与主旨 / 命题
局部论述链、论述之间的关系、全书总论述地图
回到问题树判断作者解决了什么，部分解决了什么，没解决什么
评论资格检查：先确认理解，再进行同意、不同意或暂缓评论
作者观点的最强版本，以及我的判断是否需要调整
四种严格批评：作者知识不足、知识错误、不合逻辑、分析不完整
“这本书说得有道理吗”的综合判断
这本书对你的理解、判断、行动、研究和个人目标有什么关系
这本书的使用边界和误用风险

如果你想检查生成报告是否遗漏结构，可以运行：

python scripts/check_report.py path/to/report.md --type analytical

不同种类的书不会被用同一把尺子硬套。例如：

实用书重点看目标、手段、是否可执行，以及读者同意后要采取什么行动。
文学作品重点看整体经验、人物、情节、意象、形式，不会强行把小说或诗当成论证文章。
历史书重点看史料、选择、解释、因果关系，以及是否需要比较多本历史书。
科学和数学书重点看定义、假设、实验、证明、图表、公式和证据范围。
哲学书重点看问题、关键概念、区分、前提、推理和结论。
社会科学书重点看术语定义、方法、数据、价值立场，并经常建议进入主题研究。

3. 主题研究

适合你围绕一个主题比较多本书、多篇文章、多个章节或多段资料。它不是把资料分别摘要后并排比较，而是让“你要研究的问题”成为中心，所有资料都服务于这个问题。

主题研究通常分两步：

准备阶段：先建立试验性书目或资料池，快速检视资料，判断哪些真正相关，并在必要时修订研究问题。
正式主题阅读：找出相关章节 / 段落，建立中立词汇，厘清共同问题，从不同回答中界定议题，再客观排列整个讨论。

使用 deep-reading-coach 帮我围绕“学习方法”做主题研究，列出应该比较的问题和书单。

我有三本关于投资的书，帮我比较它们对风险、复利和资产配置的看法。

通常会输出：

起始研究问题，以及检视后是否需要修订
试验性书目 / 资料池
检视筛选表：纳入、排除、暂缓及理由
每份资料真正相关的章节、段落、页码或论述
中立词汇表：避免直接采用某一个作者的术语
共同问题表：哪些问题是多份资料都能回答的
不同资料对同一问题的直接回答、间接回答或沉默
议题地图：主要分歧在哪里、各自站在哪一边
四个基本问题的跨资料比较
共识、分歧与沉默
辩证客观检查：是否公平排列讨论，没有过早站队
综合判断：你现在可以合理得出什么结论
还没解决的问题

4. 阅读计划

适合你不知道该怎么读，或者时间有限。

我不知道怎么读这本书，使用 deep-reading-coach 帮我制定一个一周阅读计划。

我只有两个小时，帮我安排这本书的阅读顺序。

通常会输出：

阅读目标
时间分配
先读哪些章节
哪些内容可以跳过或略读
读书笔记模板
后续深读建议

不适合做什么

这个 skill 不适合用来：

大段复制受版权保护的书籍内容
在没有资料的情况下假装读过某本书
替代你自己的判断
对明显只需要略读的资料强行写长篇分析

如果你只是想要非常短的摘要，也可以用它；但它可能会提醒你，摘要只是第一步，真正读懂还需要看结构、概念、论证和与你自己的关系。

安装

用户级 Codex skill 通常放在：

%USERPROFILE%\.codex\skills\deep-reading-coach

安装或修改后，请重启 Codex，让新线程加载这个 skill。

推荐的 GitHub 仓库结构：

skills/
  deep-reading-coach/
    SKILL.md
    README.md
    README_EN.md
    references/
      routing.md
      templates.md
      pdf-intake.md
    scripts/
      pdf_intake.py

从 GitHub 安装或手动复制时，请安装/复制整个 deep-reading-coach 文件夹，而不是只复制 SKILL.md。references 和 scripts 都是这个 skill 的一部分。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Deep Reading Coach

它能做什么

快速开始

模糊说法也可以

什么时候不该用它

PDF 读取

常见用法

1. Quick Preview / 检视阅读

2. Deep Breakdown / 分析阅读

3. 主题研究

4. 阅读计划

推荐工作流

不适合做什么

安装

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
references		references
scripts		scripts
PUBLISHING.md		PUBLISHING.md
README.md		README.md
README_EN.md		README_EN.md
SKILL.md		SKILL.md

Folders and files

Latest commit

History

Repository files navigation

Deep Reading Coach

它能做什么

快速开始

模糊说法也可以

什么时候不该用它

PDF 读取

常见用法

1. Quick Preview / 检视阅读

2. Deep Breakdown / 分析阅读

3. 主题研究

4. 阅读计划

推荐工作流

不适合做什么

安装

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages