Skip to content

FanPUYen/deep-reading-coach

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Deep Reading Coach

中文 | English

deep-reading-coach 是一个 Codex skill,用来帮助你更认真、更有方法地读书、读 PDF、读文章,或者围绕一个主题比较多份资料。

它不是普通的“总结器”,更像一个阅读教练。它会先帮你判断资料怎么读,再帮你拆结构、抓概念、看论证,最后把阅读结果和你的目标联系起来。


它能做什么

适合用来:

  • 快速判断一本书值不值得读
  • 给一本书或 PDF 制定阅读路线
  • 提炼一本书的主题、结构、重点章节
  • 深度拆解作者的问题、概念、主张和论证
  • 生成结构化读书笔记
  • 围绕一个主题比较多本书或多篇文章
  • 把阅读结果转成问题清单、洞察或行动建议

快速开始

在 Codex 里直接说:

使用 deep-reading-coach 帮我读这本书。

如果你有文件路径,可以这样说:

使用 deep-reading-coach 阅读 <PDF_PATH>,先帮我看看这本书该怎么读。

你不需要知道“检视阅读、分析阅读、主题阅读”这些术语。这个 skill 会根据你的说法自动选择合适的方式。


模糊说法也可以

你不需要把指令写得很标准。很口语的说法也可以:

帮我看看这个。
这讲啥?
帮我消化一下。
我想搞懂这本书,但不知道从哪里开始。

这个 skill 会自动判断应该先做快速预览、简明总结、深度拆解、主题研究,还是阅读计划。如果实在判断不出来,它应该只问一个简短问题,而不是让你选择专业术语。


什么时候不该用它

这个 skill 适合“读懂、总结、分析、评价、比较、做笔记”。如果你只是做机械文件处理,不一定需要它。

不适合只用它处理:

  • 提取某一页文字
  • 只做 OCR
  • 把 PDF 转成 Word/Markdown
  • 搜索某个关键词
  • 导出表格到 Excel
  • 统计字数、页数、图片数
  • 列出 PDF 里的图片或元数据
  • 只翻译某一页或某一段

如果你同时要求理解,就适合用它:

把这个 PDF OCR 后帮我读懂。
提取文字并整理核心观点。
把这一章转成读书笔记。

PDF 读取

当你提供 PDF 时,这个 skill 应该先检查 PDF 是否能可靠读取,而不是直接开始分析。

它自带一个辅助脚本:

scripts/pdf_intake.py

这个脚本会诊断:

  • 页数
  • 是否能直接提取文字
  • 是否像扫描版或图片版 PDF
  • 空页或低质量页面
  • 是否有乱码/异常提取
  • 是否识别到目录
  • 哪些页面需要复查
  • 建议读取方式

典型命令:

python scripts/pdf_intake.py path/to/file.pdf --out work/pdf-intake

如果 PDF 是文本型,skill 会保留页码并读取提取文本。如果 PDF 是扫描版或混合型,skill 会先标明证据等级:哪些是已确认,哪些是根据目录和结构做出的合理推断,哪些需要 OCR 或重读确认,而不是假装已经完整读懂。

在 Windows 上,优先使用系统内置 OCR,不需要 Poppler/Tesseract:

python scripts/windows_ocr_pdf.py path/to/file.pdf --out work/windows-ocr --lang zh-Hans-CN

它会尝试直接从 PDF 抽取页面图片,再调用 Windows OCR 识别中文,并生成逐页文本。

如果你想使用 AI 视觉模型识别页面图片,可以先导出视觉 OCR 输入包:

python scripts/prepare_vision_ocr.py path/to/file.pdf --out work/vision-ocr-input

它会导出页面图片、manifest、批处理 JSON 和 vision_ocr_prompt.md。这条路线适合 Windows OCR 效果差、旧书扫描复杂,或者你准备使用支持视觉的模型时。

如果本机有 pdftoppmtesseract,也可以用 Tesseract fallback:

python scripts/ocr_pages.py path/to/file.pdf --out work/pdf-ocr

它会生成 ocr_report.mdocr_pages.jsonl 和逐页 OCR 文本。如果缺少 OCR 工具,它会写出缺失工具诊断,不会偷偷安装任何东西。


常见用法

1. Quick Preview / 检视阅读

适合你想先知道一本书讲什么、值不值得读、该怎么读。

Quick Preview / 检视阅读是一轮快速定向,帮助你判断这本书表面上讲什么、值不值得读、该怎么读。它对应《如何阅读一本书》里的检视阅读,包括两个动作:有系统的略读或粗读粗浅的第一遍阅读

它不是完整分析阅读,不负责正式解释关键概念、主旨和论证。它只做暂定观察和阅读决策:初步判断书的类型、表层结构、哪些部分值得读、哪些问题要带入下一轮。同时,它也必须暂定回答四个基本问题:整体在谈什么、细部说了什么和怎么说、是否初步看来有道理、跟读者有什么关系。如果你想真正读懂一本书,应继续进入 Deep Breakdown / 分析阅读。

使用 deep-reading-coach 帮我快速看一下这本 PDF,告诉我它讲什么、适合谁、哪些章节值得细读。
这本书我还没决定要不要读,先帮我判断值不值得读。

默认会输出完整检视阅读报告。只有你明确要求“简短版”“压缩版”“只要大概”时,才会使用短版。

通常会输出:

  • 来源/PDF 读取情况
  • 目录是否可见
  • 阅读决策:跳过、略读、选读、精读,还是作为参考资料
  • 暂定书籍类型,以及为什么影响读法
  • 这本书大概像是在讲什么
  • 表层结构地图
  • 四个基本问题的暂定回答
  • 有系统略读记录
  • 粗浅第一遍阅读记录
  • 针对不同目标的阅读路线
  • 哪些部分应精读、略读或暂时跳过
  • 带入分析阅读的问题
  • 是否进入分析阅读、阅读计划、主题研究,或暂停

2. Deep Breakdown / 分析阅读

适合你想真正读懂一本书,而不只是看摘要。这个模式对应《如何阅读一本书》里的分析阅读,会按 15 条规则分三阶段处理。第一阶段会特别重视“透视一本书”:用证据分类、写出可检验的全书大意、拆出分析阅读式全书大纲,并整理作者的问题树。

分析阅读式全书大纲不是目录摘要。它要找出作者的统摄性问题、全书推进公式、功能性大部分、各章在论证中的作用,以及这些判断是怎样从书名、副标题、目录、章节标题、序言、结尾或正文证据中推出来的。

第二阶段会按章节或关键部分诠释内容:先建立阅读单元地图,再分别找出全书关键词、局部关键词、关键句、主旨、局部论述链,最后合成为全书论述地图,并回到第一阶段的问题树判断作者解决了什么。

第三阶段会做公正评论:先证明已经理解作者,再按范围判断同意、部分同意、不同意或暂缓评论。批评必须绑定具体主旨、论述或未回答的问题,并区分知识判断和个人偏好。

使用 deep-reading-coach 帮我深度拆解这本书,重点看作者想解决什么问题、核心概念、主要主张和论证结构。
我想认真读懂这本书,不只是总结。请帮我做一份深度阅读笔记。

默认会输出完整分析阅读 / 深度拆解。只有你明确要求“简短版”“压缩版”“先给我大概”时,才会使用短版。

通常会输出:

  • 这本书整体在谈什么
  • 正式分类、分类证据、读法后果与书类适配器
  • 一句话全书大意,以及对象、核心问题、主要回答、展开方式
  • 分析阅读式全书大纲:统摄性问题、全书推进公式、功能性大部分、各章功能表、各部分之间的转接关系
  • 大纲构造说明:哪些来自文本证据,哪些是合理推断,哪些需要 OCR、重读或查证
  • 作者想解决的问题树:主问题、次问题、先后顺序、对应章节
  • 阅读单元地图:哪些章节 / 部分被精读,哪些暂缓
  • 全书核心关键字、局部关键字与共通词义
  • 按章节 / 部分找出的关键句与主旨 / 命题
  • 局部论述链、论述之间的关系、全书总论述地图
  • 回到问题树判断作者解决了什么,部分解决了什么,没解决什么
  • 评论资格检查:先确认理解,再进行同意、不同意或暂缓评论
  • 作者观点的最强版本,以及我的判断是否需要调整
  • 四种严格批评:作者知识不足、知识错误、不合逻辑、分析不完整
  • “这本书说得有道理吗”的综合判断
  • 这本书对你的理解、判断、行动、研究和个人目标有什么关系
  • 这本书的使用边界和误用风险

如果你想检查生成报告是否遗漏结构,可以运行:

python scripts/check_report.py path/to/report.md --type analytical

不同种类的书不会被用同一把尺子硬套。例如:

  • 实用书重点看目标、手段、是否可执行,以及读者同意后要采取什么行动。
  • 文学作品重点看整体经验、人物、情节、意象、形式,不会强行把小说或诗当成论证文章。
  • 历史书重点看史料、选择、解释、因果关系,以及是否需要比较多本历史书。
  • 科学和数学书重点看定义、假设、实验、证明、图表、公式和证据范围。
  • 哲学书重点看问题、关键概念、区分、前提、推理和结论。
  • 社会科学书重点看术语定义、方法、数据、价值立场,并经常建议进入主题研究。

3. 主题研究

适合你围绕一个主题比较多本书、多篇文章、多个章节或多段资料。它不是把资料分别摘要后并排比较,而是让“你要研究的问题”成为中心,所有资料都服务于这个问题。

主题研究通常分两步:

  1. 准备阶段:先建立试验性书目或资料池,快速检视资料,判断哪些真正相关,并在必要时修订研究问题。
  2. 正式主题阅读:找出相关章节 / 段落,建立中立词汇,厘清共同问题,从不同回答中界定议题,再客观排列整个讨论。
使用 deep-reading-coach 帮我围绕“学习方法”做主题研究,列出应该比较的问题和书单。
我有三本关于投资的书,帮我比较它们对风险、复利和资产配置的看法。

通常会输出:

  • 起始研究问题,以及检视后是否需要修订
  • 试验性书目 / 资料池
  • 检视筛选表:纳入、排除、暂缓及理由
  • 每份资料真正相关的章节、段落、页码或论述
  • 中立词汇表:避免直接采用某一个作者的术语
  • 共同问题表:哪些问题是多份资料都能回答的
  • 不同资料对同一问题的直接回答、间接回答或沉默
  • 议题地图:主要分歧在哪里、各自站在哪一边
  • 四个基本问题的跨资料比较
  • 共识、分歧与沉默
  • 辩证客观检查:是否公平排列讨论,没有过早站队
  • 综合判断:你现在可以合理得出什么结论
  • 还没解决的问题

4. 阅读计划

适合你不知道该怎么读,或者时间有限。

我不知道怎么读这本书,使用 deep-reading-coach 帮我制定一个一周阅读计划。
我只有两个小时,帮我安排这本书的阅读顺序。

通常会输出:

  • 阅读目标
  • 时间分配
  • 先读哪些章节
  • 哪些内容可以跳过或略读
  • 读书笔记模板
  • 后续深读建议

推荐工作流

最舒服的用法通常是:

  1. 先让它做快速预览。
  2. 你挑出最重要的章节或问题。
  3. 再让它做深度拆解。
  4. 如果需要,再扩展到相关书籍做主题研究。

例如:

使用 deep-reading-coach 先快速预览这本 PDF,告诉我哪些章节最值得深读。

然后继续说:

好,接下来深度拆解第 2、3、5 章。

不适合做什么

这个 skill 不适合用来:

  • 大段复制受版权保护的书籍内容
  • 在没有资料的情况下假装读过某本书
  • 替代你自己的判断
  • 对明显只需要略读的资料强行写长篇分析

如果你只是想要非常短的摘要,也可以用它;但它可能会提醒你,摘要只是第一步,真正读懂还需要看结构、概念、论证和与你自己的关系。


安装

用户级 Codex skill 通常放在:

%USERPROFILE%\.codex\skills\deep-reading-coach

安装或修改后,请重启 Codex,让新线程加载这个 skill。

推荐的 GitHub 仓库结构:

skills/
  deep-reading-coach/
    SKILL.md
    README.md
    README_EN.md
    references/
      routing.md
      templates.md
      pdf-intake.md
    scripts/
      pdf_intake.py

从 GitHub 安装或手动复制时,请安装/复制整个 deep-reading-coach 文件夹,而不是只复制 SKILL.mdreferencesscripts 都是这个 skill 的一部分。

About

A Codex skill for deep reading books and PDFs

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors