Skip to content

v3.0.0: 多语言支持 + 并行验证 + 数据质量加固

Choose a tag to compare

@hoolulu hoolulu released this 08 Jun 12:19
· 133 commits to main since this release

v3.0.0 — 多语言支持 · 并行验证 · 数据质量加固 · 完整容错

🆕 多语言支持(核心新能力)

  • Step 0 语言判定detect_lang.py 自动检测主题语言,所有输出跟随 $LANG
  • 19 种语言支持:通过 lang_config.py 配置表覆盖中日韩英等主流语言
  • 双语文档:新增 README_EN.md 英文版
  • 搜索关键词语言与主题一致:中文主题使用中文关键词,英文主题使用英文关键词
  • 章节 agent 不硬编码语言:跟随 $LANG 变量,不做任何语言假设

⚡ 并行验证 & 数据质量

  • validate-all-chapters:ThreadPoolExecutor 并行验证所有章节,替代逐章串行
  • detect-engine:SearXNG / Exa / Web Sources 三种引擎自动探测
  • check-datapool:返回 source_count / fact_count 结构化统计
  • 数据受限检测:自动识别数据受限场景,在报告中插入声明
  • Prompt 强制脚本统计 + 兜底:避免遗漏或空数据

🛡 完整容错机制

  • Task 2 数据收集失败后自动重试 1 次
  • 步骤失败时先删除残留产物再重新执行
  • 所有脚本/命令调用都有兜底路径(换 sys.executable / 检查路径 / 直接 Python 实现)
  • 三次失败后向用户报告具体问题

📁 报告目录重组

  • 案例报告/reports/(20 份报告全部迁移,保留 git 历史)
  • 新增 3 份多语言报告:
    • 🇬🇧 Quantum Computing Market Outlook 2026
    • 🇯🇵 日本のアニメ産業のグローバル市場戦略
    • 🇰🇷 한국 반도체 산업의 글로벌 경쟁력 분석
  • 删除过时的 Global SaaS ERP Market 报告

🛠 工具链重构

  • dr_gen.py:重构命令解析,集成并行验证
  • dr_check.py:新增多种质量检查命令(check-citations, check-headers, check-sections 等)
  • dr_tools.py:新增 validate-all-chapters / detect-engine / qa-report 等高阶命令
  • 新增 json-get 命令,铁律禁止内联代码

📝 文档 & 配置

  • SKILL.md:完全重写,双语 description,Step 0 语言判定完整流程
  • README.md:FAQ 版本更新策略说明,命令列表表格化,流程图优化
  • RULES.md:标题大众化,修复过期引用(Search Router → SearXNG)
  • TYPES.md:更新分类标准与编号规范
  • command/research.md / update.md:同步最新流程
  • .gitignore:新增 .DS_Store

🧹 规范清理

  • prompts 统一编号(task1_oracle / task2_data_collection / task3_chapter_agent / task4_assembly
  • 批量优化:合并年度搜索、去掉冗余 manifest、修正编号、修复引用格式
  • 章节标题统一从 outline 生成,目录锚点可点击跳转
  • 引用格式改为 (N) 可点击,修复所有旧报告

🔗 完整变更记录

详见 commit log:git log v2.1.1..v3.0.0