Skip to content

Scrutario v0.1 (Beta)

Latest

Choose a tag to compare

@kakahuote1 kakahuote1 released this 15 May 18:51

🎉 Scrutario v0.1 (Beta) - 首个公开测试版本

欢迎体验 Scrutario 的首个公开测试版本!这是一个专为古籍、地方志及个人文献库打造的本地化桌面检索与管理平台。在 v0.1 版本中,我们构建了从文献导入、高精度 OCR 校对到沉浸式阅读的完整闭环。

✨ 核心更新与特性 (Highlights)

  • 📚 文献库与多维检索:实现本地文献库管理,支持 PDF 原页无损预览与 OCR 识别文本的双栏实时校对,并提供毫秒级的全局全文检索体验。
  • 🧩 模块化能力底座:上线独立的 OCR 能力包、文档转换包及模型训练包,全面支持离线导入/导出,并正式接入基于 GitHub 的自动更新通道。
  • 📐 复杂版式扫描引擎:新增针对特殊文献的扫描规则引擎,支持区域精准框选、页码规律匹配及丰富的右键上下文菜单,轻松应对竖排、多栏及折痕干扰。
  • 📖 沉浸式阅读体验:深度集成文档目录树、自定义书签体系及跨页全局搜索,支持无干扰的沉浸式阅读模式。
  • 🤖 模型训练数据闭环:提供校对过程中的数据截取采集、本地训练模型打包、以及模型版本生命周期管理的整套控制台方案。
  • 🎨 界面与体验打磨:全系统支持深度定制的「夜间模式(Dark Mode)」与深色标题栏,精简了界面交互层级,并全面重构了说明文档。

📦 下载与安装指南 (Downloads)

下方提供了多种资产文件,普通用户仅需下载主程序和您需要的能力包即可

💻 1. 客户端主程序 (必下)

  • Scrutario_Setup.exe:Windows 一体化安装程序。下载后双击即可安装。

🧰 2. 离线能力拓展包 (按需下载)

如果您所在的环境无法顺畅让应用自动下载模型,您可以手动下载以下文件,并在应用的“设置 -> 资料包”中选择“导入离线能力包”。

  • paddle_ppocrv5.socr - PaddleOCR PP-OCRv5 识别能力包
  • kraken_htr.socr - Kraken 7 古籍识别与微调能力包
  • cnocr_doc.socr - CnOCR 文档识别能力包
  • tesseract5.socr - Tesseract 5 离线兜底与微调能力包
  • doc_converter.sconv - 格式解析与文档转换能力包
  • ocr_train.strain - 模型训练引擎包

⚙️ 3. 增量更新支持文件 (无需手动下载)

以下文件由系统在后台升级时自动拉取,普通用户请忽略:

  • Scrutario_Setup.exe.blockmap / latest.yml / scrutario-update.json

🛠️ 开发者验证 (For Developers)

如果您下载了源码压缩包 (Scrutario_Source_v0.1.zip) 准备进行本地调试与构建,请在安装依赖后,执行以下冒烟测试以验证核心链路:

npm run smoke:app
npm run smoke:ui-interactions
npm run smoke:ocr-packages
npm run smoke:training