經緯·Contexture v0.5.0
面向人文学科的文献结构化提取平台 — 架构系统化版本。
Highlights
- Runtime 层 — 新增
aih_contexture/runtime/,统一 CLI / UI / API 的任务执行契约 - Middle JSON — 新增
aih_contexture/middle/,作为统一机器中间表示层,支持 scholarly Markdown 导出 - Backend 能力目录 — 新增
aih_contexture/backends/,含 catalog、diagnostics、doctor - Layout 后端 — Surya / VLM Layout / MinerU / Paddle PP-DocLayout 等多后端支持
- OCR 后端 — Surya / Calamari / PaddleOCR-v5 / PaddleOCR-VL / Tesseract 等
- VLM 泛化与特化 — 支持 PaddleOCR-VL / MinerU-VL 特化路径,含页面级 checkpoint
- Markdown 后处理 — 正式 runtime mode,支持印刷页码审阅与修复,支持MinerU原生json渲染为contexture标准的scholar markdown
- 评估工具 — layout comparison / scholarly Markdown evaluation / smoke manifest
- 147 个测试文件,发布前 285 passed targeted regression
完整变更记录见 [CHANGELOG.md](https://github.com/AIH-Infra/aih-contexture/blob/main/CHANGELOG.md)
**Full Changelog**: https://github.com/AIH-Infra/aih-contexture/commits/v0.5.0