Skip to content

v0.5.0

Latest

Choose a tag to compare

@Baireinhold Baireinhold released this 07 Jun 14:51
· 1347 commits to master since this release

經緯·Contexture v0.5.0

面向人文学科的文献结构化提取平台 — 架构系统化版本。

Highlights

  • Runtime 层 — 新增 aih_contexture/runtime/,统一 CLI / UI / API 的任务执行契约
  • Middle JSON — 新增 aih_contexture/middle/,作为统一机器中间表示层,支持 scholarly Markdown 导出
  • Backend 能力目录 — 新增 aih_contexture/backends/,含 catalog、diagnostics、doctor
  • Layout 后端 — Surya / VLM Layout / MinerU / Paddle PP-DocLayout 等多后端支持
  • OCR 后端 — Surya / Calamari / PaddleOCR-v5 / PaddleOCR-VL / Tesseract 等
  • VLM 泛化与特化 — 支持 PaddleOCR-VL / MinerU-VL 特化路径,含页面级 checkpoint
  • Markdown 后处理 — 正式 runtime mode,支持印刷页码审阅与修复,支持MinerU原生json渲染为contexture标准的scholar markdown
  • 评估工具 — layout comparison / scholarly Markdown evaluation / smoke manifest
  • 147 个测试文件,发布前 285 passed targeted regression

完整变更记录见 [CHANGELOG.md](https://github.com/AIH-Infra/aih-contexture/blob/main/CHANGELOG.md)

**Full Changelog**: https://github.com/AIH-Infra/aih-contexture/commits/v0.5.0