Releases: luffysolution-svg/mineru-to-obsidian
Release list
0.1.12
Full Changelog: 0.1.11...0.1.12
v0.1.11
Rename plugin name to MinerU Parser (Obsidian not allowed in plugin names)
v0.1.10
Rename plugin ID to mineru-parser (obsidian not allowed in plugin IDs)
0.1.9
docling 解析修复 / docling parse fix
修复 docling 后端对部分 PDF 解析失败的问题。docling 默认的 docling_parse 后端对某些畸形 PDF 会报 Inconsistent number of pages,并在 Windows 上清理临时文件时崩溃(WinError 32),且失败时仍以 0 退出、不写或写空 Markdown。
现在插件在默认后端失败或返回空内容时,自动用更宽容的 pypdfium2 后端重试一次。
Fixes docling failing on certain PDFs: when the default docling_parse backend errors out (and silently exits 0 with empty output), the plugin now retries once with the more tolerant pypdfium2 backend.
BRAT
manifest.json + main.js attached below.
0.1.8
修复 Doc2X 表格公式与 \text{} 公式渲染 / Fix Doc2X table math and \text{} formula breakage
- 公式整体不渲染(橙色原文、长公式溢出):Doc2X 把下标标签(如 E_{CO2_燃烧})输出成
\text{_燃烧},而下划线在 MathJax text 模式下非法,导致整条公式解析失败。现自动转义\text{}内的下划线。 - 表格内公式不渲染:Doc2X 表格是原始 HTML(需 rowspan/colspan),Obsidian 不在原始 HTML 内运行 MathJax,故单元格里的
$\mathrm{{kg}}/\mathrm{t}$显示为原文。现将单元格内的简单单位/阈值公式转为纯 Unicode 文本(kg/t、tCO₂/t、≤0.80)。
0.1.7
批量解析 + 修复 Doc2X 行内公式渲染 / Batch parsing + fix Doc2X inline formula rendering
- 多选文档右键「批量解析 N 个文档」,按各后端速率/并发限制控制并行度,显示进度与成功/失败汇总。
- 修复 Doc2X 行内公式:转换 ( ... ) →
$...$ 时去除内侧空格(Obsidian 不渲染带前导空格的行内公式,导致下标 _ 被当作斜体吞掉)。 - 归一化 latex/math 代码块为 $$,并清除 Doc2X 的
<!-- Meanless: N -->噪声标记。
0.1.6
修复 / Fixes:
- docling:改用
convert子命令(docling 2.x 下裸docling <file>不产出任何内容);将 CLI 检测超时从 10s 提到 40s(docling --version加载较慢约需 16s,导致误报「未安装」)。 - Doc2X:将返回的 LaTeX 定界符
\( \)与\[ \]转为 Obsidian 的$ $与$$ $$,公式可正常渲染(此前显示为原始文本)。
均已对真实 docling 2.107.0 CLI 与 Doc2X API 验证。
BRAT: luffysolution-svg/mineru-to-obsidian
0.1.5
新增三个解析后端 / Three new parsing backends:
- docling(本地 CLI / local)—
pip install docling,输出 Markdown,仅桌面端。 - TextIn 合合(文档解析 / HTTP)— PDF / 图片 / Office → Markdown(表格、公式、版面)。
- Doc2X(文档解析 / HTTP)— 擅长 PDF 公式 / 表格 / 学术文档。
每个后端均有设置界面、获取密钥外链、测试按钮与测试命令,并接入「检测配置」诊断。三个契约均用真实 key 端到端验证。
BRAT: luffysolution-svg/mineru-to-obsidian
0.1.4
新增百度 OCR(文档解析)后端:支持 PDF / 图片 / Office,直接输出含表格、公式、版面的 Markdown。鉴权用 API Key + Secret Key,需在百度智能云开通「文字识别」服务并实名认证。
DeepSeek-OCR 无官方托管 API,可经 OpenAI 兼容第三方(如硅基流动)用现有「视觉 LLM OCR」后端调用,已在文档中说明。
Add Baidu OCR (document parsing) backend; document DeepSeek-OCR via OpenAI-compatible third parties.
0.1.3
新增:视觉 LLM OCR 后端
- 第三个解析后端「视觉 LLM OCR」:用 OpenAI 兼容接口的视觉模型识别图片中的文字并转为 Markdown,兼容 OpenAI、new-api / one-api 等中转站。
- 设置页:API 地址 / Key / 模型 / 提示词。
- 「获取模型」按钮:通过 Key 拉取 /models 列表,模型项变为下拉选择。
- 「测试识图」按钮 + 命令「测试视觉 OCR」:发送含已知数字的测试图,验证连接、鉴权与识图能力。
- 检测配置加入视觉 OCR 状态。
修复(含 0.1.2)
- markitdown 在中文 Windows 下中文乱码(U+FFFD):强制 Python UTF-8 输出。
New vision-LLM OCR backend for image text recognition via any OpenAI-compatible endpoint (incl. relays). Includes fetch-models and a real vision capability test.