Skip to content

Releases: luffysolution-svg/mineru-to-obsidian

0.1.12

Choose a tag to compare

@github-actions github-actions released this 02 Jul 12:01

Full Changelog: 0.1.11...0.1.12

v0.1.11

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 01 Jul 16:22

Rename plugin name to MinerU Parser (Obsidian not allowed in plugin names)

v0.1.10

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 01 Jul 05:28

Rename plugin ID to mineru-parser (obsidian not allowed in plugin IDs)

0.1.9

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 07:23

docling 解析修复 / docling parse fix

修复 docling 后端对部分 PDF 解析失败的问题。docling 默认的 docling_parse 后端对某些畸形 PDF 会报 Inconsistent number of pages,并在 Windows 上清理临时文件时崩溃(WinError 32),且失败时仍以 0 退出、不写或写空 Markdown。

现在插件在默认后端失败或返回空内容时,自动用更宽容的 pypdfium2 后端重试一次。

Fixes docling failing on certain PDFs: when the default docling_parse backend errors out (and silently exits 0 with empty output), the plugin now retries once with the more tolerant pypdfium2 backend.

BRAT

manifest.json + main.js attached below.

0.1.8

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 06:20

修复 Doc2X 表格公式与 \text{} 公式渲染 / Fix Doc2X table math and \text{} formula breakage

  • 公式整体不渲染(橙色原文、长公式溢出):Doc2X 把下标标签(如 E_{CO2_燃烧})输出成 \text{_燃烧},而下划线在 MathJax text 模式下非法,导致整条公式解析失败。现自动转义 \text{} 内的下划线。
  • 表格内公式不渲染:Doc2X 表格是原始 HTML(需 rowspan/colspan),Obsidian 不在原始 HTML 内运行 MathJax,故单元格里的 $\mathrm{{kg}}/\mathrm{t}$ 显示为原文。现将单元格内的简单单位/阈值公式转为纯 Unicode 文本(kg/t、tCO₂/t、≤0.80)。

0.1.7

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 06:01

批量解析 + 修复 Doc2X 行内公式渲染 / Batch parsing + fix Doc2X inline formula rendering

  • 多选文档右键「批量解析 N 个文档」,按各后端速率/并发限制控制并行度,显示进度与成功/失败汇总。
  • 修复 Doc2X 行内公式:转换 ( ... ) → $...$ 时去除内侧空格(Obsidian 不渲染带前导空格的行内公式,导致下标 _ 被当作斜体吞掉)。
  • 归一化 latex/math 代码块为 $$,并清除 Doc2X 的 <!-- Meanless: N --> 噪声标记。

0.1.6

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 05:38

修复 / Fixes:

  • docling:改用 convert 子命令(docling 2.x 下裸 docling <file> 不产出任何内容);将 CLI 检测超时从 10s 提到 40s(docling --version 加载较慢约需 16s,导致误报「未安装」)。
  • Doc2X:将返回的 LaTeX 定界符 \( \)\[ \] 转为 Obsidian 的 $ $$$ $$,公式可正常渲染(此前显示为原始文本)。

均已对真实 docling 2.107.0 CLI 与 Doc2X API 验证。

BRAT: luffysolution-svg/mineru-to-obsidian

0.1.5

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 04:36

新增三个解析后端 / Three new parsing backends:

  • docling(本地 CLI / local)— pip install docling,输出 Markdown,仅桌面端。
  • TextIn 合合(文档解析 / HTTP)— PDF / 图片 / Office → Markdown(表格、公式、版面)。
  • Doc2X(文档解析 / HTTP)— 擅长 PDF 公式 / 表格 / 学术文档。

每个后端均有设置界面、获取密钥外链、测试按钮与测试命令,并接入「检测配置」诊断。三个契约均用真实 key 端到端验证。

BRAT: luffysolution-svg/mineru-to-obsidian

0.1.4

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 30 Jun 03:21

新增百度 OCR(文档解析)后端:支持 PDF / 图片 / Office,直接输出含表格、公式、版面的 Markdown。鉴权用 API Key + Secret Key,需在百度智能云开通「文字识别」服务并实名认证。

DeepSeek-OCR 无官方托管 API,可经 OpenAI 兼容第三方(如硅基流动)用现有「视觉 LLM OCR」后端调用,已在文档中说明。

Add Baidu OCR (document parsing) backend; document DeepSeek-OCR via OpenAI-compatible third parties.

0.1.3

Choose a tag to compare

@luffysolution-svg luffysolution-svg released this 29 Jun 17:03

新增:视觉 LLM OCR 后端

  • 第三个解析后端「视觉 LLM OCR」:用 OpenAI 兼容接口的视觉模型识别图片中的文字并转为 Markdown,兼容 OpenAI、new-api / one-api 等中转站。
  • 设置页:API 地址 / Key / 模型 / 提示词。
  • 「获取模型」按钮:通过 Key 拉取 /models 列表,模型项变为下拉选择。
  • 「测试识图」按钮 + 命令「测试视觉 OCR」:发送含已知数字的测试图,验证连接、鉴权与识图能力。
  • 检测配置加入视觉 OCR 状态。

修复(含 0.1.2)

  • markitdown 在中文 Windows 下中文乱码(U+FFFD):强制 Python UTF-8 输出。

New vision-LLM OCR backend for image text recognition via any OpenAI-compatible endpoint (incl. relays). Includes fetch-models and a real vision capability test.