Replies: 1 comment
-
|
Hi @Ventaly! I'm Dosu and I’m helping the MinerU team. 你好!关于这个问题,MinerU 目前任何版本(包括 2.7.6)都不支持输出表格单元格内容的 bbox,只能输出整个表格区域的边界框 [1]。 维护者 @myhloli 在之前的讨论中已明确回复:
目前的输出结构是:
值得注意的是,MinerU 的表格模型内部实际上会生成单元格级别的 对于你的数值溯源定位需求,可能需要考虑的变通方案:
To reply, just mention @dosu. Share context across your team and agents. Try Dosu. |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
我想请教一个问题,:
目前我在使用 MinerU 2.7.6 版本解析 PDF 和图片中的表格时,观察到输出结果是这样的:
• content_list.json 里的 bbox 字段对应的是整个表格区域的边界框
• 表格内部的结构是通过 HTML 或 Markdown 格式描述的,但似乎缺少每个单元格内具体内容的精确位置信息
我想了解一下,目前 MinerU 是否可以输出单元格内部具体内容的 bbox 呢?
比如说,一个单元格中有一段文字 "1,234.56",我需要的其实是这个文字字符串本身的边界框坐标,而不是整个表格的框。另外,如果单元格里面包含图片、数字或者混合内容,能否也定位到每个独立内容块的位置呢?
因为我的应用场景需要对表格中的数值进行溯源定位,所以这个粒度对我来说比较重要。
麻烦了解的朋友指点一下,非常感谢!🙏
Beta Was this translation helpful? Give feedback.
All reactions