表格中每个单元格内容的详细结构化 #3200
Replies: 3 comments 2 replies
-
|
Hi @pighead1016! I'm Dosu and I’m helping the MinerU team. MinerU 的表格内容详细结构化信息主要保存在 middle.json 文件中,这里不仅有表格整体和单元格的 bbox(位置),还包含每个单元格内的行(line)和片段(span)结构,每一级都带有 bbox 和内容。你可以通过 middle.json 的多层嵌套结构,精确获取到某个单元格内每一行、每一段文字的坐标和内容,适合做二次开发或精细化定位需求。middle.json 的结构大致如下: {
"tables": [
{
"type": "table",
"bbox": [x0, y0, x1, y1],
"blocks": [
{
"type": "table_body",
"bbox": [...],
"lines": [
{
"bbox": [...],
"spans": [
{
"bbox": [...],
"content": "单元格内的文字",
"type": "text"
}
]
}
]
}
]
}
]
}每一级的 bbox 都是相对于页面的坐标,spans 里就是最细粒度的文本片段及其位置。你可以根据 table → blocks → lines → spans 这条路径,获取到单元格内每一行、每一段文字的详细结构和位置信息。详细结构定义和示例可以参考官方文档说明 output_files.md。 如果需要更细致的结构化能力,可以在配置文件中通过 To reply, just mention @dosu. Share context across your team and agents. Try Dosu. |
Beta Was this translation helpful? Give feedback.
-
|
我生成的middle.json 中table 里的spans是这样的.没有content
"type": "table", "image_path": "ce47a6ff09a828844888b3907ca8688b54d0b2f1990ef450b5214a2a9ba8d9a5.jpg" } ] |
Beta Was this translation helpful? Give feedback.
-
|
@dosu. table_sub_model_name 选择不同的子模型。近期的 RapidTable 升级也增强了结构化输出(如 logic_points) 这个可以详细扩展下 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
表格输出仅有表格整体的大小位置,以及每个单元格中的内容。具体某一个单元格中文字的位置,行信息如何结构化
Beta Was this translation helpful? Give feedback.
All reactions