[Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

hehuang139 · 2022-10-19T14:34:56Z

请问，发现taskflow('document_intelligence')这种方式，是在.cache/下会生成docprompt_params.tar文件，解压后有一个模型文件inference.pdiparams和inference.pdmodel。而使用autoModel，是下载预训练模型。
我想知道是否使用taskflow效果会更好，还是和直接使用预训练模型（没经过ft）进行预测效果一致。两者的训练数据是否是一样，是不是就是一个东西？

wawltor · 2022-10-20T02:08:46Z

taskflow('document_intelligence') 中的模型是基于ERNIE-Layout模型通过大量文档信息抽取、文档问答相关语料微调之后的模型参数，layoutxlm-base-uncased 是基础的预训练模型

hehuang139 · 2022-10-20T02:27:14Z

是否可以基于taskflow('document_intelligence') 的模型进行fine-tuning.而不是基于layoutxlm-base-uncased，按您的描述我们自己的小样本微调layoutxlm-base-uncased 达到的效果估计是还不如taskflow('document_intelligence')的模型。

wawltor · 2022-10-20T02:29:13Z

是否可以基于taskflow('document_intelligence') 的模型进行fine-tuning.而不是基于layoutxlm-base-uncased，按您的描述我们自己的小样本微调layoutxlm-base-uncased 达到的效果估计是还不如taskflow('document_intelligence')的模型。

taskflow('document_intelligence')的模型是一个静态图部署的模型，目前我们还没有放开静态图微调能力，在11月份我们会放开端到端多模信息抽取相关的微调能力，包括整体数据标注方法、小样本微调、部署相关能力

hehuang139 · 2022-10-20T02:38:28Z

这里我有个疑惑，在多模态layout这个场景上，我关注到unilm layoutlm和paddlenlp layoutlm两种方案。我是希望能够使用paddle，因为我认为paddle在中文语料训练做的更好。但是如果无法利用taskflow('document_intelligence') 中的模型的结果，就有点尴尬了。同时关于11月分这个节点能否预估个具体时间，因为我的项目大约在11月初就需要具备demo能力。同时这个端对端微调，是否支持直接输入doc原始文档，而不需要手动转换图片在切割分页，在合并预测结果

wawltor · 2022-10-20T02:49:04Z

taskflow('document_intelligence') 目前的能力没有办法完全你的业务场景吗？

hehuang139 · 2022-10-20T03:03:04Z

我现在做法是分页预测在合并结果，现在有发现一个问题，就是如果实体出现多次在一个页上，会出现识别错误的情况，在布局层面

hehuang139 · 2022-10-20T03:05:25Z

而且由于您说的taskflow('document_intelligence') 目前无法微调，万一出现预测错误的情况，我无法通过标记去优化模型

wn1652400018 · 2022-10-20T03:08:27Z

要是能提供动态图模型的参数就好了，我也遇到这个问题。我试了静态图转动态图直接就报错了。

wn1652400018 · 2022-10-20T03:09:33Z

是否可以基于taskflow('document_intelligence') 的模型进行fine-tuning.而不是基于layoutxlm-base-uncased，按您的描述我们自己的小样本微调layoutxlm-base-uncased 达到的效果估计是还不如taskflow('document_intelligence')的模型。

taskflow('document_intelligence')的模型是一个静态图部署的模型，目前我们还没有放开静态图微调能力，在11月份我们会放开端到端多模信息抽取相关的微调能力，包括整体数据标注方法、小样本微调、部署相关能力

能发布动态图的模型参数吗

hehuang139 · 2022-10-20T03:10:38Z

要是能提供动态图模型的参数就好了，我也遇到这个问题。我试了静态图转动态图直接就报错了。

现在就是必须要有微调能力，但是不希望从基础的layoutxlm-base-uncased进行微调，希望能有paddle庞大的语料库

hehuang139 · 2022-10-20T03:14:29Z

这个场景应该还是和具体的业务场景关系比较大，需要微调

wangz1200 · 2022-10-20T03:16:03Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

wn1652400018 · 2022-10-20T03:17:05Z

是啊，有动态图模型的参数就可以微调了，可以参考UIE。
paddle自己发布了一个静态图模型转动态图，我试用了一下，不能转，不知道是不是我用错了，你看看。
https://aistudio.baidu.com/aistudio/projectdetail/505907

hehuang139 · 2022-10-20T03:19:58Z

ernie

@wawltor 不好意思，我应该是发错了，不是layoutx-base-uncased ，而是 ernie-layoutx-base-uncased 和 taskflow('document_intelligence')是否是一致的模型

wn1652400018 · 2022-10-20T03:19:58Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

这个不就是taskflow('document_intelligence') 的基模型吗，从您上面的答复里面看，taskflow('document_intelligence') 的基模型就是ernie-layout，不知道有没有理解错。

hehuang139 · 2022-10-20T03:23:48Z

在application目录下https://github.com/PaddlePaddle/PaddleNLP/blob/develop/applications/document_intelligence/doc_vqa/Extraction/run_train.sh 这个脚本，上面用的layoutx-base-uncased模型
而https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout 的训练用的是ernie-layoutx-base-uncased 还是说application下的没有更新？

wangz1200 · 2022-10-20T03:26:56Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

这个不就是taskflow('document_intelligence') 的基模型吗，从您上面的答复里面看，taskflow('document_intelligence') 的基模型就是ernie-layout，不知道有没有理解错。

我使用ernie-layoutx进行自有训练集cls分类训练，似乎是没效果。

hehuang139 · 2022-10-20T03:30:17Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

这个不就是taskflow('document_intelligence') 的基模型吗，从您上面的答复里面看，taskflow('document_intelligence') 的基模型就是ernie-layout，不知道有没有理解错。

我使用ernie-layoutx进行自有训练集cls分类训练，似乎是没效果。

您是怎么做数据标记的，能参考下吗？我还在处理标记的事情，没开始训练，建议可以打印下模型，确认下是否被冻结了

wangz1200 · 2022-10-20T03:30:22Z

在application目录下https://github.com/PaddlePaddle/PaddleNLP/blob/develop/applications/document_intelligence/doc_vqa/Extraction/run_train.sh 这个脚本，上面用的layoutx-base-uncased模型而https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout 的训练用的是ernie-layoutx-base-uncased 还是说application下的没有更新？

我查看了下ernie-layoutx模型下的voc词文档，疑惑是不是要自己组织自己的词。

wn1652400018 · 2022-10-20T03:30:32Z

在application目录下https://github.com/PaddlePaddle/PaddleNLP/blob/develop/applications/document_intelligence/doc_vqa/Extraction/run_train.sh 这个脚本，上面用的layoutx-base-uncased模型而https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout 的训练用的是ernie-layoutx-base-uncased 还是说application下的没有更新？
paddle发布的那个taskflow('document_intelligence') 静态模型是在ernie-layoutx-large-uncased 上用大量抽取问答数据做了微调裁剪得到的。而layoutx-base-uncased应该是微软的layoutlm系列模型。taskflow('document_intelligence') 本身也没有限制是哪个模型，两个用起来应该都能跑。

wangz1200 · 2022-10-20T03:32:04Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

这个不就是taskflow('document_intelligence') 的基模型吗，从您上面的答复里面看，taskflow('document_intelligence') 的基模型就是ernie-layout，不知道有没有理解错。

我使用ernie-layoutx进行自有训练集cls分类训练，似乎是没效果。

您是怎么做数据标记的，能参考下吗？我还在处理标记的事情，没开始训练，建议可以打印下模型，确认下是否被冻结了

留个联系方式，细说一下吧。

hehuang139 · 2022-10-20T03:35:00Z

有没有尝试过ernie-layoutx，https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout

这个不就是taskflow('document_intelligence') 的基模型吗，从您上面的答复里面看，taskflow('document_intelligence') 的基模型就是ernie-layout，不知道有没有理解错。

我使用ernie-layoutx进行自有训练集cls分类训练，似乎是没效果。

您是怎么做数据标记的，能参考下吗？我还在处理标记的事情，没开始训练，建议可以打印下模型，确认下是否被冻结了

留个联系方式，细说一下吧。

862112830 QQ

hehuang139 added the question Further information is requested label Oct 19, 2022

hehuang139 changed the title ~~[Question]: taskflow('document_intelligence') 和直接使用预模型layoutxlm-base-uncased做预测有什么区别？~~ [Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ Oct 20, 2022

hehuang139 closed this as completed Oct 21, 2022

zirui mentioned this issue Feb 13, 2023

[Question]: 关于docprompt/uie-x 从图片中长文本抽取 #4772

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

[Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

hehuang139 commented Oct 19, 2022 •

edited

wawltor commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wawltor commented Oct 20, 2022 •

edited

hehuang139 commented Oct 20, 2022

wawltor commented Oct 20, 2022

hehuang139 commented Oct 20, 2022 •

edited

hehuang139 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022 •

edited

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

[Question]: taskflow('document_intelligence') 和 直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

[Question]: taskflow('document_intelligence') 和 直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

Comments

hehuang139 commented Oct 19, 2022 • edited

wawltor commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wawltor commented Oct 20, 2022 • edited

hehuang139 commented Oct 20, 2022

wawltor commented Oct 20, 2022

hehuang139 commented Oct 20, 2022 • edited

hehuang139 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022 • edited

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

wn1652400018 commented Oct 20, 2022

wangz1200 commented Oct 20, 2022

hehuang139 commented Oct 20, 2022

[Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

[Question]: taskflow('document_intelligence') 和直接使用预模型ernie-layoutx-base-uncased 做预测有什么区别？ #3517

hehuang139 commented Oct 19, 2022 •

edited

wawltor commented Oct 20, 2022 •

edited

hehuang139 commented Oct 20, 2022 •

edited

wn1652400018 commented Oct 20, 2022 •

edited