文本检测训练完进行单张图片预测时发现漏检内容 #10499

gg336699 · 2023-07-28T09:06:41Z

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem

系统环境/System Environment：windows10/centos7
版本号/Version：Paddle：2.4.2 PaddleOCR：2.6.1.3 问题相关组件/Related components：PPOCRV3-DET
运行指令/Command Code：python tools/infer_det.py -c ./configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_student.yml -o Global.infer_img="./train_data/det/train/00001.jpg"
完整报错/Complete Error Message：无报错，只是漏检内容

数据集由铁路集装箱号以及平板车号组成，如下图所示，上半部分为集装箱信息，下半部分为平板车号：

当我使用完整数据集训练之后，各项指标如下：

hmean: 0.8266978922716627
is_float16: False, precision: 0.7673913043478261
recall: 0.8959390862944162,

但是当我进行单张图片推理测试时却发现，平板车信息并未预测出来，调整了thresh、box_thresh以及unclip_ratio超参数都没有正确输出，只是会输出集装箱信息，如下图：

当我尝试将数据集更改为只包含平板车信息并训练后，检测一切正常，可以正常输出平板车信息的检测结果，如下图：

请问有人遇到过这样的问题嘛，这是由什么原因导致的，希望可以由有一个解决方案，不胜感激！

liuhuan-gl · 2023-07-29T06:17:37Z

我也是这个问题

gg336699 · 2023-07-29T06:38:22Z

我也是这个问题

我的问题暂时性的解决了，其实就是单张测试的时候不会显示，但是如果直接转成模型去推理的话，就会有结果，不知道是啥原因，希望ocr工作组可以注意到!

xu-peng-7 · 2023-07-31T06:17:47Z

我也是这个问题

我的问题暂时性的解决了，其实就是单张测试的时候不会显示，但是如果直接转成模型去推理的话，就会有结果，不知道是啥原因，希望ocr工作组可以注意到!

您可以具体描述一下吗？我对这个问题有点感兴趣，单张测试是哪个命令，转成模型是指转成inference模型还是onnx模型？再推理的话指的是哪个命令。感谢

xuxiansheng2018 · 2023-08-02T08:46:08Z

相似问题，希望有解答

gg336699 · 2023-08-02T15:54:18Z

我也是这个问题

我的问题暂时性的解决了，其实就是单张测试的时候不会显示，但是如果直接转成模型去推理的话，就会有结果，不知道是啥原因，希望ocr工作组可以注意到!

您可以具体描述一下吗？我对这个问题有点感兴趣，单张测试是哪个命令，转成模型是指转成inference模型还是onnx模型？再推理的话指的是哪个命令。感谢

应该属于paddleocr的Bug，具体的命令是如下这条：
测试单张图像的检测效果：

python3 tools/infer_det.py -c configs/det/det_mv3_db.yml -o Global.infer_img="./doc/imgs_en/img_10.jpg" Global.pretrained_model="./output/det_db/best_accuracy"

运行上述命令后就会出现这个问题，指标高但是预测却不行。
我的做法就是忽略如上问题，直接下一步，将模型转换成pdmodel，直接进行推理，问题就不见了。
检测模型转inference 模型方式：

# 加载配置文件`det_mv3_db.yml`，从`output/det_db`目录下加载`best_accuracy`模型，inference模型保存在`./output/det_db_inference`目录下
python3 tools/export_model.py -c configs/det/det_mv3_db.yml -o Global.pretrained_model="./output/det_db/best_accuracy" Global.save_inference_dir="./output/det_db_inference/"

以上代码都是官方文档，具体配置得参照自己的。

gg336699 · 2023-08-02T15:55:04Z

相似问题，希望有解答

如上，应该是paddle的bug，希望工作组可以闲暇时间关注一下。

xuxiansheng2018 · 2023-08-04T07:35:58Z

您好，我具体描述一下我的问题：我的测试集有8500张图片，使用自己训练的det去单独只做检测的话，只有200张图片没有检测到框，可能是这些图片自身比较难识别。但是使用det和rec的联合指令的时候predict_system.py 指定了自己训练的det和自己训练的rec，以及官方的cls，却出现1700张图片检测结果为空，这种是det和rec之间的关联出现了问题吗？不知道问题出在哪里，希望您能给我个可行的建议。（自己训练的det验证acc=0.9   rec的acc=0.8）

…

------------------ 原始邮件 ------------------ 发件人: "PaddlePaddle/PaddleOCR" ***@***.***>; 发送时间: 2023年8月2日(星期三) 晚上11:55 ***@***.***>; ***@***.******@***.***>; 主题: Re: [PaddlePaddle/PaddleOCR] 文本检测训练完进行单张图片预测时发现漏检内容 (Issue #10499) 相似问题，希望有解答如上，应该是paddle的bug，希望工作组可以闲暇时间关注一下。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: ***@***.***>

xu-peng-7 · 2023-08-04T07:45:34Z

最好给一个可以复现的场景，比如你的数据集，单独检测使用的是什么命令，predict_system.py 使用了什么命令。根据目前情况来看，很可能是参数设置的问题，你有检查过实际运行时两个检测模型的参数吗？

xuxiansheng2018 · 2023-08-04T07:57:05Z

我是在自己的数据集上进行实验的，
只测试检测阶段，python3 tools/infer_det.py
-c configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_student.yml
-o Global.pretrained_model=./output/rec_ppocr_v3_distillation/best_accuracy
Global.infer_img=./data/new_det_data/test_det/crop_img/
8500张测试图片，仅有220张未检测到框。
接着我使用CUDA_VISIBLE_DEVICES=0
python3 /data/yy/PaddleOCR/tools/infer/predict_system.py
--image_dir="./data/new_det_data/test_det/crop_img/"
--det_model_dir="./inference/ch_PP-OCRv3_det_infer/"
--rec_model_dir="./inference/rec_ppocr_v3_distillation/Teacher/"
--cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/"
--use_angle_cls=True
--use_gpu=True
--draw_img_save_dir="./inference_results/inference_results_101/"
还是在自己的数据集上进行测试，输出结果发现1700张图片的识别结果都是空，也就是识别不到字，如上图所示。至于你说的参数设置我应该没有特殊设置（初次接触并不是很了解），我是按照官网的教程在自己的数据集上面测试的，测试集图片就是我发的图片那种类型。

GreatV · 2024-04-16T02:23:08Z

hi @gg336699，出问题的原图能提供一下吗？

UserWangZz · 2024-05-22T02:56:55Z

当我尝试将数据集更改为只包含平板车信息并训练后，检测一切正常，可以正常输出平板车信息的检测结果

关于这个问题，可能的原因是predict_system中的参数配置与infer时使用的config中参数不一致导致的检测效果下降，可以尝试排查一下

UserWangZz · 2024-05-22T02:57:34Z

该issue长时间未更新，暂将此issue关闭，如有需要可重新开启。

paddle-bot bot assigned andyjiang1116 Jul 28, 2023

ToddBear added expneeded need extra experiment to fix issue good first issue Good for newcomers labels Jul 31, 2023

paddle-bot bot assigned tink2123 Mar 8, 2024

Liyulingyue mentioned this issue Apr 9, 2024

【疑难解决】解决PaddleOCR历史存在的疑难Issue #11906

Closed

GreatV assigned GreatV and unassigned tink2123 and andyjiang1116 Apr 16, 2024

UserWangZz closed this as completed May 22, 2024

paddle-bot bot added the status/close label May 22, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

文本检测训练完进行单张图片预测时发现漏检内容 #10499

文本检测训练完进行单张图片预测时发现漏检内容 #10499

gg336699 commented Jul 28, 2023

liuhuan-gl commented Jul 29, 2023

gg336699 commented Jul 29, 2023

xu-peng-7 commented Jul 31, 2023

xuxiansheng2018 commented Aug 2, 2023

gg336699 commented Aug 2, 2023

gg336699 commented Aug 2, 2023

xuxiansheng2018 commented Aug 4, 2023 via email

xu-peng-7 commented Aug 4, 2023

xuxiansheng2018 commented Aug 4, 2023

GreatV commented Apr 16, 2024

UserWangZz commented May 22, 2024

UserWangZz commented May 22, 2024

文本检测训练完进行单张图片预测时发现漏检内容 #10499

文本检测训练完进行单张图片预测时发现漏检内容 #10499

Comments

gg336699 commented Jul 28, 2023

liuhuan-gl commented Jul 29, 2023

gg336699 commented Jul 29, 2023

xu-peng-7 commented Jul 31, 2023

xuxiansheng2018 commented Aug 2, 2023

gg336699 commented Aug 2, 2023

gg336699 commented Aug 2, 2023

xuxiansheng2018 commented Aug 4, 2023 via email

xu-peng-7 commented Aug 4, 2023

xuxiansheng2018 commented Aug 4, 2023

GreatV commented Apr 16, 2024

UserWangZz commented May 22, 2024

UserWangZz commented May 22, 2024