检测模糊文字的思路 #105

terrancraft · 2020-10-28T10:38:43Z

大佬，看了你许多源代码，收益匪浅。
请教你一个问题，我有一个坑爹的task需要识别模糊字。
但学习模糊字的特征真的是太困难了，我有个相反的思路:
用大量高清的样本去训练模型，不让模型具备泛化能力，然后在推理阶段同样用高清图片识别文字内容(我的task可以具备这样的推理环境)，理论上模糊字会识别成奇怪的内容，这样可以通过比较识别结果和原本文的差异来判断是否有模糊字。

我的task因为从头到尾预测阶段只有一个样本(只是为了判断一张发票上有没有印模糊或者印错的字，不需要考虑泛化性和鲁棒性)，您觉得这个方案可不可行。

novioleo · 2020-10-28T11:16:52Z

确实可以用你说的方案，不过建议还是做个简单的不确定性估计。这样比较简单。------------------ 原始邮件 ------------------ 发件人: "terrancraft"<notifications@github.com> 发送时间: 2020年10月28日(星期三) 晚上6:38 收件人: "WenmuZhou/PytorchOCR"<PytorchOCR@noreply.github.com>; 抄送: "Subscribed"<subscribed@noreply.github.com>; 主题: [WenmuZhou/PytorchOCR] 检测模糊文字的思路 (#105)

terrancraft · 2020-10-30T09:46:06Z

确实可以用你说的方案，不过建议还是做个简单的不确定性估计。这样比较简单。------------------ 原始邮件 ------------------ 发件人: "terrancraft"<notifications@github.com> 发送时间: 2020年10月28日(星期三) 晚上6:38 收件人: "WenmuZhou/PytorchOCR"<PytorchOCR@noreply.github.com>; 抄送: "Subscribed"<subscribed@noreply.github.com>; 主题: [WenmuZhou/PytorchOCR] 检测模糊文字的思路 (#105)

您指的是用dropout计算识别文字模型的不确定度吗？具体方案不太清楚，望指教。

novioleo · 2020-10-30T10:40:39Z

不确定性估计是一个技术名词。自己搜。------------------ 原始邮件 ------------------ 发件人: "terrancraft"<notifications@github.com> 发送时间: 2020年10月30日(星期五) 下午5:46 收件人: "WenmuZhou/PytorchOCR"<PytorchOCR@noreply.github.com>; 抄送: "Tao Luo"<744351893@qq.com>;"Comment"<comment@noreply.github.com>; 主题: Re: [WenmuZhou/PytorchOCR] 检测模糊文字的思路 (#105)

WenmuZhou closed this as completed Sep 4, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

检测模糊文字的思路 #105

检测模糊文字的思路 #105

terrancraft commented Oct 28, 2020

novioleo commented Oct 28, 2020 via email

terrancraft commented Oct 30, 2020

novioleo commented Oct 30, 2020 via email

检测模糊文字的思路 #105

检测模糊文字的思路 #105

Comments

terrancraft commented Oct 28, 2020

novioleo commented Oct 28, 2020 via email

terrancraft commented Oct 30, 2020

novioleo commented Oct 30, 2020 via email