识别期间双眼皮的问题 #447

lhj5426 · 2023-06-28T10:16:38Z

是这样的开发者老哥

这自动识别所有气泡对气泡识别的好但是

这种纯竖排文字无力
然后 manga-image-translatorrun
自然场景检测对这种识别的还可以
但是他会捎带手的识别气泡
然后它识别气泡的时候会戴上大量的无意义文字

一本漫画数百页每页都有大量的无意义的文字被
manga-image-translatorrun
识别在OCR之前就要手动去删很麻烦
就是用所谓的置信度检测也不行
所以我想了办法是
用 1 气泡识别先把气泡识别出来
然后再用 2自然场景检测来单独检测非气泡文字
然后问题就来是出现了双眼皮
所以能不能在批量识别的时候增加一个选项或者设置
假如入图片有被气泡识别就跳过这张图片去识别下一张
这样就杜绝了双眼皮的问题先气泡识别完然后跑 manga-image-translatorrun 它发现图片已经被识别过了就自动跳过跳过跳过
发现纯文字图没有被识别就开始识别这样的话就不会出现双眼皮的情况了
要是只用 manga-image-translatorrun 识别在气泡页面会产生大佬的无意义框选置信度检测不行只能人工处理
几百也少说也的半个小时去删这些东西

而且OCR的话双眼皮了OCR也会识别2遍所以必须清理干净
要是可以实现被识别就跳过 2个识别方式配合使用可以节省大量的删除无意义识别的时间

lhj5426 · 2023-06-28T10:23:19Z

扫置信度的话同样也会带来大量的重置置信度的问题

lhj5426 · 2023-06-28T10:41:29Z

然后当然如果只是双眼皮的问题可以通过

但最主要的问题是 manga-image-translatorrun 二次识别会产生大量的无意义识别这个问题
双眼皮只是附带的问题所以问题是避免一张图被两种扫码模式同时扫

xulihang · 2023-06-28T12:02:51Z

二次识别照理会判断图片里是不是有重叠的内容，重叠就不会添加上去的。

如果想跳过处理的话，可以用这个管理翻译的图片的功能，选中的图片会被认为已经翻译过了，处理时会被跳过。

要去除内部文字区域，也可以用这个功能，但我没做成支持操作所有图片的：

xulihang · 2023-06-28T12:09:35Z

噢，你是想自动判断有没有识别出区域，识别出的图片就跳过，这个目前没这样的设定

lhj5426 · 2023-06-28T12:10:36Z

二次识别照理会判断图片里是不是有重叠的内容，重叠就不会添加上去的。

如果想跳过处理的话，可以用这个管理翻译的图片的功能，选中的图片会被认为已经翻译过了，处理时会被跳过。

要去除内部文字区域，也可以用这个功能，但我没做成支持操作所有图片的：

按理来说应该是会自动跳过我也是这么认为的
因为OCR 或者预翻译的时候如果中断了再重新运行是会一张图检测如果检测到已经被OCR或者被翻译就会跳过的
所以我想当然的以为是不框选阶段也可以但是实际上实践之后并不能所以有了这个帖子

图片管理这个不太可能没有图我也不知道哪张是那张只能软件和资源管理器来回切换
其实这个也不是很好操作嘿嘿

lhj5426 · 2023-06-28T12:11:49Z

噢，你是想自动判断有没有识别出区域，识别出的图片就跳过，这个目前没这样的设定

是的就是先跑气泡识别跑完气泡识别在跑插件的识别如果扫到图片已经被识别框选过就跳过

lhj5426 · 2023-06-28T12:14:51Z

这样 1是避免了双眼皮二是遇到这种2个类型文字和气泡都有的漫画可以多个识别方法并用而且存在跳过多个方法还可以互相节省时间

xulihang · 2023-06-28T12:16:58Z

发张图片给我吧，我看看怎么会有重叠的问题。

lhj5426 · 2023-06-28T12:48:01Z

新建文件夹 (2).zip
抱歉刚才在厨房做菜单张是用手机发的我挑了几张图打了个压缩包

xulihang · 2023-07-02T03:15:45Z

2.0.0做了下面的改动：

之前新检测到的区域如果比原有区域大，不会被滤除。2.0.0改成滤除。
已翻译图片管理器里可以便捷选择有文字区域图片、有原文图片或者有译文图片。选中的图片在批处理时会被跳过。

lhj5426 · 2023-07-02T04:49:59Z

哦奈瑟哈哈这就去更新体验一下

lhj5426 · 2023-07-02T05:34:37Z

2.0引入了一个更严重的问题


之前1。9几的时候
这种图人物的身上不会被识别更不会被这么夸张的是被框选

xulihang · 2023-07-02T05:42:25Z

这个是启发式文字检测吧，这个本来就是这样的。

lhj5426 · 2023-07-02T05:43:57Z

这个是启发式文字检测吧，这个本来就是这样的。

不是单图的时候调用了

批量的时候没有调用现在

lhj5426 · 2023-07-02T05:45:03Z

之前批量的时候也是会调用这个的？发问题时候的截图检测就没这么多方块

lhj5426 · 2023-07-02T05:48:24Z

现在自然场景和启发式在批量里几乎是一个功能不会调用外部插件

xulihang · 2023-07-02T05:49:19Z

我用manga-translator做自然场景文字检测，只有文字区域是被识别的。用项目-批处理的自动定位所有图片的文字（自然场景文字检测）

lhj5426 · 2023-07-02T05:52:10Z

-批处理的自动定位所有图片的文字

我就用的这个功能呀之前是这样的今天更新完之后就变成检测出一堆方块了等我去重新安装一下插件

lhj5426 · 2023-07-02T06:02:56Z

我用manga-translator做自然场景文字检测，只有文字区域是被识别的。用项目-批处理的自动定位所有图片的文字（自然场景检测）

那我这是为啥呢？插件重新安装重新下了用的项目批量里的自然检测

就出来这么多方块呢

xulihang · 2023-07-02T06:09:51Z

项目文件发给我看一下

lhj5426 · 2023-07-02T06:13:39Z

项目文件发给我看一下

不好意思老哥是我的锅我不知道为什么勾选么了翻转颜色导致了一堆方块

删了之后好了
还有老哥能不能想想办法让扫码置信度的时候可以更准确的判断下这个非文字区域？

xulihang · 2023-07-02T06:26:03Z

这个需要自己重新训练一个模型。

保留图片中置信度低的区域

导出用于训练的文字区域图像和非文字区域图像

用tensorflow的make_image_classifier训练一个模型，保存为frozen_graph.pb，替换ImageTrans里的模型。这一步需要自己跑脚本和配环境，目前没有一个傻瓜式的操作工具。

lhj5426 · 2023-07-02T06:32:56Z

这个需要自己重新训练一个模型。

保留图片中置信度低的区域

导出用于训练的文字区域图像和非文字区域图像

用tensorflow的make_image_classifier训练一个模型，保存为frozen_graph.pb，替换ImageTrans里的模型。这一步需要自己跑脚本和配环境，目前没有一个傻瓜式的操作工具。

好恨自己不懂啊哈哈谢谢我还是手动把看不懂代码哈哈哈虽然有GPT 但是跨界还是挺麻烦的
而且gtp也很智障经常问东说西或者就复读机

lhj5426 closed this as completed Jul 2, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

识别期间双眼皮的问题 #447

识别期间双眼皮的问题 #447

lhj5426 commented Jun 28, 2023 •

edited

lhj5426 commented Jun 28, 2023 •

edited

lhj5426 commented Jun 28, 2023 •

edited

xulihang commented Jun 28, 2023

xulihang commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

xulihang commented Jun 28, 2023

lhj5426 commented Jun 28, 2023 •

edited

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023 •

edited

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023 •

edited

xulihang commented Jul 2, 2023 •

edited

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

识别期间双眼皮的问题 #447

识别期间双眼皮的问题 #447

Comments

lhj5426 commented Jun 28, 2023 • edited

lhj5426 commented Jun 28, 2023 • edited

lhj5426 commented Jun 28, 2023 • edited

xulihang commented Jun 28, 2023

xulihang commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

lhj5426 commented Jun 28, 2023

xulihang commented Jun 28, 2023

lhj5426 commented Jun 28, 2023 • edited

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023 • edited

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023 • edited

xulihang commented Jul 2, 2023 • edited

lhj5426 commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

xulihang commented Jul 2, 2023

lhj5426 commented Jul 2, 2023

lhj5426 commented Jun 28, 2023 •

edited

lhj5426 commented Jun 28, 2023 •

edited

lhj5426 commented Jun 28, 2023 •

edited

lhj5426 commented Jun 28, 2023 •

edited

xulihang commented Jul 2, 2023 •

edited

lhj5426 commented Jul 2, 2023 •

edited

xulihang commented Jul 2, 2023 •

edited