点击选择文字验证码识别

文字点选、选字、选择文字验证码识别
特点
纯pytorch实现，无需安装其他复杂依赖
方式一识别速度约在200~300ms之间，使用GPU话会更快
方式二的话速度约为50ms

免责声明

本项目仅供学习交流使用，请勿用于非法用途，不得在任何商业使用，本人不承担任何法律责任。

实现逻辑

使用了约3000张左右的验证码进行训练
方式一通过率达到90%以上, 偶尔有些文字识别错了也没关系，依然能通过
方式二的话通过率不高，主要问题存在为语序预测不准确和直接识别文字不准，考虑解决方案为增加训练集
预测语序的kenlm模型训练集是2014年的人民日报,效果只能说一般，考虑更换训练集
识别逻辑
方式一
1、利用yolo框选出给出的文字和图中出现的文字，作为题目
2、利用crnn识别给定的文字，作为答题范围
3、根据答题范围，利用cnn预测图片中出现的文字是那个

方式二
1、利用yolo框选图中出现的文字
2、利用cnn识别图中文字
3、利用kenlm计算各种组合情况，选择困惑度最低的,获得正确的词语

模型文件

下载链接
http://39.108.219.137/text_select_captcha/model
百度网盘
链接：https://pan.baidu.com/s/1FF6A-YZAE1Bofgswp-D29w
提取码：ceow
（下载model文件夹放入到代码所在目录）
模型文件在model目录下
卷积神经网络模型 cnn_iter.pth（用于识别图片中的文字）
卷积神经网络+CTCloss模型 ocr-lstm.pth（用于识别标题中的文字）
yoloV3模型 yolov3_ckpt.pth （用于框选出图片中的文字和标题）
kenlm统计语言模型 people_chars_lm.klm （用于计算语序）
模型结构
模型结构存放在src/utils中

环境准备

1、安装python3.6（建议使用anconda）
2、建立虚拟环境
3、pip install -r requirements.txt

如何使用

方式一
python mode_one.py
方式二
python mode_two.py

结果如下

[
    {
        "crop": [
            231,
            173,
            297,
            248
        ],
        "classes": "target",
        "content": "拌"
    },
    {
        "crop": [
            0,
            344,
            114,
            385
        ],
        "classes": "title",
        "content": "凉拌牛肚"
    },
    {
        "crop": [
            58,
            189,
            125,
            265
        ],
        "classes": "target",
        "content": "牛"
    },
    {
        "crop": [
            231,
            271,
            297,
            343
        ],
        "classes": "target",
        "content": "肚"
    },
    {
        "crop": [
            201,
            79,
            265,
            152
        ],
        "classes": "target",
        "content": "凉"
    }
]

效果演示

以bilbil登录验证码为例
python bilbil.py

打赏

如果觉得我的项目对您有用，请随意打赏。您的支持将鼓励我继续创作！
o(￣︶￣)o

如有什么问题欢迎各位在lssues中提问
有其他问题或需求请联系邮件yj970814@163.com

参考资料

https://github.com/ypwhs/captcha_break
https://github.com/eriklindernoren/PyTorch-YOLOv3
https://github.com/meijieru/crnn.pytorch
https://github.com/chineseocr/chineseocr
https://github.com/JiageWang/hand-writing-recognition

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

模型大小从50M增加到200M,大幅减少漏检测的情况，如果要使用yolo-tiny仅需要修改setting.py中相关路径

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
config		config
doc		doc
model		model
src		src
test		test
.gitignore		.gitignore
README.md		README.md
bilbil.py		bilbil.py
mode_one.py		mode_one.py
mode_two.py		mode_two.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

点击选择文字验证码识别

免责声明

实现逻辑

模型文件

环境准备

如何使用

效果演示

打赏

参考资料

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

About

Releases

Packages

Languages

payiz-asj/Text_select_captcha

Folders and files

Latest commit

History

Repository files navigation

点击选择文字验证码识别

免责声明

实现逻辑

模型文件

环境准备

如何使用

效果演示

打赏

参考资料

点个star再走呗！

2020/08/31 优化识别单字的卷积神经网络

2020/09/01提交 识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

2020/09/01提交识别准确率从75%提升到90%，目标检测模型从yolo-tiny替换成yolo

Packages