简易身份证识别

当前项目里面有很多参数都需要手动去调。这个版本是很初级的版本，所以中间有很多bug，有兴趣的自己改下。 另外当前项目用了 @eragonruan 的tensorflow-ctpn ，由于代码需要将其项目中代码抽离了出来，所以没有相关git信息。大家有兴趣可以去star一下。

身份证定位

两个方案一起，提升精准度。

基于人脸

利用dlib进行人脸的landmark的提取，找到左右眼的坐标，求出倾斜角度。对图像进行旋转。再提取人脸的区域，然后根据比例，对身份证区域的估计，取出最大的估计的矩形框。

优势对于清晰画质的人脸准确度高，稳健性强。

劣势速度较慢，模型较大。不适合移动端部署。

基于矩形检测

利用opencv对区域的图像进行pyrmeanshift平滑，然后对图像进行canny运算，然后进行findContour然后对线段数等于4的线段进行计算，配置面积阈值，当大于一定面积的矩形才能被进行计算。对矩形区域进行透视变化，得到矫正后的图像。

优势不需要额外的模型，速度快，适合处理预览帧。

劣势稳健性不强，特别是复杂背景的情况下。另外必须强调图像是正向，正负偏差为60度。

文字框取

CTPN

pretrained model 通过生成数据然后放入CTPN训练，得到关于中文的字符框取的模型。

优势速度快，精准度高。

劣势模型大，程序逻辑复杂

ERFilter（相较于MSER是针对于文字的ER）

优势集成于opencv中，有训练好的模型，方便部署。

劣势准确率低，需要添加复杂的优化逻辑

文字识别

按字识别

文本分割

MSER

单字识别

将拆分出来的字进行识别用多种方式，有简单的KNN，SVM分类器，也有复杂一点的用CNN进行识别。从实现速度上来说，CNN的识别是最快拟合的。

优势单步骤实现速度快，开发难度低。

劣势按字识别由于是两个步骤，所以如果最开始文字分割没有做好，那么后面的单字识别的效果就会很差。

整行识别

基于CRNN的文本识别

CNN+BiLSTM+CTC的模式。将图像Resize至特定大小，然后将图像经过卷积层后得到高度为4，宽度为N的FM，然后将FM进行flatten然后得到一个序列，将序列代入BLSTM，用ctc来求取loss，得到不定个数的字的预测。

结果

由于只是为了打通流程，未对模型进行特别优化，所以识别错误率很高。 CRNN的训练需要大量的数据集，未做训练。

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
ctpnlib		ctpnlib
single_character_recognition		single_character_recognition
.gitignore		.gitignore
README.md		README.md
VGGnet_fast_rcnn_iter_50000.ckpt.data-00000-of-00001		VGGnet_fast_rcnn_iter_50000.ckpt.data-00000-of-00001
VGGnet_fast_rcnn_iter_50000.ckpt.index		VGGnet_fast_rcnn_iter_50000.ckpt.index
VGGnet_fast_rcnn_iter_50000.ckpt.meta		VGGnet_fast_rcnn_iter_50000.ckpt.meta
__init__.py		__init__.py
cfg.py		cfg.py
other.py		other.py
requirements.txt		requirements.txt
run.py		run.py
shape_predictor_5_face_landmarks.dat		shape_predictor_5_face_landmarks.dat
text.yml		text.yml
text_proposal_connector.py		text_proposal_connector.py
text_proposal_graph_builder.py		text_proposal_graph_builder.py
trained_classifierNM1.xml		trained_classifierNM1.xml
trained_classifierNM2.xml		trained_classifierNM2.xml
trained_classifier_erGrouping.xml		trained_classifier_erGrouping.xml

novioleo/simplest_idcard_recognizition

Folders and files

Latest commit

History

Repository files navigation

简易身份证识别

身份证定位

基于人脸

基于矩形检测

文字框取

CTPN

ERFilter（相较于MSER是针对于文字的ER）

文字识别

按字识别

文本分割

单字识别

整行识别

基于CRNN的文本识别

结果

About

Resources

Stars

Watchers

Forks

Languages