端到端中文车牌识别

这是一个pytorch实现的端到端中文车牌识别，整个项目主要是从SSD修改而来的，非常感谢作者的开源。同时项目主要参考了阿里的这篇paperA Novel Integrated Framework for Learning both Text Detection and Recognition的思想，实现了ocr_roi_pooling，基于此，可以将检测、分类和文字识别整合在一个网络任务中进行训练，并采用vgg做为特征提取网络。端到端OCR的优势主要有：

速度更快，因为采用同一个特征提取网络
识别部分的视野相对于CRNN的方法会更大
就是步骤少了，最起码我们只用处理一遍数据了，所以人类的懒惰才是推动科技进步的源动力。

现在网上也有相关开源的中文车牌识别项目。但大多都是采用SSD做车牌检测，CRNN做车牌识别。最起码训练和推导是采用两步走的策略。

数据集

我采用了CCPD: Chinese City Parking Dataset数据集，但是GPU计算能力有限，于是随机选择了70000张作为训练样本，采用batchsize=16,迭代了30000次。你可以下载整个数据集，然后将测试样本图片放到./data/test_data。

如果你要用你自己的图片进行测试，要看ssd300是否能检测出来(检测部分是SSD300)。

依赖安装

克隆项目

git clone https://github.com/chenjun2hao/CLPR.pytorch.git

安装cupy，实现ocr_roi_pooling的时候，使用cupy进行了GPU加速。注意： 最开始的时候也用numpy实现了ocr_roi_pooling的功能，但是训练的时候速度太慢了。训练了一天还没有收敛。所以深度学习GPU加速那是必须的，特别是训练的时候。cupy的具体安装可以参考cupy，例如：

(Binary Package for CUDA 9.0)
$ pip install cupy-cuda90

其他

python 3.6
pytorch 0.4.0

测试

下载预训练的模型Baidu disk, password:16pk，然后将模型放到weights文件夹下

python test.py

some examples:

图1	图2
图3	图4
图5	图6

训练

Coming later 整理好了再开源

TO DO

对于斜视或者倾斜车牌的效果不好。可以在识别网络中加入一个矫正网络。
识别部分很容易将最后一位漏掉，或者多字的情况。可以尝试多尺度的特征融合，再在channel上加上SEmodule，增加识别部分的特征。

References

CCPD: Chinese City Parking Dataset
Chainer
ssd.pytorch
chenjun2hao/CLPR.pytorch

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Creadme.md

Creadme.md

端到端中文车牌识别

数据集

依赖安装

测试

训练

TO DO

References

Files

Creadme.md

Latest commit

History

Creadme.md

File metadata and controls

端到端中文车牌识别

数据集

依赖安装

测试

训练

TO DO

References