# OpenCV实战——停车场识别案例


## 一、背景分析

1. 需求分析
   - 现代化发展的需求
   - 车辆数量增多，依靠人力管理不显示
2. 技术分析
   - 车牌定位技术
   - 车牌字符分割技术
   - 车牌字符识别技术
3. 技术难点分析
   - 车牌定位技术
   - 基于Tesseract-OCR 进行字符的分割和识别

## 二、车牌定位

### 1. 图像预处理

-  图像压缩

### 2. 灰度化

In [None]:
import cv2

img = cv2.imread("14.1/car.jpg")
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("img", img)
cv2.imshow("gray", gray_img)
cv2.waitKey()
cv2.destroyAllWindows()

### 3. 直方图均衡化

![](14.1/img.png)
img.max() 取三通道中最大的**像素值**，是一个数值
shape属性的三个值
   -  shape[0] 行数
   -  shape[1] 列数
   -  shape[2] 色彩通道数
   
**增强图片对比度,本质上属于图像增强,通过将某个像素的灰度值映射到更大的灰度空间**

[直方图均衡化](https://opencv.apachecn.org/#/docs/4.0.0/4.10-tutorial_py_histograms)

![](a.png)

In [None]:
import cv2


def stretch(img):
    '''
    增强图片对比度
    '''
    maxi = float(img.max())
    mini = float(img.min())
    print("maxi", maxi)
    print("mini" ,mini)

    for i in range(img.shape[0]):
        for j in range(img.shape[1]):
            img[i, j] = (255 / (maxi - mini) * img[i, j] - (255 * mini) / (maxi - mini))

    return img


if __name__ == '__main__':
    img = cv2.imread("14.1/img.png")
    cv2.imshow("img", img)
    stretch_img = stretch(img)
    cv2.imshow('stretch_img', stretch_img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

### 4. 图像的滤波

1. 中值滤波
2. 高斯滤波

区别：使用的卷积核不同

### 5. 二值化

cv2.threshold (源图片, 阈值, 填充色, 阈值类型)

In [None]:
import cv2

def dobinaryzation(img):
    '''
    二值化处理函数
    '''
    maxi = float(img.max())
    mini = float(img.min())

    x = maxi - ((maxi - mini) / 2)
    print("阈值", x)
    ret, thresh = cv2.threshold(img, x, 255, cv2.THRESH_BINARY)
    return thresh


if __name__ == '__main__':
    img = cv2.imread("14.1/car.jpg")
    cv2.imshow("img", img)
    dobinaryzation_img = dobinaryzation(img)
    cv2.imshow('dobinaryzation_img', dobinaryzation_img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

### 6. 边缘检测

Canny 边缘检测

1. 高斯滤波
2. 计算梯度值和梯度方向
3. 过滤非最大值
4. 使用上下阀值来检测边缘


[**参考资料**](https://zhuanlan.zhihu.com/p/42122107)

### 7. 车牌定位

![](v.png)
![](w.png)

## 三、车牌字符的分割和识别

### 通过Tesseract-OCR 进行字符的分割和识别

1. 对预 处理后的图片进一步处理
   - 形态学去噪
   - 统一转换为白底黑字
2. 调用Tesseract引擎进行字符分割和识别

    步骤：
    1. 灰度，二值化处理
    2. 形态学操作去噪
    3. 识别
![](14.1/cp.jpg)

In [None]:
import cv2 as cv
from PIL import Image
import pytesseract as tess


def recoginse_text(image):

    # 灰度 二值化
    gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
    # 如果是白底黑字 建议 _INV
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)

    # 形态学操作 (根据需要设置参数（1，2）)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (1, 2))  # 去除横向细线
    morph1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 1))  # 去除纵向细线
    morph2 = cv.morphologyEx(morph1, cv.MORPH_OPEN, kernel)
    cv.imshow("Morph", morph2)

    # 黑底白字取非，变为白底黑字（便于pytesseract 识别）
    cv.bitwise_not(morph2, morph2)
    textImage = Image.fromarray(morph2)

    # 图片转文字
    text = tess.image_to_string(textImage)
    n = 10  # 根据不同国家车牌固定数目进行设置
    print("识别结果:")
    print(text[1:n])


def main():
    # 读取需要识别的数字字母图片，并显示读到的原图
    src = cv.imread("14.1/cp.jpg")
    cv.imshow("src", src)

    # 识别
    recoginse_text(src)

    cv.waitKey(0)
    cv.destroyAllWindows()


if __name__ == "__main__":
    main()


### 计算机是如何识别出来图像的（卷积神经网络）

详见ppt