



### CCPD2020新能源车牌数据集
CPPD的图片文件名具有特殊规则，详细可查看：https://github.com/detectRecog/CCPD

具体规则如下：

例如: 025-95_113-154&383_386&473-386&473_177&454_154&383_363&402-0_0_22_27_27_33_16-37-15.jpg

每个名称可以分为七个字段，以-符号作为分割。这些字段解释如下。
009144965277777778-90_263-326&515_498&569-493&569_332&569_326&515_498&515-0_0_3_26_26_31_30_31-138-8.jpg
- 025：车牌面积与整个图片区域的面积比。025 (25%)

- 95_113：水平倾斜程度和垂直倾斜度。水平 95度 垂直 113度

- 154&383_386&473：左上和右下顶点的坐标。左上(154,383) 右下(386,473)

- 386&473_177&454_154&383_363&402：整个图像中车牌的四个顶点的精确（x，y）坐标。这些坐标从右下角顶点开始。(386,473) (177,454) (154,383) (363,402)

- 0_0_22_27_27_33_16：CCPD中的每个图像只有一个车牌。每个车牌号码由一个汉字，一个字母和五个字母或数字组成。有效的中文车牌由七个字符组成：省（1个字符），字母（1个字符），字母+数字（5个字符）。“ 0_0_22_27_27_33_16”是每个字符的索引。这三个数组定义如下。每个数组的最后一个字符是字母O，而不是数字0。我们将O用作“无字符”的符号，因为中文车牌字符中没有O。因此以上车牌拼起来即为 皖AY339S

- 37：牌照区域的亮度。 37 (37%)

- 15：车牌区域的模糊度。15 (15%)

```python
provinces = ["皖", "沪", "津", "渝", "冀", "晋", "蒙", "辽", "吉", "黑", "苏", "浙", "京", "闽", "赣", "鲁", "豫", "鄂", "湘", "粤", "桂", "琼", "川", "贵", "云", "藏", "陕", "甘", "青", "宁", "新", "警", "学", "O"]
alphabets = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W','X', 'Y', 'Z', 'O']
ads = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X','Y', 'Z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'O']
```


## CCPD2020 模型数据准备

### 一 、划分训练集、测试集

In [13]:
import os
import shutil

def clean_dir(path):
    shutil.rmtree(path) ###删除文件夹
    os.mkdir(path)## 创建文件夹

clean_dir("/root/autodl-tmp/ultralytics/apply/plate_ocr/images/train")
clean_dir("/root/autodl-tmp/ultralytics/apply/plate_ocr/images/val/")

clean_dir("/root/autodl-tmp/ultralytics/apply/plate_ocr/labels/train/")
clean_dir("/root/autodl-tmp/ultralytics/apply/plate_ocr/labels/val/")

image_list_train=os_get_files("/root/autodl-tmp/ultralytics/apply/plate_ocr/CCPD2020/ccpd_green/train/")
image_list_val=os_get_files("/root/autodl-tmp/ultralytics/apply/plate_ocr/CCPD2020/ccpd_green/val/")





## 随机取list
import random
train_list=random.sample(image_list_train,1000)
val_list=random.sample(image_list_val,1000)

## 移动图像list：
## 将图片移到目标文件夹
import re
def move_files(listpath,trapath):
    for img in listpath:
        #print("/root/autodl-tmp/ultralytics/apply/cpc_yolo/images/train/"+img.split('/')[-1])
        shutil.copy(img,trapath+img.split('/')[-1])


move_files(train_list,"/root/autodl-tmp/ultralytics/apply/plate_ocr/images/train/")
move_files(val_list,"/root/autodl-tmp/ultralytics/apply/plate_ocr/images/val/")

### 二  处理坐标信息

In [None]:
import cv2
import matplotlib.pyplot as plt

#以下为花瓶对应坐标
## 处理获取想要的目标格式：
image=cv2.imread("/root/autodl-tmp/ultralytics/apply/plate_ocr/images/train/0157986111111-90_265-283&404_491&481-491&479_288&481_283&404_490&408-0_0_5_24_24_25_30_30-194-104.jpg")
#得到每一个横坐标
bb_w=[491,288,283,490]
#得到每一纵坐标
bb_h=[479,481,404,408]
print(bb_w,bb_h)

import cv2
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

for i in range(len(bb_w)):
    #绘制圆点
    plt.scatter(bb_w[i],bb_h[i],marker='o', c='r')
plt.show()

In [81]:
(train_list[0].split('/')[-1]).split('.')[0].split("-")

['0157986111111',
 '90_265',
 '283&404_491&481',
 '491&479_288&481_283&404_490&408',
 '0_0_5_24_24_25_30_30',
 '194',
 '104']

In [15]:
from PIL import Image

def labels_get(list_image):
    for  trainlist_sin in list_image:
        img_sin=Image.open(trainlist_sin)
        weight,height=img_sin.size
        
        size_pt,angle,coordinate,coordinate_all,plate,light,ambiguity=tuple((trainlist_sin.split('/')[-1]).split('.')[0].split("-"))
        
        ### 将坐标信息写入txt
        xcoor=[round(int(x.split("&")[0])/weight,4) for x in coordinate_all.split("_")]
        ycoor=[round(int(x.split("&")[1])/height,4) for x in coordinate_all.split("_")]
        
        with open("/root/autodl-tmp/ultralytics/apply/plate_ocr/labels/"+trainlist_sin.split("/")[-2]+"/"+trainlist_sin.split("/")[-1].split(".")[-2]+".txt",mode="w") as f:
            f.writelines("0"+" ")
            for i,xcor in enumerate(xcoor):
                f.writelines(str(xcor)+" ")
                f.writelines(str(ycoor[i])+" ")
            f.writelines("\n")
    print("done")

In [16]:
labels_get(train_list)

done


In [17]:
labels_get(val_list)

done
