# 로컬 개발 코드
- 로컬에서 주피터 노트북(Jupyter Notebook), 주피터 랩(JupyterLab) 또는 파이썬(Python)을 이용한다.
- 사이킷 런(scikit-learn), 텐서플로우(tensorflow), 파이토치(pytorch)를 사용하여 딥러닝 프로그램을 개발한다.
- 파일명: 0_local_object_detection.ipynb

### 로컬 개발 워크플로우(workflow)
- 로컬 개발 워크플로우를 다음의 4단계로 분리한다.

1. **데이터 세트 준비(Data Setup)**
- 로컬 저장소에서 전처리 및 학습에 필요한 학습 데이터 세트를 준비한다.
- 데이터 출처:
- https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=178
- https://public.roboflow.com/object-detection/pothole

2. **데이터 전처리(Data Preprocessing)**
- 데이터 세트의 분석 및 라벨링 파일의 type 변환 등의 전처리를 수행한다.
    - 데이터세트 분석: 카테고리의 균일화 과정(고용량 대용량 업로드 문제로 사전에 처리하여 진행한 상태)
    - 라벨링 데이터 : 준비된 Annotaion 라벨링 데이터를 COCO 라벨링 형식에서 YOLO 라벨링 형식으로 변환한다.
    - 데이터를 모델 학습에 사용할 수 있도록 가공한다.

3. **학습 모델 훈련(Train Model)**
- 데이터를 훈련에 사용할 수 있도록 가공한 뒤에 학습 모델을 구성한다.
- 학습 모델을 준비된 데이터 세트로 훈련시킨다.
- mAP(Mean Average Precision)나 손실(Loss)등 학습 모델의 성능을 검증한다.
- 학습 모델의 성능 검증 후, 학습 모델을 배포한다.
- 배포할 학습 모델을 meta_data 폴더 아래에 저장한다.

4. **추론(Inference)**
- 저장된 전처리 객체나 학습 모델 객체를 준비한다.
- 추론에 필요한 테스트 데이터 세트를 준비한다.
- 배포된 학습 모델을 통해 테스트 데이터에 대한 추론을 진행한다.

# 도로 위험물 객체탐지(Object Detection)
- 지금부터 이미지와 동영상 데이터를 이용하여 위험물 객체 탐지를 진행해보고자 한다.

## 사용할 데이터
---
- AI HUB
- roboflow

### **AI HUB**
![image](https://aihub.or.kr/web-nas/aihub21/files/public/inline-images/2020-02-062-1_0.png)

- AI HUB에서 제공하는 Open Dataset인 [도로 장애물 표면 인지 영상(수도권 외)](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=178)이라는 **광역시, 고속도로, 국도 등 도로상의 장애물 및 도로 표면의 이상 상태 인지를 위한 영상 및 이미지 데이터셋**으로 11가지 카테고리 이미지 프레임이 존재한다. 우리는 이 중에서 다음 6개의 카테고리 이미지 데이터만 사용하고자 한다.
- 해당 데이터셋은 **png형태의 원본 이미지**와 **json형태의 라벨링 이미지**로 구성되어 있다. 라벨링 박스의 좌표는 COCO방식으로 이루어져있다.
- 사용할 데이터셋의 원본 이미지와 라벨링 이미지의 관계를 파악하고 라벨링 형식의 구성을 확인하고 이해한다.

### **roboflow**
![image](https://i.imgur.com/7Xz8d5M.gif)

- roboflow에서 제공하는 Public Dataset인 [pothole Dataset](https://public.roboflow.com/object-detection/pothole)이라는 이것은 움푹 들어간 곳이 표시된 665개의 도로 이미지 모음입니다.
AI허브에서도 포트홀 이미지가 제공되지만 균열, 매우 작은 포트홀 등 위험요소로 보기 힘든 이미지가 많아 포트홀만 이 데이터셋으로 대체하였고 665개의 이미지를 모두 사용하고자 한다.
- 해당 데이터셋은 **jpg형태의 원본 이미지**와 **txt형태의 라벨링 이미지**로 구성되어 있습니다.라벨링 박스의 좌표는 YOLO방식으로 이루어져있다.

#### **사용할 7개의 위험물 카테고리**
- 아래의 7가지 카테고리는 골목에서 이륜차에게 위험요소가 될만한 **위험요소**와 오탐지를 방지하기 위한 **오탐지 방지용** 2가지의 기준에 부합하는 요소들을 선정하였다.
1.위험요소(라바콘, 공사표지판, 쓰레기, 포트홀) 2. 오탐지방지용(사람, 정상수리된 포트홀, 맨홀)

- AI HUB
    - Person(사람)
    - Traffic cone(라바콘)
    - Construction signs & Parking prohibited board(공사표지판)
    - Garbage bag & sacks(쓰레기)
    - Filled pothole(정상수리된 포트홀)
    - Manhole(정상도로의 맨홀)

- roboflow
    - Pothole(포트홀)

In [1]:
# Imports
import os, sys, time, random, glob, json, torch, yaml, zipfile, cv2
import glob, json, os, shutil
import matplotlib.pyplot as plt
import matplotlib.image as img
import matplotlib.colors as mcolors

from tqdm import tqdm
from PIL import Image
from glob import glob
from pprint import pprint
from pylabel import importer
from model.yolov5.detect import run
from sklearn.model_selection import train_test_split

## 1. 데이터셋 준비(Data Setup)

### 학습 카테고리를 균일화 시키는 과정
- 이 과정은 사용하는 원본 데이터셋 용량 업로드 문제로 학습할 분량의 데이터만 추출하여 images, Annotation 폴더에 저장해두었다.
- 카테고리별 사용한 이미지 개수
    - 665장: Person(사람)
    - 665장: Traffic cone(라바콘)
    - 665장: Construction signs & Parking prohibited board(공사표지판)
    - 318장: Garbage bag & sacks(쓰레기)
    - 665장: Filled pothole(정상수리된 포트홀)
    - 665장: Manhole(정상도로의 맨홀)
    - 665장: Pothole(포트홀)
- 위와 같이 추출한 이유는 roboflow의 포트홀 이미지가 665장이므로 다른 데이터셋도 같은 개수로 맞춰주었다.
- 쓰레기 카테고리의 경우, 절대적인 이미지 수가 부족해 318장만 추출하였다.

In [2]:
# dataset.zip 파일 압축 풀기
zip_source_path = './dataset.zip'
zip_target_path = './meta_data'

extract_zip_file = zipfile.ZipFile(zip_source_path)
extract_zip_file.extractall(zip_target_path)

extract_zip_file.close()

In [3]:
# 이미지, 라벨 데이터 확인
img_path = './meta_data/dataset/images/'
label_path = './meta_data/dataset/labels/'
annotation_path = './meta_data/dataset/Annotations/'

img_list = os.listdir(img_path)
label_list = os.listdir(label_path)
annotation_list = os.listdir(annotation_path)

print(f'Image의 총 장수: {len(img_list)}')
print(f'Label의 총 갯수: {len(label_list)}')
print(f'Annotation의 총 갯수: {len(annotation_list)}')

Image의 총 장수: 4308
Label의 총 갯수: 665
Annotation의 총 갯수: 3643


### 이미지 사이즈 확인

In [4]:
from PIL import Image

image1 = Image.open(img_path + img_list[1000])
plt.figure(figsize=(16, 12))
plt.imshow(image1)
plt.axis('off')
plt.show()

imag1_size = image1.size
print('width:', imag1_size[0])
print('height:', imag1_size[1])

width: 1280
height: 720


In [7]:
# # 이미지 시각화
image = img.imread(img_path + img_list[1000])

plt.figure(figsize=(16, 12))
plt.title('Original Image')
plt.imshow(image)
plt.axis('off')
plt.show()

## **2. 데이터 전처리(Data Preprocessing)**
---

### 데이터 준비 (Preparing Data)

앞서 확인한 AI HUB와 roboflow의 데이터를 훈련에 사용할 수 있는 형태로 바꾸고자 한다.
- 학습 카테고리를 균일화 시키는 과정
    - 이 과정은 사용하는 원본 데이터셋의 용량이 커서 학습할 분량의 데이터만 추출하는 과정으로 미리 다운샘플링 하여 넣어 images, Annotation 폴더에 저장해두었다.

- 라벨링 데이터 변환
    - YOLOv5에서 라벨링 학습을 위해서는 YOLO방식의 라벨링 방식과, txt type 데이터가 요구되므로 json type, COCO방식의 라벨링 방식을 가진 라벨링 데이터를 전부 txt type과 YOLO방식의 라벨링 방식으로 변환해준다.
        - COCO 라벨링 방식(x,y,w,h) -> x: 좌상단x, y: 좌상단y, w: bounding box의 width, h: bounding box의 height
        - YOLO 라벨링 방식(x,y,w,h) -> x: bounding box 중심점의 x, y: bounding box 중심점의 y, w: bounding box의 width, h: bounding box의 h

- 훈련(train) 및 검증(val) 데이터셋 생성
    - 전체 데이터 중 일부는 훈련 (train)에 사용하고, 나머지 일부는 훈련된 모델의 성능을 검증(val)하기 위해 사용하고자 한다. (`train_test_split`)

- train/val 이미지 경로를 txt파일로 저장
    - YOLOv5가 동작에 사용되는 ymal파일 실행을 위해 txt type으로 이미지 경로 저장(`with open(): f.write()`)

- ymal 파일 생성
    - naems : 카테고리명
    - nc : 카테고리 개수(카테고리명 순서대로 0 ~ nc-1의 인덱스 설정됨.)
    - trian : train이미지 경로(train.txt)
    - val : val이미지 경로(val.txt)



### annotation 폴더 내의 json 파일 불러오기

In [9]:
LABEL_PATH = './meta_data/dataset/Annotations/'
LABEL_SAVE_PATH = './meta_data/dataset/labels'
json_list = os.listdir(LABEL_PATH)

### json -> txt / COCO -> YOLO 포맷 변경

In [10]:
for file in tqdm(json_list):
    dataset = importer.ImportCoco(LABEL_PATH + file)

    # 좌표 변경을 위한 변수 지정
    bbox_x = int(dataset.df.iloc[0].ann_bbox_xmin)
    bbox_y = int(dataset.df.iloc[0].ann_bbox_ymin)
    height = int(dataset.df.iloc[0].ann_bbox_height)
    width = int(dataset.df.iloc[0].ann_bbox_width)
    img_height = int(dataset.df.iloc[0].img_height)
    img_width = int(dataset.df.iloc[0].img_width)

    # 카테고리 id, 해당하는 이미지의 이름 정보
    img_category = int(dataset.df.iloc[0].cat_id)
    img_name = dataset.df.iloc[0].img_filename[:-3]

    # 카테고리 id가 0~6안에 있어야하기 때문에 카테고리 id 재설정
    if img_category == 2:
        img_category = img_category - 1
    elif img_category == 3:
        img_category = img_category - 1
    elif img_category == 4:
        img_category = img_category - 1
    elif img_category == 5:
        img_category = img_category - 1
    elif img_category == 9:
        img_category = img_category - 4
    elif img_category == 10:
        img_category = img_category - 4

    # img_height, img_width 정보 누락 방지
    if img_height != 720:
        img_height = 720
    if img_width != 1280:
        img_width = 1280

    # COCO -> YOLO 포맷으로 바운딩 박스 좌표 기준 변경
    dw = 1.0 / img_width
    dh = 1.0 / img_height
    x_center = bbox_x + width / 2.0
    y_center = bbox_y + height / 2.0
    x = x_center * dw
    y = y_center * dh
    w = width * dw
    h = height * dh

    # SAVE_PATH가 없으면 생성
    if not os.path.exists(LABEL_SAVE_PATH):
        os.makedirs(LABEL_SAVE_PATH)

    # txt파일이 없으면 생성
    if not os.path.isfile(LABEL_SAVE_PATH + '/' + img_name + 'txt'):
        f = open(LABEL_SAVE_PATH + '/' + img_name + 'txt', 'w')
        f.close()

    # 변경된 좌표값, 카테고리 id를 이용해 txt포맷의 라벨링 데이터 생성
    f = open(LABEL_SAVE_PATH + '/' + img_name + 'txt', 'a')
    f.write(str(img_category) + ' ')
    f.write(str(x) + ' ')
    f.write(str(y) + ' ')
    f.write(str(w) + ' ')
    f.write(str(h) + '\n')
    f.close()

100%|██████████| 3643/3643 [01:03<00:00, 57.48it/s]


### 데이터 시각화
- 최종 전처리된 이미지의 카테고리별 개수를 막대그래프로 시각화하여 카테고리 분포를 확인할 수 있다. 

In [12]:
# 학습 카테고리 분포 확인
cat_name = ["Pothole on road",
            "Person",
            "Garbage bag & sacks",
            "Construction signs",
            "Traffic cone",
            "Filled pothole",
            "Manhole"]
LABEL_SAVE_PATH = './meta_data/dataset/labels'
label_list = os.listdir(LABEL_SAVE_PATH)

# 라벨 정보를 불러와서 카테고리 id부분만 읽어서 리스트에 저장
cat_list = []
for label in tqdm(label_list):
    f = open(LABEL_SAVE_PATH + '/' + label, 'r')
    cat_list.append(int(f.readline()[:2]))
    f.close()

# 카테고리 빈도수 확인
cat_count = []
for i in range(0, 7):
    cat_count.append(cat_list.count(i))

# 그래프로 시각화
plt.title("Train Category Status", size=20)
plt.bar(cat_name, cat_count, color=mcolors.TABLEAU_COLORS)
plt.xticks(rotation=90)
plt.show()

100%|██████████| 4308/4308 [00:00<00:00, 13324.68it/s]


In [13]:
# 이미지 파일 리스트 생성
DIR_LIST = os.path.abspath(r'./meta_data/dataset/images')
DIR_PATH = os.path.abspath(r'./meta_data/dataset')
train_img_list = glob(f'{DIR_LIST}/*.png')
print(f'이미지 파일 갯수: {len(train_img_list)}')

이미지 파일 갯수: 4308


### 훈련 & 평가 데이터셋 생성
- 전체 데이터셋 중 9:1의 비율로 훈련, 평가 데이터셋을 생성한다.

In [14]:
# train, validation 데이터 분리
train_img_list, val_img_list = train_test_split(train_img_list,
                                                train_size=0.9,
                                                random_state=42)

print(f'Train Image 갯수: {len(train_img_list)}')
print(f'Validation Image 갯수: {len(val_img_list)}')

Train Image 갯수: 3877
Validation Image 갯수: 431


### 학습, 테스트 데이터셋의 정보를 담은 txt파일 생성

In [15]:
# train/val 이미지 경로 txt파일로 저장
with open(f'{DIR_PATH}\\train.txt', 'w') as f:
    f.write('\n'.join(train_img_list) + '\n')

with open(f'{DIR_PATH}\\val.txt', 'w') as f:
    f.write('\n'.join(val_img_list) + '\n')

### Yaml 파일 최신화

In [16]:
# yaml 생성
with open(f'{DIR_PATH}\data.yaml', 'r') as f:
    data = yaml.full_load(f)

data['train'] = f'{DIR_PATH}\\train.txt'
data['val'] = f'{DIR_PATH}\\val.txt'

with open(f'{DIR_PATH}\data.yaml', 'w') as f:
    yaml.dump(data, f)

print(f'data.yaml 파일 정보: {data}')

data.yaml 파일 정보: {'names': ['Pothole on road', 'Person', 'Garbage bag & sacks', 'Construction signs & Parking prohibited board', 'Traffic cone', 'Filled pothole', 'Manhole'], 'nc': 7, 'train': 'C:\\DataScience\\T3Q\\플랫폼 최종 제출 양식\\T3Q_1_PLATFORM\\meta_data\\dataset\\train.txt', 'val': 'C:\\DataScience\\T3Q\\플랫폼 최종 제출 양식\\T3Q_1_PLATFORM\\meta_data\\dataset\\val.txt'}


## **3. 학습 모델 훈련 (Train Model)**
---


command 명령어를 통해 제공되는 YOLOv5의 train.py 파일을 사용하여 학습한다.

### 모델 컴파일 및 학습(Compile and Train Model)
eopchs ,batch size, img_size, optimizer, yolov5모델 구조, yolov5 가중치를 선택할 수 있다.

- --epochs: 학습시킬 횟수 설정
- --batch: 16
- --data: 생성한 ymal파일을 통해 이미지경로가 저장된 txt파일에 접근하여 데이터를 불러온다.
    - train/val/test 경로, 클래스 개수, 클래스 이름이 저장된 yaml파일의 경로
- --cfg: 모델의 구조(yolov5s.yaml)
- --weights: YOLOv5에서 제공하는 학습 가중치 설정(yolov5s.pt)
    - cfg, weights 최소 둘 중 하나 입력
- --name: 전체 학습 결과가 저장 될 폴더이름
- 학습결과: runs\train 폴더 안에 저장됨



In [26]:
!python.\yolo_v5_model\train.py --batch 16 --epochs 50 --data.\dataset\data.yaml --cfg.\yolo_v5_model\models\yolov5s.yaml --weights yolov5s.pt --name train_results

python: can't open file '.\yolo_v5_model\train.py': [Errno 2] No such file or directory


### 모델 평가
1. 혼동행렬
2. train,validation 비교 그래프
3. 실제 학습된 label데이터와 학습된 모델의 예측 데이터


In [None]:
address_matrix = r'.\model\yolov5\runs\train\train_results\confusion_matrix.png'
address_graph = r'.\model\yolov5\runs\train\train_results\results.png'
address_label = r'.\model\yolov5\runs\train\train_results\val_batch0_labels.jpg'
address_pred = r'.\model\yolov5\runs\train\train_results\val_batch0_pred.jpg'

# # 이미지, 라벨 시각화
matrix = img.imread(address_matrix)
graph = img.imread(address_graph)
label = img.imread(address_label)
pred = img.imread(address_pred)

# 혼동행렬
plt.figure(figsize=(16,12))
plt.subplot(2, 2, 1)
plt.title('confusion metirix')
plt.imshow(matrix)

# box_loss, object_loss, class_loss, presicion, recall, mAP_0.5, mAP_0.5:0.95
plt.subplot(2, 2, 2)
plt.title('graph')
plt.imshow(graph)

# 학습할 때 사용한 라벨링 데이터
plt.subplot(2, 2, 3)
plt.title('label')
plt.imshow(label)

# 학습모델이 예측한 데이터
plt.subplot(2, 2, 4)
plt.title('predict')
plt.imshow(pred)

plt.axis('off')
plt.show()

## **4. 추론 (Inference)**
---
훈련시킨 모델을 직접 사용해보고자 한다. 잘 훈련된 모델이라면 우리가 촬영한 이미지나 동영상이 주어졌을 때, 그 이미지나, 동영상의 카테고리를 bounding box로 detecting할 것이다. 그 과정을 진행보고자 한다.

- 이미지 또는 동영상 준비
- yolov5 모델에 위에서 학습한 모델 가중치를 설정하여 테스트
- 결과 확인

### 이미지 또는 동영상 준비
예제에서는 미리 준비해둔 이미지와 동영상 파일을 대신 받아 추론을 진행해보고자 한다.
실제 사용자가 자신의 이미지 또는 동영상을 만들어 실행해볼 수도 있다.
- 이미지, 동영상 생성법
    1. 직접 촬영한 이미지 또는 동영상을 저장한다.
    2. 지원 이미지 포맷: 'bmp', 'dng', 'jpeg', 'jpg', 'mpo', 'png', 'tif', 'tiff', 'webp', 'pfm'
    3. 지원 동영상 포맷: 'asf', 'avi', 'gif', 'm4v', 'mkv', 'mov', 'mp4', 'mpeg', 'mpg', 'ts', 'wmv'
    3. bounding box로 객체 탐지할 카테고리로는 다음과 같은 목록이 있다.
        - Person(사람)
        - Traffic cone(라바콘)
        - Construction signs & Parking prohibited board(공사표지판)
        - Garbage bag & sacks(쓰레기)
        - Filled pothole(정상수리된 포트홀)
        - Manhole(정상도로의 맨홀)
        - Pothole(포트홀)

In [19]:
# 추론 데이터셋 준비 / test_dataset.zip 파일 압축 풀기
zip_source_path = './test_dataset.zip'
zip_target_path = './meta_data'

extract_zip_file = zipfile.ZipFile(zip_source_path)
extract_zip_file.extractall(zip_target_path)

extract_zip_file.close()

# 추론 실행
detect.py의 run 함수를 임포트 하여 사용한다.
- weights : 가장 잘 학습된 가중치 best.pt를 사용한다.
- conf-thres: cofidence score가 0.3 이상인 detecting box만 시각화(0~1까지 설정 가능)
- source: 테스트할 이미지나 동영상 경로
- line_thickness: bounding box의 line 두께를 설정한다.
- project: detecting 결과가 저장되는 경로
- view_img: 추론 결과 시각화 여부
- 더 많은 parameter설명은 model\yolov5\detect.py line 54 run()함수 참고

프레임마다 인식되는 카테고리명과 해당 카테고리 갯수를 확인할 수 있다.
결과 이미지, 동영상은 는 지정한 경로 안에 저장된다.

In [20]:
# 테스트할 이미지 또는 영상 source 경로 설정
source = r'.\meta_data\test_dataset\V0F_HY_1505_20201227_101811_N_CH2_Busan_Sun_Mainroad_Day_51810.png'

### 추론 결과
bounding box와 conf_score가 시각화되어 표시된다.

In [23]:
# 추론 결과: runs\detect 폴더 안에 저장됨
run(weights=r'.\model\yolov5\runs\train\train_results\weights\best.pt',
    source=source,
    conf_thres=0.3,
    line_thickness=2,
    project=r'.\meta_data\test_result',
    view_img=True)

YOLOv5  2022-12-4 Python-3.8.13 torch-1.13.0+cpu CPU

Fusing layers... 
YOLOv5s summary: 157 layers, 7029004 parameters, 0 gradients, 15.8 GFLOPs
image 1/1 C:\DataScience\T3Q\   \T3Q_1_PLATFORM\meta_data\test_dataset\V0F_HY_1505_20201227_101811_N_CH2_Busan_Sun_Mainroad_Day_51810.png: 384x640 1 Garbage bag & sacks, 98.9ms
Results saved to [1mmeta_data\test_result\exp3[0m
