# **저시력자를 위한 원화 화폐 분류**
---
- 본 과제는 UltraLytics YOLO v5 모델 사용을 권장합니다.
    - 본 파일의 목차는 UltraLytics YOLO v5에 맞게 작성되어 있습니다.
    - 다른 모델을 찾아서 사용하셔도 좋습니다.
    - 산출물이 잘 나오면 됩니다 : )
---

## 0.미션
---
- **과제 수행 목표**
    - 본 과제는 Object Detection 문제입니다.
    - Object Detection 문제로 접근하기 위해 **데이터셋 전처리**를 하셔야 합니다.
    - 데이터셋 : money_dataset.zip
        1. 데이터셋은 압축 파일로 제공됩니다.
        2. 압축 파일 안에는 화폐마다 폴더가 개별적으로 존재합니다.
        3. 폴더 안에는 화폐 이미지와 화폐 정보가 담긴 json 파일이 있습니다.
    - 여러분이 직접 촬영한 화폐 사진들을 탐지 과정에서 이용 해보세요.
    - 이미지에 화폐 하나만 나오게 촬영하는 것은 지양해주세요.
    - 다양한 방법으로 화폐를 촬영하고 결과를 확인해보세요.
        - ex 1) 화폐의 모든 종류를 한 이미지에 나오게 촬영
        - ex 2) 여러 화폐를 겹치게 하여 촬영
---
- **Key Point**
    1. 모델에 맞는 폴더 구조 확인
    2. 이미지 축소 비율에 맞춰 좌표값 변경
        - 좌표를 이미지 리사이즈한 비율로 변경
    3. 모델에 맞는 정보 추출/형식 변경
        - json 파일에서 정보 추출 및 모델 형식에 맞게 변경
    4. 화폐당 하나의 클래스로 변경
        - 총 8개 클래스
    5. 모델 선택 필요
---

## 1.환경설정

### (1) 구글 드라이브 연동
---
- 아래의 코드 셀을 반드시 실행시켜야 합니다.
---

In [1]:
from google.colab import drive
drive.mount('/content/drive/')

Mounted at /content/drive/


### (2) 데이터셋 불러오기
---
- **세부요구사항**
    - 데이터셋 파일의 압축을 해제하세요.
---
- 예제 코드에서는 zipfile 모듈을 이용하였습니다.
    - [zipfile document](https://docs.python.org/3/library/zipfile.html#zipfile-objects)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [2]:
import zipfile

In [3]:
# 데이터셋 압축 파일 경로 : 유저별로 상이할 수 있음
money_data = zipfile.ZipFile( '/content/drive/MyDrive/money_dataset.zip' )

In [4]:
# 데이터셋 압축 해제
money_data.extractall('/content/drive/MyDrive/Dataset/')

KeyboardInterrupt: ignored

In [None]:
!mkdir /content/drive/MyDrive/Dataset/recall

In [None]:
# 데이터셋 압축 해제
money_data.extractall('/content/drive/MyDrive/Dataset/recall')

## 2.데이터 전처리

### (1) 폴더 구조 생성 및 파일 이동
---
- **세부요구사항**
    -  모델에서 요구하는 폴더 구조를 만들어야 합니다.
        - Hint : Image와 Label을 구분하는 폴더를 만들어 주세요
---
- 예제 코드에서는 glob, shutil 모듈을 이용하였습니다.
    - [glob document](https://docs.python.org/3/library/glob.html) | [shutil document](https://docs.python.org/3/library/shutil.html)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [None]:
# 1.폴더 구조 만들기
!mkdir /content/drive/MyDrive/Dataset/images;
!mkdir /content/drive/MyDrive/Dataset/images/train; mkdir /content/drive/MyDrive/Dataset/images/val

!mkdir /content/drive/MyDrive/Dataset/labels !mkdir /content/drive/MyDrive/Dataset/labels/train_json; mkdir /content/drive/MyDrive/Dataset/labels/val_json;


In [None]:
import glob, shutil

In [None]:
# 2. Dataset metadata 입력
won_list = ['10', '50', '100', '500', '1000', '5000', '10000', '50000']
data_path = '/content/drive/MyDrive/Dataset/'

In [None]:

for won in won_list:
    print('class: ', won)
    print(len(glob.glob(f'/content/drive/MyDrive/Dataset/{won}/*')))
    print(len(glob.glob(f'/content/drive/MyDrive/Dataset/{won}/*jpg')))
    print(len(glob.glob(f'/content/drive/MyDrive/Dataset/{won}/*json')))

class:  10
0
0
0
class:  50
0
0
0
class:  100
0
0
0
class:  500
0
0
0
class:  1000
0
0
0
class:  5000
0
0
0
class:  10000
0
0
0
class:  50000
0
0
0


---
- 데이터를 Training set | Validation set으로 분할하세요.
    - 예시 : Training과 Validation은 8:2로 분리
- Hint : 이미지 데이터는 /images에, JSON 데이터는 /labels에 넣어주세요
    - 예시 : /dataset/images/train, /dataset/labels/train
    - 예제 코드에서는 glob, shutil 모듈을 이용하였습니다.
    - [glob document](https://docs.python.org/3/library/glob.html) | [shutil document](https://docs.python.org/3/library/shutil.html)

    ※ 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
    
---

In [None]:
########################
# 이 셀부터 코드 작성하세요
########################
# 3. 데이터를 Training set | Validation set으로 분할하세요.
import random, glob, shutil

images_train_path = '/content/drive/MyDrive/Dataset/images/train/'
images_valid_path = '/content/drive/MyDrive/Dataset/images/val/'

labels_train_path = '/content/drive/MyDrive/Dataset/labels/train_json/'
labels_valid_path = '/content/drive/MyDrive/Dataset/labels/val_json/'

for lst in won_list :
    path = '/content/drive/MyDrive/Dataset/' + lst + '/'
    train_data = glob.glob(path + '*.jpg')
    labels_data = glob.glob(path + '*.json')
    
    valid_jpg = random.sample(train_data, k = round(len(train_data)*0.2))

    valid_json = valid_jpg.copy()
    for idx, x in enumerate(valid_jpg) :
        valid_json[idx] = x[:-3] + 'json'

    
    for file in valid_jpg :
        shutil.move(file, images_valid_path)

    for file in valid_json :
        shutil.move(file, labels_valid_path)
    
    train_data = glob.glob(path + '*.jpg')
    labels_data = glob.glob(path + '*.json')

    for file in train_data :
        shutil.move(file, images_train_path)

    for file in labels_data :
        shutil.move(file, labels_train_path)

In [None]:
import os

print('images - train 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/images/train/')))
print('images - val 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/images/val/')))
print('labels - train 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/labels/train_json/')))
print('labels - val 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/labels/val_json/')))

images - train 개수 :  4175
images - val 개수 :  1043
labels - train 개수 :  4175
labels - val 개수 :  1043


In [None]:
print(sorted(os.listdir('/content/drive/MyDrive/Dataset/images/train/'))[:5])
print(sorted(os.listdir('/content/drive/MyDrive/Dataset/labels/train_json/'))[:5])

['10000_B_DESK_0_1.jpg', '10000_B_DESK_0_10.jpg', '10000_B_DESK_0_100.jpg', '10000_B_DESK_0_101.jpg', '10000_B_DESK_0_102.jpg']
['10000_B_DESK_0_1.json', '10000_B_DESK_0_10.json', '10000_B_DESK_0_100.json', '10000_B_DESK_0_101.json', '10000_B_DESK_0_102.json']


### (2) json에서 정보 추출
---
- **세부요구사항**
    - json 파일에서 필요한 정보를 추출하세요:
        - 위치 정보 : x1, x2, y1, y2
        - 박스 정보 : shape_type
        - 클래스 정보 : labels
    - 화폐당 하나의 클래스로 변경하세요.
        - json 파일에는 화폐 클래스가 앞뒷면으로 구분되어 있습니다.
        - 화폐의 앞뒷면 구분을 없애주세요.
            - 예시 : 'ten_front', 'ten_back' -> 'ten'
    - 화폐의 위치 정보를 YOLO 모델 형식에 맞게 변경 해주세요.
        - 사용되는 이미지는 원본에서 1/4로 축소되어 있습니다.
        - json 파일의 정보는 원본 기준 데이터이므로 위치 정보 추출을 할 때 x값과 y값을 1/4로 줄여주세요.
    - 이렇게 변경된 정보를 YOLO label 형식에 맞게 txt파일로 저장 해 주세요.
        - Hint : YOLO Labeling Format [label, x-center, y-center, width-norm, height-norm]
---

In [None]:
import os, json

In [None]:
!mkdir '/content/drive/MyDrive/Dataset/labels/train'
!mkdir '/content/drive/MyDrive/Dataset/labels/val'



In [None]:
won_dict = {'Ten':'0', 'Fifty':'1', 'Hundred':'2', 'Five_Hundred':'3', 'Thousand':'4', 'Five_Thousand':'5', 'Ten_Thousand':'6', 'Fifty_Thousand':'7'}

In [None]:
json_path = '/content/drive/MyDrive/Dataset/labels/'
temp_list = ['train_json', 'val_json']

In [None]:
def to_txt(file_, train_or_val) :
    file_path = json_path + train_or_val + '/' + file_
    
    with open(file_path,encoding='UTF-8') as json_file:
        data = json.load(json_file)
    
    if train_or_val == 'train_json' :
        save_path = '/content/drive/MyDrive/Dataset/labels/train/' + file_
    else :
        save_path = '/content/drive/MyDrive/Dataset/labels/val/' + file_
    with open(save_path[:-5]+'.txt', 'w') as f :
        if 'back' in data['shapes'][0]['label'] : 
            label = data['shapes'][0]['label'].replace('_back', '')
        elif 'front' in data['shapes'][0]['label'] : 
            label = data['shapes'][0]['label'].replace('_front', '')        
        else : label = data['shapes'][0]['label']
        label = won_dict[str(label)]
        x_center = ((data['shapes'][0]['points'][0][0] + data['shapes'][0]['points'][1][0])/2)/data['imageWidth']
        y_center = ((data['shapes'][0]['points'][0][1] + data['shapes'][0]['points'][1][1])/2)/data['imageHeight']
        width_norm = (data['shapes'][0]['points'][1][0] - data['shapes'][0]['points'][0][0])/data['imageWidth']
        height_norm = (data['shapes'][0]['points'][1][1] - data['shapes'][0]['points'][0][1])/data['imageHeight']
        f.write(f'{label} {x_center} {y_center} {width_norm} {height_norm}')
        f.close()

In [None]:
x = 'Ten_front'

In [None]:
label = 'Fifty'

In [None]:
won_dict['Ten']

'10'

In [None]:
########################
# 이 셀부터 코드 작성하세요
# Json 파일에서 필요한 정보만 골라 txt로 바꾸는 작업임을 기억하세요!
########################
lst = []
for train_or_val in temp_list :
    for file_ in os.listdir('/content/drive/MyDrive/Dataset/labels/' + train_or_val) :
        # try:
        to_txt(file_, train_or_val)
        # except :
            # lst.append([file_, train_or_val])

In [None]:
lst

[]

In [None]:
print('label_txt train 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/labels/train')))
print('label_txt val 개수 : ', len(os.listdir('/content/drive/MyDrive/Dataset/labels/val')))

label_txt train 개수 :  4175
label_txt val 개수 :  1043


### (3) 데이터셋 정보가 담긴 파일 생성
---
- **세부요구사항**
    - 파일 안에 있어야 할 정보는 아래와 같습니다.
        - 학습할 클래스 이름 정보
        - 학습할 클래스 수 정보
        - Training, Validation 데이터셋 위치 정보
---
- 가장 대중적으로 이용하는 라이브러리는 yaml 입니다.
    - [yaml document](https://pyyaml.org/wiki/PyYAMLDocumentation)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [None]:
import yaml

In [None]:
won_dict = {0:'10', 1:'50', 2:'100', 3:'500', 4:'1000', 5:'5000', 6:'10000', 7:'50000'}

In [None]:
str_data = """
path: /content/drive/MyDrive/Dataset  # 데이터셋 경로
train: images/train  # Training 데이터셋 위치 정보
val: images/val  # Validation 데이터셋 위치 정보

# Classes
nc: 8  # 학습할 클래스 수
names: ['10원','50원','100원','500원','1000원','5000원','10000원','50000원'] # 학습할 클래스 이름 정보
            """

with open('/content/drive/MyDrive/Dataset/money.yaml', 'w') as f :
    f.write(str_data)





    

In [None]:
########################
# 이 셀부터 코드 작성하세요
########################
with open('/content/drive/MyDrive/Dataset/money.yaml', 'w') as f :
    f.write(str_data)
    

## 3.모델링

### (1) 모델 라이브러리 설치
---

In [2]:
!pip install jedi

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting jedi
  Downloading jedi-0.18.2-py2.py3-none-any.whl (1.6 MB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.6 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.4/1.6 MB[0m [31m10.9 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m1.6/1.6 MB[0m [31m28.2 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m22.2 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: jedi
Successfully installed jedi-0.18.2


In [3]:
!git clone https://github.com/ultralytics/yolov5

Cloning into 'yolov5'...
remote: Enumerating objects: 15338, done.[K
remote: Counting objects: 100% (3/3), done.[K
remote: Compressing objects: 100% (3/3), done.[K
remote: Total 15338 (delta 0), reused 2 (delta 0), pack-reused 15335[K
Receiving objects: 100% (15338/15338), 14.21 MiB | 29.58 MiB/s, done.
Resolving deltas: 100% (10523/10523), done.


In [4]:
## yolov5 폴더 requirements.txt 수정 필요
## setuptools<=64.0.2

temp_str = 'setuptools<=64.0.2\n'

f = open('/content/yolov5/requirements.txt', 'r')
f_str = f.readlines()
f.close()

f2 = open('/content/yolov5/requirements.txt', 'w')

for idx, val in enumerate(f_str) :
    if 'setuptools' in val :
        idx_v = idx
        f_str.remove(val)
        f_str.insert(idx_v, temp_str)

for val in f_str :
    f2.write(val)

f2.close() 

In [6]:
!cd yolov5; pip install -r requirements.txt

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


### (2) 가중치 파일 다운로드
---
- **세부요구사항**
    - 모델 개발자가 제공하는 사전 학습 가중치 파일을 다운로드 하세요.
        - 해당 과정이 불필요하다면 넘어가셔도 됩니다!
---

In [7]:
########################
# 이 셀부터 코드 작성하세요
########################
!wget -O /content/drive/MyDrive/Dataset/yolov5s.pt https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt

--2023-03-24 04:40:06--  https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt
Resolving github.com (github.com)... 140.82.113.3
Connecting to github.com (github.com)|140.82.113.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/264818686/381bd8a8-8910-4e9e-b0dd-2752951ef78c?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230324%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230324T044006Z&X-Amz-Expires=300&X-Amz-Signature=c1fe2dd352b29e7cce2c41399873c9629c42a63a6f8f65211cbec690b5943da9&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=264818686&response-content-disposition=attachment%3B%20filename%3Dyolov5s.pt&response-content-type=application%2Foctet-stream [following]
--2023-03-24 04:40:06--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/264818686/381bd8a8-8910-4e9e-b0dd-2752951ef78c?X-Amz-Algorithm=AW

### (3) 학습 : train.py
---
- **세부요구사항**
    - UltraLytics YOLO v5에는 아래의 데이터가 필요합니다.
        - 데이터셋 정보가 담긴 yaml 파일
        - 사용하려는 모델 구조에 대한 yaml 파일
        - 사용하려는 모델의 가중치 파일
---

In [10]:
########################
# 이 셀부터 코드 작성하세요
########################
!cd yolov5; python train.py \
    --data '/content/drive/MyDrive/Dataset/money.yaml' \
    --cfg '/content/yolov5/models/yolov5s.yaml' \
    --weights '/content/drive/MyDrive/Dataset/yolov5s.pt' \
    --epochs 1000 \
    --patience 5 \
    --img 320 \
    --project '/content/drive/MyDrive/Dataset' \
    --name 'train_money' \
    --exist-ok
    # --device cpu

[34m[1mtrain: [0mweights=/content/drive/MyDrive/Dataset/yolov5s.pt, cfg=/content/yolov5/models/yolov5s.yaml, data=/content/drive/MyDrive/Dataset/money.yaml, hyp=data/hyps/hyp.scratch-low.yaml, epochs=1000, batch_size=16, imgsz=320, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, bucket=, cache=None, image_weights=False, device=, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=/content/drive/MyDrive/Dataset, name=train_money, exist_ok=True, quad=False, cos_lr=False, label_smoothing=0.0, patience=5, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest
[34m[1mgithub: [0mup to date with https://github.com/ultralytics/yolov5 ✅
YOLOv5 🚀 v7.0-128-gb96f35c Python-3.9.16 torch-1.13.1+cu116 CUDA:0 (NVIDIA A100-SXM4-40GB, 40514MiB)

[34m[1mhyperparameters: [0mlr0=0.01, lrf=0.01, momentum=0.937, weight_decay=0.0005, warmup_epoc



```
# 코드로 형식 지정됨

```
# 코드로 형식 지정됨
```


```

## 4.탐지 : detect.py
---
- **세부요구사항**
    - 학습 과정에서 생성된 가중치 파일을 이용하세요.
    - IoU threshold를 0.25 이하로 설정하세요.
    - confidence threshold를 0.75 이상으로 설정하세요.
---
- 여러분이 **직접 촬영한 화폐 사진과 동영상**을 탐지 과정에 이용하여 결과를 확인하세요.
    - 조건
        1. 화폐의 수를 늘려가며 촬영 해보세요.
            - ex) 50원 하나, 50원 둘, 50원 셋, ...
        2. 화폐의 종류를 늘려가며 촬영 해보세요.
            - ex) 50원 하나와 100원 하나, 50원 하나와 100원 하나와 1000원 하나, ...
        3. 사진은 최소 30장 이상, 동영상은 최소 하나 이상 촬영하여 사용 해보세요.
---

In [13]:
import zipfile
money_picture = zipfile.ZipFile( '/content/drive/MyDrive/money_picture 2.zip')
money_picture.extractall('/content/drive/MyDrive/Dataset/')
money_video = zipfile.ZipFile( '/content/drive/MyDrive/money_video.zip')
money_video.extractall('/content/drive/MyDrive/Dataset/')

In [17]:
########################
# 이 셀부터 코드 작성하세요
########################
!cd yolov5; python detect.py \
    --weights '/content/drive/MyDrive/Dataset/train_money/weights/best.pt' \
    --source '/content/drive/MyDrive/Dataset/money_picture' \
    --project '/content/drive/MyDrive/Dataset/' \
    --name 'images' \
    --img 320 \
    --conf-thres 0.75 \
    --iou-thres 0.25 \
    --line-thickness 2 \
    --exist-ok 
    # --device CPU

[34m[1mdetect: [0mweights=['/content/drive/MyDrive/Dataset/train_money/weights/best.pt'], source=/content/drive/MyDrive/Dataset/money_picture, data=data/coco128.yaml, imgsz=[320, 320], conf_thres=0.75, iou_thres=0.25, max_det=1000, device=, view_img=False, save_txt=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=/content/drive/MyDrive/Dataset/, name=images, exist_ok=True, line_thickness=2, hide_labels=False, hide_conf=False, half=False, dnn=False, vid_stride=1
YOLOv5 🚀 v7.0-128-gb96f35c Python-3.9.16 torch-1.13.1+cu116 CUDA:0 (Tesla T4, 15102MiB)

Fusing layers... 
YOLOv5s summary: 157 layers, 7031701 parameters, 0 gradients, 15.8 GFLOPs
image 1/98 /content/drive/MyDrive/Dataset/money_picture/1000.jpeg: 192x320 1 1000원, 12.0ms
image 2/98 /content/drive/MyDrive/Dataset/money_picture/10000_1.jpg: 320x256 4 10000원s, 12.4ms
image 3/98 /content/drive/MyDrive/Dataset/money_picture/10000_1.png: 2

In [None]:
from IPython.display import Image
from google.colab import files

In [None]:
!zip -r /content/detected_images.zip /content/yolov5/detected/images

In [None]:
files.download(filename='/content/detected_images.zip')