# **저시력자를 위한 원화 화폐 분류**
---
- 본 과제는 UltraLytics YOLO v5 모델 사용을 권장합니다.
    - 본 파일의 목차는 UltraLytics YOLO v5에 맞게 작성되어 있습니다.
    - 다른 모델을 찾아서 사용하셔도 좋습니다.
    - 산출물이 잘 나오면 됩니다 : )
---

## 0.미션
---
- **과제 수행 목표**
    - 본 과제는 Object Detection 문제입니다.
    - Object Detection 문제로 접근하기 위해 **데이터셋 전처리**를 하셔야 합니다.
    - 데이터셋 : money_dataset.zip
        1. 데이터셋은 압축 파일로 제공됩니다.
        2. 압축 파일 안에는 화폐마다 폴더가 개별적으로 존재합니다.
        3. 폴더 안에는 화폐 이미지와 화폐 정보가 담긴 json 파일이 있습니다.
    - 여러분이 직접 촬영한 화폐 사진들을 탐지 과정에서 이용 해보세요.
    - 이미지에 화폐 하나만 나오게 촬영하는 것은 지양해주세요.
    - 다양한 방법으로 화폐를 촬영하고 결과를 확인해보세요.
        - ex 1) 화폐의 모든 종류를 한 이미지에 나오게 촬영
        - ex 2) 여러 화폐를 겹치게 하여 촬영
---
- **Key Point**
    1. 모델에 맞는 폴더 구조 확인
    2. 이미지 축소 비율에 맞춰 좌표값 변경
        - 좌표를 이미지 리사이즈한 비율로 변경
    3. 모델에 맞는 정보 추출/형식 변경
        - json 파일에서 정보 추출 및 모델 형식에 맞게 변경
    4. 화폐당 하나의 클래스로 변경
        - 총 8개 클래스
    5. 모델 선택 필요
---

## 1.환경설정

### (1) 구글 드라이브 연동
---
- 아래의 코드 셀을 반드시 실행시켜야 합니다.
---

In [1]:
from google.colab import drive
drive.mount('/content/drive/')

Mounted at /content/drive/


### (2) 데이터셋 불러오기
---
- **세부요구사항**
    - 데이터셋 파일의 압축을 해제하세요.
---
- 예제 코드에서는 zipfile 모듈을 이용하였습니다.
    - [zipfile document](https://docs.python.org/3/library/zipfile.html#zipfile-objects)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [2]:
import zipfile

In [3]:
# zip 파일까지의 경로
dataset_path = '/content/drive/MyDrive/ktaivle_mp3th_2/Datasets_money/money_dataset.zip'

In [4]:
# 데이터셋 압축 파일 경로 : 유저별로 상이할 수 있음
money_data = zipfile.ZipFile(dataset_path)

MyDrive 경로 내에 압축을을 해제할 경우 코드를 다시 실행 했을 때 오류가 납니다. 되도록이면 content 하위 경로에 폴더를 만들어 저장하도록 합시다.

인터넷 연결이 정상적인 경우 ZipFile()로 충분히 빠른 시간내에 압축 해제가 가능합니다.

게다가, 현재 colab pro를 사용하고 있기 때문에 고용량 RAM을 사용해 자리를 비워도 코랩이 데이터를 기억하도록 할 수 있습니다.


In [5]:
# 데이터셋 압축 해제
money_data.extractall('/content/Datasets_money/')

In [6]:
# 압축 해제된 데이터셋이 들어있는경로
data_path = '/content/Datasets_money/'

## 2.데이터 전처리

### (1) 폴더 구조 생성 및 파일 이동
---
- **세부요구사항**
    -  모델에서 요구하는 폴더 구조를 만들어야 합니다.
        - Hint : Image와 Label을 구분하는 폴더를 만들어 주세요
---
- 예제 코드에서는 glob, shutil 모듈을 이용하였습니다.
    - [glob document](https://docs.python.org/3/library/glob.html) | [shutil document](https://docs.python.org/3/library/shutil.html)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [7]:
# 1.폴더 구조 만들기
try:
    !mkdir /content/Dataset/
except:
    pass
try:
    !mkdir /content/Dataset/images;
    !mkdir /content/Dataset/images/train; mkdir /content/Dataset/images/val
except:
    pass

try:
    !mkdir /content/Dataset/labels;
    !mkdir /content/Dataset/labels/train; mkdir /content/Dataset/labels/val
except:
    pass

In [8]:
# 경로를 미리 지정해둡시다다
train_img_path = '/content/Dataset/images/train/'
valid_img_path = '/content/Dataset/images/val'

train_lab_path = '/content/Dataset/labels/train'
valid_lab_path = '/content/Dataset/labels/val'

In [9]:
import glob, shutil
import random

In [10]:
# 2. Dataset metadata 입력
won_list = ['10', '50', '100', '500', '1000', '5000', '10000', '50000']

---
- 데이터를 Training set | Validation set으로 분할하세요.
    - 예시 : Training과 Validation은 8:2로 분리
- Hint : 이미지 데이터는 /images에, JSON 데이터는 /labels에 넣어주세요
    - 예시 : /dataset/images/train, /dataset/labels/train
    - 예제 코드에서는 glob, shutil 모듈을 이용하였습니다.
    - [glob document](https://docs.python.org/3/library/glob.html) | [shutil document](https://docs.python.org/3/library/shutil.html)

    ※ 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
    
---

딕셔너리를 이용해 각 클래스(돈의 종류)별로 확장자를 제외한 파일 이름을 담은 리스트를 생성하겠습니다.
- tip
    - glob.glob()은 하위 폴더 및 파일들의 전체 경로를 담은 리스트를 반환하고, os.listdir()은 하위 폴더 및 파일들의 이름만 반환하므로 편의에 맞게 잘 사용하도록 합시다.

In [11]:
won_data_dic = dict()

각 폴더들을 보면 이미지 파일 바로뒤에 json파일이 따라옵니다.

저는 파일 이름만 필요하기에 2칸씩 띄어 세어서 연산량을 줄이도록 하겠습니다.

In [12]:
for won in won_list:
    file_pathes = glob.glob(f'{data_path}{won}/*')
    won_data_dic[won] = []
    # 리스트 내의 요소들을 k개씩 띄어 세기 list[::k]
    for file_path in file_pathes[::2]:
        filename, ext = file_path.split('.')
        won_data_dic[won].append(filename)

방금 우리가 딕셔너리에 담았던, 클래스이름을 key값으로 하는 파일 이름 리스트 속에 있는 요소들의 숫자(파일 이름 수)와 실제 각 클래스별 파일 이름 수를 비교해보도록 하겠습니다.

In [13]:
for won in won_list:
    file_pathes = glob.glob(f'{data_path}{won}/*')
    print(len(file_pathes)// 2) 

436
440
440
440
858
867
867
870


In [14]:
for key in won_list:
    print(len(won_data_dic[key]))

436
440
440
440
858
867
867
870


위의 코드는 사실 안좋은 예시였답니다 ㅎㅎ.

파이썬이 저한테 **'너가 준 파일이름 이미 옮겨놨는데 왜 또 줌?'**이라고 하면서 오류를 뱉어주네요.

아마, 제가 위에서 **'각 폴더들을 보면 이미지 파일 바로뒤에 json파일이 따라옵니다'** 라고 한 부분이 틀렸던 것 같네요 순서가 짬뽕인 친구들이 있나봅니다.

이번엔 /*jpg를 이용해 파일 경로의 끝이 jpg로 끝나는(확장자가 .jpg)인 파일만 뽑아서 다시 해보도록 하겠습니다.

In [15]:
for won in won_list:
    file_pathes = glob.glob(f'{data_path}{won}/*jpg')
    won_data_dic[won] = []
    # 리스트 내의 요소들을 k개씩 띄어 세기 list[::k]
    for file_path in file_pathes:
        filename, ext = file_path.split('.')
        won_data_dic[won].append(filename)

In [16]:
print('현재 데이터셋에 존재하는 파일 이름 개수')
for won in won_list:
    file_pathes = glob.glob(f'{data_path}{won}/*')
    print(len(file_pathes)// 2) 
print('딕셔너리 속 파일 이름 개수')
for key in won_list:
    print(len(won_data_dic[key]))    

현재 데이터셋에 존재하는 파일 이름 개수
436
440
440
440
858
867
867
870
딕셔너리 속 파일 이름 개수
436
440
440
440
858
867
867
870


### Image 파일과 Label 파일을 동시에 이동시키기


1. 각 클래스별 파일이름 리스트를 shuffle로 섞는다. 
2. 파일이름 리스트의 길이를 구하고, validation 데이터의 크기 비율을 그 길이에 곱해서 val 폴더로 들어갈 마지막 index값을 구한다.
3. enumerate를 이용해 각 리스트 속 파일 이름의 index 정보를 함께 얻어내 각 파일이 train 폴더로 갈지 val 폴더로 갈지 정한다.
    - 이때, 폴더 이름에 확장자(.jpg, .json)를 붙여서 두개의 폴더가 가야할 곳으로 한번에 이동하도록 한다.
4. 1~3을 모든 클래스에 대해서 각각 실행한다.

In [79]:
won_data_dic['10'][0]

'/content/drive/MyDrive/ktaivle_mp3th_2/Datasets_money/10/10_1138_1'

In [17]:
random.seed(2023)
valid_size = 0.2
for key in won_list:
    shuffle_lst = won_data_dic[key].copy()
    random.shuffle(shuffle_lst)
    lst_num = len(shuffle_lst)
    last_val_idx = int(lst_num * valid_size)
    for idx, filename in enumerate(shuffle_lst):
        # train으로 이동
        if idx > last_val_idx:
            # image - jpg
            shutil.move(filename + '.jpg', train_img_path)
            # label - json
            shutil.move(filename + '.json', train_lab_path)
        # val로
        else:
            # image - jpg
            shutil.move(filename + '.jpg', valid_img_path)
            # label - json
            shutil.move(filename + '.json', valid_lab_path)

In [18]:
print(len(glob.glob('/content/Dataset/images/train/*')),
len(glob.glob('/content/Dataset/images/val/*')),

len(glob.glob('/content/Dataset/labels/train/*')),
len(glob.glob('/content/Dataset/labels/val/*')),
)

4168 1050 4168 1050


아주 완벽하게 완성된 모습입니다^^

참고로, 안좋은 예시처럼 클래스 별로 파일이름을 구분하게 되면 위의 코드블록에서 0 26 0 26이라는 값을 뱉어줍니다.

In [None]:
########################
# 이 셀부터 코드 작성하세요
########################
# 3. 데이터를 Training set | Validation set으로 분할하세요.


### (2) json에서 정보 추출
---
- **세부요구사항**
    - json 파일에서 필요한 정보를 추출하세요:
        - 위치 정보 : x1, x2, y1, y2
        - 박스 정보 : shape_type
        - 클래스 정보 : labels
    - 화폐당 하나의 클래스로 변경하세요.
        - json 파일에는 화폐 클래스가 앞뒷면으로 구분되어 있습니다.
        - 화폐의 앞뒷면 구분을 없애주세요.
            - 예시 : 'ten_front', 'ten_back' -> 'ten'
    - 화폐의 위치 정보를 YOLO 모델 형식에 맞게 변경 해주세요.
        - 사용되는 이미지는 원본에서 1/5로 축소되어 있습니다.
        - json 파일의 정보는 원본 기준 데이터이므로 위치 정보 추출을 할 때 x값과 y값을 1/5로 줄여주세요.
    - 이렇게 변경된 정보를 YOLO label 형식에 맞게 txt파일로 저장 해 주세요.
        - Hint : YOLO Labeling Format [label, x-center, y-center, width-norm, height-norm]
---

In [19]:
import os, json

In [20]:
json_path = '/content/Dataset/labels/'
temp_list = ['train', 'val']

In [22]:
ls

[0m[01;34mDataset[0m/  [01;34mDatasets_money[0m/  [01;34mdrive[0m/  [01;34msample_data[0m/


json파일을 하나만 열어봅시다

In [21]:
with open('/content/Dataset/labels/train/10000_B_DESK_0_1.json') as f:
    data = json.load(f)

data

{'version': '3.16.7',
 'flags': {},
 'shapes': [{'label': 'Ten_Thousand_back',
   'line_color': None,
   'fill_color': None,
   'points': [[389.19400127999995, 1505.904624],
    [2539.7390591999997, 2508.0394751999997]],
   'shape_type': 'rectangle',
   'flags': {}}],
 'lineColor': [0, 255, 0, 128],
 'fillColor': [255, 0, 0, 128],
 'imagePath': '10000_B_DESK_0_1.jpg',
 'imageWidth': 3024,
 'imageHeight': 4032,
 'imageData': None}

dict 타입(딕셔너리)으로 정보를 담고있는 모습을 볼 수 있습니다.

먼저 우리가 필요한 데이터가 무엇인지 파악해봅시다

###필요한 정보
- 'shapes' : list > 각 box에 대한 정보를 담음
    - 'label' : str > class 정보
    - 'points' : 2중 list > box 좌표
- 'imageWidth' : int > 원래 이미지 너비
- 'imageHeight' : int > 원래 이미지 높이

key값을 통해 dict 내부 요소들에 접근해서 우리가 원하는 데이터들을 뽑아와 봅시다

In [24]:
data_in_need = data['shapes'][0]['label'], data['shapes'][0]['points'], data['imageWidth'], data['imageHeight']
data_in_need

('Ten_Thousand_back',
 [[389.19400127999995, 1505.904624], [2539.7390591999997, 2508.0394751999997]],
 3024,
 4032)

### json 파일에서 우리가 원하는 정보를 추출하기
하나의 json 파일을 까서 정보를 빼오는 코드를 바탕삼아서 전체 json 파일을 확인해서 정보를 빼오는 코드를 만들어봅시다.

다른 모델을 가져다 쓸 경우 **데이터의 형식이나, 폴더의 구조, 심지어는 폴더의 이름마저 신경써서 설정**해야 합니다.

이번 같은 경우에는 label 폴더 속 train 폴더와 val 폴더에 json 파일이 있으면 안되므로, json 파일들을 담고 있는 train 폴더와 val 폴더의 이름을 각각 train_json, val_json으로 바꿔주겠습니다.

그 후, 새롭게 train 폴더와 val 폴더를 만듭시다!

In [25]:
os.rename('/content/Dataset/labels/train', '/content/Dataset/labels/train_json')
os.rename('/content/Dataset/labels/val', '/content/Dataset/labels/val_json')

In [26]:
os.mkdir('/content/Dataset/labels/train')
os.mkdir('/content/Dataset/labels/val')

In [27]:
# 항상 확인하는 습관을 들입시다~~~~~!
train_labels_path = glob.glob('/content/Dataset/labels/train_json/*')
val_labels_path = glob.glob('/content/Dataset/labels/val_json/*')

len(train_labels_path), len(val_labels_path)

(4168, 1050)

In [28]:
train_labels_path[:5]

['/content/Dataset/labels/train_json/10000_B_DESK_0_145.json',
 '/content/Dataset/labels/train_json/5000_B_HAND_0_61.json',
 '/content/Dataset/labels/train_json/10000_B_HAND_0_12.json',
 '/content/Dataset/labels/train_json/500_540_1.json',
 '/content/Dataset/labels/train_json/1000_F_STUFF_0_41.json']

### 정보 추출해서 txt파일에 담아 저장하기

1. label 데이터가 담긴 파일의 경로들을 담은 리스트에서 각 파일 경로를 가져온다.
2. with 구문을 이용해 파일을 열고 json 데이터를 가져온다.
3. key 값을 사용해 필요한 정보에 접근하고, 적절한 처리과정을 거친 후, 변수에 저장한다.
4. 다시 with 구문을 이용해 이번엔 새 txt파일을 생성하고 변수들을 str 데이터 타입으로 바꾼뒤에 집어넣고 저장한다.
5. 1~4를 모든 json 파일에 적용한다.

In [29]:
# won_list = ['10', '50', '100', '500', '1000', '5000', '10000', '50000']
# train json 파일들

for filepath in train_labels_path:

    with open(f'{filepath}') as f:
        data = json.load(f)
    
    # class 파악
    class_info = data['shapes'][0]['label'].split('_')
    first = class_info[0]
    second = class_info[1]
    
    if first == 'Ten':
        if second == 'Thousand':
            # 10,000 : 6
            cls = 6
        else:
            # 10 : 0
            cls = 0
    elif first =='Fifty':
        if second == 'Thousand':
            # 50,000 : 7
            cls = 7
        else:
            # 50 : 1
            cls = 1
    elif first == 'Hundred':
        # 100 : 2
        cls = 2
    elif first == 'Five':
        if second == ' Hundred':
            # 500 : 3
            cls = 3
        else:
            # 5,000 : 5
            cls = 5
    else:
        # 1,000 : 4
        cls = 4
    #print(cls)

    # 전체 이미지 크기
    width, height = data['imageWidth'], data['imageHeight']

    # box 중심점
    point_info = data['shapes'][0]['points']
    x1, y1 = point_info[0]
    x2, y2 = point_info[1]
        
        # 중심점 계산
    x_mid = (x1 + x2) / 2
    y_mid = (y1 + y2) / 2
        # 정규화 계산
    x_mid_sc = x_mid / width
    y_mid_sc = y_mid / height
    #print(x_mid_sc, y_mid_sc)

    # box 높이, 너비
    box_width = (x2 - x1) / width
    box_height = (y2 - y1) / height
    
    # 파일 이름 추출하기
        # file_route: list > 현재 파일에 대한 모든 상위 폴더의 이름을 담은 리스트
    file_route = filepath.split('/')
        # 확장자 제거해주기
    filename, ext = file_route[-1].split('.')
        # 숙제 : 파일 이름을 '_'로 split 해서 class 정보를 알아낼 수 있습니다(서연님의 아이디어).
        # 내일까지 숙제입니다^^. 

    # txt 파일 새로 작성해서 저장하기
    with open(f'/content/Dataset/labels/train/{filename}.txt', 'w') as txt_f:
        information = [cls, x_mid_sc, y_mid_sc, box_width, box_height]
        txt_f.write(' '.join(map(str, information)))

In [31]:
# val json 파일들

for filepath in val_labels_path:

    with open(f'{filepath}') as f:
        data = json.load(f)
    
    # class 파악
    class_info = data['shapes'][0]['label'].split('_')
    first = class_info[0]
    second = class_info[1]
    
    if first == 'Ten':
        if second == 'Thousand':
            # 10,000 : 6
            cls = 6
        else:
            # 10 : 0
            cls = 0
    elif first =='Fifty':
        if second == 'Thousand':
            # 50,000 : 7
            cls = 7
        else:
            # 50 : 1
            cls = 1
    elif first == 'Hundred':
        # 100 : 2
        cls = 2
    elif first == 'Five':
        if second == ' Hundred':
            # 500 : 3
            cls = 3
        else:
            # 5,000 : 5
            cls = 5
    else:
        # 1,000 : 4
        cls = 4
    #print(cls)

    # 전체 이미지 크기
    width, height = data['imageWidth'], data['imageHeight']

    # box 중심점
    point_info = data['shapes'][0]['points']
    x1, y1 = point_info[0]
    x2, y2 = point_info[1]
        
        # 중심점 계산
    x_mid = (x1 + x2) / 2
    y_mid = (y1 + y2) / 2
        # 정규화 계산
    x_mid_sc = x_mid / width
    y_mid_sc = y_mid / height
    #print(x_mid_sc, y_mid_sc)

    # box 높이, 너비
    box_width = (x2 - x1) / width
    box_height = (y2 - y1) / height
    
    # 파일 이름 추출하기
        # file_route: list > 현재 파일에 대한 모든 상위 폴더의 이름을 담은 리스트
    file_route = filepath.split('/')
        # 확장자 제거해주기
    filename, ext = file_route[-1].split('.')

    with open(f'/content/Dataset/labels/val/{filename}.txt', 'w') as txt_f:
        information = [cls, x_mid_sc, y_mid_sc, box_width, box_height]
        txt_f.write(' '.join(map(str, information)))

In [32]:
# 확인은 필수입니다다
len(glob.glob('/content/Dataset/labels/train/*')), len(glob.glob('/content/Dataset/labels/val/*'))

(4168, 1050)

### (3) 데이터셋 정보가 담긴 파일 생성
---
- **세부요구사항**
    - 파일 안에 있어야 할 정보는 아래와 같습니다.
        - 학습할 클래스 이름 정보
        - 학습할 클래스 수 정보
        - Training, Validation 데이터셋 위치 정보
---
- 가장 대중적으로 이용하는 라이브러리는 yaml 입니다.
    - [yaml document](https://pyyaml.org/wiki/PyYAMLDocumentation)
    - 해당 모듈 이외에 자신이 잘 알고 있는 방법을 사용해도 됩니다.
---

In [33]:
import yaml

In [35]:
won_dict = {0:'10', 1:'50', 2:'100', 3:'500', 4:'1000', 5:'5000', 6:'10000', 7:'50000'}

In [36]:
########################
# 이 셀부터 코드 작성하세요
########################
# 언젠가 우리는 일일이 손으로 쓰지 못할 만큼 어마무시한 클래스의 숫자를 가진진 다중 분류 문제를 만날 수 있습니다.
# 그러니 f-string을 통해 코딩하는 습관을 기르도록 합시다.

document = f'''
path: /content/Dataset
train: images/train
val: images/val

nc: {len(won_list)}
names: {won_list}

'''
with open('/content/Dataset/money.yaml', 'w') as f:
    f.write(document)

## 3.모델링

### (1) 모델 라이브러리 설치
---

In [37]:
!pip install jedi

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting jedi
  Downloading jedi-0.18.2-py2.py3-none-any.whl (1.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m52.0 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: jedi
Successfully installed jedi-0.18.2


In [38]:
!git clone https://github.com/ultralytics/yolov5

Cloning into 'yolov5'...
remote: Enumerating objects: 15315, done.[K
remote: Counting objects: 100% (9/9), done.[K
remote: Compressing objects: 100% (9/9), done.[K
remote: Total 15315 (delta 3), reused 3 (delta 0), pack-reused 15306[K
Receiving objects: 100% (15315/15315), 14.13 MiB | 12.72 MiB/s, done.
Resolving deltas: 100% (10505/10505), done.


In [39]:
## yolov5 폴더 requirements.txt 수정 필요
## setuptools<=64.0.2

temp_str = 'setuptools<=64.0.2\n'

f = open('/content/yolov5/requirements.txt', 'r')
f_str = f.readlines()
f.close()

f2 = open('/content/yolov5/requirements.txt', 'w')

for idx, val in enumerate(f_str):
    if 'setuptools' in val:
        idx_v = idx
        f_str.remove(val)
        f_str.insert(idx_v, temp_str)

for val in f_str:
    f2.write(val)

f2.close()

In [41]:
!cd yolov5; pip install -r requirements.txt

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


만약 에러가 나면 그냥 한번 더 돌려주시면 됩니다.

### (2) 가중치 파일 다운로드
---
- **세부요구사항**
    - 모델 개발자가 제공하는 사전 학습 가중치 파일을 다운로드 하세요.
        - 해당 과정이 불필요하다면 넘어가셔도 됩니다!
---

pre-trained 모델을 저장할 폴더를 만들어 둡시다

In [42]:
########################
# 이 셀부터 코드 작성하세요
########################
os.mkdir('/content/yolov5/pretrained')

yolov5를 만든 사람들의 github 주소로 가서 pre_trained된 yolov5 모델에 대한 다운로드 링크를 가져와서 파이썬 코드로 다운로드 해봅시다.

**직접 한번 해보세요!**

In [43]:
!wget -O '/content/yolov5/pretrained/yolov5s.pt' 'https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt'

--2023-03-23 14:55:10--  https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt
Resolving github.com (github.com)... 20.205.243.166
Connecting to github.com (github.com)|20.205.243.166|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/264818686/381bd8a8-8910-4e9e-b0dd-2752951ef78c?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230323%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230323T145510Z&X-Amz-Expires=300&X-Amz-Signature=c6e9e46cef2ce32e1357c57e5b5e033707846df8d990598e53118b9e9323b7a8&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=264818686&response-content-disposition=attachment%3B%20filename%3Dyolov5s.pt&response-content-type=application%2Foctet-stream [following]
--2023-03-23 14:55:10--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/264818686/381bd8a8-8910-4e9e-b0dd-2752951ef78c?X-Amz-Algorith

### (3) 학습 : train.py
---
- **세부요구사항**
    - UltraLytics YOLO v5에는 아래의 데이터가 필요합니다.
        - 데이터셋 정보가 담긴 yaml 파일
        - 사용하려는 모델 구조에 대한 yaml 파일
        - 사용하려는 모델의 가중치 파일
---

epoch 한번이 정상적으로 돌아가는지만 확인합시다다

In [44]:
########################
# 이 셀부터 코드 작성하세요
########################
!cd yolov5; python train.py\
    --data '/content/Dataset/money.yaml' \
    --cfg '/content/yolov5/models/yolov5s.yaml' \
    --weights '/content/yolov5/pretrained/yolov5s.pt' \
    --epochs 1000 \
    --patience 5 \
    --img 640 \
    --project 'trained' \
    --name 'train_money' \
    --exist-ok

[34m[1mtrain: [0mweights=/content/yolov5/pretrained/yolov5s.pt, cfg=/content/yolov5/models/yolov5s.yaml, data=/content/Dataset/money.yaml, hyp=data/hyps/hyp.scratch-low.yaml, epochs=1000, batch_size=16, imgsz=640, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, bucket=, cache=None, image_weights=False, device=, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=trained, name=train_money, exist_ok=True, quad=False, cos_lr=False, label_smoothing=0.0, patience=5, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest
[34m[1mgithub: [0mup to date with https://github.com/ultralytics/yolov5 ✅
YOLOv5 🚀 v7.0-122-g78a90c9 Python-3.9.16 torch-1.13.1+cu116 CUDA:0 (Tesla T4, 15102MiB)

[34m[1mhyperparameters: [0mlr0=0.01, lrf=0.01, momentum=0.937, weight_decay=0.0005, warmup_epochs=3.0, warmup_momentum=0.8, warmup_bias_lr=0.1, box=0

## 4.탐지 : detect.py
---
- **세부요구사항**
    - 학습 과정에서 생성된 가중치 파일을 이용하세요.
    - IoU threshold를 0.25 이하로 설정하세요.
    - confidence threshold를 0.75 이상으로 설정하세요.
---
- 여러분이 **직접 촬영한 화폐 사진과 동영상**을 탐지 과정에 이용하여 결과를 확인하세요.
    - 조건
        1. 화폐의 수를 늘려가며 촬영 해보세요.
            - ex) 50원 하나, 50원 둘, 50원 셋, ...
        2. 화폐의 종류를 늘려가며 촬영 해보세요.
            - ex) 50원 하나와 100원 하나, 50원 하나와 100원 하나와 1000원 하나, ...
        3. 사진은 최소 30장 이상, 동영상은 최소 하나 이상 촬영하여 사용 해보세요.
---

In [None]:
########################
# 이 셀부터 코드 작성하세요
########################
