
# 주제 : 여러 의상 사진에서 옷 종류 구분하기
--------------
## 실습 가이드
    1. 데이터를 다운로드하여 Colab에 불러옵니다.
    2. 필요한 라이브러리는 모두 코드로 작성되어 있습니다.
    3. 코드는 위에서부터 아래로 순서대로 실행합니다.
    4. 전체 문제 구성은 좌측 첫 번째 아이콘을 통해 확인할 수 있습니다.

## 데이터 소개
  - 이번 주제의 데이터는 너무나 유명한 fashion MNIST 데이터를 사용합니다.
  ![mnist 이미지](https://rviews.rstudio.com/post/2019-10-31-a-comparison-of-methods-for-predicting-clothing-classes-using-the-fashion-mnist-dataset-in-rstudio-and-python-part-1/index_files/figure-html/unnamed-chunk-8-1.png)

   위의 이미지는 다음과 같은 것을 보여줍니다.  
(a) 28x28의 배열에서 의류의 모습 어떻게 모사되는지   
(b) 각 0-9까지의 다양한 의류 그림의 모습들


   - 데이터 출처: [fashionmnist](https://www.kaggle.com/zalando-research/fashionmnist)

## 최종 목표

  - fashion MNIST 이미지를 클래시피케이션 하기
  - 멀티 클래스와 멀티레이블 구분하기
  - 이미지 확장 하기
  - 이미지에 객체 삽입하기

  - 출제자 : 손근영 강사


In [None]:
import tensorflow as tf
from tensorflow import keras
from keras.layers import Dense
from keras.models import Sequential

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings 
from IPython.display import Image

warnings.filterwarnings('ignore')
%matplotlib inline

SEED = 34

## Step 1. 도입전 기본 처리

### 문제 1. fashion mnist 데이터 살펴보기

In [None]:
# 데이터를 불러오는 코드를 작성해주세요.

### 문제 2. train_images/labels와 test_images/labes의 shape을 출력해보세요.

In [None]:
# 데이터의 크기를 shape 함수를 통해 출력해주세요.

In [None]:
# 레이블을 설정해보세요.
labels = ["T-shirt/top",  # index 0
        "Trouser",      # index 1
        "Pullover",     # index 2 
        "Dress",        # index 3 
        "Coat",         # index 4
        "Sandal",       # index 5
        "Shirt",        # index 6 
        "Sneaker",      # index 7 
        "Bag",          # index 8 
        "Ankle boot"]   # index 9

### 문제 3. (28, 28) 형태의 이미지를 plt을 이용하여 출력해보세요.

In [None]:
# 28x28의 흑백 이미지를 plt를 이용하여 출력하는 코드를 작성해보세요

In [None]:
# plt의 title에 label 정보를 출력해보세요.

### 문제 4. train_images에서 0이 아닌 값들을 출력해보세요.

In [None]:
# 하나의 이미지에 대한 모든 0이 아닌 값을 출력하는 코드를 작성하세요.

In [None]:
# 이미지의 값이 가장 큰 idx와 작은 idx를 구하여 출력해보세요

### 문제 5. train_images의 dtype을 출력해보세요.

In [None]:
# dtype을 이용하여 이미지의 np array type을 확인해보세요.

## Step 2. 전처리

### 문제 6. train/test 이미지 데이터의 범위 확인

In [None]:
# test_images의 shape과 dtype, 0이 아닌 숫자를 출력하는 코드를 작성하세요.

### 문제 7. train/test 이미지 데이터의 최소/최대값을 출력

In [None]:
# train/test 전체 데이터에서 각 images, labels의 min, max를 출력하는 코드를 작성하세요.

### 문제 8. 정수형을 실수형으로 변경 후 dtype으로 비교

In [None]:
# train/test 데이터의 타입을 dtype으로 확인해보고 실수형으로 전환하는 코드를 작성하세요.

### 문제 9. 데이터 0-1 노말라이즈 수행


#### 힌트

일반적으로 0-1사의의 값을 가지게 하기 위해서는 다음 수식을 사용합니다.

$$normalize(x) = \frac{x - 최소값}{최대값 - 최소값}$$

이 경우 최소값이 0이기 떄문에 다음과 같이 간편하게 구할 수 있습니다.

$$normalize(x) = \frac{x}{최대값}$$

In [None]:
# images의 값이 0-1사이의 값을 같도록 코드를 작성해보세요.

In [None]:
# 임의의 구간으로 노말라이즈 할 수 있는 코드를 작성해보세요

### 문제 10. 0-1 노말라이즈 후 데이터의 값이 변경되었는지 문제 6, 7의 방법을 이용하여 확인하세요.

In [None]:
# 노말라이즈 후 min/max, shape, 0이 아닌 값, dtype 등을 확인하는 코드를 작성해보세요. 

In [None]:
# 스케일링 범위를 바꿔서 시도해보세요

## Step 3. 시각화 방법

### 문제 11. train_image의 이미지를 5장 획득하여 (5, 28, 28)의 shape을 출력하세요.

In [None]:
# (60000, 28, 28)인 train_images에서 (5, 28, 28)을 획득하는 코드를 작성하세요.

### 문제 12. 획득한 5장의 의미지를 (28, 28 * 5)의 shape으로 변경해보세요.

In [None]:
# np.hstack은 height 방향의 배열을 풀어서 width 방향으로 연결해줍니다.
# 해당 기능을 쓰면 (height, image_height, image_width)의 shape을 (image_height, image_width * height)으로 바꿔 줄 수 있습니다.
# 코드를 작성해보세요.

### 문제 13. np.hstack은 tensorflow에서 제공하는 방법이 아니므로 transpose 함수를 이용하여 (28, 28 * 5)로 shape을 변경해보세요.

In [None]:
# transpose는 tensor의 axis를 섞는 기능을 합니다.
# 해당 기능을 이용해서 (28, 140)을 작성하는 코드를 작성해보세요.

### 문제 14. (28, 140)이 된 tensor를 plt로 출력해보세요.

In [None]:
# (28, 140)의 이미지를 plt로 출력해보세요.

In [None]:
# 레이블에 따라 5개를 출력하는 함수를 만들어보세요.

## Step 4. Data augmentation - 이미지 확대 및 다객체 추가 방법

### 문제 15. 이미지 한장의 크기를 4배로 확대하고, 객체는 4분면 영역중 랜덤으로 1공간에 넣는 함수를 작성하여보세요.

In [None]:
# 이미지 한장의 크기를 4배로 확대하고, 객체는 4분면 영역중 랜덤으로 1공간에 넣는 함수를 작성하여보세요.

### 문제 16. 4배 이미지 변환을 전체 train/test 데이터에 실행하여 train_expand_images, test_expand_images를 생성하세요.

In [None]:
# 4배 이미지 변환을 전체 train/test 데이터에 실행하여 train_expend_images, test_expend_images를 생성하세요.

### 문제 17. 4배 이미지 변환 함수를 수정하여 이미지 사이즈를 4배 확대 시킨 뒤, 객체를 랜덤으로 0~4개, 랜덤 4분면에 위치시키는 함수를 작성하세요.

In [None]:
# 4배 이미지 변환 함수를 수정하여 이미지 사이즈를 4배 확대 시킨 뒤, 객체를 랜덤으로 1~4개, 랜덤 4분면에 위치시키는 함수를 작성하세요.

### 문제 18. 4배 이미지 변환을 전체 train/test 데이터에 실행하여 train_multi_images, test_multi_images, train_multi_labels, train_multi_labels를 생성하세요.

In [None]:
# 4배 이미지 변환을 전체 train/test 데이터에 실행하여 train_multi_images, test_multi_images, train_multi_labels, train_multi_labels를 생성하세요.

In [None]:
# 개수에 따라 연속된 그림을 보여주는 함수를 작성해보세요

### 문제 19. multi labels와 train_labels의 값의 형태를 비교해보세요.

In [None]:
# multi labels와 train_labels의 값의 형태를 비교해보세요.

### 문제 20. train_labels에서 label들의 분포를 구해보세요.

In [None]:
# 문제 20. train_labels에서 label들의 분포를 히스토그램으로 구해보세요.

### 문제 21. multi labels에서 label들의 분포와  multi images에서 평균 사진 개수 분포를 구하세요.

In [None]:
# 문제 21. multi labels에서 label들의 분포를 히스토그램으로 구해보세요.

In [None]:
# 문제 22. multi images에서 평균 사진 개수 분포를 구하세요

## Step 5. 모델링

### 문제 22. train_expand_images, train_labels로 초벌 모델을 생성해보세요.

In [None]:
# train_expand_images, train_labels로 싱글 label을 처리하는 image classification 초벌 모델을 생성해보세요.

### 문제 23. 모델을 할당 받고 서머리를 출력해보세요.

In [None]:
# single_fashin_mnist_model() 모델을 할당 받고 서머리를 출력하는 코드를 작성하세요.

### 문제 24. 만든 모델에 로스와 옵티마이저, 메트릭을 설정하세요.

In [None]:
# 만든 모델에 loss는 categorical_crossentropy, optimizer는 adam 매트릭은 accuracy으로 설정하는 코드를 작성하세요.

### 문제 25. 만든 모델에 train_expand_images를 학습시켜 보세요.

In [None]:
# train_expand_images, train_labels을 학습시키고 15 epochs을 돌리고 그 진행 사항을 hist에 저장하는 코드를 작성하세요.

### 문제 26. 학습 진행 사항을 출력하세요.

In [None]:
# hist의 accuracy plt의 plot을 이용하여 출력하는 코드를 작성하세요.

## Step 6. 결과 확인

### 문제 27. 완성된 모델에서 test_expand_images를 1장 넣고 결과를 res 변수에 저정하세요.

In [None]:
# 모델에  test_expand_images 중 1장을 넣고 결과를 받는 코드를 작성하세요.

### 문제 28. res의 결과와 실제 label을 비교하고 test_exnpand_images[0]을 plt로 출력하세요.

In [None]:
# res의 결과와 실제 label을 비교하고 test_exnpand_images[0]을 plt로 출력하세요.

## Step 7. 멀티 레이블 모델링

### 문제 29. train_multi_images 와 train_multi_labels를 처리 할 수 있는 모델을 작성하세요.

In [None]:
# 기존 모델의 마지막 layer에 변환을 줘서 multi labels을 처리할 수 있는 모델을 작성하세요.

### 문제 30. 기존 모델을 멀티 모델로 변환하여 모델 서머리를 출력하세요.

In [None]:
# 기존 모델을 멀티 모델로 변환하여 모델 서머리를 출력하세요.

### 문제 31. 문제 25과 같은 세팅으로 train_multi_images를 학습시키세요.

In [None]:
# 문제 25과 같은 세팅으로 train_multi_images를 학습시키세요.

### 문제 32. 완성된 모델에서 test_multi_images를 1장 넣고 결과를 res 변수에 저정한뒤 실제 test_multi_labels와 비교해보세요.

In [None]:
# 완성된 모델에서 test_multi_images를 1장 넣고 결과를 res 변수에 저정한뒤 실제 test_multi_labels와 비교해보세요.

## Step 8. 모델 저장 및 로드, 다운

### 문제 33. 모델을 저장하세요.

In [None]:
# 모델을 저장하는 코드를 작성하세요.

### 문제 34. 모델 파일을 새로운 모델에 로드하세요.

In [None]:
# 모델을 로드하는 코드를 작성하세요.

### 문제 35. 로드한 모델을 test 데이터로 평가해보세요.


In [None]:
# 로드한 모델을 test 데이터로 평가해보세요.

### 문제 36. 모델을 내 컴퓨터에 저장해보세요

In [None]:
# 모델을 내 컴퓨터에 저장해보세요.