# 딥러닝으로 패션 MNIST 분류하기

In [None]:
# 경고 무시
from warnings import filterwarnings
filterwarnings("ignore")

### 텐서플로우와 케라스 라이브러리 import 및 버전 확인

In [None]:
import tensorflow as tf
from tensorflow import keras

print(tf.__version__)
print(keras.__version__)

## 패션 MNIST 데이타셋
- 패션 아이템 이미지
- 28*28 픽셀 크기의 흑백이미지 70,000개
    - 케라스에서 60,000개의 학습 데이타셋, 10,000개의 테스트 데이타셋으로 제공
- 10개의 클래스
    - T-shirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker, Bag, Ankle boot
- 픽셀 강도 
    - 0 ~ 255의 정수로 표현

<img src="./img/fashon-mnist.png" width=600 align="left">

### 1. Fashion-MNIST 데이터셋 로드하기
### 1) 데이타 로드

In [None]:
from tensorflow.keras.datasets.fashion_mnist import load_data



### 2) 데이터 이미지로 그려보기

In [None]:
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(777)

# Fashion-MNIST의 레이블에 해당하는 품목입니다.
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

sample_size = 9
# 0 ~ 59999의 범위에서 무작위로 3개의 정수 추출
random_idx = np.random.randint(60000, size=sample_size) 

plt.figure(figsize = (5, 5))
for i, idx in enumerate(random_idx):
    plt.subplot(3, 3, i+1)
    plt.xticks([])
    plt.yticks([])
    plt.imshow(x_train[idx], cmap = 'gray') 
    plt.xlabel(class_names[y_train[idx]]) 
    
plt.show()

### 2. 피쳐 전처리/레이블 범주형 데이타로 변경하기

In [None]:
# 피쳐 값의 정규화 : 범위를 0 ~ 1로 만든다.


# 레이블 범주화 
from tensorflow.keras.utils import to_categorical



### 3. 검증 데이타셋 만들기

In [None]:
from sklearn.model_selection import train_test_split

# 학습/검증 데이터셋을 0.7/0.3의 비율로 분리합니다.

# 데이타 형태 확인
print(x_train.shape, y_train.shape)
print(x_val.shape, y_val.shape)
print(x_test.shape, y_test.shape)

### 4. 딥러닝 모델 구성하기

### 4.1 첫 번째 모델 

### 1) 첫번째 모델 구성하기

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten



# 1) 입력층 : (28, 28) -> 28 * 28 = 784

# 2) 은닉층1 : 64개의 출력을 가지는 Dense 층

# 3) 은닉층2 : 32개의 출력을 가지는 Dense 층

# 4) 출력층 : 10개의 출력을 가지는 Dense 층


In [None]:
# 모델 요약


- Param #
    - 1) 입력층(flatten) 
    - 2) 은닉층1(dense) = 784(입력) X 64(은닉층1 노드) + 64(biases) = 50,240개
    - 3) 은닉층2(dense_1) = 64(은닉층1 노드) X 32(은닉층2 노드) + 32(biases) = 2,080개
    - 4) 출력층(dense_2) = 32(은닉츠2 노드) X 10(출력개수) + 10(biases) = 330개

###  2) 컴파일 설정

In [None]:
# 최적화 함수 : adam
# 손실 함수 : 'categorical_crossentropy'
# 모니터링 할 평가지표 : 'acc'

### 3) 모델 실행

### 4) 모델 평가

In [None]:
# 첫번째 모델 평가하기


### 5) Early_stopping  콜백 사용하여 모델 학습

In [None]:
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping
import os

MODEL_DIR = './model/'
if not os.path.exists(MODEL_DIR):
    os.mkdir(MODEL_DIR)

modelpath="./model/{epoch:02d}-{val_loss:.4f}.hdf5"
checkpointer = ModelCheckpoint(filepath=modelpath, monitor='val_loss', verbose=1, save_best_only=True)
early_stopping_callback = EarlyStopping(monitor='val_loss', patience=10)

In [None]:
# Early_stopping 콜백을 이용한 모델 평가하기


### 4.2 두 번째 모델 

### 1) 모델 구성하기

In [None]:


# 1) 입력층 : (28, 28) -> 28 * 28 = 784

# 2) 은닉층1 : 128개의 출력을 가지는 Dense 층

# 3) 은닉층2: 64개의 출력을 가지는 Dense 층

# 4) 은닉층3 : 32개의 출력을 가지는 Dense 층

# 5) 출력층 : 10개의 출력을 가지는 Dense 층


In [None]:
# 모델 요약


### 2) 컴파일 설정

In [None]:
# 최적화 함수: adam
# 손실 함수: categorical_crossentropy
# 모니터링 할 평가지표: acc(정확도)

### 3) 모델 학습

### 4) 모델 평가

In [None]:
# 두번째 모델 평가


### 5) 두번째 모델을 이용한 예측

In [None]:
import numpy as np
np.set_printoptions(precision=7) # numpy 소수점 제한

results = second_model.predict(x_test)

print(results.shape)
print(f'각 클래스에 속할 확률 : \n{results[0]}')
print(f'예상 클래스 : {results[0].argmax()}')

### 6) 예측한 데이타 이미지로 확인하기

In [None]:
import matplotlib.pyplot as plt

arg_results = np.argmax(results, axis = -1) # 가장 큰 값의 인덱스를 가져옵니다.
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 예측 결과를 이미지로 보여주기
plt.imshow(x_test[0].reshape(28, 28))
title = 'Predicted value of the first image : ' + str(arg_results[0]) + ', ' + class_names[arg_results[0]]
plt.title(title, fontsize = 12)
plt.show()

### 5. 두 모델의 학습 과정 그려보기

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def draw_loss_acc(history_1, history_2, epochs):
    his_dict_1 = history_1.history
    his_dict_2 = history_2.history
    keys = list(his_dict_1.keys())
    
    epochs = range(1, epochs)
    fig = plt.figure(figsize = (8,6))
    ax = fig.add_subplot(1, 1, 1)
    
    # axis 선과 ax의 축 레이블 제거
    ax.spines['top'].set_color('none')
    ax.spines['bottom'].set_color('none')
    ax.spines['left'].set_color('none')
    ax.spines['right'].set_color('none')
    ax.tick_params(labelcolor='w', top=False, bottom=False, left=False, right=False)
    
    for i in range(len(his_dict_1)):
        temp_ax = fig.add_subplot(2, 2, i + 1)
        temp = keys[i%2]
        val_temp = keys[(i + 2)%2 + 2]
        temp_history = his_dict_1 if i < 2 else his_dict_2
        temp_ax.plot(epochs, temp_history[temp][1:], color = 'blue', label = 'train_' + temp)
        temp_ax.plot(epochs, temp_history[val_temp][1:], color = 'orange', label = val_temp)
        if(i == 1 or i == 3):
            start, end = temp_ax.get_ylim()
            temp_ax.yaxis.set_ticks(np.arange(np.round(start, 2), end, 0.01))            
        temp_ax.legend()
    ax.set_ylabel('loss', size = 15)
    ax.set_xlabel('epochs', size = 15)
    plt.tight_layout()
    plt.show()
    
draw_loss_acc(first_history, second_history, 30)