# 기본 분류: 의류 이미지 분류

이 튜토리얼에서는 운동화나 셔츠 같은 옷 이미지를 분류하는 신경망 모델을 훈련합니다.

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
import tensorflow as tf
from tensorflow import keras

from sklearn.model_selection import train_test_split

In [None]:
print(tf.__version__, np.__version__)

## - 패션 MNIST 데이터 세트

10개의 범주(category)와 70,000개의 흑백 이미지로 구성된 [패션 MNIST](https://github.com/zalandoresearch/fashion-mnist) 데이터셋을 사용하겠습니다. 이미지는 해상도(28x28 픽셀)가 낮고 다음처럼 개별 옷 품목을 나타냅니다:

<table>
  <tr><td>     <img src="https://tensorflow.org/images/fashion-mnist-sprite.png" alt="Fashion MNIST sprite" width="600">   </td></tr>
  <tr><td align="center">     <b>그림 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">패션-MNIST 샘플</a> (Zalando, MIT License).<br>{nbsp}   </td></tr>
</table>


여기에서 60,000개의 이미지를 사용하여 네트워크를 훈련하고 10,000개의 이미지를 사용하여 네트워크에서 이미지 분류를 학습한 정도를 평가합니다. TensorFlow에서 직접 Fashion MNIST에 액세스할 수 있습니다. TensorFlow에서 직접 [Fashion MNIST 데이터](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/fashion_mnist/load_data)를 가져오고 로드합니다.

## 훈련 세트 분할

In [None]:
fashion_mnist = tf.keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) =  keras.datasets.fashion_mnist.load_data()

load_data() 함수를 호출하면 네 개의 넘파이(NumPy) 배열이 반환됩니다:

- `train_images`와 `train_labels` 배열은 모델 학습에 사용되는 *훈련 세트*입니다.
- `test_images`와 `test_labels` 배열은 모델 테스트에 사용되는 *테스트 세트*입니다.

이미지는 28x28 크기의 넘파이 배열이고 픽셀 값은 0과 255 사이이다. *레이블*(label)은 0에서 9로 분류한 의류 이름이다.


```
0	T-shirt/top
1	Trouser
2	Pullover
3	Dress
4	Coat
5	Sandal
6	Shirt
7	Sneaker
8	Bag
9	Ankle boot
```


In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

## 데이터 탐색

훈련 세트에 60,000개의 이미지 각 이미지는 28x28 픽셀:

In [None]:
train_images.shape

비슷하게 훈련 세트에는 60,000개의 레이블이 있습니다:

In [None]:
train_labels.shape

각 레이블은 0과 9사이의 정수입니다:

In [None]:
train_labels[:20]

테스트 세트에는 10,000개의 이미지가 있습니다. 이 이미지도 28x28 픽셀로 표현됩니다:

In [None]:
test_images.shape

테스트 세트는 10,000개의 이미지에 대한 레이블을 가지고 있습니다:

In [None]:
test_labels[:20]

## 데이터 전처리

훈련 세트에 있는 첫 번째 이미지를 보면 픽셀 값의 범위가 0~255 사이라는 것을 알 수 있습니다:

In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

255로 나누어 0-1 사이 값으로 정규화 한다. *훈련 세트*와 *테스트 세트*를 동일한 방식으로 전처리하는 것이 중요하다:

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

훈련 세트*에서 처음 25개 이미지와 그 아래 클래스 이름 출력

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## 모델 구성


### 층 설정

keras 의  [*레이어*](https://www.tensorflow.org/api_docs/python/tf/keras/layers) 클래스를 사용해  층을 연결하여 구성한다. 

In [None]:
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])


### 모델 컴파일

모델의 [*컴파일*](https://www.tensorflow.org/api_docs/python/tf/keras/Model#compile) 파라미터:

- [*손실 함수*](https://www.tensorflow.org/api_docs/python/tf/keras/losses) - 훈련 중 모델이 얼마나 정확한지 측정합니다. 모델을 올바른 방향으로 "조정"하려면 이 함수를 최소화해야 합니다.
- [*옵티마이저*](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers) - 모델이 인식하는 데이터와 해당 손실 함수를 기반으로 모델이 업데이트되는 방식입니다.
- [*메트릭*](https://www.tensorflow.org/api_docs/python/tf/keras/metrics) — 훈련 및 테스트 단계를 모니터링하는 데 사용됩니다. 다음 예에서는 올바르게 분류된 이미지의 비율인 *정확도*를 사용합니다.

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

## 모델 훈련

신경망 모델을 훈련하려면 다음 단계가 필요합니다.

1. 훈련 데이터를 모델에 주입: `train_images`와 `train_labels` 배열
2. 모델의 예측을 만들어 `test_images` 를 예측하고,  이 예측이 `test_labels` 배열의 레이블과 맞는지 확인한다.


모델이 훈련되면서 손실과 정확도 지표가 출력된다. 

In [None]:
from tqdm import tqdm
from tqdm.keras import TqdmCallback

In [None]:
history = model.fit(train_images, train_labels, epochs=10, verbose=0, callbacks=[TqdmCallback()])

이 모델은 훈련 세트에서 약 91% 정도의 정확도를 달성합니다.

In [None]:
# Fashion MNIST 분류 모델 학습 결과 시각화
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], 'b-', label='loss')
# plt.plot(history.history['val_loss'], 'r--', label='val_loss')
plt.xlabel('Epoch')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], 'g-', label='accuracy')
# plt.plot(history.history['val_accuracy'], 'k--', label='val_accuracy')
plt.xlabel('Epoch')
plt.ylim(0.7, 1)
plt.legend()

plt.show()

### 정확도 평가



In [None]:
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print(test_loss, test_acc)

테스트 세트의 정확도가 훈련 세트의 정확도보다 조금 낮습니다. 훈련 세트의 정확도와 테스트 세트의 정확도 사이의 차이는 *과대적합*(overfitting) 때문입니다. 


## ex) 검증 정확도/손실율을 사용해서 그래프에 지표를 출력해 보자

val_loss, val_accuracy 는 fit() 학습시 validation_split 를 사용해서 얻을 수 있다.

In [None]:
# history = model.fit(train_scaled, train_target, epochs=, validation_split=, verbose=0, callbacks=)

In [None]:
history.history.keys()

In [None]:
plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], 'b-', label='loss')
plt.plot(history.history['val_loss'], 'r--', label='val_loss')
plt.xlabel('Epoch')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], 'g-', label='accuracy')
plt.plot(history.history['val_accuracy'], 'k--', label='val_accuracy')
plt.xlabel('Epoch')
plt.ylim(0.7, 1)
plt.legend()

plt.show()

## ex) 분류 모델에서 손실함수를 `mse` 로 쓰면?

In [None]:
model.compile(optimizer='adam', loss='mse', metrics='accuracy')

In [None]:
history = model.fit(train_scaled, train_target, epochs=25, validation_split=0.25, verbose=0, callbacks=[TqdmCallback()])

크로스 엔트로피로 학습한 결과는 89% 정확도를 보여주었었다.

In [None]:
model.evaluate(val_scaled, val_target)

In [None]:
history.history.keys()

In [None]:
# Fashion MNIST 분류 모델 학습 결과 시각화
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], 'b-', label='loss')
plt.plot(history.history['val_loss'], 'r--', label='val_loss')
plt.xlabel('Epoch')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], 'g-', label='accuracy')
plt.plot(history.history['val_accuracy'], 'k--', label='val_accuracy')
plt.xlabel('Epoch')
plt.ylim(0.7, 1)
plt.legend()

plt.show()

## 훈련된 모델 사용하기

훈련된 모델에 테스트 샘을을 사용해서 예측/분류를 수행해 보자.

In [None]:
def plot_image(i, predictions_array, true_label, img):
    true_label, img = true_label[i], img[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])

    plt.imshow(img, cmap=plt.cm.binary)

    predicted_label = np.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'

    plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*np.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
    true_label = true_label[i]
    plt.grid(False)
    plt.xticks(range(10))
    plt.yticks([])
    thisplot = plt.bar(range(10), predictions_array, color="#777777")
    plt.ylim([0, 1])
    predicted_label = np.argmax(predictions_array)

    thisplot[predicted_label].set_color('red')
    thisplot[true_label].set_color('blue')

### 학습한 모델을 확률 모델로 만들기



In [None]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

### 한 이미지 예측하기


In [None]:
img = test_images[1]

print(img.shape)

이미지를 사용할 때에도 2차원 배열로 만들어야 한다.

In [None]:
img = (np.expand_dims(img,0))

print(img.shape)

이제 이 이미지의 예측을 만듭니다. 한 이미지에 대한 예측은 대상 클래스 분류인 10개의 옷 품목에 상응하는 모델의 신뢰도(confidence)를 나타낸다. 

In [None]:
predictions_single = probability_model.predict(img)

print(predictions_single)

가장 높은 신뢰도를 가진 레이블을 확인해 보자.

In [None]:
np.argmax(predictions_single[0])

이 레이블을 출력해 보자

In [None]:
plot_value_array(1, predictions_single[0], test_labels)

_ = plt.xticks(range(10), class_names, rotation=45)
plt.show()

예상과 같이 모델이 레이블을 예측합니다.

### 테스트 샘플로 예측하기

테스트 샘플에 대한 예측을 수행해 보자.

In [None]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

In [None]:
predictions = probability_model.predict(test_images)

여기서는 테스트 세트에 있는 각 이미지의 레이블을 예측했습니다. 첫 번째 예측을 확인해 보죠:

In [None]:
predictions[0]

In [None]:
np.argmax(predictions[0])

In [None]:
class_names[9]

모델은 이 이미지가 앵클 부츠(`class_name[9]`)라고 가장 확신하고 있습니다. 이 값이 맞는지 테스트 레이블을 확인해 보죠:

In [None]:
test_labels[0]

### 예측 확인

훈련된 모델을 사용하여 일부 이미지에 대한 예측을 수행할 수 있습니다.

0번째 원소의 이미지, 예측, 신뢰도 점수 배열을 확인해 보겠습니다.

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))

for i in range(num_images):
    plt.subplot(num_rows, 2*num_cols, 2*i+1)
    plot_image(i, predictions[i], test_labels, test_images)
    plt.subplot(num_rows, 2*num_cols, 2*i+2)
    plot_value_array(i, predictions[i], test_labels)

plt.tight_layout()
plt.show()