#9. FashionMNIST 이미지 분류하기

<img src="https://codetorial.net/tensorflow/_images/fashion_MNIST_sample.png" width=400, height=400/>

Fashion MNIST 이미지 데이터셋

Fashion MNIST 데이터셋은 위 그림과 같이 운동화, 셔츠, 샌들과 같은 작은 이미지들의 모음이며, 기본 MNIST 데이터셋과 같이 열 가지로 분류될 수 있는 28X28 픽셀의 이미지 70,000가지로 이루어져 있습니다.

이번 페이지에서는 Dense 층들로 구성되는 Fully-Connected Neural Network(완전 연결된 인공신경망) 을 이용해서 Fasion Mnist데이터셋을 분류해 보겠습니다.

순서는 아래와 같습니다.

1. Fashion MNIST 데이터셋 불러오기
2. Fashion MNIST 데이터셋 살펴보기
3. Fashion MNIST 데이터셋 전처리하기
4. 모델 구성하기
5. 모델 컴파일하기
6. 모델 훈련하기
7. 모델의 정확도 평가하기
8. 예측하기
9. 뉴런의 개수의 영향
10. 콜백(CallBack)사용하기
11. FashionMNIST 이미지 인식 예제

## Fashion MNIST 데이터셋 불러오기

In [None]:
import tensorflow as tf

# 1. Fashion MNIST 데이터셋 불러오기
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

tf.keras.datasets 모듈은 Neural Network의 훈련에 사용될 수 있는 여러 데이터셋을 포함합니다.

아래와 같은 7가지의 데이터셋이 있습니다.

1. boston_housing
2. cifar10
3. ciar100
4. fashion_mnist
5. imdb
6. mnist
7. reuters

예제에서는 fashion_mnist 데이터셋 모듈을 사용합니다.

fashion_mnist 모듈은 데이터셋을 반환하는 load_data()함수를 포함하는데, load_data()함수를 호출하면 Numpy 어레이의 튜플을 반환합니다.

train_images와 train_labels는 Neural Network 모델의 훈련(training)에 사용되고,

test_images와 test_labels는 테스트(test)에 사용됩니다.

## Fashion MNIST 데이터셋 살펴보기
train_images와 train_labels의 첫 번째 요소를 각각 살펴보겠습니다.

In [None]:
print(train_images[0])
print(train_labels[0])

train_images는 0에서 255 사이의 값을 갖는 28x28 크기의 NumPy 어레이를 갖는 어레이이고,

train_lables는 0에서 9 사의의 정수 값을 갖는 어레이입니다.

0에서 9까지의 정수 값은 이미지(옷)의 클래스를 나타내는 레이블입니다. 각각의 레이블과 클래스는 아래와 같습니다.

0 : T-shirt/top
1 : Trouser
2 : Pullover
3 : Dress
4 : Coat
5 : Sandal
6 : Shirt
7 : Sneaker
8 : Bag
9 : Ankel boot

첫 번째 train_images를 Matplotlib을 이용해서 이미지로 나타내보면, 아래와 같은 이미지가 출력됩니다.

<img src="https://codetorial.net/tensorflow/_images/fashion_MNIST_01.png" width=400 height=300/>

In [None]:
print(train_images.shape)
print(train_labels.shape)
print(test_images.shape)
print(test_labels.shape)

각 어레이의 형태(shape)를 출력해보면,

train_images와 test_images는 각각(28X28)의 형태를 갖는 60000개, 10000개 이미지의 어레이,

train_labels와 test_labels는 각각 0에서 9사이의 정수 형태를 갖는 60000개, 10000개 어레이임을 알 수 있습니다.

## Fashion MNIST 데이터셋 처리하기

In [None]:
#2. 데이터 전처리
train_images, test_images = train_images / 255.0, test_images / 255.0

0에서 255 사이의 값을 갖는 훈련/테스트 데이터들을 0.0~1.0 사이의 값들을 갖도록 변환합니다.

## 모델 구성하기

In [None]:
#3. 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax'),
])

MNIST 인식 예제와 같이 Sequentia() 클래스를 이용해서 신경망 모델을 순서대로 구성합니다.

tf.keras.layers.Faltten 클래스는 아래 그림과 같이 입력 데이터를 1차원으로 변환합니다.

<img src = "https://codetorial.net/tensorflow/_images/fashion_MNIST_02.png"/>

## 모델 컴파일하기

compile()메서드를 이용해서 모델을 훈련하는데 사용할 옵티마이저, 손실 함수, 지표를 설정합니다.

In [None]:
#4. 모델 컴파일
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

손실 함수(loss function)은 훈련 과정에서 모델의 오차를 측정하는 데 사용됩니다.

옵티마이저(optimizer)는 데이터와 손실 함수를 바탕으로 모델(의 웨이트와 바이어스)을 업데이트 하는 방식을 말합니다.

지표(metrics)는 훈련과 테스트 단계를 평가하기 위해 사용됩니다.

'accuracy'로 설정하면, 이미지를 올바르게 분류한 비율로 모델을 평가합니다.

## 모델 훈련하기

In [None]:
#5. 모델 훈련
model.fit(train_images, train_labels, epochs=5)

fit()메서드에 훈련에 사용할 이미지 데이터와 레이블을 입력해줍니다.

에포크(epochs)는 60000개의 전체 이미지를 몇 번 학습할지 설정합니다.

## 모델 정확도 평가하기

evaluate()메서드를 이용해서 손실(loss)과 정확도(accuracy)를 각각 얻을 수 있습니다.

In [None]:
#6. 정확도 평가하기
loss, accuracy = model.evaluate(test_images, test_labels)
print(loss,accuracy)

## 예측하기

predict() 메서드를 사용하면 모델이 각 이미지의 클래스를 예측하는 결과를 확인할 수 있습니다.

In [None]:
#7. 예측하기
import numpy as np

predictions = model.predict(test_images)
print(predictions[0])
print(np.argmax(predictions[0]))

predictions는 각각 test_images에 대한 신경망의 출력값을 나타내는 어레이입니다.

첫 번째 예측 predictions[0]을 출력해보면 10개의 값을 갖는 어레이이며, 입력 이미지 데이터가 열 개의 숫자 중 어떤 숫자일 확률을 의미합니다.

np.argmax()함수를 이용해서 가장 높은 값을 갖는 인덱스를 확인해보면 9를 출력합니다.

즉, 학습된 신경망은 이 이미지가 ankle boot라고 예측합니다.

## 오류가 있는 셀(실행X)

In [None]:
## CASE 1
# 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(128, activation='relu'), ## CASE 1
    #tf.keras.layers.Dense(512, activation='relu'), ## CASE 2
    #tf.keras.layers.Dense(1024, activation='relu'), ## CASE 3
    tf.keras.layers.Dense(10, activation='softmax'),
])
# 모델 컴파일
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
# 모델 훈련
model.fit(train_images, train_labels, epochs=5)

# 정확도 평가
loss1, accuracy1 = model.evaluate(test_images, test_labels)

## CASE 2
# 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    #tf.keras.layers.Dense(128, activation='relu'), ## CASE 1
    tf.keras.layers.Dense(512, activation='relu'), ## CASE 2
    #tf.keras.layers.Dense(1024, activation='relu'), ## CASE 3
    tf.keras.layers.Dense(10, activation='softmax'),
])
# 모델 컴파일
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
# 모델 훈련
model.fit(train_images, train_labels, epochs=5)

# 정확도 평가
loss2, accuracy2 = model.evaluate(test_images, test_labels)

## CASE 3
# 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    #tf.keras.layers.Dense(128, activation='relu'), ## CASE 1
    #tf.keras.layers.Dense(512, activation='relu'), ## CASE 2
    tf.keras.layers.Dense(1024, activation='relu'), ## CASE 3
    tf.keras.layers.Dense(10, activation='softmax'),
])
# 모델 컴파일
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])
# 모델 훈련
model.fit(train_images, train_labels, epochs=5)

# 정확도 평가
loss3, accuracy3 = model.evaluate(test_images, test_labels)

에포크에 다른 손실과 정확도를 그래프로 표현하면 아래와 같습니다.

In [None]:
import matplotlib.pyplot as plt

x = np.arange(1,5,1)

plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.plot(x, loss1, 'r--', x, loss2, 'b--', x, loss3, 'g--')

matplotlib에 대한 지식이 부족

## 뉴런의 개수와 영향

가운데 뉴련층의 뉴런 노드의 개수를 조절하면 훈련에 어떤 영향을 미치는지 알아봅시다.

아래 그림과 같이 뉴런 노드의 개수를 128, 512, 1024로 변화시키면서 세 가지 경우에 대해 훈련 과정의 손실과 정확도를 확인해 보겠습니다.

<img src = "https://codetorial.net/tensorflow/_images/fashion_MNIST_03.png"/>

In [None]:
# 3. 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),      ## CASE 1
    # tf.keras.layers.Dense(512, activation='relu'),    ## CASE 2
    # tf.keras.layers.Dense(1024, activation='relu'),   ## CASE 3
    tf.keras.layers.Dense(10, activation='softmax')
])

에포크에 따른 손실과 정확도를 그래프로 표현하면 아래와 같습니다.

<img src = "https://codetorial.net/tensorflow/_images/fashion_MNIST_04.png"/>

뉴런 노드의 개수가 증가하면 훈련 과정에서 손실 값이 감소하고 테스트 정확도는 증가하는 경향이 있습니다.

하지만 계산과 최적화를 필요로 하는 파라미터의 숫자가 증가하기 때문에 훈련에 걸리는 시간은 증가합니다.

512개와 1024개에서 손실과 정확도의 증가가 크지 않은 이유는 FashionMNISt 분류 문제가 비교적 간단한 문제이기 때문입니다.

따라서 문제에 맞게 적절한 개수의 뉴런을 사용하면서 짧은 훈련 시간 동안 높은 정확도를 얻는 것이 좋습니다.

## 콜백(Callback) 사용하기

tf.keras.callbacks 모듈의 Callback 클래스를 사용하면,

훈련 중에 손실 값이 특정 기준 미만이 되었을 때 훈련을 중단할 수 있습니다.

In [None]:
import tensorflow as tf

class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if logs.get('loss') < 0.3:
      print("\n 훈련을 중지합니다.")
      self.model.stop_training = True
callbacks = myCallback()

# 1. Fashion MNIST 데이터셋 임포트
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# 2. 데이터 전처리
train_images, test_images = train_images / 255.0, test_images / 255.0

# 3. 모델 구성
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(512, activation='relu'),
  tf.keras.layers.Dense(10, activation='softmax')
])

# 4. 모델 컴파일
model.compile(optimizer='adam',
          loss='sparse_categorical_crossentropy',
          metrics=['accuracy'])

# 5. 모델 훈련
model.fit(train_images, train_labels, epochs=5, callbacks=[callbacks])

우선 myCallback 클래스에 조건식을 사용해서 훈련을 중단할 조건을 지정하고,

fit()메서드에 callback 파라미터를 사용해서 이 클래스가 호출되도록 합니다.

op_epoch_end는 각 에포크(epoch)의 끝에 호출되는 메서드입니다.

한 에포크가 끝나고 손실 값(loss)이 0.3 미만이라면 훈련을 중단하도록 해주었습니다.

예제에서 총 5회 에포크의 훈련을 설정했음에도 4회 에포크에서 훈련이 중단되었습니다.

에포크(epoch)에 따른 손실과 정확도는 아래와 같습니다.

<img src = "https://codetorial.net/tensorflow/_images/fashion_MNIST_05.png"/>

## FashionMNIST 이미지 인식 예제

전체 코드는 아래와 같습니다.

In [None]:
import tensorflow as tf
import numpy as np

# 1. Fashion MNIST 데이터셋 임포트
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()


# 2. 데이터 전처리
train_images, test_images = train_images / 255.0, test_images / 255.0


# 3. 모델 구성
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])


# 4. 모델 컴파일
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


# 5. 모델 훈련
model.fit(train_images, train_labels, epochs=5)


# 6. 정확도 평가하기
loss, accuracy = model.evaluate(test_images, test_labels)
print(loss, accuracy)


# 7. 예측하기
predictions = model.predict(test_images)
print(predictions[0])
print(np.argmax(predictions[0]))