# Fashion MNIST

### 데이터 가져오기

In [1]:
import tensorflow as tf

data = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = data.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


### Normalization (정규화)

이미지 픽셀 값을 0 ~ 1 사이의 값으로 바꿈

In [2]:
training_images  = training_images / 255.0
test_images = test_images / 255.0

### 신경망 정의

In [3]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

### Loss function & Optimizer

In [5]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

sparse_categorical_crossentropy : 하나의 숫자를 예측하는 것이 아니라 하나의 카테고리를 선택  

`metrics=['accuracy']` : loss 와 accuracy 동시 출력

### Train

In [6]:
model.fit(training_images, training_labels, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fb910bb5610>

### Evaluate

In [7]:
model.evaluate(test_images, test_labels)



[0.3698198199272156, 0.8691999912261963]

모델 정확도 = 86.92%

### Predict

In [8]:
classifications = model.predict(test_images)
print(classifications[0])
print(test_labels[0])

[1.2457368e-06 1.9189658e-08 6.2559218e-07 4.5600935e-08 3.8794947e-06
 1.2112443e-03 8.9519399e-06 2.8383078e-02 2.2114384e-05 9.7036874e-01]
9


첫 번째 의류 아이템의 실제 label 은 9 이기 때문에 배열의 마지막 값이 가장 작은 것을 확인할 수 있다.  

즉, 97.0% 확률로 label 9 이라고 출력한 것이다.

### Overfitting (과대 적합)

모델이 훈련 세트에 과하게 적합한 상태가 되어 **일반성이 떨어지는** 현상

In [9]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=50)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.History at 0x7fb910a9a460>

In [11]:
model.evaluate(test_images, test_labels)



[0.4983988404273987, 0.8870999813079834]

Train-set 의 정확도는 크게 높아졌지만 Test-set 에 대한 정확도는 조금만 향상되었다.  

오래 훈련했기 때문에 더 높은 성능이 나오긴 했지만 항상 이러한 결과가 나오지는 않는다.

### Train 조기 종료

원하는 정확도에 도달하면 훈련을 멈추게 하는 방법 → Callback 콜백 사용

In [16]:
class myCallback(tf.keras.callbacks.Callback):
    def on_epoch_end(self, epoch, logs=None):       # epoch가 끝날 때마다
        if(logs.get('accuracy') > 0.90):            # 정확도를 체크
            print("\n정확도 90%에 도달하여 훈련을 멈춥니다!")
            self.model.stop_training = True

In [17]:
callbacks = myCallback()

In [18]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(training_images, training_labels, epochs=50, callbacks=[callbacks])

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
정확도 90%에 도달하여 훈련을 멈춥니다!


<keras.callbacks.History at 0x7fb910900c70>