In [None]:
# TensorFlow and tf.keras
import tensorflow as tf

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
import os
print(tf.__version__)

In [None]:
fashion_mnist = tf.keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

In [None]:
train_images.shape

In [None]:
len(train_labels)

In [None]:
train_labels

### 데이터 전처리

In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

In [None]:
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])

In [None]:
model.summary()

<img src="https://github.com/keai-kaist/SEP532-2022-Spring/blob/master/Practice_1/imgs/flatten.png?raw=true" align="center" width="600"/>

이미지 형식을 2차원 배열(28 x 28 픽셀)에서 784(28 * 28)의 1차원 배열로 변환합니다. 이 레이어는 모델이 사용할 수 있도록 데이터의 모양을 다시 포맷하기 위한 것이므로 학습된 매개변수가 없습니다.

평면화 레이어 이후의 네트워크는 **Sequence of Dense layers**로 구성됩니다. 첫 번째 조밀한 계층은 비선형 함수(ReLU 활성화)가 있는 은닉 계층입니다. 두 번째는 출력 레이어로, 레이어의 차원은 MNIST의 클래스 수와 동일합니다. 그리고 출력 레이어는 분류를 위해 **softmax 함수**를 사용합니다.

Softmax 함수 $ f_j(z) = \frac{e^{z_j}}{\sum_{K} e^{z_k}}$는 임의의 실수 값으로 구성된 벡터를 가져와 **합이 0과 1** 사이의 값을 갖는 벡터. 이 벡터는 입력 값이 주어지면 예측된 출력 클래스에 대한 확률 분포를 나타냅니다.


### Complie the model 

이 단계에서는 모델 학습을 위한 손실 함수와 최적화 방법을 정의합니다. Keras API에서는 `tf.keras.Model.complie` 함수를 사용하여 수행할 수 있습니다. Compile 함수의 인수는 다음과 같습니다.

- *Loss function*: 모델이 얼마나 정확한지 측정하는 방법을 정의합니다. 훈련 중에 모델을 올바른 방향으로 "조정"하는 이 기능을 최소화하려고 합니다.
- *Optimizer*: 모델이 보는 데이터와 손실 함수를 기반으로 모델이 업데이트되는 방식을 정의합니다.
- *Metric*: 여기에서 Training 및 Test 단계를 모니터링하는 데 사용되는 지표를 정의할 수 있습니다.

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])


### Trainin the model

In [None]:
history = model.fit(train_images, train_labels, epochs=10)

In [None]:
def plot_history(history):
    plt.figure()
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.plot(history.history['loss'])
    plt.legend(['Training'])

    plt.figure()
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.plot(history.history['accuracy'])
    plt.legend(['Training', 'Validation'], loc='lower right')
    plt.show()

plot_history(history)

In [None]:
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nTest accuracy:', test_acc)

In [None]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

In [None]:
predictions = probability_model.predict(test_images)

In [None]:
predictions[0]

In [None]:
np.argmax(predictions[0])

In [None]:
test_labels[0]

In [None]:
def plot_image(i, predictions_array, true_label, img):
    true_label, img = true_label[i], img[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])

    plt.imshow(img, cmap=plt.cm.binary)

    predicted_label = np.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'

    plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                    100*np.max(predictions_array),
                                    class_names[true_label]),
                                    color=color)

In [None]:
def plot_value_array(i, predictions_array, true_label):
    true_label = true_label[i]
    plt.grid(False)
    plt.xticks(range(10))
    plt.yticks([])
    thisplot = plt.bar(range(10), predictions_array, color="#777777")
    plt.ylim([0, 1])
    predicted_label = np.argmax(predictions_array)

    thisplot[predicted_label].set_color('red')
    thisplot[true_label].set_color('blue')

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
    plt.subplot(num_rows, 2*num_cols, 2*i+1)
    plot_image(i, predictions[i], test_labels, test_images)
    plt.subplot(num_rows, 2*num_cols, 2*i+2)
    plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

### Checkpoint 만들기

In [None]:
ckpt_path_for_t1 = "checkpoints/training_1/cp.ckpt"
ckpt_dir_for_t1 = os.path.dirname(ckpt_path_for_t1)

# Create a callback that saves the model's weights
cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=ckpt_path_for_t1,
                                                 save_weights_only=True,
                                                 save_best_only=True,
                                                 verbose=1)

In [None]:
model.fit(train_images, 
          train_labels,  
          epochs=10,
          validation_data=(test_images, test_labels),
          callbacks=[cp_callback])  # Pass callback to training

In [None]:
!ls {ckpt_dir_for_t1}

### load Model

In [None]:
latest = tf.train.latest_checkpoint(ckpt_dir_for_t1)
latest

In [None]:
model2 = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])
model2.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
model2.load_weights(latest)
model2.fit(train_images, train_labels, epochs=5)

In [None]:
# Re-evaluate the model
loss, acc = model.evaluate(test_images, test_labels,verbose=0)
print("Restored model, accuracy: {:5.2f}%".format(100*acc))

### Model 전체 저장하기

In [None]:
model2.save('model2.h5')

In [None]:
# Recreate the exact same model, including its weights and the optimizer
model3 = tf.keras.models.load_model('model2.h5')

# Show the model architecture
model3.summary()


### Model plotting

In [None]:
!pip install graphviz

In [None]:
tf.keras.utils.plot_model(model, 'my_first_model.png', show_shapes=True)