In [1]:
import numpy as np
import random
import tensorflow as tf

In [2]:
random.seed(777)
learning_rate = 0.001
batch_size = 100
training_epochs = 15
nb_classes = 10

컴퓨터 프로그램에서 발생하는 무작위 수는 사실 엄격한 의미의 무작위 수가 아니다. 

어떤 특정한 시작 숫자를 정해 주면 컴퓨터가 정해진 알고리즘에 의해 마치 난수처럼 보이는 수열을 생성한다. 

이런 시작 숫자를 `시드`(seed)라고 한다. 

일단 생성된 난수는 다음번 난수 생성을 위한 시드값이 된다. 따라서 시드값은 한 번만 정해주면 된다. 시드는 보통 현재 시각등을 이용하여 자동으로 정해지지만 사람이 수동으로 설정할 수도 있다. 특정한 시드값이 사용되면 그 다음에 만들어지는 난수들은 모두 예측할 수 있다. 이 책에서는 코드의 결과를 재현하기 위해 항상 시드를 설정한다.

In [3]:
(x_train, y_train), (x_test2, y_test) = tf.keras.datasets.mnist.load_data()
print(x_train.shape)

x_train = x_train.reshape(x_train.shape[0], 28 * 28)
x_test = x_test2.reshape(x_test2.shape[0], 28 * 28)

y_train = tf.keras.utils.to_categorical(y_train, nb_classes)
y_test = tf.keras.utils.to_categorical(y_test, nb_classes)

(60000, 28, 28)


In [4]:
tf.model = tf.keras.Sequential()

In [5]:
tf.model.add(tf.keras.layers.Dense(input_dim = 784, units=256,
                                  kernel_initializer='glorot_normal',
                                  activation='relu'))
tf.model.add(tf.keras.layers.Dense(units=256, kernel_initializer='glorot_normal',
                                  activation='relu'))
tf.model.add(tf.keras.layers.Dense(units=nb_classes,
                                  kernel_initializer='glorot_normal',
                                  activation='softmax'))
tf.model.compile(loss='categorical_crossentropy',
                optimizer=tf.keras.optimizers.Adam(lr=learning_rate),
                metrics=['accuracy'])

`glorot_normal`


Glorot 정규분포 초기값 설정기, Xavier 정규분포 초기값 설정기라고도 합니다.

0을 중심으로 `stddev = sqrt(2 / (fan_in + fan_out))`의 표준편차를 가진 절단된 정규분포에 따라 샘플이 생성되는데, 여기서 fan_in이란 가중치 텐서의 입력 유닛의 수를, fan_out은 가중치 텐서의 출력 유닛의 수를 의미합니다.

In [6]:
tf.model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 256)               200960    
_________________________________________________________________
dense_1 (Dense)              (None, 256)               65792     
_________________________________________________________________
dense_2 (Dense)              (None, 10)                2570      
Total params: 269,322
Trainable params: 269,322
Non-trainable params: 0
_________________________________________________________________


In [7]:
history = tf.model.fit(x_train, y_train, batch_size=batch_size,
                      epochs=training_epochs)

Train on 60000 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


In [8]:
y_predicted = tf.model.predict(x_test)
for x in range(0,10):
    random_index = random.randint(0, x_test.shape[0]-1)
    print("index: ", random_index,
         "actual y: ", np.argmax(y_test[random_index]),
         "predicted y: ", np.argmax(y_predicted[random_index]))

index:  3757 actual y:  8 predicted y:  1
index:  7304 actual y:  5 predicted y:  5
index:  7300 actual y:  7 predicted y:  7
index:  6039 actual y:  9 predicted y:  9
index:  9429 actual y:  3 predicted y:  3
index:  4420 actual y:  5 predicted y:  5
index:  5507 actual y:  2 predicted y:  2
index:  8809 actual y:  1 predicted y:  1
index:  654 actual y:  5 predicted y:  5
index:  7302 actual y:  8 predicted y:  8


In [9]:
evaluation = tf.model.evaluate(x_test, y_test)

