In [26]:
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [27]:
# 데이터 살펴보기
print(train_images.shape)
len(train_labels)

(60000, 28, 28)


60000

In [28]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

In [29]:
print(test_images.shape)
len(test_labels)

(10000, 28, 28)


10000

In [30]:
test_labels

array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

In [31]:
# 신경망 구성
from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation = "relu", input_shape = (28 * 28, ))) # Dense -> 완전연결(full connected)
network.add(layers.Dense(10, activation = "softmax"))

# 컴파일 단계에 포함될 세 가지
# 1. 손실 함수(loss / cost function) : 훈련 데이터에서 신경망의 성능을 측정하는 방법으로 네트워크가 옳은 방향으로 학습될 수 있도록 도와준다.
# 2. 옵티마이저(Optimizer) : 입력된 데이터와 손실 함수를 기반으로 네트워크를 업데이트하는 메커니즘이다.
# 3. 훈련과 테스트 과정을 모니터링할 지표 : 여기서는 정확도(Accuracy)만 고려한다.
network.compile(optimizer = "rmsprop", loss = "categorical_crossentropy", metrics = ["accuracy"])

# 훈련을 시작하기 전에 데이터를 네트워크에 맞는 크기로 바꾸고 모든 값을 0 ~ 1 사이로 스케일을 조정한다.
# 보통 이미지는 픽셀의 최댓값인 255로 나누어 사용한다.
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255

test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype("float32") / 255

# 레이블을 범주형으로 인코딩 한다. (원 핫 인코딩)
from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

# 훈련 데이터 학습
network.fit(train_images, train_labels, epochs = 5, batch_size = 128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x2722b798748>

In [33]:
# 테스트 셋에서도 모델이 잘 작동하는지 확인
test_loss, test_acc = network.evaluate(test_images, test_labels)
print("test_acc : ", test_acc)

test_acc :  0.9823


In [34]:
# 결과 : 훈련 셋 정확도는 약 98.9%, 테스트 셋 정확도는 약 98.2%가 나왔다.
# 훈련 셋 보다 테스트 셋 정확도가 낮은 걸로 보아 과대적합(Overfitting)이 된걸로 추측된다.