In [None]:
# 필요한 라이브러리
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

# 데이터 준비
# 1. MNIST 데이터 불러오기
(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()
print(X_train.shape)             # 학습용 데이터의 모양
print(y_train.shape)             # 레이블 데이터의 모양

# 2. 데이터 전처리: 데이터 모양 재설정(3차원)
X_train = np.expand_dims(X_train, axis = -1)
X_test = np.expand_dims(X_test, axis = -1)

# 3. 데이터 전처리: Normalize
X_train = X_train /255
X_test = X_test/255

# 3. 데이터 전처리: 학습용 데이터에서 검즘용 데이터 분할
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train,
                                                  test_size = 0.2,
                                                  random_state = 14)
print(X_train.shape)             # 학습용 데이터의 모양
print(X_val.shape)               # 검증용 데이터의 모양

# CNN 모델 생성
# 1. 모델 생성함수 설정
def create_model():
    model = tf.keras.Sequential()
    model.add(tf.keras.layers.Conv2D(filters = 32,
                                     kernel_size = (3, 3),
                                     strides = 1,
                                     padding = 'same',
                                     activation = 'relu',
                                     input_shape = (28, 28, 1)))
    model.add(tf.keras.layers.MaxPool2D((2, 2)))
    model.add(tf.keras.layers.Conv2D(filters = 64,
                                     kernel_size = (3, 3),
                                     strides = 1,
                                     padding = 'same',
                                     activation = 'relu'))
    model.add(tf.keras.layers.MaxPool2D((2, 2)))
    model.add(tf.keras.layers.Conv2D(filters = 128,
                                     kernel_size = (3, 3),
                                     strides = 1,
                                     padding = 'same',
                                     activation = 'relu'))
    model.add(tf.keras.layers.Flatten())
    model.add(tf.keras.layers.Dense(units = 10, activation = 'softmax'))

    return model

model = create_model()              # 모델 구조 확인
print(model.summary())

# 2. 모델 컴파일
model.compile(loss = 'sparse_categorical_crossentropy',
              optimizer = 'adam',
              metrics = ['acc'])

# 3. 학습 진행
history = model.fit(X_train, y_train, batch_size = 64,
          epochs = 10, validation_data = (X_val, y_val))

# 4. 학습 결과 확인
print(history.history)

plt.figure(figsize = (12, 5))        # 학습 결과 시각화
plt.plot(history.history['loss'], label = 'loss')
plt.plot(history.history['val_loss'], label = 'val_loss')
plt.legend()
plt.show()

# 5. 모델 성능 평가
model.evaluate(X_test, y_test)