In [6]:
# 첫 번째 셀: 필요한 라이브러리 임포트
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.datasets import mnist
from sklearn.model_selection import train_test_split

In [7]:
# 두 번째 셀: 데이터 로드 및 전처리
# MNIST 데이터 세트를 로드합니다.
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 픽셀 값을 0과 1 사이로 정규화합니다.
x_train = x_train / 255.0
x_test = x_test / 255.0

# 데이터 형태를 CNN 입력 형태로 변환합니다. (이미지 높이, 이미지 너비, 채널 수)
x_train = x_train.reshape(-1, 28, 28, 1)
x_test = x_test.reshape(-1, 28, 28, 1)

# 레이블을 원-핫 인코딩으로 변환합니다.
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# 학습 데이터(x_train, y_train)를 학습 및 검증 세트로 분리합니다.
# 여기서 random_state를 설정하여 데이터 분리 결과를 고정합니다.
x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, test_size=0.2, random_state=2024)

In [8]:
# 세 번째 셀: 모델 구성
# CNN 모델을 정의합니다.
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Dropout(0.2),  # 과적합 방지를 위한 드롭아웃 추가
    
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Dropout(0.3),
    
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.4),
    Dense(10, activation='softmax')  # 10개의 클래스
])

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [9]:
# 네 번째 셀: 모델 컴파일
# 손실 함수와 옵티마이저, 평가지표 설정
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

In [10]:
# 다섯 번째 셀: 모델 학습
# 학습 과정을 설정하고, 일부 데이터를 검증 세트로 사용하여 학습합니다.
from sklearn.model_selection import train_test_split

# x_train과 y_train을 학습과 검증 세트로 분리 (random_state=2024 적용)
x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, test_size=0.2, random_state=2024)

# 검증 세트를 명시적으로 전달하여 학습
history = model.fit(x_train, y_train, epochs=10, batch_size=32, validation_data=(x_val, y_val))

Epoch 1/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 8ms/step - accuracy: 0.8088 - loss: 0.5831 - val_accuracy: 0.9755 - val_loss: 0.0832
Epoch 2/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 8ms/step - accuracy: 0.9679 - loss: 0.1082 - val_accuracy: 0.9815 - val_loss: 0.0600
Epoch 3/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 8ms/step - accuracy: 0.9745 - loss: 0.0842 - val_accuracy: 0.9842 - val_loss: 0.0509
Epoch 4/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 8ms/step - accuracy: 0.9792 - loss: 0.0666 - val_accuracy: 0.9851 - val_loss: 0.0461
Epoch 5/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 8ms/step - accuracy: 0.9825 - loss: 0.0558 - val_accuracy: 0.9876 - val_loss: 0.0401
Epoch 6/10
[1m1200/1200[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 8ms/step - accuracy: 0.9842 - loss: 0.0485 - val_accuracy: 0.9870 - val_loss: 0.0399
Epoch 7/10

In [11]:
# 여섯 번째 셀: 모델 평가 및 손실/정확도 차이 계산
# 검증 세트와 테스트 세트에 대해 모델을 평가하고, 결과를 출력합니다.
val_loss, val_accuracy = model.evaluate(x_train, y_train, verbose=0)
test_loss, test_accuracy = model.evaluate(x_test, y_test, verbose=0)

print(f"검증 세트 - 손실: {val_loss:.4f}, 정확도: {val_accuracy:.4f}")
print(f"테스트 세트 - 손실: {test_loss:.4f}, 정확도: {test_accuracy:.4f}")
print(f"손실 차이: {abs(val_loss - test_loss):.4f}")
print(f"정확도 차이: {abs(val_accuracy - test_accuracy):.4f}")

검증 세트 - 손실: 0.0086, 정확도: 0.9975
테스트 세트 - 손실: 0.0276, 정확도: 0.9915
손실 차이: 0.0190
정확도 차이: 0.0060


In [12]:
# 일곱 번째 셀: 모델 저장
# 최종 학습된 모델을 .keras 확장자로 저장합니다.
model.save("final_model.keras")