<a href="https://colab.research.google.com/github/FutureOfTed/AI-class/blob/main/Week7/digits_DNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import matplotlib.pyplot as plt
from sklearn import datasets, metrics
from sklearn.model_selection import train_test_split
import tensorflow as tf
from tensorflow.keras import layers, models

In [2]:
digits = datasets.load_digits()

In [5]:
# 1️⃣ 데이터 준비 및 분할
# digits.data: 특성 데이터 (이미지)
# digits.target: 레이블 데이터
# (1797, 64) 형태의 데이터를 (1797, 8, 8)로 변환할 필요는 없지만,
# Fashion MNIST와 유사하게 (이미지 수, 픽셀 수) 형태로 사용
x_data = digits.data
y_data = digits.target

# Scikit-learn 함수를 사용하여 훈련/테스트 데이터 분할
x_train, x_test, y_train, y_test = train_test_split(
    x_data, y_data, test_size=0.2, random_state=42
)

In [7]:
# 2️⃣ 정규화 (0~1)
# digits 데이터셋은 0부터 16까지의 픽셀 값을 가짐
x_train = x_train / 16.0
x_test = x_test / 16.0

In [8]:
# 3️⃣ 데이터 형태 확인
# digits 데이터는 이미 (샘플 수, 64) 형태로 평탄화되어 있음
# 따라서 Flatten 레이어의 input_shape를 (64,)로 변경해야 함
# (Fashion MNIST는 28*28=784, Digits는 8*8=64)
print("x_train shape:", x_train.shape) # (1437, 64)
print("x_test shape:", x_test.shape)   # (360, 64)

x_train shape: (1437, 64)
x_test shape: (360, 64)


In [9]:
# 4️⃣ DNN 모델 구성
model_dnn = models.Sequential([
    # digits 이미지는 8x8=64 픽셀이므로, input_shape를 (64,)로 설정
    # 데이터가 이미 평탄화되어 있으므로, Flatten은 (64,)를 입력받음
    layers.Flatten(input_shape=(64,)),
    layers.Dense(256, activation='relu'),
    layers.Dropout(0.3),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.3),
    layers.Dense(10, activation='softmax') # 0~9까지 10개의 클래스
])

  super().__init__(**kwargs)


In [10]:
# 5️⃣ 컴파일
model_dnn.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

In [11]:
# 6️⃣ 학습
print("\n--- Digits DNN 모델 학습 시작 ---")
history_dnn = model_dnn.fit(
    x_train, y_train,
    epochs=10,
    # validation_split을 훈련 데이터에서 0.1로 지정
    validation_split=0.1,
    batch_size=32, # 데이터셋 크기가 작으므로 배치 사이즈를 줄임
    verbose=2
)


--- Digits DNN 모델 학습 시작 ---
Epoch 1/10
41/41 - 3s - 72ms/step - accuracy: 0.3171 - loss: 2.2436 - val_accuracy: 0.4792 - val_loss: 2.1476
Epoch 2/10
41/41 - 1s - 22ms/step - accuracy: 0.5700 - loss: 1.9548 - val_accuracy: 0.6319 - val_loss: 1.6838
Epoch 3/10
41/41 - 0s - 6ms/step - accuracy: 0.6814 - loss: 1.4301 - val_accuracy: 0.7569 - val_loss: 1.1050
Epoch 4/10
41/41 - 0s - 5ms/step - accuracy: 0.7602 - loss: 0.9872 - val_accuracy: 0.8611 - val_loss: 0.7848
Epoch 5/10
41/41 - 0s - 7ms/step - accuracy: 0.7951 - loss: 0.7510 - val_accuracy: 0.8750 - val_loss: 0.5798
Epoch 6/10
41/41 - 0s - 4ms/step - accuracy: 0.8399 - loss: 0.6044 - val_accuracy: 0.9028 - val_loss: 0.4797
Epoch 7/10
41/41 - 0s - 5ms/step - accuracy: 0.8739 - loss: 0.4974 - val_accuracy: 0.9167 - val_loss: 0.4052
Epoch 8/10
41/41 - 0s - 5ms/step - accuracy: 0.8693 - loss: 0.4574 - val_accuracy: 0.9097 - val_loss: 0.3664
Epoch 9/10
41/41 - 0s - 4ms/step - accuracy: 0.8824 - loss: 0.4158 - val_accuracy: 0.9028 - val_l

In [12]:
# 7️⃣ 평가
print("\n--- 테스트 데이터로 모델 평가 ---")
test_loss, test_acc = model_dnn.evaluate(x_test, y_test, verbose=2)
print(f"✅ Digits DNN Test Accuracy: {test_acc:.4f}")


--- 테스트 데이터로 모델 평가 ---
12/12 - 0s - 4ms/step - accuracy: 0.9306 - loss: 0.2792
✅ Digits DNN Test Accuracy: 0.9306
