# 과제: 손글씨 숫자 분류기 만들기


## 과제 목표
MNIST 데이터셋을 사용하여 간단한 신경망(MLP)을 설계하고 손글씨 숫자를 분류하세요.

## 조건 및 요구사항

### 1. 데이터셋
- **데이터**: MNIST 데이터셋 (케라스에서 제공).
- **데이터 분할**: 훈련 데이터와 테스트 데이터로 나누어 사용.
- **정규화**: 입력 데이터를 0~1 범위로 정규화.

In [1]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

## 데이터 준비
data = mnist.load_data()
## 데이터 분할
(x_train, y_train), (x_test, y_test) = data
## 데이터 정규화 (0 - 1 범위)
x_train = x_train.astype('float32')/255.0
x_test = x_test.astype('float32')/255.0

### 2. 모델 구조
- **신경망 구조**:
  - 은닉층: 1개.
  - 은닉층의 뉴런 수: `128`.
  - 은닉층의 활성화 함수: `ReLU`.
  - 출력층: 10개의 뉴런과 `softmax` 활성화 함수.
- **모델 구성**: `tensorflow.keras.Sequential`을 사용하여 구성.

In [2]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

## 모델 구성
model = Sequential([
    ## 이미지를 일차원 벡터로 변환
    Flatten(input_shape=(28, 28)),

    ## 은닉층은 1개이고 활성화 함수는 ReLU, 뉴런수는 128개
    Dense(128, activation='relu'),

    ## 출력층은 10개의 뉴런, 활성화 함수는 softmax
    Dense(10, activation='softmax')
])

  super().__init__(**kwargs)


### 3. 모델 컴파일
- **손실 함수**: `categorical_crossentropy`.
- **옵티마이저**: `adam`.
- **평가지표**: `accuracy`.


In [3]:
## 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

### 4. 훈련
- **에포크 수**: `5`.
- **배치 크기**: `32`.


In [4]:
## 훈련을 진행할 때 target과 output의 shape이 안맞아 to_categorical을 통해 2D배열로 변환
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

model.fit(x_train, y_train, batch_size=32, epochs = 5)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 4ms/step - accuracy: 0.8761 - loss: 0.4242
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.9652 - loss: 0.1194
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 4ms/step - accuracy: 0.9771 - loss: 0.0743
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 3ms/step - accuracy: 0.9832 - loss: 0.0564
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 4ms/step - accuracy: 0.9878 - loss: 0.0424


<keras.src.callbacks.history.History at 0x7d792115c4f0>

### 5. 성능 평가
- **훈련 후**: 테스트 데이터에서 모델의 정확도를 출력하세요.


In [12]:
## 테스트 데이터를 통해 정확도 예측
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f'Test Accuracy: {test_acc}')

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.9707 - loss: 0.0955
Test Accuracy: 0.9746000170707703



## 출력 결과 예시
1. **정확도 출력**:
   - 훈련 정확도와 테스트 정확도를 출력하세요.
2. **새로운 데이터 예측**:
   - 테스트 데이터 첫 번째 샘플에 대한 모델의 예측 값과 실제 값을 출력하세요.

In [13]:
import numpy as np
## 정확도 예측 결과
print(f'Test Accuracy: {test_acc}')
## test데이터의 첫번째 샘플
test_first_sample = x_test[0]
## test데이터 첫번째 샘플 배치 처리(배치크기, 높이, 너비)
test_first_sample = test_first_sample.reshape((1, 28, 28))
## 단일 샘플 데이터를 모델에 넣어 예측
prediction = model.predict(test_first_sample)

## 최대값을 가지는 인덱스 반환
pred = np.argmax(prediction)
actual = np.argmax(y_test[0])

print(f'Prediction: {pred}')
print(f'Actual: {actual}')

Test Accuracy: 0.9746000170707703
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step
Prediction: 7
Actual: 7
