# 딥러닝으로 MNIST 손글씨 인식하기 

## MNIST 손글씨 데이타 세트

<img src="./img/mnist_data.png" align=left width=500>

- MNIST 데이터셋은 미국 국립표준기술원(NIST)이 고등학생과 인구조사국 직원등이 
     - 쓴 손글씨를 이용해 만든 데이터로 구성
- 70,000개의 28*28 글자 이미지에 각각 0부터 9까지 이름표를 붙인 데이터셋
    - 60,000개의 학습 데이타셋, 10,000개의 테스트 데이타셋으로 구성
- 머신러닝을 배우는 사람이라면 자신의 알고리즘과 다른 알고리즘의 성과를 비교해 보고자 
     - 한 번씩 도전해 보는 가장 유명한 데이터 중 하나

### 1. MNIST 데이터셋 다운로드

In [None]:
# 텐서플로우 저장소에서 데이터를 다운 받기


### 1) 데이터의 형태 확인하기

In [None]:
# 학습 데이타, 테스트 데이터 확인하기


### 2) 데이터 그려보기

In [None]:
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(777)

sample_size = 3
# 0~59999의 범위에서 무작위로 3개의 정수를 뽑아서 해당 그림 확인
random_idx = np.random.randint(60000, size = sample_size)
print(random_idx)

for idx in random_idx:
    img = x_train[idx, :]
    label = y_train[idx]
    plt.figure()
    plt.imshow(img)
    plt.title('%d-th data, label is %d' % (idx,label), fontsize = 15)

- cmap = 'Greys' 옵션을 지정해 흑백으로 출력

In [None]:
# 그래프로 확인 - 흑백
import matplotlib.pyplot as plt

plt.imshow(x_train[0], cmap='Greys') # 흑백 출력
plt.title('Label is %d' % (y_train[0]), fontsize=15)
plt.show()

- 코드로 이미지 확인하기
    - 이미지는 가로 28 × 세로 28 = 총 784개의 픽셀로 이루어져 있음
    - 각 픽셀은 밝기 정도에 따라 0부터 255까지 의 등급을 매김
    - 흰색 배경이 0, 글씨가 들어간 곳은 0~255까지 숫자 중 하나로 채워져 긴 행렬로 이루어진 하나의 집합으로 변환

In [None]:
# 코드로 확인
import sys

for x in x_train[0]:
    for i in x:
        sys.stdout.write('%d\t' % i)
    sys.stdout.write('\n')

### 2. 검증 데이터셋 만들기
- 학습 데이타셋을 학습 데이타셋과 검증 데이타셋으로 분리

In [None]:
from sklearn.model_selection import train_test_split

# 학습/검증 데이터셋을 0.7/0.3의 비율로 분리합니다.


print(f'학습 데이터:{x_train.shape}, 레이블:{y_train.shape}')
print(f'검증 데이터:{x_val.shape}, 레이블:{y_val.shape}')
print(f'테스트 데이터:{x_test.shape}, 레이블:{y_test.shape}')

### 3. 모델 입력을 위한 피쳐 데이터 전처리
- 피쳐 데이타 전처리 - 정규화 이용
- 2차원 이미지 데이타(28, 28) -> 1차원으로 변경(28*28=784) -> RGB(0~ 255)의 최대값인 255로 나눈다.

In [None]:


# 1) 데이터를 2차원(28, 28)에서 1차원(28*28=784)으로 변경
# 2) 모델의 입력으로 사용하기 위한 피쳐 전처리 - 정규화


# 1차원으로 변경 확인


### 4. 모델 입력을 위한 레이블(클래스) 전처리
- 다중 분류를 진행하므로 레이블을 원-핫 인코딩 형태로 변경

In [None]:
from tensorflow.keras.utils import to_categorical

# 각 데이터의 레이블을 범주형 형태의 원-핫 인코딩 형태로 변경




### 5. 모델 정의

In [None]:


# 입력층 - 784개 1차원, 은닉층1 - 64노드

# 은닉층2 - 32노드

# 출력층 - 10개의 출력


In [None]:
# 모델 요약


- Param #
    - 1) 입력 + 은닉층1(dense) = 784(입력) X 64(노드) + 64(biases) = 50,240개
    - 2) 은닉층2(dense_1) = 64(은닉층1 노드) X 32(은닉층2 노드) + 32(biases) = 2,080개
    - 3) 출력층 = 32(은닉층2 노드) X 10(출력갯수) + 10(biases) = 330개

### 6. 컴파일 설정

In [None]:
# 최적화 함수 : adam
# 손실 함수 : 다중분류 - 'categorical_crossentropy'
# 모니터링 할 평가지표 : 정확도 - 'acc'

### 7. 모델 학습하기

### 8. 모델 평가하기

### 1) 모델 평가하기 - molde.evaluate() 함수 이용

- 결과: 정확도 - 97%

### 2) 혼동 행렬을 이용한 모델 평가

In [None]:
from sklearn.metrics import classification_report, confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns

results = model.predict(x_test) # y_test의 예측값

# y_test의 실제 정답과 예측값으로 혼동 행렬 생성
plt.figure(figsize = (7, 5))
cm = confusion_matrix(np.argmax(y_test, axis = -1), np.argmax(results, axis = -1))
sns.heatmap(cm, annot = True, fmt = 'd',cmap = 'Blues')
plt.xlabel('predicted label', fontsize = 15)
plt.ylabel('true label', fontsize = 15)
plt.show()

### 3) 분류 보고서를 이용한 모델 평가 

In [None]:
print(classification_report(np.argmax(y_test, axis = -1), np.argmax(results, axis = -1)))

### 9. 학습 결과 그려보기

In [None]:
# history를 통해 확인해볼 수 있는 값
history.history.keys()

In [None]:
import matplotlib.pyplot as plt

his_dict = history.history
loss = his_dict['loss']
val_loss = his_dict['val_loss'] # 검증 데이터가 있는 경우 ‘val_’ 수식어가 붙습니다.

epochs = range(1, len(loss) + 1)
fig = plt.figure(figsize = (10, 5))

# 훈련 및 검증 손실 그리기
ax1 = fig.add_subplot(1, 2, 1)
ax1.plot(epochs, loss, color = 'blue', label = 'train_loss')
ax1.plot(epochs, val_loss, color = 'orange', label = 'val_loss')
ax1.set_title('train and val loss')
ax1.set_xlabel('epochs')
ax1.set_ylabel('loss')
ax1.legend()

acc = his_dict['acc']
val_acc = his_dict['val_acc']

# 훈련 및 검증 정확도 그리기
ax2 = fig.add_subplot(1, 2, 2)
ax2.plot(epochs, acc, color = 'blue', label = 'train_acc')
ax2.plot(epochs, val_acc, color = 'orange', label = 'val_acc')
ax2.set_title('test and val acc')
ax2.set_xlabel('epochs')
ax2.set_ylabel('acc')
ax2.legend()

plt.show()

### 10. 학습된 모델을 통해 값 예측하기

### 1) 예측

In [None]:
import numpy as np
np.set_printoptions(precision=7) # numpy 소수점 제한



### 2) 예측값을 그림으로 확인해보기

In [None]:
import matplotlib.pyplot as plt

arg_results = np.argmax(results, axis = -1) # 가장 큰 값의 인덱스를 가져옵니다.
plt.imshow(x_test[0].reshape(28, 28))
plt.title('Predicted value of the first image : ' + str(arg_results[0]), fontsize = 12)
plt.show()

## 전체 코드

In [None]:
import tensorflow as tf
from tensorflow.keras.datasets.mnist import load_data

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.utils import to_categorical

from sklearn.model_selection import train_test_split
tf.random.set_seed(777)

# 1. 데이타 로드
(x_train, y_train), (x_test, y_test) = load_data(path='mnist.npz')

# 2. 검증 데이타 분할
x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, 
                                                  test_size = 0.3, 
                                                  random_state = 777)
# 3. 피쳐 정규화/레이블 원-핫 인코딩
num_x_train = x_train.shape[0]
num_x_val = x_val.shape[0]
num_x_test = x_test.shape[0]

x_train = (x_train.reshape((num_x_train, 28 * 28))) / 255
x_val = (x_val.reshape((num_x_val, 28 * 28))) / 255
x_test = (x_test.reshape((num_x_test, 28 * 28))) / 255

y_train = to_categorical(y_train)
y_val = to_categorical(y_val)
y_test = to_categorical(y_test)

# 4. 딥러닝 모델 구성
model = Sequential()
model.add(Dense(64, activation = 'relu', input_shape = (784, )))
model.add(Dense(32, activation = 'relu'))
model.add(Dense(10, activation = 'softmax'))

# 5. 컴파일 설정
model.compile(optimizer='adam', 
              loss = 'categorical_crossentropy', 
              metrics=['acc'])

# 6. 모델 학습
history = model.fit(x_train, y_train, 
                    epochs = 30, 
                    batch_size = 128, 
                    validation_data = (x_val, y_val))

# 7. 모델 평가
model.evaluate(x_test, y_test)