# 인공지능 가위바위보 준비  
- 데이터준비  
- 딥러닝 네트워크 설계  
- 학습  
- 테스트(평가)

## 1. MNIST 숫자 손글씨 Dataset 불러오기   
- Tensorflow 의 표준 API 인 tf.keras 의 Sequential API 를 중심으로


[여기](http://yann.lecun.com/exdb/mnist/) 에는 MNIST 교수님이  
직접 만드신 손글씨 사진과 그에 맞는 데이터가 있다.

데이터셋은 500명 사용자가 작성한 70,000장의 손글씨 사진이 있다.  
(train 60000, test 10000)

train 데이터와 test 데이터가 있는데  
우리는 train을 가지고 알고리즘을 만든 다음에  
test로 성능 테스트를 하면 된다.

In [1]:
import tensorflow as tf
from tensorflow import keras

import numpy as np
import matplotlib.pyplot as plt
import os


print(tf.__version__)   # Tensorflow의 버전을 출력

mnist = keras.datasets.mnist

# MNIST 데이터를 로드. 다운로드하지 않았다면 다운로드까지 자동으로 진행됩니다. 
(x_train, y_train), (x_test, y_test) = mnist.load_data()   

print(len(x_train))  # x_train 배열의 크기를 출력

2.6.0
60000


우리가 불러온 학습용 데이터 개수 확인해보기

In [2]:
print(x_train.shape)

(60000, 28, 28)


6000개의 사진이 28x28 의 크기로 있다.

---


여기서 잠깐
---
* Train set : 모델 학습 용 dataset  
* Validation set : 학습이 완료된 모델을 검증하기 위한 dataset  
* Test set : 학습도 검증도 완료된 모델의 성능 평가를 위한 dataset

데이터 셋을 모은 다음 Train 6: Validation 2 : Test 2 의 비율로 나눈다.  
(Validation 할만큼 양이 많지 않으면 Train에 8)

# 데이터 전처리

인공지능 모델을 훈련/사용 할 때 , 일반적으로 입력을 0~1사이의 값으로 정규화 시켜 사용한다.

MNIST 이미지 데이터는 각 픽셀의 값이 0 ~ 255 의 범위 내에 있으므로 데이터를 255.0 으로 나누어 주면 된다.

In [3]:
x_train_norm, x_test_norm = x_train / 255.0, x_test / 255.0
print('최소값:',np.min(x_train_norm), ' 최대값:',np.max(x_train_norm))

최소값: 0.0  최대값: 1.0


> 255로 나누어 0~1사이의 값을 만든 모습이다

# 딥러닝 네트워크 설계

딥러닝 네트워크 설계는  
텐서플로우 케라스 (tf.keras) 에서 Sequential API 를
사용할 예정

개발의 자유도는 떨어지지만 간단하게 딥러닝 모델을 만드는 도구 이다.

### 딥러닝 네트워크 설계 코드

In [4]:
model=keras.models.Sequential()
model.add(keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(28,28,1)))
model.add(keras.layers.MaxPool2D(2,2))
model.add(keras.layers.Conv2D(32, (3,3), activation='relu'))
model.add(keras.layers.MaxPooling2D((2,2)))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(32, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

print('Model에 추가된 Layer 개수: ', len(model.layers))

Model에 추가된 Layer 개수:  7


> tf.keras 를 이용해 Sequential API 를 불러 Lenet 이라는 딥러닝 네트워크를 설계한 내용이다.

<img src="../Instruct_code.png" width="6500px" height="500px"></img>

---
우리가 만든 딥러닝 네트워크 모델을 확인해보지

In [6]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 16)        160       
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 13, 13, 16)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 11, 11, 32)        4640      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 5, 5, 32)          0         
_________________________________________________________________
flatten (Flatten)            (None, 800)               0         
_________________________________________________________________
dense (Dense)                (None, 32)                25632     
_________________________________________________________________
dense_1 (Dense)              (None, 10)                3

---
근데 여기서 네트워크를 다르게 만들어 볼 수도 있는데,  
위 에서 Conv2D  혹은 Dense , epoch 값을 변경하여 만든다.  
(맨밑 dense 는 바꾸면 안됨 그거는 숫자 갯수인 10개로 맞춰나야 함)

---
이 네트워크의 입력은

(데이터 갯수, 이미지크기x, 이미지크기y, 채널수)

의 형태를 지닌다.  
(채널은 흑백인지 컬러인지를 의미한다.)

허나 print(x_train.shape) 를 해보면  
(60,000, 28, 28) 로 3객 나오는 것을 알 수 있다.  
채널수를 추가해준다.

In [7]:
print("Before Reshape - x_train_norm shape: {}".format(x_train_norm.shape))
print("Before Reshape - x_test_norm shape: {}".format(x_test_norm.shape))

x_train_reshaped=x_train_norm.reshape( -1, 28, 28, 1)  # 데이터갯수에 -1을 쓰면 reshape시 자동계산됩니다.
x_test_reshaped=x_test_norm.reshape( -1, 28, 28, 1)

print("After Reshape - x_train_reshaped shape: {}".format(x_train_reshaped.shape))
print("After Reshape - x_test_reshaped shape: {}".format(x_test_reshaped.shape))

Before Reshape - x_train_norm shape: (60000, 28, 28)
Before Reshape - x_test_norm shape: (10000, 28, 28)
After Reshape - x_train_reshaped shape: (60000, 28, 28, 1)
After Reshape - x_test_reshaped shape: (10000, 28, 28, 1)


---
수정된 x_train_reshaped 로 딥러닝 네트워크를 학습시켜보자

In [8]:
model.compile(optimizer='adam',
             loss='sparse_categorical_crossentropy',
             metrics=['accuracy'])

model.fit(x_train_reshaped, y_train, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7fbf7c02ec40>

echos=10 은  
전체 60,000개의 데이터를 10번 반복해서 학습하라는 뜻

학습이 진행됨에 따라 정확도 (accuracy) 가 올라가는 걸 볼 수 있다.

---
완성된 딥러닝 네트워크로 test파일을 확인해보자

In [9]:
test_loss, test_accuracy = model.evaluate(x_test_reshaped,y_test, verbose=2)
print("test_loss: {} ".format(test_loss))
print("test_accuracy: {}".format(test_accuracy))

313/313 - 1s - loss: 0.0363 - accuracy: 0.9895
test_loss: 0.03629588335752487 
test_accuracy: 0.9894999861717224


와우 정확도가 98.94% 이정도면 충분한거 아니냐?  
위에 모델에서는 evaluate 라는 함수를 썼지만
.predict() 를 사용하면 model 이 입력값을 보고 실제로 추론한 확률분포를 출력할 수 있다.

우리가 만든 딥러닝 모델이란 사실 10개의 숫자 중 어디에 가장 근접할 지에 대한 확률값을 출력하는 함수이다.

---
predict를 활용한 코드

In [10]:
predicted_result = model.predict(x_test_reshaped)  # model이 추론한 확률값. 
predicted_labels = np.argmax(predicted_result, axis=1)

idx=0  #1번째 x_test를 살펴보자. 
print('model.predict() 결과 : ', predicted_result[idx])
print('model이 추론한 가장 가능성이 높은 결과 : ', predicted_labels[idx])
print('실제 데이터의 라벨 : ', y_test[idx])

model.predict() 결과 :  [1.3132054e-14 2.6960585e-11 5.4069371e-12 1.4042201e-10 6.5124948e-14
 1.6036312e-12 3.1894430e-17 1.0000000e+00 1.4683288e-11 1.0271363e-09]
model이 추론한 가장 가능성이 높은 결과 :  7
실제 데이터의 라벨 :  7


보면 7번째 리스트 값이 1.0000000e+00 으로 1에 가장 근접하다. 가장 그럴듯하다는 얘기다.