# Computer Vision
## MNIST Data Classification using Convolutional Neural Network

세션을 통해 Convolutional Neural Network와 이를 구성하는 Convolutional layers, pooling, kernels, padding, stride 등을 배웠습니다. 이제 이들을 직접 구현해보도록 하겠습니다.    

이전 기초 딥러닝 과제에서는 MLP(Multilayer Perceptron) 모델을 통해 이미지 분류를 진행해 보았습니다.   

CNN모델에서는 Fully-Connected Network(MLP)로 이미지를 분류하기 전에 Convolutional layers를 집어넣어 Feature Mapping을 우선 진행합니다. 이를 통해 이미지의 3차원적 특성을 모델이 더욱 잘 이해할 수 있게 됩니다.  

데이터는 MNIST digits를 사용합니다.

- 다음의 package를 import 합니다.
    - numpy as np
    - tensorflow as tf  
    - tensorflow : keras
    - keras.layers : Dense, Dropout, Sequential
    - keras.layers : Flatten, Conv2D, MaxPooling2D
    - sklearn.model_selection : train_test_split
    - matplotlib.pyplot as plt

- MNIST data를 불러옵니다

In [0]:
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = ______._________

In [0]:
num_labels = 10 #분류할 label의 수

In [0]:
plt.imshow(X_train[0]); 
plt.colorbar()
plt.show()  # 이미지로 보기

- convolutional layer의 크기를 결정하기 위해 이미지의 픽셀 수를 알아내는 것은 필수입니다.  
- train data와 test data에 shape 함수를 적용해 데이터 갯수와 각 이미지 픽셀 수를 구합니다.

In [0]:
print(X_train._____)
print(y_train._____)
print(X_test._____)
print(y_test.______)

- 위 코드를 통해 각 이미지는 28x28 픽셀의 이미지로 이루어져 있는 것을 알 수 있습니다.

In [0]:
# 입력 이미지의 가로, 세로 길이를 변수로 저장합니다.
width, height = 28, 28 

- X의 경우 reshape 함수를 통해서 4차원 형태(데이터 갯수, 행의 수, 열의 수, 채널 갯수)로 변경해줍니다. 

In [0]:
X_train = X_train.reshape(___________, ______, _______, 1)
X_test = X_test.reshape(__________, ______, ______, 1)
input_shape = (______, _______, 1)

- 0-255까지의 픽셀 값들을 0-1까지의 range로 변환해줍니다.

In [0]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')

X_train /= ______
X_test /= ______

In [0]:
print(X_train.shape)
print('train data 갯수 : {}, test data 갯수 : {}'.format(X_train.shape[0], X_test.shape[0]))

- Feed forward Neural Network에 softmax를 적용시키기 위해서는 label data를 one-hot encoding 해줘야 합니다.  
  - ex) 1 = [0,1,0,0,0,0,0,0,0,0], 7 = [0,0,0,0,0,0,0,1,0,0]  
- train, test label 각각에 keras의 utils.to_categorical 함수를 적용시켜 벡터 형태로 변형시켜줍니다.

In [0]:
y_train = ________._____.___________(y_train, _____)
y_test = _____._____._________(y_test, _____)
print(y_train)

- 추후 모델 검증을 위해 Train data를 train, validation set 으로 분리합니다.
- train을 70%, validation을 30%의 비율로 분리합니다.


In [0]:
split_size = int(X_train.shape[0]*0.7)
X_train, X_valid, y_train, y_valid = _____________(_____, _____, test_size=0.3, random_state = 42)
print(X_train.shape, X_valid.shape)
print(y_train.shape, y_valid.shape)

### modeling

- 첫번째 convolutional layer: input image가 3x3 kernel을 거쳐 32개의 26x26 feature maps로 변형된후, ReLU 활성화 함수가 적용됩니다.
- 두번째 convolutional layer:  26x26 feature map이 3x3 kernel을 거쳐 64개의 24x24 feature maps로 변형 됩니다.
- max pooling 적용: 2x2 pooling을 통해 12x12 feature map으로 변형됩니다.

In [0]:
model = Sequential()

model.add(Conv2D(__, _________=_____, _________ = _____, input_shape=input_shape)) 
model.add(_______(__, __________=______, ____________ = _______))
model.add(MaxPooling2D(________=______))

본격적인 classification을 위해 Fully Connected Neural Network를 추가합니다.
- 12x12x64의 feature map을 flatten 시켜줍니다.
- Dense를 통해 node: 128, 활성화함수: relu 인 hidden layer를 추가합니다.
- 오버피팅 방지를 위해 dropout을 추가합니다. Dropout 비율은 0.5로 설정합니다.
- 출력층에 적절한 output dimension과 활성함수를 결정하여 입력해줍니다.

In [0]:
model.____(_______) #64개의 24x24 features를 하나의 vector로 만들어줍니다.
model.___(_______(___, ___________=_____))
model._____(________(____))
model._____(______(_________, _______=_________)) #categorical classification에 맞는 활성화 함수를 집어넣습니다.

 - 현재 구성된 model의 구조를 확인합니다.

In [0]:
model.summary()

- 다음과 같이 모델의 학습과정을 설정합니다.
  - loss : categorial_crossentropy
  - optimizer : adam
  - metrics : accuracy

In [0]:
model._________(______=______________, ________ = _____, _________=_______)

- 다음과 같이 모델을 학습합니다.
  - batch_size : 64
  - epochs : 15

In [0]:
fitted_model = model.fit(______, ________, validation_data=(_____, _____), ______=__, _______=____, shuffle=True)

학습시킨 모델의 accuracy와 loss를 그래프로 확인합니다.

In [0]:
hist = fitted_model.history

plt.figure(figsize=(18,4))

plt.subplot(1,2,1)
plt.plot(hist[_____])
plt.plot(hist[_____])
plt.title('accuracy')
plt.xlabel('epoch')
plt.legend(['train','validation'])

plt.subplot(1,2,2)
plt.plot(hist[_____])
plt.plot(hist[_____])
plt.title('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'])

최종적으로, test data에 모델을 적용시킵니다.

In [0]:
score = model.evaluate(____, ______)
print('Test Loss: {:.4f}'.format(score[0]))
print('Test Accuracy: {:.4f}'.format(score[1]))