# AI_Assignment2_12150981_박중규

## Part 1

### 라이브러리 import

In [None]:
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers
import matplotlib.pyplot as plt
%matplotlib inline

### MINIST Dataset을 통해 train 이미지와 test 이미지를 준비

In [None]:
# 데이터 전처리 과정

# 클래스의 개수와 이미지의 모양
num_classes = 10
input_shape = (28, 28, 1)

# train 데이터와 test 데이터
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# 이미지의 스케일을 [0, 1]범위로 조정
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

# 이미지를 28x28x1 모양으로 만든다
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

# convert class vectors to binary class matrices
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

### CNN 모델만들기

In [None]:
# 합성곱 신경망 구성

# Convolution -> ReLU -> Max Pooling -> Convolution -> ReLu -> Maxpooling
# -> Flatten -> Dropout -> Fully Connected -> Softmax 순서의 모델

# Convolutional Layer : 필터를 통해 이미지의 feature을 뽑아내는 layer
# ReLU Layer : 활성화 함수
# Pooling Layer : 이미지의 크기를 줄이며 특정 feature 강조
# Dropout Layer : overfitting을 방지하기 위해 복잡도를 줄임. 이를 위해 매 epoch마다 랜덤한 노드 생략
# Flatten Layer : 입력 데이터의 shape 변경
# Fully Connected Layer : 프로세스의 결과를 가지고 이미지를 분류하는 과정
# Softmax Layer : Classification 수행
model = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)
# 모델 Layer와 파라메터에 관한 요약설명
model.summary()

### 모델의 인자를 설정 후 학습시키기

In [None]:
# batch_size : 한 번의 bathc마다 주는 데이터의 size
# epochs : epcoh은 전체 데이터 셋에 대해 순전파/역전파를 거치는 과정을 말하는데, 그 과정의 횟수를 의미
batch_size = 128
epochs = 15

# loss: 손실함수의 설정. 모델 최적화에 사용하는 목적 함수
# optimizer : 정규화기. 최적화 알고리즘을 설정
# metric : 평가지표. classfication에서는 accuracy 사용
model.compile(loss="categorical_crossentropy", 
              optimizer="adam", 
              metrics=["accuracy"])

# 지정했던 인자들을 넣어서 모델 학습시키기
# validation_split : train 데이터 셋의 일부 비율을 학습 중 평가에 사용되는 검증 데이터로 활용
history = model.fit(x_train, y_train, 
                    batch_size=batch_size, 
                    epochs=epochs, 
                    validation_split=0.1)

Epoch 1/15

### 학습의 정확도 출력

In [None]:
# train 데이터와 validation 데이터에 대해 accuracy와 loss 그래프를 출력

# 모델에서 각 값 가져오기
train_accuracy = history.history['accuracy']
val_accuracy = history.history['val_accuracy']
train_loss = history.history['loss']
val_loss = history.history['val_loss']

# train 데이터와 validation 데이터에 대한 accuracy값
plt.plot(list(range(epochs)), train_accuracy, 'bo', label='Training accuracy')
plt.plot(list(range(epochs)), val_accuracy, 'b', label='Validation accuracy')
plt.title('Training and validation accuracy')
plt.legend()
plt.show()

# train 데이터와 validation 데이터에 대한 loss값
plt.figure()
plt.plot(list(range(epochs)), train_loss, 'bo', label='Training loss')
plt.plot(list(range(epochs)), val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()

### Test 데이터 셋에 대한 평가

In [10]:
# 모델에 test 데이터 셋을 넣고 accuracy와 loss 계산
score = model.evaluate(x_test, y_test, verbose=0)
print("Test loss of model:", score[0])
print("Test accuracy of model:", score[1])

Test loss of model: 0.023732811212539673
Test accuracy of model: 0.9918000102043152


## Part 2

### 1. Implement with different CNN architecture

In [16]:
# Convolutional Layer와 Pooling Layer를 추가하여 다른 CNN 구조 생성

model2 = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

model2.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_9 (Conv2D)           (None, 26, 26, 32)        320       
                                                                 
 max_pooling2d_9 (MaxPooling  (None, 13, 13, 32)       0         
 2D)                                                             
                                                                 
 conv2d_10 (Conv2D)          (None, 11, 11, 64)        18496     
                                                                 
 max_pooling2d_10 (MaxPoolin  (None, 5, 5, 64)         0         
 g2D)                                                            
                                                                 
 conv2d_11 (Conv2D)          (None, 3, 3, 64)          36928     
                                                                 
 max_pooling2d_11 (MaxPoolin  (None, 1, 1, 64)        

In [12]:
model2.compile(loss="categorical_crossentropy", 
              optimizer="adam", 
              metrics=["accuracy"])

history2 = model2.fit(x_train, y_train, 
                    batch_size=batch_size, 
                    epochs=epochs, 
                    validation_split=0.1)

Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


In [13]:
score2 = model2.evaluate(x_test, y_test, verbose=0)
print("Test loss of model2:", score2[0])
print("Test accuracy of model2:", score2[1])

Test loss of model2: 0.0520080141723156
Test accuracy of model2: 0.9860000014305115


### 2. Implement with different training parameters

In [14]:
# epochs의 값을 2배로 늘려서 모델을 학습시켜 보기

model3 = keras.Sequential(
    [
        keras.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

batch_size = 128
epochs_30 = 30

model3.compile(loss="categorical_crossentropy", 
              optimizer="adam", 
              metrics=["accuracy"])

history3 = model3.fit(x_train, y_train, 
                    batch_size=batch_size, 
                    epochs=epochs_30, 
                    validation_split=0.1)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


In [15]:
score3 = model3.evaluate(x_test, y_test, verbose=0)
print("Test loss of model3:", score3[0])
print("Test accuracy of model3:", score3[1])

Test loss of model3: 0.021890977397561073
Test accuracy of model3: 0.9932000041007996


### Short summary of what I have learned and my observation

+ MNIST data set과 tensorflow의 keras를 이용하여 직접 CNN모델을 구축해보고 데이터를 학습시켜 데이터를 분류하는 경험을 할 수 있었습니다.
+ 코드를 직접 작성하고 분석해봄으로써 전반적인 모델구축 과정, 데이터학습 과정을 알 수 있었고 라이브러리의 프로퍼티나 메소드를 이해하는데 도움이 되었습니다.
+ CNN architecture가 어떻게 구성되는지 알 수 있었고 각 Layer가 어떤 역할을 수행하는지 알 수 있었습니다.
+ model1(기본 모델), model2(Layer를 추가하여 구조를 다르게한 모델), model3(epochs를 2배로 증가하여 학습)을 여러번 데이터 학습을 시키고 평가한 결과 다음과 같은 관찰을 할 수 있었습니다.

> 1) Layer를 추가하여 total parameters의 수가 증가한다고 해도 정확성이 증가하는 것은 아님을 알았습니다. model2에서는 여러번 시행해본 결과, 오히려 정확성이 더 떨어지는 모습을 보였습니다. 

> 2) epochs를 2배로 늘려 여러번 시행해본 결과, 조금의 정확성이 증가하는 모습을 보였습니다. 그러나 학습시간이 2배로 증가하는 측면을 고려한다면, 효율성의 문제는 별개로 생각해볼 수 있습니다. 학습시간은 줄이면서 정확성을 더 높인다면 더 효율적이고 성능좋은 모델을 만들 수 있을 것입니다.