# 2022-1 빅데이터와 인공지능 15주차 Reports

## 15주차 1차시
### Question 1
* 최적화 방법(optimizer), 손실함수(loss), 지표(metrics)의 종류와 정의를 조사

### Answer 1
1. 최적화 방법(optimizer)  
    1.1 SGD(Stochastic Gradient Descent): Full-Batch가 아닌 Mini-Batch로 학습하는 방법  
    1.2 **Adam(Adaptive Moment Estimation)**:  Momentum과 RMSProp의 조합으로 학습하는 방법  
    1.3 RMSprop(Root Mean Square Propagation): 가중치 기울기를 단순 누적시키는 것이 아니라 최신 기울기를 더 많이 반영하는 방법  
    1.4 Adagrad(Adaptive Gradient): 학습을 통해 크게 변동이 있었던 가중치에 대해서는 학습률을 감소시키고, 아직 변동이 없었던 가중치에 대해서는 학습률을 증가시키는 방법  
    1.5 Adadelta(Adaptive Delta): 임의의 고정된 크기까지만의 모든 제곱된 기울기들을 누적하는 방법  
* * *
2. 손실함수(loss)  
    2.1 MSE(Mean Squared Error): 예측값과 실제값 사이의 평균 제곱 오차  
    2.2 MAE(Mean Absolute Error): 예측값과 실제값 사이의 평균 절대오차  
    2.3 RMSE(Root Mean Absolute Error): MSE에 제곱근을 취한 형태로, 왜곡 감소를 위한 손실함수  
    2.4 MSLE(Mean Squared Logarithmic Error): MSE에 로그값을 취한 형태로, 왜곡 감소를 위한 손실함수  
    2.5 Categorical Crossentropy: 다중 분류에서 label이 One-Hot Vector로 구성될 때 사용되는 손실함수  
    2.6 Sparse Categorical Crossentropy: 다중 분류에서 label이 숫자로 구성될 때 사용되는 손실함수
* * *
3. 지표(metrics)  
    3.1 Accuracy: 정확도를 평가하는 지표, 전체 예측 개수 중 맞춘 예측 개수의 비율  
    3.2 BinaryAccuracy: 설정한 threshold에 따라 정확도를 평가하는 지표  
    3.3 Precision: 전체 정답으로 맞춘 것들 중 실제로 정답을 맞춘 비율
    3.4 Recall: 실제로 정답인 것들 중 분류리가 정답으로 예측한 비율  
    3.5 F1Score: Precision과 Recall의 평균으로 정확도를 평가하는 지표

## 15주차 2차시
### Question 2
* CNN 모델에서의 스트라이드(Stride)와 패딩(Padding)에 대해 알아보세요.

### Answer 2
1. **패딩(Padding)**   
1.1 패딩(Padding): 커널을 통과하며 특성맵을 구성할 때, 입력 데이터의 크기와 출력 데이터가 다를 경우, 입력 배열 주위를 가상의 원소로 채우는 작업.  
1.2 Same Padding: 실제 입력 값은 아니기 때문에, 주위에 0으로 채우고 입력 데이터의 크기를 유지하는 방법  
1.3 Valid Padding: 패딩 없이 순수한 입력 배열로만 커널을 통과하여 특성맵을 구성하는 작업
* * *
2. **스트라이드(Stride)**   
2.1 스트라이드(Stride): 특성맵을 구성할 때, 커널이 상하좌우로 이동하는 크기  
2.2 만약 두 칸씩 건너뛰고 싶으면, stride = 2로 설정  
2.3 스트라이드를 증가시키면, 커널을 통과하는 특성맵의 크기가 작아진다.


## 15주차 3차시
### Question 3
* CNN 모델을 다양하게 설계하여 예측(분류) 정확도를 비교하시오.

### Answer 3

In [1]:
import pandas as pd
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

In [2]:
# Load MNIST dataset
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [3]:
# Scaling the image pixel matrice to [0, 1]
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

In [4]:
# Encoding labels to one-hot vectors
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

In [5]:
# Constructing the model: using the sequential model
from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (5, 5), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

model.summary()

Metal device set to: Apple M1

systemMemory: 8.00 GB
maxCacheSize: 2.67 GB

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 24, 24, 32)        832       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 12, 12, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 8, 8, 64)          51264     
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 4, 4, 64)         0         
 2D)                                                             
                                                                 
 flatten (Flatten)           (None, 1024)              0         
                                              

2022-06-09 23:18:20.785460: I tensorflow/core/common_runtime/pluggable_device/pluggable_device_factory.cc:305] Could not identify NUMA node of platform GPU ID 0, defaulting to 0. Your kernel may not have been built with NUMA support.
2022-06-09 23:18:20.785562: I tensorflow/core/common_runtime/pluggable_device/pluggable_device_factory.cc:271] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 0 MB memory) -> physical PluggableDevice (device: 0, name: METAL, pci bus id: <undefined>)


In [6]:
# Compiling and fitting the mode
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=64)
# Evaluate the model
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

Epoch 1/5


2022-06-09 23:18:20.994937: W tensorflow/core/platform/profile_utils/cpu_utils.cc:128] Failed to get CPU frequency: 0 Hz


  1/938 [..............................] - ETA: 8:31 - loss: 2.3223 - accuracy: 0.0625

2022-06-09 23:18:21.350395: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
 27/313 [=>............................] - ETA: 1s - loss: 0.0216 - accuracy: 0.9907 

2022-06-09 23:19:26.038545: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Test accuracy: 0.9927000403404236


In [7]:
# Comparison of the model with various hyperparameters
# Hyperparameters: epochs, batch_size
list_epochs = [1, 3, 5, 10]
list_batch_size = [32, 64, 128]
df_results = pd.DataFrame(columns=list_epochs, index=list_batch_size)

for i in list_epochs:
    for j in list_batch_size:
        model.fit(train_images, train_labels, epochs=i, batch_size=j, verbose=False)
        test_loss, test_acc = model.evaluate(test_images, test_labels)
        df_results.loc[j, i] = test_acc
        print(f"Epochs: {i}, Batch size: {j}, Test Accuracy: {test_acc}")

Epochs: 1, Batch size: 32, Test Accuracy: 0.9903000593185425
Epochs: 1, Batch size: 64, Test Accuracy: 0.9927000403404236
Epochs: 1, Batch size: 128, Test Accuracy: 0.9923000335693359
Epochs: 3, Batch size: 32, Test Accuracy: 0.9921000599861145
Epochs: 3, Batch size: 64, Test Accuracy: 0.9922000765800476
Epochs: 3, Batch size: 128, Test Accuracy: 0.9937000274658203
Epochs: 5, Batch size: 32, Test Accuracy: 0.9933000206947327
Epochs: 5, Batch size: 64, Test Accuracy: 0.9937000274658203
Epochs: 5, Batch size: 128, Test Accuracy: 0.9934000372886658
Epochs: 10, Batch size: 32, Test Accuracy: 0.9923000335693359
Epochs: 10, Batch size: 64, Test Accuracy: 0.9913000464439392
Epochs: 10, Batch size: 128, Test Accuracy: 0.9929000735282898


In [8]:
# Print results
df_results

Unnamed: 0,1,3,5,10
32,0.9903,0.9921,0.9933,0.9923
64,0.9927,0.9922,0.9937,0.9913
128,0.9923,0.9937,0.9934,0.9929
