<div class="alert alert-block" style="border: 2px solid #1976D2;background-color:#E3F2FD;padding:5px;font-size:0.9em;">
본 자료는 저작권법 제25조 2항에 의해 보호를 받습니다. 본 자료를 외부에 공개하지 말아주세요.<br>
<b><a href="https://school.fun-coding.org/">잔재미코딩 (https://school.fun-coding.org/)</a> 에서 본 강의를 포함하는 최적화된 로드맵도 확인하실 수 있습니다</b></div>

### PyTorch 와 CNN
- PyTorch 에는 CNN 을 쉽게 적용할 수 있도록, API 를 제공함

### Convolution Layers 와 PyTorch
- Conv1d (1차원 입력 데이터를 위한 Convolustion Layer, 일반적으로 Text-CNN에서 많이 사용)
- **Conv2d (2차원 입력 데이터를 위한 Convolustion Layer, 일반적으로 이미지 분류에서 많이 사용)**
- Conv3d (3차원 입력 데이터를 위한 Convolustion Layer)

### Conv2d

Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros')
- 주요 옵션
  - in_channels (int) – 입력 채널 수 (흑백 이미지일 경우는 1, RGB 값을 가진 이미지일 경우 3)
  - out_channels (int) – 출력 채널 수
  - kernel_size (int or tuple) – 커널 사이즈 (int 또는 튜플로 적용 가능)
  - stride (int or tuple, optional) – stride 사이즈 (Default: 1)
  - padding (int, tuple or str, optional) – padding 사이즈 (Default: 0)
  - padding_mode (string, optional) – padding mode (Default: 'zeros')
     - 이외에도 'zeros', 'reflect', 'replicate' or 'circular' 등 버전 업데이트마다 지속 추가중
  - dilation (int or tuple, optional) – 커널 사이 간격 사이즈 (Default: 1)
  <img src="https://www.researchgate.net/profile/Xiaofan-Zhang-4/publication/323444534/figure/fig9/AS:631623057956913@1527602080819/3-3-convolution-kernels-with-different-dilation-rate-as-1-2-and-3.png">
  - 출처: https://www.researchgate.net/figure/3-3-convolution-kernels-with-different-dilation-rate-as-1-2-and-3_fig9_323444534
  
  > 다양한 CNN 알고리즘 중 하나라고 이해하면 됨

### shape 이해
- Input Tensor: $(N, C_{in}, H_{in}, W_{in})$
   - N: batch 사이즈
   - $C_{in}$: in_channels (입력 채널 수) 와 일치해야 함
   - $H_{in}$: 2D Input Tensor 의 높이
   - $W_{in}$: 2D Input Tensor 의 너비
- Output Tensor: $(N, C_{out}, H_{out}, W_{out})$    
   - N: batch 사이즈
   - $C_{out}$: out_channels (출력 채널 수) 와 일치해야 함
   - $H_{out}$: $\frac{H_{in} + 2 \times padding[0] - dilation[0] \times (kernelsize[0] - 1) - 1}{stride[0]} + 1$
   - $W_{out}$: $\frac{W_{in} + 2 \times padding[1] - dilation[1] \times (kernelsize[1] - 1) - 1}{stride[1]} + 1$
     - stride 는 일반적으로는 int 로 하나의 값으로 지정가능하지만,
     - 다양한 CNN 알고리즘 중에는 너비, 높이에서의 padding, stride 를 달리할 수 있고 (dilation 도 마찬가지임), 이를 (stride[0], stride[1]) 의 예와 같이 튜플 형태로 적용도 가능함
     
- 참고: https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html

### shape 일반적인 계산
- 모든 CNN 변형 알고리즘까지 포함하는 식으로 shape 를 계산하면 복잡하므로, 다음 식으로 생각해도 좋음
- Stride 와 Padding 을 적용했을 때의 최종 
    - 입력 데이터 높이: H
    - 입력 데이터 너비: W
    - 필터 높이: FH
    - 필터 너비: FW
    - Stride 크기: S
    - 패딩 사이즈: P
    - Output 너비 = $\frac{W + 2P - FW}{S} + 1$
    - Output 높이 =  $\frac{H + 2P - FH}{S} + 1$

In [None]:
import torch
import torch.nn as nn

conv1 = nn.Conv2d(1, 1, 3, padding=1)
input1 = torch.Tensor(1, 1, 5, 5)
out1 = conv1(input1)
out1.shape

### Pooling Layers
- 입력 데이터 차원에 맞추어, Max Pooling 또는 Average Pooling 을 적용할 수 있음
  - MaxPool1d
  - MaxPool2d
  - MaxPool3d
  - AvgPool1d
  - AvgPool2d
  - AvgPool3d

### MaxPool2d
MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
- 주요 옵션
  - kernel_size: 커널 사이즈
  - stride: stride 사이즈 (Default: kernel_size)
  - padding: padding 사이즈
  - dilation: 커널 사이 간격 사이즈
  - ceil_mode: True 일 경우, 출력 shape 계산시, 나누어 떨어지지 않을 경우 ceil 사용 (디폴트: floor) 
     - 참고: floor (무조건 내림, 예: floor(3.7) = 3)
     - 참고: ceil (무조건 올림, 예: ceil(3.1) = 4)    

In [None]:
import torch
import torch.nn as nn

conv1 = nn.Conv2d(1, 1, 3, padding=1)
input1 = torch.Tensor(1, 1, 5, 5)
pool1 = nn.MaxPool2d(2)
out1 = conv1(input1)
print (out1.shape)
out2 = pool1(out1)
print (out2.shape)

In [None]:
import torch
import torch.nn as nn

conv1 = nn.Conv2d(1, 1, 3, padding=1)
input1 = torch.Tensor(1, 1, 5, 5)
pool1 = nn.MaxPool2d(2)
out1 = conv1(input1)
print (out1.shape)
out2 = pool1(out1)
print (out2.shape)

### 모델 정의
- Convolution Layer 는 입력 데이터에 필터(커널) 적용 후, activation 함수 적용한 Layer 를 의미함
  1. Convolution Layer 는 입력 데이터에 필터(커널) 적용을 위한 전용 클래스 제공 (nn.Conv2d)
  2. 이후에 Activation 함수 적용 (예: nn.LeakyReLU(0.1))
  3. 이후에 Batch Nomalization, Dropout 등 regularization 을 적용할 수도 있음 (옵션)
  4. 이후에 Pooling 적용(예: nn.MaxPool2d)

- BatchNorm1d() 과 BatchNorm2d()
   - BatchNorm1d(C) 는 Input과 Output이 (N, C) 또는 (N, C, L)의 형태
      - N은 Batch 크기, C는 Channel, L은 Length
   - BatchNorm2d(C) 는 Input과 Output이 (N, C, H, W)의 형태
      - N은 Batch 크기, C는 Channel, H는 height,  W는 width
   - 인자로 Output Channel 수를 넣으면 되며, Conv2d() 에서는 BatchNorm2d() 를 사용해야 함
   
    ```python
    conv1 = nn.Conv2d(1, 1, 3, padding=1)
    input1 = torch.Tensor(1, 1, 5, 5)
    out1 = conv1(input1)
    out1.shape
    결과: torch.Size([1, 1, 5, 5])
    ```
<img src="https://miro.medium.com/max/1280/1*usA-K08Tn5i6P7eLvV8htg.png" width=1000>

### shape 계산
- Stride 와 Padding 을 적용했을 때의 최종 
    - 입력 데이터 높이: H
    - 입력 데이터 너비: W
    - 필터 높이: FH
    - 필터 너비: FW
    - Stride 크기: S
    - 패딩 사이즈: P
    - Output 너비 = $\frac{W + 2P - FW}{S} + 1$
    - Output 높이 =  $\frac{H + 2P - FH}{S} + 1$

In [None]:
conv1 = nn.Sequential (
    nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(32),            
    nn.MaxPool2d(2)
    # Img = (?, 1, 28, 28)
    # Conv + Pool = (28 + 2 * 1 - 3) / 2 + 1 = 13 + 1 = 14, (?, 32, 14, 14)
)
input1 = torch.Tensor(1, 1, 28, 28)
out1 = conv1(input1)
print (out1.shape)

In [None]:
conv1 = nn.Sequential (
    nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(32),            
    nn.MaxPool2d(2),
    # Img = (1, 1, 28, 28)
    # Conv = (28 + 2 * 1 - 3) + 1 = 27 + 1 = 28, (1, 32, 28, 28)    
    # MaxPool = 28 / 2 = 14, (1, 32, 14, 14)    
    nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(64),            
    nn.MaxPool2d(2),
    # Conv = (14 + 2 * 1 - 3) + 1 = 13 + 1 = 14, (1, 64, 14, 14)    
    # MaxPool = 14 / 2 = 7, (1, 64, 7, 7)    
    nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(128),            
    nn.MaxPool2d(2)
    # Conv = (7 + 2 * 1 - 3) + 1 = 6 + 1 = 7, (1, 128, 7, 7)    
    # MaxPool = 7 / 2 = 7, (1, 128, 3, 3)      
)

input1 = torch.Tensor(1, 1, 28, 28)
out1 = conv1(input1)
out2 = out1.view(out1.size(0), -1)
print (out1.shape, out2.shape, 128 * 3 * 3)

### CNN 모델 구성
1. 다음 세트로 하나의 Convolution Layer + Pooling Layer  를 구성하고, 여러 세트로 구축
   - 보통 Convolution Layer + Pooling Layer 의 출력 채널을 늘리는 방식으로 여러 세트 구축
    ```python
    nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(32),            
    nn.MaxPool2d(2),

    nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(64),            
    nn.MaxPool2d(2),    
    ```
2. Flatten 
   - 텐서.view(텐서.size(0), -1) 로 Flatten
    ```python
    self.conv_layer.view(out.size(0), -1)
    ```
3. 여러 Fully-Connected Layer 로 구성
   - Flatten 한 입력을 받아서, 최종 Multi-Class 갯수만큼 출력
   - Multi-Class 일 경우, nn.LogSoftmax() 로 최종 결과값 출력
    ```python
    nn.Linear(3 * 3 * 128, 128),
    nn.LeakyReLU(0.1),            
    nn.BatchNorm2d(128),
    nn.Linear(128, 64),
    nn.LeakyReLU(0.1),
    nn.BatchNorm2d(64),
    nn.Linear(64, 10),
    nn.LogSoftmax(dim=-1)
    ```

In [None]:
class CNNModel(nn.Module):
    def __init__(self):
        super().__init__()
        
        self.conv_layers = nn.Sequential (
            nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
            nn.LeakyReLU(0.1),
            nn.BatchNorm2d(32),            
            nn.MaxPool2d(2),

            nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
            nn.LeakyReLU(0.1),
            nn.BatchNorm2d(64),            
            nn.MaxPool2d(2),

            nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
            nn.LeakyReLU(0.1),
            nn.BatchNorm2d(128),            
            nn.MaxPool2d(2)
        )
        
        self.linear_layers = nn.Sequential (
            nn.Linear(3 * 3 * 128, 128),
            nn.LeakyReLU(0.1),            
            nn.BatchNorm1d(128), # Linear Layer 이므로, BatchNorm1d() 사용해야 함
            nn.Linear(128, 64),
            nn.LeakyReLU(0.1),
            nn.BatchNorm1d(64), # Linear Layer 이므로, BatchNorm1d() 사용해야 함
            nn.Linear(64, 10),
            nn.LogSoftmax(dim=-1)
        )        
            
    def forward(self, x):
        x = self.conv_layers(x) # Conv + Pool
        x = x.view(x.size(0), -1) # Flatten
        x = self.linear_layers(x) # Classification
        return x

### MNIST with CNN

In [None]:
import torch
import torch.nn as nn
from torch.utils.data import DataLoader, Subset
from torchvision import datasets, transforms
from sklearn.model_selection import train_test_split
import numpy as np
from copy import deepcopy

In [None]:
train_rawdata = datasets.MNIST(root = 'dataset',
                            train=True,
                            download=True,
                            transform=transforms.ToTensor())
test_dataset = datasets.MNIST(root = 'dataset',
                            train=False,
                            download=True,
                            transform=transforms.ToTensor())
print('number of training data : ', len(train_rawdata))
print('number of test data : ', len(test_dataset))

In [None]:
VALIDATION_RATE = 0.2
train_indices, val_indices, _, _ = train_test_split(
    range(len(train_rawdata)), # X index 번호
    train_rawdata.targets, # y
    stratify=train_rawdata.targets, # 균등분포
    test_size=VALIDATION_RATE # test dataset 비율
)

In [None]:
train_dataset = Subset(train_rawdata, train_indices)
validation_dataset = Subset(train_rawdata, val_indices)

In [None]:
print (len(train_dataset), len(validation_dataset), len(test_dataset))

In [None]:
minibatch_size = 128 # Mini-batch 사이즈는 128 로 설정
# create batches
train_batches = DataLoader(train_dataset, batch_size=minibatch_size, shuffle=True)
val_batches = DataLoader(validation_dataset, batch_size=minibatch_size, shuffle=True)
test_batches = DataLoader(test_dataset, batch_size=minibatch_size, shuffle=True)

### CNNModel 객체 생성

In [None]:
model = CNNModel()
model

### input, output, loss, optimizer 설정

In [None]:
loss_func = nn.NLLLoss() # log softmax 는 NLLLoss() 로 진행해야 함
optimizer = torch.optim.Adam(model.parameters()) # Adam, learning rate 필요없음

### Training & Validation

In [None]:
def train_model(model, early_stop, n_epochs, progress_interval):
    
    train_losses, valid_losses, lowest_loss = list(), list(), np.inf

    for epoch in range(n_epochs):
        
        train_loss, valid_loss = 0, 0
        
        # train the model
        model.train() # prep model for training
        for x_minibatch, y_minibatch in train_batches:
            y_minibatch_pred = model(x_minibatch)
            loss = loss_func(y_minibatch_pred, y_minibatch)

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            train_loss += loss.item()
        
        train_loss = train_loss / len(train_batches)
        train_losses.append(train_loss)      
        
        # validate the model
        model.eval()
        with torch.no_grad():
            for x_minibatch, y_minibatch in val_batches:
                y_minibatch_pred = model(x_minibatch)
                loss = loss_func(y_minibatch_pred, y_minibatch)
                valid_loss += loss.item()
                
        valid_loss = valid_loss / len(val_batches)
        valid_losses.append(valid_loss)

        if valid_losses[-1] < lowest_loss:
            lowest_loss = valid_losses[-1]
            lowest_epoch = epoch
            best_model = deepcopy(model.state_dict())
        else:
            if early_stop > 0 and lowest_epoch + early_stop < epoch:
                print ("Early Stopped", epoch, "epochs")
                model.load_state_dict(best_model)
                break
                
        if (epoch % progress_interval) == 0:
            print (train_losses[-1], valid_losses[-1], lowest_loss, lowest_epoch, epoch)
            
    model.load_state_dict(best_model)        
    return model, lowest_loss, train_losses, valid_losses

### 훈련 실행
<div class="alert alert-block" style="border: 2px solid #E65100;background-color:#FFF3E0;padding:10px">
<font size="4em" style="color:#BF360C;">CPU 만으로는 테스트에 상당한 시간이 걸림</font><br>
    <font size="4em" style="color:#BF360C;">colab 을 통한 테스트 추천 (12_CNN_MNIST_GPU.ipynb) 파일 기반</font>
</div>

In [None]:
nb_epochs = 100 
progress_interval = 3
early_stop = 30

model, lowest_loss, train_losses, valid_losses = train_model(model, early_stop, nb_epochs, progress_interval)

### GPU 기반 훈련 방법 (코드 수정 방법, Nvidia GPU 기반)

- GPU 사용 가능 환경 설정
   - torch.cuda.is_available() 을 통해 Nvidia GPU(+ CUDA 설치) 사용 가능시, device 를 'cuda' 로 설정
   - torch.cuda.manual_seed_all(1) 을 통해, 매번 실행시 동일한 결과가 나오도록 random 값 generation seed 를 설정 (옵션)
    ```python
    device = 'cuda' if torch.cuda.is_available() else 'cpu'
    torch.manual_seed(1)
    if device == 'cuda':
        torch.cuda.manual_seed_all(1)
    ```
- model 객체 GPU 내 생성
    ```python
    model = CNNModel().to(device)
    ```
- 학습을 위한 Training 함수내 텐서를 GPU 로 보냄
    ```python
    for x_minibatch, y_minibatch in train_batches:
        x_minibatch = x_minibatch.to(device)
        y_minibatch = y_minibatch.to(device)
        y_minibatch_pred = model(x_minibatch)
    ```

### 훈련 실행
<div class="alert alert-block" style="border: 2px solid #E65100;background-color:#FFF3E0;padding:10px">
<font size="4em" style="color:#BF360C;">Overfitting 문제를 해결하기 위해, Dropout() 과 함께 적용</font><br>
    <font size="4em" style="color:#BF360C;">colab 을 통한 테스트 추천 (12_CNN_MNIST_GPU_DROPOUT.ipynb) 파일 기반</font>
</div>

```
CNNModel(
  (conv_layers): Sequential(
    (0): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): LeakyReLU(negative_slope=0.1)
    (2): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (3): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (4): LeakyReLU(negative_slope=0.1)
    (5): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (6): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (7): Dropout(p=0.25, inplace=False)
    (8): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (9): LeakyReLU(negative_slope=0.1)
    (10): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (11): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (12): LeakyReLU(negative_slope=0.1)
    (13): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (14): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (15): Dropout(p=0.25, inplace=False)
    (16): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (17): LeakyReLU(negative_slope=0.1)
    (18): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (19): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (20): Dropout(p=0.25, inplace=False)
  )
  (linear_layers): Sequential(
    (0): Linear(in_features=1152, out_features=128, bias=True)
    (1): LeakyReLU(negative_slope=0.1)
    (2): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (3): Linear(in_features=128, out_features=10, bias=True)
    (4): LogSoftmax(dim=-1)
  )
)
```

### 테스트셋 기반 Evaluation

In [None]:
test_loss = 0
correct = 0
wrong_samples, wrong_preds, actual_preds = list(), list(), list()

model.eval()
with torch.no_grad():
    for x_minibatch, y_minibatch in test_batches:
        y_test_pred = model(x_minibatch)
        test_loss += loss_func(y_test_pred, y_minibatch)  
        pred = torch.argmax(y_test_pred, dim=1)
        correct += pred.eq(y_minibatch).sum().item()
        
        wrong_idx = pred.ne(y_minibatch).nonzero()[:, 0].cpu().numpy().tolist()
        for index in wrong_idx:
            wrong_samples.append(x_minibatch[index].cpu())
            wrong_preds.append(pred[index].cpu())
            actual_preds.append(y_minibatch[index].cpu())
            
test_loss /= len(test_batches.dataset)
print('Average Test Loss: {:.4f}'.format( test_loss ))
print('Accuracy: {}/{} ({:.2f}%)'.format( correct, len(test_batches.dataset), 100 * correct / len(test_batches.dataset) ))

### incorrect data 만 확인해보기
- GPU 로 학습하였을 경우, 텐서.numpy() 는 동작하지 않음 
- 다음과 같이 텐서.cpu().numpy() 로 CPU 로 복사해서, numpy() 로 변환해야 함
    ```python
    wrong_samples[index].cpu().numpy( ).reshape(28,28)
    ```

In [None]:
# incorrect 데이터 중, 100개 이미지만 출력해보기
import matplotlib.pyplot as plt
# 주피터 노트북에서 그림을 주피터 노트북 내에 표시하도록 강제하는 명령
%matplotlib inline 

plt.figure(figsize=(18 , 20))

for index in range(100):
    plt.subplot(10, 10, index + 1)
    plt.axis('off')
    plt.imshow(wrong_samples[index].numpy().reshape(28,28), cmap = "gray")
    plt.title("Pred" + str(wrong_preds[index].item()) + "(" + str(actual_preds[index].item()) + ")", color='red')

<div class="alert alert-block" style="border: 2px solid #1976D2;background-color:#E3F2FD;padding:5px;font-size:0.9em;">
본 자료는 저작권법 제25조 2항에 의해 보호를 받습니다. 본 자료를 외부에 공개하지 말아주세요.<br>
<b><a href="https://school.fun-coding.org/">잔재미코딩 (https://school.fun-coding.org/)</a> 에서 본 강의를 포함하는 최적화된 로드맵도 확인하실 수 있습니다</b></div>