## CNN을 이용하여 CIFAR10 분류기 만들기


1. CIFAR10 데이터를 불러와서 전처리를 수행합니다.

2. Convolutional Neural Network를 정의합니다.

3. Loss function을 정의합니다.

4. 학습을 수행합니다.

5. 테스트를 수행합니다.

### 1. Load and Normalize CIFAR10

In [3]:
pip install touch

Collecting touch
  Downloading touch-2020.12.3.tar.gz (1.4 kB)
Collecting values
  Downloading values-2020.12.3.tar.gz (1.3 kB)
Building wheels for collected packages: touch, values
  Building wheel for touch (setup.py) ... [?25l[?25hdone
  Created wheel for touch: filename=touch-2020.12.3-py3-none-any.whl size=1422 sha256=0b11b059d3bde6f84be8e25e0445f5f9fc787ddb93d2155ced19d90c7559a864
  Stored in directory: /root/.cache/pip/wheels/03/39/9d/1f1f4cd924104bf4f340ccc29bdff231a08dce99309588c118
  Building wheel for values (setup.py) ... [?25l[?25hdone
  Created wheel for values: filename=values-2020.12.3-py3-none-any.whl size=1385 sha256=df884513410449e9b319b8398b52032fea4a94cdbeba51ab5711ea212e7a416a
  Stored in directory: /root/.cache/pip/wheels/72/5b/76/a2fdac16138610fb0433ad75827f79def289083d657f2d394e
Successfully built touch values
Installing collected packages: values, touch
Successfully installed touch-2020.12.3 values-2020.12.3


In [5]:
pip install touchvision

[31mERROR: Could not find a version that satisfies the requirement touchvision (from versions: none)[0m
[31mERROR: No matching distribution found for touchvision[0m


In [11]:
# CIFAR10 학습에 사용할 라이브러리를 불러옵
import torch
import torchvision
from torchvision import transforms
from torch.utils.data import DataLoader

In [13]:
# sklearn의 pipeline과 같은 용도로 사용됩니다.
transform = transforms.Compose([
                                 transforms.ToTensor(),
                                 transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))
]) 
# bs = 4   ## 나중에 GPU쓰면서 올려봅시다.
batch_size = 4
# CIFAR10 불러옵니다.
# pytorch는 data 정의하고, dataloader를 정의합니다. train, test 둘 다 해줍니다.
train_data = torchvision.datasets.CIFAR10(
    roots=",/",
    train =True,
    download=True,
    transform=transform
)

train_loader = DataLoader(train_data,batch_size=batch_size,shuffle=True)

test_data =torchvision.datasets.CIFAR10(
    roots=",/",
    test =False, #test data이기 때문에
    download=True,
    transform=transform
)

test_loader = DataLoader(test_data,batch_size=batch_size,shuffle=False) # False로 두는 경우 Test data를 고정하고 싶은경우 설정

# 나중에 출력을 위해 CIFAR10 클래스 정의.
classes = ("plane", "car", "bird", "cat", "deer", "dog", "frog", "horse", "ship", "truck")

TypeError: ignored

In [None]:
# 많이 사용되는 코드니까 그냥 한번씩 쳐봅시다.
# 사용할 이미지를 batch_size 만큼 출력하는 코드.
import matplotlib.pyplot as plt
import numpy as np

def imshow(img):
    img = img / 2 + 0.5  # denormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))
    plt.show()

dataiter = iter(train_loader)
images, labels = dataiter.next()  # batch size만큼의 이미지를 불러옵니다. e.g. 4

imshow(torchvision.utils.make_grid(images))
print(" ".join("%s\t" % classes[labels[j]] for j in range(batch_size)))


### 2. Define a CNN

In [None]:
# Neural Network를 정의하기 위해서 Class를 구현해봅니다.
# nn.Module 기억하세요 !
## (input_size-filter_size) / stride + 1--> activation map의 size
import torch.nn as nn
import torch.nn.functional as F

class CNN(nn.Module):
# 생성자
# input -> conv1 -> relu -> conv2 -> relu -> pool ->fc
# 32 x 32 x3 -> 28 x 28 x6 -> 24 X 24 X16 -> 12 X 12 X16
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(in_channels=3,out_channels=6,kernel_size = 5)
        self.relu =nn.ReLU()
        self.conv2 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5)
        self.pool=nn.MaxPool2d(kernel_size = 2, stride=2)
        self.fc = nn.Linear(in_features = 12*12*16,out_fetures= 10)
    
    def forward(self,x): # x = input
        x = self.conv1(x) #32x32x3 -> 28X28X6
        x = self.relu(x)
        x = self.conv2(x) #28x28x6 -> 24X24X16
        x = self.pool(x) # 24X24X16 -> 12X12X16
        x = torch.flatten(x,1) # 2차원 matrix를 1차원 vector로 만들어줍니다.
        x = self.fc(x)
        return x




### 3. Define a Loss function and optimizer

In [None]:
# 학습을 위해 사용할 Loss Function과 Optimizer를 지정합니다.


### 4. Train the Network

### 4-1. Training on CPU

In [None]:
# 먼저 CPU로 학습을 시켜봅니다.
epochs = 

# 구조를 외워두세요. pytorch로 구현할 때 사용하는 기본 뼈대입니다.


print("Finish Training")

### 4-2. Training on GPU

In [None]:
# 지금 사용가능한 GPU가 있는지 확인합니다. Google Colab에서는 런타임을 변경했는지 확인하는 용도이고, 로컬에서 세팅이 잘되었는지 확인도 가능합니다.
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

In [None]:
# check GPU


In [None]:
# convert to CUDA tensors


In [None]:
# 이번엔 GPU training입니다.



In [None]:
# save model


### 5. Test the CNN on test data

In [None]:
dataiter = iter(test_loader) # iterator
images, labels = dataiter.next()

imshow(torchvision.utils.make_grid(images))
print(" ".join("%s\t" % classes[labels[j]] for j in range(batch_size)))

In [None]:
# test samples



In [None]:
# 출력값이 가장 큰 label 출력하기


In [None]:
# test loss와 accuracy를 출력해봅시다.
# 이 코드도 test할 때 주로 사용되는 코드 형태라서 외워두면 좋습니다.


# pytorch에서는 Dynamic Computational Graph를 사용하기 때문에, inference할 때 gradient update를 하지 않는 조건을 꼭 지정해야한다!




In [None]:
# class별로 예측을 얼마나 하는지 살펴봅시다.



## Exercise

1. conv1 의 kernel size를 3x3으로 바꿔보세요.

2. conv1 의 kernel size를 7x7으로 바꿔보세요.

Reference : https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html