# 파이썬으로 배우는 기계학습
# Machine Learning with Python

# 제 13-2 강: 기계학습 오픈 프레임워크 - PyTorch


## 학습 목표
- 기계학습을 위한 오픈 프레임워크는 무엇이 있는지 알아본다.
- TensorFlow, Keras, PyTorch가 무엇인지 이해한다.
- CNN을 이용한 MNIST 데이터를 3가지 프레임워크로 학습하는 것을 이해한다. 

## 학습 내용
- 신경망 구현을 위한 패키지
- PyTorch 란?
- PyTorch 환경 구축
- PyTorch 를 이용한 MNIST 데이터 분석

## 1. 신경망 구현을 위한 패키지

이번 강의에서는 PyTorch 를 소개하겠습니다. PyTorch 를 사용한다면 간단하게 신경망을 구성할 수 있습니다. 데이터를 읽어드린 다음, 신경망을 구성하고 학습시켜 결과를 예측하는 것을 보여드리겠습니다. 

## 2. PyTorch 란?

<img src="https://github.com/idebtor/KMOOC-ML/blob/master/ipynb/images/pytorch.png?raw=true" width="300">
<br><center>그림 1: Pytorch [출처](https://pytorch.org/)</center>

Lua 언어로 개발된 Torch라는 딥러닝 라이브러리가 있었습니다. 머신러닝 라이브러리이자 Scientific Computing 프레임 워크 였습니다. 하지만, Lua 기반이라 다른 라이브러리에 비해 업데이트 속도도 느리고 사용자도 적었습니다. 그런데 이 Torch 를 Facebook에서 Python API로 개발하였습니다. 그러면서 폭발적인 인기를 얻게 되었고, 오늘 여러분들께 소개해 드리게 된 딥러닝 라이브러리 PyTorch입니다.

디버깅이 쉬운 직관적인 코드로 구성되어있다.
모델 그래프가 고정 상태가 아니기 때문에 언제든지 데이터에 따라 모델 조정 작업이 가능하다. (모델을 feed 하면서 정의하기 때문에 언제든 수정이 가능)

## 3. PyTorch 환경 구축

Pytorch를 사용하기 위해서는 Python이 설치되어 있어야 합니다. 이전에, 우리는 Tensorflow를 설치하면서 아나콘다를 이용했으므로, Python을 설치할 필요도 없으며, 이미 아나콘다가 설치되어 있다고 가정하에 설명드리겠습니다.

### 3.1 Anaconda 설치

Anaconda3 를 설치하세요. 이 [링크](https://www.continuum.io/downloads)를 통해 설치하시면 됩니다.

### 3.2 PyTorch 설치

Anaconda 까지 설치되어 있으면 PyTorch를 설치하는 것은 간단합니다. conda command를 이용하는 방법과, pip을 이용하는 방법 2가지가 있습니다.

```conda install pytorch torchvision -c pytorch```


```sudo pip install torch torchvision```

Pytorch가 제대로 설치되어있는지를 알아보기 위해 다음의 코드를 실행시켜보시길 바랍니다.

In [1]:
from __future__ import print_function
import torch
x = torch.rand(5, 3)
print(x)

tensor([[0.7647, 0.3304, 0.6325],
        [0.1758, 0.8955, 0.6468],
        [0.4148, 0.8790, 0.1989],
        [0.0852, 0.3862, 0.1473],
        [0.0085, 0.1239, 0.4428]])


위에서 설치중에 어려움이 있다면, 아래 링크를 참고하도록 합니다.

- [Anaconda 설치](https://www.continuum.io/downloads)
- [Pytorch 설치](https://pytorch.org/get-started/locally/)

## 4. PyTorch 를 이용한 MNIST 데이터 분석

이제 PyTorch 를 사용할 환경이 구축되었습니다. PyTorch 를 이용해서 MNIST 데이터를 분석해보도록 합시다.

### 4.1 MNIST 데이터 읽어오기

PyTorch 에는 datasets 라는 모듈이 있으며, 사람들이 많이 사용하는 데이터를 쉽게 사용할 수 있도록 만들어져 있습니다. MNIST 데이터를 읽어오기 위해서는 datasets.MNIST를 이용하면 됩니다. torch.utils.data 에 있는 DataLoader 클래스에서 생성자 메소드를 호출하면 MNIST 데이터의 학습 데이터와 테스트 데이터를 얻을 수 있습니다.

In [2]:
import torch
from torchvision import datasets, transforms

use_cuda = not False and torch.cuda.is_available()
kwargs = {'num_workers': 1, 'pin_memory': True} if use_cuda else {}

train_loader = torch.utils.data.DataLoader(
        datasets.MNIST('../data', train=True, download=True,
                    transform=transforms.Compose([
                        transforms.ToTensor(),
                        transforms.Normalize((0.1307,), (0.3081,))
                    ])),
        batch_size=64, shuffle=True, **kwargs)
test_loader = torch.utils.data.DataLoader(
        datasets.MNIST('../data', train=False, 
                    transform=transforms.Compose([
                        transforms.ToTensor(),
                        transforms.Normalize((0.1307,), (0.3081,))
                    ])),
        batch_size=64, shuffle=True, **kwargs)

DataLoader 클래스의 객체인 train_loader와 test_loader 안에 있는 dataset에 관한 내용은 다음과 같습니다. 

train_loader는 60000개의 데이터가 들어있으며, 각각에 데이터에 대한 평균과 분산에 대해서도 정리가 되어 있습니다.
test_loader는 10000개의 데이터가 들어있으며, train_loader와 마찬가지로 평균과 분산 값이 들어있습니다.

In [3]:
print(train_loader.dataset)
print(test_loader.dataset)

Dataset MNIST
    Number of datapoints: 60000
    Split: train
    Root Location: ../data
    Transforms (if any): Compose(
                             ToTensor()
                             Normalize(mean=(0.1307,), std=(0.3081,))
                         )
    Target Transforms (if any): None
Dataset MNIST
    Number of datapoints: 10000
    Split: test
    Root Location: ../data
    Transforms (if any): Compose(
                             ToTensor()
                             Normalize(mean=(0.1307,), std=(0.3081,))
                         )
    Target Transforms (if any): None


### 4.2 신경망 구축

이제 신경망을 구축합니다. 이번에는 Tensorflow와 Keras와 다르게 클래스로 구현해보도록 하겠습니다. 
총 3개의 Convolutional Layer를 사용하며 마지막에는 10개의 출력값을 가지는 레이어를 구축합니다. 3개의 Convolutional Layer에는 kernel size가 2인, fitter가 들어가며 Dropout ratio는 0.2를 유지하도록 합니다.

마지막 층은 10개의 뉴런을 사용하며, 각각의 뉴런은 0부터 9까지의 숫자를 예측하는 역할을 합니다. 

또한, 순전파를 위해 forward 메소드도 구현해주도록 합니다. 여기서, 각각의 Convolutional Layer에서 사용할 활성화 함수를 지정해주도록 합니다. 3개의 Layer모두 relu 함수를 활성화 함수로 지정했습니다. 

마지막 층에서는 softmax 함수를 구현하여, 결과를 조금 더 명확히 알 수 있도록 합니다.

In [4]:
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, kernel_size=2)
        self.conv1_drop = nn.Dropout2d(0.2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=2)
        self.conv2_drop = nn.Dropout2d(0.2)
        self.conv3 = nn.Conv2d(32, 64, kernel_size=2)
        self.conv3_drop = nn.Dropout2d(0.2)
        
        self.fc1 = nn.Linear(256, 10)
        
    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1_drop(self.conv1(x)), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = F.relu(F.max_pool2d(self.conv3_drop(self.conv3(x)), 2))
        x = x.view(-1, 256)
        x = self.fc1(x)
        
        return F.log_softmax(x)

### 4.3 하이퍼 파라미터 정의

자, 이제 신경망을 구축했으니 신경망에서 사용할 하이퍼파라미터 값을 설정해주도록 합니다.
반복횟수는 10회로, 학습률은 0.01, random seed를 b값이 랜덤으로 설정되도록 합니다. 또한 RMSprop을 최적화 함수로 사용하도록 지정합니다. 

In [5]:
n_epochs = 10
learning_rate = 0.01
random_seed = 1
log_interval = 10

network = Net()
optimizer = optim.RMSprop(network.parameters(), lr=learning_rate)

### 4.4 train 메소드

이제 모델을 학습시키는 단계입니다. network.train()은 우리가 구현하지는 않았지만, torch.nn.Module에 있는 메소드입니다. 이를 이용하여 학습을 위한 준비를 하고, train_loader에 있는 데이터들을 하나하나 학습시켜나갑니다. 이때, 손실함수로 Cross Entropy를 사용하고 있는 것을 알 수 있네요. 

또, 주목해 볼만한 것은 PyTorch에서 역전파는 `loss.backward()`만으로 수행될 수 있다는 점입니다. 일일이 구현을 안해도되니 매우 편하지요?

In [6]:
def train(epoch):
    network.train()
    for batch_idx, (data, target) in enumerate(train_loader):
        optimizer.zero_grad()
        output = network(data)
        loss = F.cross_entropy(output, target)
        loss.backward()
        optimizer.step()
        if batch_idx % log_interval == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                100. * batch_idx / len(train_loader), loss.item()))
            

### 4.5 test 메소드

이제 학습된 모델을 테스트하는 단계입니다. network.eval() 도 마찬가지로, torch.nn.Module에 있는 메소드입니다. 평가를 위한 준비를 마친 다음, test_loader에 있는데이터 하나하나에 대해 반복하며 모델이 올바른 결과를 내는지 확인합니다. 

In [7]:
def test():
    network.eval()
    test_loss = 0
    correct = 0
    for data, target in test_loader:
        output = network(data)
        test_loss += F.cross_entropy(output, target, size_average=False).item()
        pred = output.data.max(1, keepdim=True)[1]
        correct += pred.eq(target.data.view_as(pred)).sum()
        test_loss /= len(test_loader.dataset)
    print('Test Accuracy {}%\n'.format(100.*correct / len(test_loader.dataset)))

### 4.6 측정

In [8]:
for epoch in range(1, n_epochs+1):
    train(epoch)
    test()







Test Accuracy 96%

Test Accuracy 96%



Test Accuracy 96%

Test Accuracy 96%



Test Accuracy 95%

Test Accuracy 96%



Test Accuracy 95%

Test Accuracy 97%



Test Accuracy 97%



Test Accuracy 96%



## 참고자료

- Udacity 강의 'Artificial Intelligence Nanodegree - Convolutional Neural Networks' [aind2-cnn Jupyter Notebook 파일](https://github.com/udacity/aind2-cnn/blob/master/mnist-mlp/mnist_mlp.ipynb)
- Keras Documentation https://keras.io/

----------
Rejoice in the Lord always. I will say it again: Rejoice! (Ph4:4)