In [1]:
import numpy as np
import matplotlib.pyplot as plt
import torch
import torch.nn as nn # 인공 신경망 모델을 설계할 때 필요한 함수를 모아 놓은 모듈
import torch.nn.functional as F # torch.nn 모듈 중에서도 자주 이용되는 함수를 'F'로 지정
from torchvision import transforms, datasets # 컴퓨터 비전 연구 분야에서 자주 이용하는 torchvision 모듈

In [2]:
if torch.cuda.is_available():
    DEVICE = torch.device('cuda')
else:
    DEVICE = torch.device('cpu')
print('Using PyTorch version:', torch.__version__, ' Device:', DEVICE)

Using PyTorch version: 1.7.1  Device: cpu


<Mini-Batch와 Epoch>
- 1개의 미니배치를 이용해 학습하는 횟수는 'Iteration'라고 한다.
- 미니배치의 데이터 개수를 지정해준다면, Iteration은 전체 데이터 개수에서 1개의 미니배치를 구성하고 있는 데이터 개수를 나눠준 몫 만큼 Iteration을 진행한다.
    - ex) 전체 데이터가 10,000개이고, 1,000개 데이터를 이용해 1개의 미니배치를 구성한다면 1 Epoch당 10회의 Iteration이 발생!

<데이터 셋 불러오기 옵션>
- 데이터를 다운로드할 때, 이미지 데이터에 대한 기본적인 전처리를 동시에 진행할 수 있다.
- 아래의 예제에서는 ```transforms``` 함수 내 ```ToTensor()``` 메서드를 이용해 이미지 데이터를 'tensor' 형태로 변경하였다.
    - 이미지 데이터의 경우, 한 픽셀은 0 ~ 255 범위의 스칼라 값으로 구성되어 있는데, 이를 0 ~ 1 범위로 변경해주는 정규화 과정을 진행해 준 것이다.
    - **다층 퍼셉트론 모델이 포함된 인공 신경망 모델**은 Input 데이터 값의 크기가 커질수록 불안정하거나 과적합되는 방향으로 학습이 진행될 우려가 있기 때문에, **정규화 과정을 이용해 Input으로 이용하는 것을 권장**한다.

In [3]:
# 하이퍼파라미터 지정
BATCH_SIZE = 32  # 미니배치 1개 단위에 대해 데이터가 32개로 구성되어 있는 것을 의미
EPOCHS = 10      # 전체 데이터 셋을 10번 반복해 학습한다는 것을 의미 (즉, 전체 데이터를 이용해 학습을 진행한 횟수)

# MNIST 데이터 셋 다운로드
train_dataset = datasets.MNIST(root = '../data/MNIST',  # 데이터 셋이 저장될 장소를 지정
                               train = True,            # 학습용 데이터 셋으로 지정 
                               download = True,         # 인터넷 상에서 다운로드해서 이용할 것인지 여부
                               transform = transforms.ToTensor()) # 데이터 셋을 tensor 형태로 변경
test_dataset = datasets.MNIST(root = '../data/MNIST',
                              train = False,
                              transform = transforms.ToTensor())
# 다운로드한 MNIST 데이터 셋을 미니배치 단위로 분리
train_loader = torch.utils.data.DataLoader(dataset = train_dataset,
                                           batch_size = BATCH_SIZE, # 미니배치 1개 단위를 구성하는 데이터의 개수
                                           shuffle = True) # 데이터의 순서를 섞고자 할 때 이용(즉, 잘못된 방향으로 학습하는 것을 방지)
test_loader = torch.utils.data.DataLoader(dataset = test_dataset,
                                          batch_size = BATCH_SIZE,
                                          shuffle = False)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ../data/MNIST\MNIST\raw\train-images-idx3-ubyte.gz


HBox(children=(HTML(value=''), FloatProgress(value=1.0, bar_style='info', layout=Layout(width='20px'), max=1.0…

Extracting ../data/MNIST\MNIST\raw\train-images-idx3-ubyte.gz to ../data/MNIST\MNIST\raw
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ../data/MNIST\MNIST\raw\train-labels-idx1-ubyte.gz


HBox(children=(HTML(value=''), FloatProgress(value=1.0, bar_style='info', layout=Layout(width='20px'), max=1.0…

Extracting ../data/MNIST\MNIST\raw\train-labels-idx1-ubyte.gz to ../data/MNIST\MNIST\raw
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ../data/MNIST\MNIST\raw\t10k-images-idx3-ubyte.gz


HBox(children=(HTML(value=''), FloatProgress(value=1.0, bar_style='info', layout=Layout(width='20px'), max=1.0…

Extracting ../data/MNIST\MNIST\raw\t10k-images-idx3-ubyte.gz to ../data/MNIST\MNIST\raw
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ../data/MNIST\MNIST\raw\t10k-labels-idx1-ubyte.gz




HBox(children=(HTML(value=''), FloatProgress(value=1.0, bar_style='info', layout=Layout(width='20px'), max=1.0…

Extracting ../data/MNIST\MNIST\raw\t10k-labels-idx1-ubyte.gz to ../data/MNIST\MNIST\raw
Processing...
Done!


  return torch.from_numpy(parsed.astype(m[2], copy=False)).view(*s)


- X_train
    - **32개의 이미지 데이터가 1개의 미니배치를 구성**하고 있고 **가로 28개, 세로 28개의 픽셀로 구성**되어 있으며 **채널이 1이므로 Gray Scale(즉, 흑백)**로 이루어진 이미지 데이터이다.
- y_train
    - 32개의 이미지 데이터 각각에 label 값이 1개씩 존재하기 때문에 32개의 값을 갖고 있다.

In [4]:
# 데이터 확인하기 (1)
for (X_train, y_train) in train_loader:
    print('X_train:', X_train.size(), 'type:', X_train.type())
    print('y_train:', y_train.size(), 'type:', y_train.type())
    break

X_train: torch.Size([32, 1, 28, 28]) type: torch.FloatTensor
y_train: torch.Size([32]) type: torch.LongTensor


In [5]:
# 데이터 확인하기 (2) >> 코드를 실행하면 Kernel이 꺼진다..왜 이러지?
# pltsize = 1
# plt.figure(figsize = (10 * pltsize, pltsize))
# for i in range(10):
#     plt.subplot(1, 10, i + 1)
#     plt.axis('off')
#     plt.imshow(X_train[i, :, :, :].numpy().reshape(28, 28), cmap = "gray_r")
#     plt.title('Class: ' + str(y_train[i].item()))

In [6]:
# Multi Layer Perceptron (MLP) 모델 설계하기
# PyTorch 모듈 내에 딥러닝 모델 관련 기본 함수를 포함하고 있는 nn.Module 클래스를 상속받는 Net 클래스를 정의
class Net(nn.Module):
    def __init__(self): # Net 클래스의 인스턴스를 생성했을 때 지니게 되는 성질을 정의
        super(Net, self).__init__()        # nn.Module 내에 있는 메서드를 상속받아 사용
        self.fc1 = nn.Linear(28 * 28, 512) # 첫 번째 Fully Connected Layer 정의
        self.fc2 = nn.Linear(512, 256)     # 두 번째 Fully Connected Layer 정의
        self.fc3 = nn.Linear(256, 10)      # 세 번째 Fully Connected Layer 정의
    
    def forward(self, x):
        x = x.view(-1, 28 * 28)  # view 메서드를 통해 2차원 데이터를 784 크기의 1차원 데이터로 변환
        
        x = self.fc1(x)          # __init__()을 통해 정의한 첫 번째 Fully Connected Layer에 1차원으로 펼친 이미지 데이터를 통과
        x = F.sigmoid(x)         # 비선형 함수인 sigmoid()를 이용하여 두 번째 Fully Connected Layer의 Input으로 계산
        
        x = self.fc2(x)          # __init__()을 통해 정의한 두 번째 Fully Connected Layer에 앞서 계산된 x를 통과
        x = F.sigmoid(x)         # 비선형 함수인 sigmoid()를 이용하여 세 번째 Fully Connected Layer의 Input으로 계산
        
        x = self.fc3(x)                # __init__()을 통해 정의한 세 번째 Fully Connected Layer에 앞서 계산된 x를 통과
        x = F.log_softmax(x, dim = 1)  # log_softmax()를 이용하여 최종 Output을 계산
        # <참고>
        # softmax가 아닌 log_softmax를 사용하는 이유는 MLP 모델이 역전파 알고리즘을 이용해 학습을 진행할 때,
        # Loss 값에 대한 Gradient 값을 좀 더 원활하게 계산할 수 있기 때문!
        return x

In [7]:
# Optimizer, Objective Function 설정하기
model = Net().to(DEVICE) # 'DEVICE' 장비를 이용하여 MLP 모델을 완성하기 위해, 앞서 정의한 MLP 모델을 기존에 선정한 'DEVICE'에 할당
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01, momentum = 0.5) # momentum은 Optimizer의 관성을 의미
criterion = nn.CrossEntropyLoss() # MLP 모델의 Output 값과 원-핫 인코딩 값인 Label 값의 Loss를 CrossEntropy를 이용하여 계산

print(model)

Net(
  (fc1): Linear(in_features=784, out_features=512, bias=True)
  (fc2): Linear(in_features=512, out_features=256, bias=True)
  (fc3): Linear(in_features=256, out_features=10, bias=True)
)


In [8]:
# MLP 모델 학습을 진행하며 학습 데이터에 대한 모델 성능을 확인하는 함수 정의 (MLP 모델을 학습)
def train(model, train_loader, optimizer, log_interval):
    model.train() # 기존에 정의한 MLP 모델을 '학습' 상태로 지정
    # train_loader 내에 미니배치 단위로 저장된 데이터를 순서대로 이용하여 MLP 모델을 학습
    for batch_idx, (image, label) in enumerate(train_loader):
        image = image.to(DEVICE) # 미니배치 내에 있는 image 데이터를 이용하여 MLP 모델을 학습시키기 위해 기존에 정의한 장비에 할당
        label = label.to(DEVICE) # 미니배치 내에 있는 image 데이터와 매칭된 label 데이터도 기존에 정의한 장비에 할당
        
        optimizer.zero_grad()    # opimizer의 Gradient를 초기화
        
        output = model(image)    # 장비에 할당한 이미지 데이터를 MLP 모델의 Input으로 이용
        loss = criterion(output, label)
        
        loss.backward()   # Loss 값을 계산한 결과를 바탕으로 역전파를 통해 계산된 Gradient 값을 각 파라미터에 할당
        optimizer.step()  # 각 파라미터에 할당된 Gradient 값을 이용하여 파라미터 값을 업데이트
        
        # 아래의 코드는 위 함수가 실행되는 과정을 모니터링하기 위한 코드
        if batch_idx % log_interval == 0:
            print("Train Epoch: {} [{}/{} ({:.0f}%)]\tTrain Loss: {:.6f}".format(
                epoch, batch_idx * len(image), len(train_loader.dataset), 
                100. * batch_idx / len(train_loader), loss.item()))

In [9]:
# 학습되는 과정 속에서 검증 데이터에 대한 모델 성능을 확인하는 함수 정의 (학습의 진행 과정을 모니터링)
def evaluate(model, test_loader):
    model.eval()   # 학습 과정 또는 학습이 완료된 MLP 모델을 학습 상태가 아닌 '평가' 상태로 지정
    test_loss = 0  # 기존에 정의한 test_loader 내의 데이터를 이용하여 Loss 값을 계산하기 위해 '0'으로 임시 설정
    correct = 0    # 학습 과정 또는 학습이 완료된 MLP 모델이 올바른 Class로 분류한 경우를 count 하기 위해 '0'으로 임시 설정
    
    # MLP 모델을 평가하는 단계에서는 Gradient를 통해 파라미터 값이 업데이트 되는 현상을 방지하기 위해,
    # torch.no_grad() 메서드를 통해 Gradient의 흐름을 억제
    with torch.no_grad():
        for image, label in test_loader:
            image = image.to(DEVICE)  # 미니배치 내에 있는 image 데이터를 이용하여 MLP 모델을 검증하기 위해 기존에 정의한 장비에 할당
            label = label.to(DEVICE)  # 미니배치 내에 있는 image 데이터와 매칭된 label 데이터도 기존에 정의한 장비에 할당
            
            output = model(image)     # 장비에 할당한 image 데이터를 MLP 모델의 Input으로 사용
            test_loss += criterion(output, label).item()   # Loss 값 업데이트
            
            prediction = output.max(1, keepdim = True)[1]  # 가장 큰 벡터 값의 위치에 대응하는 클래스로 예측했다고 판단
            correct += prediction.eq(label.view_as(prediction)).sum().item() # 최종 예측이 올바른지 count
            
    test_loss /= len(test_loader.dataset) # 현재까지 계산된 test_loss 값을 미니배치 개수만큼 나눠서 평균 Loss 값을 계산
    test_accuracy = 100. * correct / len(test_loader.dataset) # 정확도 계산
    return test_loss, test_accuracy

In [10]:
# MLP 모델 학습을 실행하며 Train/Test set의 Loss 및 Test set Accuracy 확인하기
for epoch in range(1, EPOCHS + 1):
    train(model, train_loader, optimizer, log_interval = 200) # MLP 모델 학습 with SGD Optimizer
    test_loss, test_accuracy = evaluate(model, test_loader)   # 각 epoch별로 출력되는 Loss 값과 accuracy 값을 계산
    print('\n[EPOCH: {}], \tTest Loss: {:.4f}, \tTest Accuracy: {:.2f} %\n]'.format(
        epoch, test_loss, test_accuracy))






[EPOCH: 1], 	Test Loss: 0.0699, 	Test Accuracy: 31.50 %
]

[EPOCH: 2], 	Test Loss: 0.0389, 	Test Accuracy: 59.34 %
]

[EPOCH: 3], 	Test Loss: 0.0233, 	Test Accuracy: 78.77 %
]

[EPOCH: 4], 	Test Loss: 0.0173, 	Test Accuracy: 84.20 %
]

[EPOCH: 5], 	Test Loss: 0.0142, 	Test Accuracy: 86.76 %
]

[EPOCH: 6], 	Test Loss: 0.0127, 	Test Accuracy: 88.17 %
]

[EPOCH: 7], 	Test Loss: 0.0121, 	Test Accuracy: 88.70 %
]

[EPOCH: 8], 	Test Loss: 0.0112, 	Test Accuracy: 89.58 %
]

[EPOCH: 9], 	Test Loss: 0.0108, 	Test Accuracy: 89.87 %
]

[EPOCH: 10], 	Test Loss: 0.0104, 	Test Accuracy: 90.24 %
]
