## 1. 일반 FashionMNIST 학습

In [1]:
# 라이브러리 불러오기
from __future__ import print_function
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms

In [2]:
# loader 함수 정의
def get_mnist_loaders(train_batch_size, test_batch_size):
    """Get MNIST data loaders"""
    train_loader = torch.utils.data.DataLoader(
        datasets.MNIST('./data', train=True, download=True,
                       transform=transforms.Compose([
                           transforms.ToTensor(),
                           transforms.Normalize((0.1307,), (0.3081,))
                       ])),
        batch_size=train_batch_size, shuffle=True)
    
    test_loader = torch.utils.data.DataLoader(
        datasets.MNIST('./data', train=False, transform=transforms.Compose([
                           transforms.ToTensor(),
                           transforms.Normalize((0.1307,), (0.3081,))
                       ])),
        batch_size=test_batch_size, shuffle=True)

    return train_loader, test_loader

In [3]:
# 모델 정의
class Net(nn.Module):
    def __init__(self, activation):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)
        self.activation = activation 

    def forward(self, x):
        x = self.activation(self.conv1(x))
        x = self.conv2(x)
        x = F.max_pool2d(x, 2)
        x = self.dropout1(x)
        x = torch.flatten(x, 1)
        x = self.activation(self.fc1(x))
        x = self.dropout2(x)
        x = self.fc2(x)
        output = F.log_softmax(x, dim=1)
        return output

In [4]:
# train, test 정의
def train(log_interval, model, train_loader, optimizer, epoch, device):
    model.train()
    for batch_idx, (data, target) in enumerate(train_loader):
        optimizer.zero_grad()
        output = model(data.to(device))
        loss = F.nll_loss(output, target.to(device))
        loss.backward()
        optimizer.step()
        if batch_idx % log_interval == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                100. * batch_idx / len(train_loader), loss.item()))           

def test(model, test_loader, device):
    model.eval()
    test_loss = 0
    correct = 0
    with torch.no_grad():
        for data, target in test_loader:
            output = model(data.to(device))
            test_loss += F.nll_loss(output, target.to(device), reduction='sum').item()  # sum up batch loss
            pred = output.argmax(dim=1, keepdim=True)  # get the index of the max log-probability
            correct += pred.eq(target.to(device).view_as(pred)).sum().item()

    test_loss /= len(test_loader.dataset)
    test_accuracy = 100. * correct / len(test_loader.dataset)

In [5]:
# 전체 시스템 정의
def train_mnist():
    cfg = { 'device' : "cuda" if torch.cuda.is_available() else "cpu",
          'train_batch_size' : 64,
          'test_batch_size' : 1000,
          'n_epochs' : 1,
          'seed' : 0,
          'log_interval' : 100,
          'save_model' : False,
          'lr' : 0.001,
          'momentum': 0.5,
          'optimizer': optim.SGD,
          'activation': F.relu
          }

    torch.manual_seed(cfg['seed'])
    train_loader, test_loader = get_mnist_loaders(cfg['train_batch_size'], cfg['test_batch_size'])
    model = Net(cfg['activation']).to(cfg['device'])
    optimizer = cfg['optimizer'](model.parameters(), lr=cfg['lr'])
    for epoch in range(1, cfg['n_epochs'] + 1):
        train(cfg['log_interval'], model, train_loader, optimizer, epoch, cfg['device'])
        test_accuracy = test(model, test_loader, cfg['device'])

    if cfg['save_model']:
        torch.save(model.state_dict(), "C:\\Users\\Bang\\JupyterProjects\\Pytorch_GridSearch_Example\\model\\mnist_cnn.pt")

    return test_accuracy

if __name__ == '__main__':
    train_mnist()



## 2. GridSearch 학습

In [6]:
# 패키지 설치
!pip install optuna



In [7]:
# 라이브러리 불러오기(GridSearch)
import optuna

In [8]:
# 전체 시스템 정의
def train_mnist(trial):
    cfg = { 'device' : "cuda" if torch.cuda.is_available() else "cpu",
        'train_batch_size' : 64,
        'test_batch_size' : 1000,
        'n_epochs' : trial.suggest_int('n_epochs', 3, 5, 1),
        'seed' : 0,
        'log_interval' : 100,
        'save_model' : False,
        'lr' : trial.suggest_loguniform('lr', 1e-3, 1e-2),  
        'momentum' : trial.suggest_uniform('momentum', 0.4, 0.99),
        'optimizer': trial.suggest_categorical('optimizer',[optim.SGD, optim.RMSprop]),
        'activation': F.relu
        }

    torch.manual_seed(cfg['seed'])
    train_loader, test_loader = get_mnist_loaders(cfg['train_batch_size'], cfg['test_batch_size'])
    model = Net(cfg['activation']).to(cfg['device'])
    optimizer = cfg['optimizer'](model.parameters(), lr=cfg['lr'])
    for epoch in range(1, cfg['n_epochs'] + 1):
        train(cfg['log_interval'], model, train_loader, optimizer, epoch, cfg['device'])
        test_accuracy = test(model, test_loader, cfg['device'])

    if cfg['save_model']:
        torch.save(model.state_dict(), "C:\\Users\\Bang\\JupyterProjects\\Pytorch_GridSearch_Example\\model\\mnist_cnn.pt")

    return test_accuracy

In [9]:
# GridSearch 정의
study = optuna.create_study(sampler=optuna.samplers.TPESampler(), direction='maximize')

# GridSearch 학습
study.optimize(train_mnist, n_trials=5) # study.optimize(train_mnist, n_trials=20, direction='maximize')

[32m[I 2022-11-28 14:53:47,437][0m A new study created in memory with name: no-name-0f1f6355-b1fe-4099-b71d-c15d824902f6[0m
  'lr' : trial.suggest_loguniform('lr', 1e-3, 1e-2),
  'momentum' : trial.suggest_uniform('momentum', 0.4, 0.99),




[33m[W 2022-11-28 14:54:21,934][0m Trial 0 failed because of the following error: The value None could not be cast to float.[0m




[33m[W 2022-11-28 14:55:08,315][0m Trial 1 failed because of the following error: The value None could not be cast to float.[0m




[33m[W 2022-11-28 14:55:54,551][0m Trial 2 failed because of the following error: The value None could not be cast to float.[0m




[33m[W 2022-11-28 14:56:40,865][0m Trial 3 failed because of the following error: The value None could not be cast to float.[0m




[33m[W 2022-11-28 14:57:38,719][0m Trial 4 failed because of the following error: The value None could not be cast to float.[0m


In [10]:
# 라이브러리 불러오기(joblib)
import joblib

# GridSearch 학습 저장
joblib.dump(study, 'C:\\Users\\Bang\\JupyterProjects\\Pytorch_GridSearch_Example\\GridSearch\\mnist_optuna.pkl')

['C:\\Users\\Bang\\JupyterProjects\\Pytorch_GridSearch_Example\\GridSearch\\mnist_optuna.pkl']

In [11]:
study = joblib.load('C:\\Users\\Bang\\JupyterProjects\\Pytorch_GridSearch_Example\\GridSearch\\mnist_optuna.pkl')
df = study.trials_dataframe().drop(['duration', 'state','datetime_start','datetime_complete'], axis=1)
# 최적의 파라미터를 확인하기 위해서 study.best_trial및 study.best_params도 사용할 수 있다.
# 예를 들어 파라미터 간의 관계를 확인하기 위해 plot_parallel_coordinates(study) 이라는 명령어를 사용하여 아래와 같은 결과를 얻을 수 있다. (이 예시에서는 lr과 momentum이 파라미터)
# 다른 방법으로 contour plot을 이용할 수도 있다. 이 결과는 plot_contour(study) 를 통해 얻을 수 있다.
# 또한 slice_plot(study) 을 호출하여 slice plot을 만들 수 있다. 이는 각 파라미터에 대해 개별적인 최적의 부분 공간이 어디에 위치하는지 이해하는 데 도움이 될 수 있다.
# 마지막으로 study history를 시각화 하기 위해 plot_optimization_history(study) 을 이용할 수도 있다.

# 실제 학습에 사용되는 함수를 수정한다. (예시에서 train_mnist 함수가 이에 해당한다. ) 이 함수는 아래의 조건을 충족해야 한다.
# 1. 평가 지표가 될 점수를 return 해야 한다. 이 함수 안에서 모델의 파라미터를 정해준다. (trial.suggest_.. 함수 이용). 이 함수는 trial을 매개변수로 받아야 한다.
# 2. study.optimize 를 실행한다. 1에서 정의한 함수를 파라미터로 넘겨준다. 예시: study.optimize(train_mnist, n_trials=20, direction='maximize')
df.head(3)

Unnamed: 0,number,value,params_lr,params_momentum,params_n_epochs,params_optimizer
0,0,,0.001541,0.487012,3,<class 'torch.optim.sgd.SGD'>
1,1,,0.007495,0.881453,4,<class 'torch.optim.sgd.SGD'>
2,2,,0.008898,0.930849,4,<class 'torch.optim.rmsprop.RMSprop'>
