# python 파일 ipynb로 통합
- 파일 통합
- 통합하고 주석달아서 필기

## 0. 라이브러리 , 패키지 임포트

In [6]:
import os
from copy import deepcopy
import argparse # 명령행 패키지

# 연산
import numpy as np

# 파이토치
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim  # optimizer 패키지

## 1. model.py

In [8]:
class ImageClassifier(nn.Module):
    
    def __init__(self, input_size, output_size):
        super().__init__()
        self.input_size = input_size
        self.output_size = output_size

        # FCL 구성
        self.layers = nn.Sequential(
            nn.Linear(input_size, 500),
            nn.LeakyReLU(),
            nn.BatchNorm1d(500),
            nn.Linear(500, 400),
            nn.LeakyReLU(),
            nn.BatchNorm1d(400),
            nn.Linear(400, 300),
            nn.LeakyReLU(),
            nn.BatchNorm1d(300),
            nn.Linear(300, 200),
            nn.LeakyReLU(),
            nn.BatchNorm1d(200),
            nn.Linear(200, 100),
            nn.LeakyReLU(),
            nn.BatchNorm1d(100),
            nn.Linear(100, 50),
            nn.LeakyReLU(),
            nn.BatchNorm1d(50),
            nn.Linear(50, output_size),
            nn.Softmax(dim=-1),
            )

    def forward(self, x):
        # |x| = (batch_size, input_size) = (batch_size, 784(28x28))
        y = self.layers(x)
        # |y| = (batch_size, output_size(=10)) = y_hat
        return y

## 2. trainer.py

In [9]:
class Trainer():

    def __init__(self, model, optimizer, crit):
        self.model = model
        self.optimizer = optimizer
        self.crit = crit

        super().__init__()

    def _train(self, x, y, config):
        self.model.train()  # 모델을 train 모드로 전환. 빼먹지말고 항상 명심할것 

        # Shuffle before begin / 매 에포크마다 x,y 데이터를 섞어줘야 한다.
        # x, y 페어를 이뤄서 섞어줘야한다.
        # x개만큼(mnist면 60000개) 랜덤 인덱스를 만들어준다.
        indices = torch.randperm(x.size(0), device=x.device)
        # 6만개 랜덤 인덱스로 index_select로 원본데이터를 섞어준다.
        # 그리고 split으로 배치 개수만큼으로 쪼개준다. 
        # 배치 사이즈가 100이면 x에는 랜덤으로 섞인 60개의 배치묶음이 생긴다.
        x = torch.index_select(x, dim=0, index=indices).split(config.batch_size, dim=0)
        y = torch.index_select(y, dim=0, index=indices).split(config.batch_size, dim=0)

        total_loss = 0

        for i, (x_i, y_i) in enumerate(zip(x, y)):
            y_hat_i = self.model(x_i)
            # Crossentropy Loss
            loss_i = self.crit(y_hat_i, y_i.squeeze()) # 혹시모를 차원을 맞추기위한 스퀴즈

            # Initialize the gradients of the model
            self.optimizer.zero_grad() # 기존 기울기 초기화
            loss_i.backward() # 역전파

            self.optimizer.step() # 최적화 진행

            if config.verbose >= 2:
                print(
                    f'Train Iteration{i+1}/{len(x)} : loss = {float(loss_i):.4f}')

            # Don't forget to detach to prevent memory leak.
            # loss_i는 텐서형이다. 그리고 지금껏 쓰인 계산그래프가 저장되어있다.
            # float을 안하고 그냥 하면 total_loss에 모든 iteration의 computational graph가 물려있게된다.
            # 결론적으로 이것들이 다 메모리를 잡고있어서 코스트가 증가하는 꼴(메모리 누수)
            # 그렇기에 파이썬의 float형으로 바꿔 없애주자.
            total_loss += float(loss_i)

        return total_loss / len(x)

    def _validate(self, x, y, config):
        # Turn evaluation mode on.
        self.model.eval() # 꼭 evaluation 모드로 변경해야한다.

        # Turn on the no_grad mode to make more efficiently
        with torch.no_grad(): # 검증엔 경사하강이 필요없다.
            # Shuffle before begin. 검증인 셔플안해도될수도 있지만 그냥 했다.
            indices = torch.randperm(x.size(0), device=x.device)
            x = torch.index_select(x, dim=0, index=indices).split(config.batch_size, dim=0)
            y = torch.index_select(y, dim=0, index=indices).split(config.batch_size, dim=0)

            total_loss = 0

            for i, (x_i, y_i) in enumerate(zip(x, y)):
                y_hat_i = self.model(x_i)
                loss_i = self.crit(y_hat_i, y_i.squeeze())

                if config.verbose >= 2:
                    print(
                        f'Valid Iteration{i+1}/{len(x)} : loss = {float(loss_i):.4f}')

                total_loss += float(loss_i)

            return total_loss / len(x)

    def train(self, train_data, valid_data, config):
        lowest_loss = np.inf
        best_model = None

        for epoch_index in range(config.n_epochs):
            train_loss = self._train(train_data[0], train_data[i], config)
            valid_loss = self._validate(valid_data[0], valid_data[1], config)

            # You must use deep copy to take a snapshot of current best weights.
            # deepcopy를 안해주면 for돌때마다 best_model이 계속바뀐다. (메모리주소참조)
            if valid_loss <= lowest_loss:
                lowest_loss = valid_loss
                best_model = deepcopy(self.model.state_dict())

            print(f'Epoch{epoch_index + 1}/{config.n_epochs} : train_loss = {train_loss:.4d}, valid_loss = {valid_loss:.4d}, lowest_loss = {lowest_loss:.4d}')

        # Restore to best model
        self.model.load_state_dict(best_model)

## 3. utils.py

In [10]:
def load_mnist(is_train=True, flatten=True):
    from torchvision import datasets, transforms

    dataset = datasets.MNIST(
        '../data', train=is_train, download=True,
        transform=transforms.Compose([
            transforms.ToTensor(),
        ]),
    )

    x = dataset.data.float() / 255.
    y = dataset.targets

    if flatten:
        x = x.view(x.size(0), -1)

    return x, y

## 4. train.py

In [None]:
# CLI 환경 인자 설정
def define_argparser():
    p = argparse.ArgumentParser()
    
    # 저장될 모델, weight파일 이름
    p.add_argument('--model_fn', required=True)
    # gpu_id
    p.add_argument('--gpu_id', type=int, default=0 if torch.cuda.is_available() else -1)
    
    # train, validation set split ratio
    p.add_argument('--train_ratio', type=float, default=.8)

    p.add_argument('--batch_size', type=int, default=64)
    p.add_argument('--n_epochs', type=int, default=20)
    p.add_argument('--verbose', type=int, default=2)

    config = p.parse_args()

    return config


def main(config):
    # Set device based on user defined configuration.
    device = torch.device('cpu') if config.gpu_id < 0 else torch.device('cuda:%d' % config.gpu_id)

    x, y = load_mnist(is_train=True)
    # Reshape tensor to chunk of 1-d vectors.
    x = x.view(x.size(0), -1)

    train_cnt = int(x.size(0) * config.train_ratio)
    valid_cnt = x.size(0) - train_cnt

    # Shuffle dataset to split into train/valid set.
    indices = torch.randperm(x.size(0))
    x = torch.index_select(
        x,
        dim=0,
        index=indices
    ).to(device).split([train_cnt, valid_cnt], dim=0)
    y = torch.index_select(
        y,
        dim=0,
        index=indices
    ).to(device).split([train_cnt, valid_cnt], dim=0)

    print("Train:", x[0].shape, y[0].shape)
    print("Valid:", x[1].shape, y[1].shape)

    model = ImageClassifier(28**2, 10).to(device)
    optimizer = optim.Adam(model.parameters())
    crit = nn.CrossEntropyLoss() # nn.NLLLoss()

    trainer = Trainer(model, optimizer, crit)

    trainer.train((x[0], y[0]), (x[1], y[1]), config)

    # Save best model weights.
    torch.save({
        'model': trainer.model.state_dict(),
        'config': config,
    }, config.model_fn)

In [None]:
if __name__ == '__main__':
    config = define_argparser()
    main(config)