# 05. PyTorch 모듈러 배우기

노트북으로 작성할 코드를 파이썬 스크립트(.py)로 어떻게 전환하는가

주피터에서 작성한 코드를 여러 개의 스크립트 파일로 나누어 **기능별로 모듈화 하는 것**

예를 들면 다음과 같이 나눌 수 있다. 

- data_setup.py : 데이터 다운로드 및 전처리 기능 담당
- engine.py : 훈련 및 평가용 함수 정의
- model_builder.py or model.py : PyTorch 모델 정의
- train.py : 전체 학습 파이프라인을 실행하는 메인 스크립트
- utils.py : 시각화 등 여러 유틸리티 함수 모음



### 노트북의 장점과 단점 

**장점** 

실험을 빠르게 반복하고 아이디어를 시각화하고 초기 프로토타이핑 단계에서 강력함

**단점**  

프로젝트 규모가 커질수록 코드의 재사용성과 유지보수성 떨어짐

셀 기반의 실행 방식 때문에 의존성이 꼬이거나 실행 순서 문제가 발생할 수 있음

협업이만 버전 관리 측면에서 불편할 수 있음





### 실전에서의 PyTorch 사용 예

다음과 같은 바법으로 train.py 스크립트를 실행하도록 한다. <br>
python train.py --model MODEL_NAME --batch_size BATCH_SIZE --lr LEARNING_RATE --num_epochs NUM_EPOCHS <br>

예를 들어 TinyVGG 모델을 10에폭동안 학습하고 싶다면<br>
python train.py --model tinyvgg --batch_size 32 --lr 0.001 --num_epochs 10



%%writefile 이라는 매직커멘드를 이용해서 각 주요 부분을 파이썬 스크립트 파일로 저장하는 코드 <br>
즉 data_setup.py, train.py 등을 자동 생성

**최종 목표**
pytoh train.py 라는 커맨드 라인 한 줄로 모델 훈련 가능하게 하기

In [2]:
%%writefile going_modular/data_setup.py

import os
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

NUM_WORKERS = os.cpu_count()

def create_dataloaders(train_dir: str, 
                      test_dir: str,
                      transform: transforms.Compose,
                      batch_size: int,
                      num_workers: int=NUM_WORKERS):
    """
    학습용 & 테스트용 데이터로더 만드는 함수

    학습용 데이터와 테스트용 데이터가 있는 디렉토리 경로를 받아서 파이토치 데이터셋과 데이터로더로 변환

    Args:
        train_dir : 훈련용 데이터 디렉토리 경로
        test_dir : 
        transform :
        batch_size :
        num_workers :
    """

    train_data = datasets.ImageFolder(train_dir, transform = transform)
    test_Data - datasets.ImageFolder(test_dir, transform  = transform)

    class_names = train_data.classes

    train_dataloader = DataLoader(
        train_data,
        batch_size = batch_size,
        suhffle = True,
        num_workers = num_workers,
        pin_memory = True
    )
    test_dataloader = DataLoader(
        test_data,
        batch_size = batch_size,
        shuffle = False,
        num_workers = num_workers,
        pin_memory = True
    )

    return train_dataloader, test_dataloader, class_names

Writing going_modular/data_setup.py


In [None]:
from going_modular import data_setup

train_dataloader, test_dataloader, class_names = data_setup.create_dataloaders()