Jupyter은 사용하기 쉬운 환경이기는 하지만 모든 개발에서 사용할 수 없다.
따라서 대회에서 제공되는 baseline 코드를 pyTorch 프로젝트로 템플릿화하는 게 첫번째 단계이다.
PyTorch Projcet Template의 장점은 사용자 필요에 따라 수정하기 편리하고, 실행/데이터/모델/설정/로깅 등의 모듈을 분리할 수 있다는 장점이 있다.

https://github.com/victoresque/pytorch-template

가장 많이 쓰는 위 링크의 템플릿의 폴더 구조는 

📁pytorch-template/ <br>
│<br>
├── train.py - main script to start training<br>
├── test.py - evaluation of trained model<br>
│<br>
├── config.json - holds configuration for training<br>
├── parse_config.py - class to handle config file and cli options<br>
│<br>
├── new_project.py - initialize new project with template files<br>
│<br>
├── 📁base/ - abstract base classes<br>
│   ├── base_data_loader.py<br>
│   ├── base_model.py<br>
│   └── base_trainer.py<br>
│<br>
├── 📁data_loader/ - anything about data loading goes here<br>
│   └── data_loaders.py<br>
│<br>
├── 📁data/ - default directory for storing input data<br>
│<br>
├── 📁model/ - models, losses, and metrics<br>
│   ├── model.py<br>
│   ├── metric.py<br>
│   └── loss.py<br>
│<br>
├── 📁saved/<br>
│   ├── models/ - trained models are saved here<br>
│   └── log/ - default logdir for tensorboard and logging output<br>
│<br>
├── 📁trainer/ - trainers<br>
│   └── trainer.py<br>
│<br>
├── 📁logger/ - module for tensorboard visualization and logging<br>
│   ├── visualization.py<br>
│   ├── logger.py<br>
│   └── logger_config.json<br>
│  <br>
└── 📁utils/ - small utility functions<br>
    ├── util.py<br>
    └── ...<br>

하지만 내게 맞춤화해서 이번 대회에서 사용한 템플릿 구조는 아래와 같다.<br>
📁pytorch-template/<br>
│<br>
├── train.py - 모델을 학습한다. seed_everything 함수: seed 결정 / main 함수: Dataloader을 불러오고, Model과 Trainer을 설정한다<br>
├── inference.py - 저장된 모델로 예측을 진행한다. output 형식(submission_format.csv)을 불러와서 예측된 결과로 바꿔주고, output.csv로 출력한다<br>
├── requirements.txt - pytorch, pandas, wandb 등의 버전 정보를 저장한다 / pip install -r requirements.txt<br>
│<br>
├── 📁data/ input 데이터(train.csv, dev.csv, test.csv)를 저장한다. 저작권 이슈가 있으므로 .gitignore을 사용해 remote에 올리지 않도록 주의한다<br>
│<br>
├── 📁dataloader/ 데이터를 로드해온다. <br>
│   └── data_loaders.py - baseline의 train.py에 있던 Dataset 클래스(tokenization, preprocessing, setup 등의 함수)도 포함되어있다. pytorch_lightning을 사용했다<br>
│<br>
├── 📁models/ <br>
│   ├── model.py - baseline의 train.py에 있던 Model 클래스<br>
│   ├── optimizer.py - config에서 optimizer, scheduler 정보를 받아와서 설정한다.<br>
│   └── loss_function.py - loss 함수로 L1loss를 설정한다<br>
│<br>
├── 📁configs/ config.json 파일을 사용하지 않고 argparse를 사용해서 argument를 설정한다. 모델 정보, wandb 플젝명, 데이터 경로 등을 수정할 수 있다.<br>
│   └── configs.py <br>
│<br>
├── 📁trainer/ - trainers<br>
│   └── trainer.py - earlystopping 등을 설정한다.<br>
│<br>
└── 📁notebook/ .ipynb 파일들을 모아뒀다.<br>