[View Source Code](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/05_pytorch_going_modular.md) | [View Slides](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/slides/05_pytorch_going_modular.pdf) 

# 05. PyTorch Going Modular (Chuyển sang dạng modular)

Phần này trả lời câu hỏi: "làm thế nào để chuyển code notebook thành các Python scripts?"

Để làm điều đó, chúng ta sẽ chuyển những code cells hữu ích nhất trong [notebook 04. PyTorch Custom Datasets](https://www.learnpytorch.io/04_pytorch_custom_datasets/) thành một loạt các Python scripts được lưu vào thư mục có tên [`going_modular`](https://github.com/mrdbourke/pytorch-deep-learning/tree/main/going_modular).

## Modular (dạng modular) là gì?

Going modular có nghĩa là chuyển code notebook (từ Jupyter Notebook hoặc Google Colab notebook) thành một loạt các Python scripts khác nhau cung cấp chức năng tương tự.

Ví dụ, chúng ta có thể chuyển code notebook từ một loạt các cells thành các Python files sau:

* `data_setup.py` - một file để chuẩn bị và tải xuống dữ liệu (data) nếu cần.
* `engine.py` - một file chứa các hàm huấn luyện (training functions) khác nhau.
* `model_builder.py` hoặc `model.py` - một file để tạo một mô hình PyTorch (PyTorch model).
* `train.py` - một file để tận dụng tất cả các files khác và huấn luyện (train) một mô hình PyTorch đích (target PyTorch model).
* `utils.py` - một file dành riêng cho các hàm tiện ích hữu ích (helpful utility functions).

> **Lưu ý:** Việc đặt tên và bố cục của các files trên sẽ phụ thuộc vào trường hợp sử dụng và yêu cầu code của bạn. Python scripts cũng chung chung như các notebook cells riêng lẻ, có nghĩa là bạn có thể tạo một script cho hầu hết mọi loại chức năng.

## Tại sao bạn muốn chuyển sang modular?

Notebooks rất tuyệt vời để khám phá lặp đi lặp lại (iteratively exploring) và chạy các thí nghiệm (experiments) một cách nhanh chóng.

Tuy nhiên, đối với các dự án quy mô lớn hơn, bạn có thể thấy Python scripts có thể tái tạo (reproducible) hơn và dễ chạy hơn.

Mặc dù đây là một chủ đề tranh luận, vì các công ty như [Netflix đã cho thấy cách họ sử dụng notebooks cho production code](https://netflixtechblog.com/notebook-innovation-591ee3221233).

**Production code** là code chạy để cung cấp dịch vụ cho ai đó hoặc cái gì đó.

Ví dụ, nếu bạn có một ứng dụng (app) chạy trực tuyến mà người khác có thể truy cập và sử dụng, code chạy ứng dụng đó được coi là **production code**.

Và các thư viện như [`nb-dev`](https://github.com/fastai/nbdev) của fast.ai (viết tắt của notebook development) cho phép bạn viết toàn bộ Python libraries (bao gồm cả documentation) bằng Jupyter Notebooks.

### Ưu và nhược điểm của notebooks so với Python scripts

Có tranh luận cho cả hai phía.

Nhưng danh sách này tóm tắt một vài chủ đề chính.

|               | **Ưu điểm (Pros)**                                               | **Nhược điểm (Cons)**                                     |
| ------------- | ------------------------------------------------------ | -------------------------------------------- |
| **Notebooks** | Dễ thí nghiệm/bắt đầu (Easy to experiment/get started)                         | Versioning có thể khó (Versioning can be hard)                       |
|               | Dễ chia sẻ (Easy to share) (ví dụ: link đến Google Colab notebook) | Khó sử dụng chỉ các phần cụ thể (Hard to use only specific parts)              |
|               | Rất trực quan (Very visual)                                            | Text và graphics có thể cản trở code (Text and graphics can get in the way of code) |

|                    | **Ưu điểm (Pros)**                                                                            | **Nhược điểm (Cons)**                                                                                  |
| ------------------ | ----------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------- |
| **Python scripts** | Có thể đóng gói code lại với nhau (Can package code together) (tiết kiệm việc viết lại code tương tự trên các notebooks khác nhau) | Thí nghiệm không trực quan bằng (Experimenting isn't as visual) (thường phải chạy toàn bộ script thay vì một cell) |
|                    | Có thể sử dụng git cho versioning                                                          |                                                                                           |
|                    | Nhiều dự án open source sử dụng scripts                                               |                                                                                           |
|                    | Các dự án lớn hơn có thể chạy trên cloud vendors (không hỗ trợ notebooks nhiều)     |                                                                                           |

### Quy trình làm việc của tôi (My workflow)

Tôi thường bắt đầu các dự án machine learning trong Jupyter/Google Colab notebooks để thí nghiệm nhanh (quick experimentation) và trực quan hóa (visualization).

Sau đó, khi tôi có thứ gì đó hoạt động, tôi chuyển những phần code hữu ích nhất sang Python scripts.

<img src="https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/05-my-workflow-for-experimenting.png" alt="one possible workflow for writing machine learning code, start with jupyter or google colab notebooks and then move to Python scripts when you've got something working." width=1000/>

*Có nhiều quy trình làm việc (workflows) có thể có để viết code machine learning. Một số thích bắt đầu với scripts, những người khác (như tôi) thích bắt đầu với notebooks và chuyển sang scripts sau đó.*

### PyTorch trong thực tế (PyTorch in the wild)

Trong các chuyến đi của bạn, bạn sẽ thấy nhiều code repositories cho các dự án ML dựa trên PyTorch có hướng dẫn về cách chạy code PyTorch dưới dạng Python scripts.

Ví dụ, bạn có thể được hướng dẫn chạy code như sau trong terminal/command line để huấn luyện một mô hình (train a model):

```
python train.py --model MODEL_NAME --batch_size BATCH_SIZE --lr LEARNING_RATE --num_epochs NUM_EPOCHS
```

<img src="https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/05-python-train-command-line-annotated.png" alt="command line call for training a PyTorch model with different hyperparameters" width=1000/> 

*Chạy một PyTorch `train.py` script trên command line với các cài đặt hyperparameter khác nhau.*

Trong trường hợp này, `train.py` là Python script đích (target Python script), nó có thể sẽ chứa các hàm để huấn luyện một mô hình PyTorch (train a PyTorch model).

Và `--model`, `--batch_size`, `--lr` và `--num_epochs` được gọi là argument flags.

Bạn có thể đặt chúng thành bất kỳ giá trị nào bạn thích và nếu chúng tương thích với `train.py`, chúng sẽ hoạt động, nếu không, chúng sẽ báo lỗi.

Ví dụ, giả sử chúng ta muốn huấn luyện (train) mô hình TinyVGG từ notebook 04 trong 10 epochs với batch size là 32 và learning rate là 0.001:

```
python train.py --model tinyvgg --batch_size 32 --lr 0.001 --num_epochs 10
```

Bạn có thể thiết lập bất kỳ số lượng argument flags nào trong `train.py` script để phù hợp với nhu cầu của mình.

PyTorch blog post để huấn luyện các mô hình computer vision tiên tiến (state-of-the-art) sử dụng style này.

<img src="https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/05-training-sota-recipe.png" alt="PyTorch training script recipe for training state of the art computer vision models" width=800/>

*PyTorch command line training script recipe để huấn luyện các mô hình computer vision tiên tiến với 8 GPUs. Nguồn: [PyTorch blog](https://pytorch.org/blog/how-to-train-state-of-the-art-models-using-torchvision-latest-primitives/#the-training-recipe).*

## Những gì chúng ta sẽ đề cập (What we're going to cover)

Khái niệm chính của phần này là: **chuyển các code cells notebook hữu ích thành các Python files có thể tái sử dụng**.

Làm điều này sẽ giúp chúng ta tiết kiệm việc viết cùng một code lặp đi lặp lại.

Có hai notebooks cho phần này:

1. [**05. Going Modular: Part 1 (cell mode)**](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/05_pytorch_going_modular_cell_mode.ipynb) - notebook này được chạy như một Jupyter Notebook/Google Colab notebook truyền thống và là phiên bản tóm tắt của [notebook 04](https://www.learnpytorch.io/04_pytorch_custom_datasets/).
2. [**05. Going Modular: Part 2 (script mode)**](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/05_pytorch_going_modular_script_mode.ipynb) - notebook này giống với số 1 nhưng có thêm chức năng để chuyển từng phần chính thành Python scripts, chẳng hạn như `data_setup.py` và `train.py`. 

Văn bản trong tài liệu này tập trung vào các code cells 05. Going Modular: Part 2 (script mode), những cells có `%%writefile ...` ở đầu.

### Tại sao hai phần? (Why two parts?)

Bởi vì đôi khi cách tốt nhất để học một thứ gì đó là xem nó *khác* như thế nào so với thứ khác.

Nếu bạn chạy từng notebook cạnh nhau, bạn sẽ thấy chúng khác nhau như thế nào và đó là nơi có những học hỏi quan trọng.

<img src="https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/05-notebook-cell-mode-vs-script-mode.png" alt="running cell mode notebook vs a script mode notebook" width=1000/>

*Chạy hai notebooks cho phần 05 cạnh nhau. Bạn sẽ nhận thấy rằng **script mode notebook có thêm code cells** để chuyển code từ cell mode notebook thành Python scripts.*

### Những gì chúng ta đang hướng tới (What we're working towards)

Đến cuối phần này, chúng ta muốn có hai thứ:

1. Khả năng huấn luyện (train) mô hình mà chúng ta đã xây dựng trong notebook 04 (Food Vision Mini) chỉ với một dòng code trên command line: `python train.py`.
2. Một cấu trúc thư mục (directory structure) của các Python scripts có thể tái sử dụng, chẳng hạn như: 

```
going_modular/
├── going_modular/
│   ├── data_setup.py
│   ├── engine.py
│   ├── model_builder.py
│   ├── train.py
│   └── utils.py
├── models/
│   ├── 05_going_modular_cell_mode_tinyvgg_model.pth
│   └── 05_going_modular_script_mode_tinyvgg_model.pth
└── data/
    └── pizza_steak_sushi/
        ├── train/
        │   ├── pizza/
        │   │   ├── image01.jpeg
        │   │   └── ...
        │   ├── steak/
        │   └── sushi/
        └── test/
            ├── pizza/
            ├── steak/
            └── sushi/
```

### Những điều cần lưu ý (Things to note)

* **Docstrings** - Viết code có thể tái tạo (reproducible) và dễ hiểu là quan trọng. Và với điều này trong tâm trí, mỗi hàm/class mà chúng ta sẽ đặt vào scripts đã được tạo với [Python docstring style của Google](https://google.github.io/styleguide/pyguide.html#383-functions-and-methods) trong tâm trí.
* **Imports ở đầu scripts** - Vì tất cả các Python scripts mà chúng ta sẽ tạo có thể được coi là một chương trình nhỏ riêng biệt, tất cả các scripts đều yêu cầu các input modules của chúng được import ở đầu script, ví dụ:

```python
# Import modules required for train.py
import os
import torch
import data_setup, engine, model_builder, utils

from torchvision import transforms
```

## Bạn có thể nhận trợ giúp ở đâu? (Where can you get help?)

Tất cả các tài liệu cho khóa học này [đều có sẵn trên GitHub](https://github.com/mrdbourke/pytorch-deep-learning).

Nếu bạn gặp khó khăn, bạn có thể đặt câu hỏi trên [trang GitHub Discussions của khóa học](https://github.com/mrdbourke/pytorch-deep-learning/discussions).

Và tất nhiên, có [PyTorch documentation](https://pytorch.org/docs/stable/index.html) và [PyTorch developer forums](https://discuss.pytorch.org/), một nơi rất hữu ích cho mọi thứ về PyTorch. 

## 0. Cell mode vs. script mode

Một cell mode notebook chẳng hạn như [05. Going Modular Part 1 (cell mode)](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/05_pytorch_going_modular_cell_mode.ipynb) là một notebook chạy bình thường, mỗi cell trong notebook là code hoặc markdown.

Một script mode notebook chẳng hạn như [05. Going Modular Part 2 (script mode)](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/going_modular/05_pytorch_going_modular_script_mode.ipynb) rất giống với cell mode notebook, tuy nhiên, nhiều code cells có thể được chuyển thành Python scripts.

> **Lưu ý:** Bạn *không cần* tạo Python scripts thông qua notebook, bạn có thể tạo chúng trực tiếp thông qua IDE (integrated developer environment) như [VS Code](https://code.visualstudio.com/). Có script mode notebook như một phần của phần này chỉ để demonstrateột cách chuyển từ notebooks sang Python scripts.

## 1. Lấy dữ liệu (Get data)

Việc lấy dữ liệu (data) trong mỗi notebook 05 xảy ra giống như trong [notebook 04](https://www.learnpytorch.io/04_pytorch_custom_datasets/#1-get-data).

Một cuộc gọi được thực hiện tới GitHub thông qua Python's `requests` module để tải xuống một `.zip` file và giải nén nó.

```python 
import os
import requests
import zipfile
from pathlib import Path

# Setup path to data folder
data_path = Path("data/")
image_path = data_path / "pizza_steak_sushi"

# If the image folder doesn't exist, download it and prepare it... 
if image_path.is_dir():
    print(f"{image_path} directory exists.")
else:
    print(f"Did not find {image_path} directory, creating one...")
    image_path.mkdir(parents=True, exist_ok=True)
    
# Download pizza, steak, sushi data
with open(data_path / "pizza_steak_sushi.zip", "wb") as f:
    request = requests.get("https://github.com/mrdbourke/pytorch-deep-learning/raw/main/data/pizza_steak_sushi.zip")
    print("Downloading pizza, steak, sushi data...")
    f.write(request.content)

# Unzip pizza, steak, sushi data
with zipfile.ZipFile(data_path / "pizza_steak_sushi.zip", "r") as zip_ref:
    print("Unzipping pizza, steak, sushi data...") 
    zip_ref.extractall(image_path)

# Remove zip file
os.remove(data_path / "pizza_steak_sushi.zip")
```

Điều này dẫn đến việc có một file gọi là `data` chứa một thư mục khác gọi là `pizza_steak_sushi` với các hình ảnh pizza, steak và sushi ở định dạng phân loại hình ảnh tiêu chuẩn (standard image classification format).

```
data/
└── pizza_steak_sushi/
    ├── train/
    │   ├── pizza/
    │   │   ├── train_image01.jpeg
    │   │   ├── test_image02.jpeg
    │   │   └── ...
    │   ├── steak/
    │   │   └── ...
    │   └── sushi/
    │       └── ...
    └── test/
        ├── pizza/
        │   ├── test_image01.jpeg
        │   └── test_image02.jpeg
        ├── steak/
        └── sushi/
```

## 2. Tạo Datasets và DataLoaders (`data_setup.py`)

Khi chúng ta đã có dữ liệu (data), chúng ta có thể chuyển nó thành PyTorch `Dataset`s và `DataLoader`s (một cho training data và một cho testing data).

Chúng ta chuyển đổi code tạo `Dataset` và `DataLoader` hữu ích thành một hàm gọi là `create_dataloaders()`.

Và chúng ta viết nó vào file bằng cách sử dụng dòng `%%writefile going_modular/data_setup.py`. 

```py title="data_setup.py"
%%writefile going_modular/data_setup.py
"""
Contains functionality for creating PyTorch DataLoaders for 
image classification data.
Chứa chức năng để tạo PyTorch DataLoaders cho 
dữ liệu phân loại hình ảnh (image classification data).
"""
import os

from torchvision import datasets, transforms
from torch.utils.data import DataLoader

NUM_WORKERS = os.cpu_count()

def create_dataloaders(
    train_dir: str, 
    test_dir: str, 
    transform: transforms.Compose, 
    batch_size: int, 
    num_workers: int=NUM_WORKERS
):
  """Creates training and testing DataLoaders.
  Tạo training và testing DataLoaders.

  Takes in a training directory and testing directory path and turns
  them into PyTorch Datasets and then into PyTorch DataLoaders.
  Nhận đường dẫn thư mục training và testing và chuyển
  chúng thành PyTorch Datasets và sau đó thành PyTorch DataLoaders.

  Args:
    train_dir: Path to training directory.
               Đường dẫn đến thư mục training.
    test_dir: Path to testing directory.
              Đường dẫn đến thư mục testing.
    transform: torchvision transforms to perform on training and testing data.
               torchvision transforms để thực hiện trên training và testing data.
    batch_size: Number of samples per batch in each of the DataLoaders.
                Số lượng samples mỗi batch trong mỗi DataLoader.
    num_workers: An integer for number of workers per DataLoader.
                 Một số nguyên cho số lượng workers mỗi DataLoader.

  Returns:
    A tuple of (train_dataloader, test_dataloader, class_names).
    Where class_names is a list of the target classes.
    Một tuple của (train_dataloader, test_dataloader, class_names).
    Trong đó class_names là danh sách các target classes.
    Example usage:
      train_dataloader, test_dataloader, class_names = \
        = create_dataloaders(train_dir=path/to/train_dir,
                             test_dir=path/to/test_dir,
                             transform=some_transform,
                             batch_size=32,
                             num_workers=4)
  """
  # Use ImageFolder to create dataset(s)
  # Sử dụng ImageFolder để tạo dataset(s)
  train_data = datasets.ImageFolder(train_dir, transform=transform)
  test_data = datasets.ImageFolder(test_dir, transform=transform)

  # Get class names
  # Lấy class names
  class_names = train_data.classes

  # Turn images into data loaders
  # Chuyển images thành data loaders
  train_dataloader = DataLoader(
      train_data,
      batch_size=batch_size,
      shuffle=True,
      num_workers=num_workers,
      pin_memory=True,
  )
  test_dataloader = DataLoader(
      test_data,
      batch_size=batch_size,
      shuffle=False, # don't need to shuffle test data
                     # không cần shuffle test data
      num_workers=num_workers,
      pin_memory=True,
  )

  return train_dataloader, test_dataloader, class_names
```

Nếu chúng ta muốn tạo `DataLoader`s, chúng ta giờ có thể sử dụng hàm trong `data_setup.py` như thế này:

```python
# Import data_setup.py
from going_modular import data_setup

# Create train/test dataloader and get class names as a list
# Tạo train/test dataloader và lấy class names dưới dạng list
train_dataloader, test_dataloader, class_names = data_setup.create_dataloaders(...)
```

## 3. Tạo một mô hình (Making a model) (`model_builder.py`)

Qua một vài notebooks trước (notebook 03 và notebook 04), chúng ta đã xây dựng mô hình TinyVGG một vài lần.

Vì vậy, có lý khi đặt mô hình (model) vào file riêng để chúng ta có thể tái sử dụng nó nhiều lần.

Hãy đặt model class `TinyVGG()` của chúng ta vào một script với dòng `%%writefile going_modular/model_builder.py`:

```python title="model_builder.py"
%%writefile going_modular/model_builder.py
"""
Contains PyTorch model code to instantiate a TinyVGG model.
Chứa code mô hình PyTorch để tạo instance một mô hình TinyVGG.
"""
import torch
from torch import nn 

class TinyVGG(nn.Module):
  """Creates the TinyVGG architecture.
  Tạo kiến trúc TinyVGG.

  Replicates the TinyVGG architecture from the CNN explainer website in PyTorch.
  See the original architecture here: https://poloclub.github.io/cnn-explainer/
  Tái tạo kiến trúc TinyVGG từ trang web CNN explainer trong PyTorch.
  Xem kiến trúc gốc tại đây: https://poloclub.github.io/cnn-explainer/
  
  Args:
    input_shape: An integer indicating number of input channels.
                 Một số nguyên chỉ số lượng input channels.
    hidden_units: An integer indicating number of hidden units between layers.
                  Một số nguyên chỉ số lượng hidden units giữa các layers.
    output_shape: An integer indicating number of output units.
                  Một số nguyên chỉ số lượng output units.
  """
  def __init__(self, input_shape: int, hidden_units: int, output_shape: int) -> None:
      super().__init__()
      self.conv_block_1 = nn.Sequential(
          nn.Conv2d(in_channels=input_shape, 
                    out_channels=hidden_units, 
                    kernel_size=3, 
                    stride=1, 
                    padding=0),  
          nn.ReLU(),
          nn.Conv2d(in_channels=hidden_units, 
                    out_channels=hidden_units,
                    kernel_size=3,
                    stride=1,
                    padding=0),
          nn.ReLU(),
          nn.MaxPool2d(kernel_size=2,
                        stride=2)
      )
      self.conv_block_2 = nn.Sequential(
          nn.Conv2d(hidden_units, hidden_units, kernel_size=3, padding=0),
          nn.ReLU(),
          nn.Conv2d(hidden_units, hidden_units, kernel_size=3, padding=0),
          nn.ReLU(),
          nn.MaxPool2d(2)
      )
      self.classifier = nn.Sequential(
          nn.Flatten(),
          # Where did this in_features shape come from? 
          # It's because each layer of our network compresses and changes the shape of our inputs data.
          # in_features shape này đến từ đâu?
          # Đó là vì mỗi layer của network nén và thay đổi shape của input data.
          nn.Linear(in_features=hidden_units*13*13,
                    out_features=output_shape)
      )
    
  def forward(self, x: torch.Tensor):
      x = self.conv_block_1(x)
      x = self.conv_block_2(x)
      x = self.classifier(x)
      return x
      # return self.classifier(self.conv_block_2(self.conv_block_1(x))) # <- leverage the benefits of operator fusion
      # return self.classifier(self.conv_block_2(self.conv_block_1(x))) # <- tận dụng lợi ích của operator fusion
```

Bây giờ thay vì coding mô hình TinyVGG từ đầu mỗi lần, chúng ta có thể import nó bằng cách sử dụng:

```python
import torch
# Import model_builder.py
from going_modular import model_builder
device = "cuda" if torch.cuda.is_available() else "cpu"

# Instantiate an instance of the model from the "model_builder.py" script
# Tạo instance của mô hình từ "model_builder.py" script
torch.manual_seed(42)
model = model_builder.TinyVGG(input_shape=3,
                              hidden_units=10, 
                              output_shape=len(class_names)).to(device)
```

## 4. Tạo các hàm `train_step()` và `test_step()` và `train()` để kết hợp chúng

Chúng ta đã viết một số hàm training trong [notebook 04](https://www.learnpytorch.io/04_pytorch_custom_datasets/#75-create-train-test-loop-functions):

1. `train_step()` - nhận một mô hình (model), một `DataLoader`, một loss function và một optimizer và huấn luyện (trains) mô hình trên `DataLoader`.
2. `test_step()` - nhận một mô hình, một `DataLoader` và một loss function và đánh giá (evaluates) mô hình trên `DataLoader`.
3. `train()` - thực hiện 1. và 2. cùng nhau trong một số epochs nhất định và trả về một results dictionary.

Vì những thứ này sẽ là *engine* của việc huấn luyện mô hình, chúng ta có thể đặt tất cả chúng vào một Python script gọi là `engine.py` với dòng `%%writefile going_modular/engine.py`:

```python title="engine.py"
%%writefile going_modular/engine.py
"""
Contains functions for training and testing a PyTorch model.
"""
import torch

from tqdm.auto import tqdm
from typing import Dict, List, Tuple

def train_step(model: torch.nn.Module, 
               dataloader: torch.utils.data.DataLoader, 
               loss_fn: torch.nn.Module, 
               optimizer: torch.optim.Optimizer,
               device: torch.device) -> Tuple[float, float]:
  """Trains a PyTorch model for a single epoch.

  Turns a target PyTorch model to training mode and then
  runs through all of the required training steps (forward
  pass, loss calculation, optimizer step).

  Args:
    model: A PyTorch model to be trained.
    dataloader: A DataLoader instance for the model to be trained on.
    loss_fn: A PyTorch loss function to minimize.
    optimizer: A PyTorch optimizer to help minimize the loss function.
    device: A target device to compute on (e.g. "cuda" or "cpu").

  Returns:
    A tuple of training loss and training accuracy metrics.
    In the form (train_loss, train_accuracy). For example:
    
    (0.1112, 0.8743)
  """
  # Put model in train mode
  model.train()
  
  # Setup train loss and train accuracy values
  train_loss, train_acc = 0, 0
  
  # Loop through data loader data batches
  for batch, (X, y) in enumerate(dataloader):
      # Send data to target device
      X, y = X.to(device), y.to(device)

      # 1. Forward pass
      y_pred = model(X)

      # 2. Calculate  and accumulate loss
      loss = loss_fn(y_pred, y)
      train_loss += loss.item() 

      # 3. Optimizer zero grad
      optimizer.zero_grad()

      # 4. Loss backward
      loss.backward()

      # 5. Optimizer step
      optimizer.step()

      # Calculate and accumulate accuracy metric across all batches
      y_pred_class = torch.argmax(torch.softmax(y_pred, dim=1), dim=1)
      train_acc += (y_pred_class == y).sum().item()/len(y_pred)

  # Adjust metrics to get average loss and accuracy per batch 
  train_loss = train_loss / len(dataloader)
  train_acc = train_acc / len(dataloader)
  return train_loss, train_acc

def test_step(model: torch.nn.Module, 
              dataloader: torch.utils.data.DataLoader, 
              loss_fn: torch.nn.Module,
              device: torch.device) -> Tuple[float, float]:
  """Tests a PyTorch model for a single epoch.

  Turns a target PyTorch model to "eval" mode and then performs
  a forward pass on a testing dataset.

  Args:
    model: A PyTorch model to be tested.
    dataloader: A DataLoader instance for the model to be tested on.
    loss_fn: A PyTorch loss function to calculate loss on the test data.
    device: A target device to compute on (e.g. "cuda" or "cpu").

  Returns:
    A tuple of testing loss and testing accuracy metrics.
    In the form (test_loss, test_accuracy). For example:
    
    (0.0223, 0.8985)
  """
  # Put model in eval mode
  model.eval() 
  
  # Setup test loss and test accuracy values
  test_loss, test_acc = 0, 0
  
  # Turn on inference context manager
  with torch.inference_mode():
      # Loop through DataLoader batches
      for batch, (X, y) in enumerate(dataloader):
          # Send data to target device
          X, y = X.to(device), y.to(device)
  
          # 1. Forward pass
          test_pred_logits = model(X)

          # 2. Calculate and accumulate loss
          loss = loss_fn(test_pred_logits, y)
          test_loss += loss.item()
          
          # Calculate and accumulate accuracy
          test_pred_labels = test_pred_logits.argmax(dim=1)
          test_acc += ((test_pred_labels == y).sum().item()/len(test_pred_labels))
          
  # Adjust metrics to get average loss and accuracy per batch 
  test_loss = test_loss / len(dataloader)
  test_acc = test_acc / len(dataloader)
  return test_loss, test_acc

def train(model: torch.nn.Module, 
          train_dataloader: torch.utils.data.DataLoader, 
          test_dataloader: torch.utils.data.DataLoader, 
          optimizer: torch.optim.Optimizer,
          loss_fn: torch.nn.Module,
          epochs: int,
          device: torch.device) -> Dict[str, List]:
  """Trains and tests a PyTorch model.

  Passes a target PyTorch models through train_step() and test_step()
  functions for a number of epochs, training and testing the model
  in the same epoch loop.

  Calculates, prints and stores evaluation metrics throughout.

  Args:
    model: A PyTorch model to be trained and tested.
    train_dataloader: A DataLoader instance for the model to be trained on.
    test_dataloader: A DataLoader instance for the model to be tested on.
    optimizer: A PyTorch optimizer to help minimize the loss function.
    loss_fn: A PyTorch loss function to calculate loss on both datasets.
    epochs: An integer indicating how many epochs to train for.
    device: A target device to compute on (e.g. "cuda" or "cpu").

  Returns:
    A dictionary of training and testing loss as well as training and
    testing accuracy metrics. Each metric has a value in a list for 
    each epoch.
    In the form: {train_loss: [...],
                  train_acc: [...],
                  test_loss: [...],
                  test_acc: [...]} 
    For example if training for epochs=2: 
                 {train_loss: [2.0616, 1.0537],
                  train_acc: [0.3945, 0.3945],
                  test_loss: [1.2641, 1.5706],
                  test_acc: [0.3400, 0.2973]} 
  """
  # Create empty results dictionary
  results = {"train_loss": [],
      "train_acc": [],
      "test_loss": [],
      "test_acc": []
  }
  
  # Loop through training and testing steps for a number of epochs
  for epoch in tqdm(range(epochs)):
      train_loss, train_acc = train_step(model=model,
                                          dataloader=train_dataloader,
                                          loss_fn=loss_fn,
                                          optimizer=optimizer,
                                          device=device)
      test_loss, test_acc = test_step(model=model,
          dataloader=test_dataloader,
          loss_fn=loss_fn,
          device=device)
      
      # Print out what's happening
      print(
          f"Epoch: {epoch+1} | "
          f"train_loss: {train_loss:.4f} | "
          f"train_acc: {train_acc:.4f} | "
          f"test_loss: {test_loss:.4f} | "
          f"test_acc: {test_acc:.4f}"
      )

      # Update results dictionary
      results["train_loss"].append(train_loss)
      results["train_acc"].append(train_acc)
      results["test_loss"].append(test_loss)
      results["test_acc"].append(test_acc)

  # Return the filled results at the end of the epochs
  return results
```

Bây giờ chúng ta đã có script `engine.py`, chúng ta có thể import các hàm từ nó thông qua:

```python
# Import engine.py
from going_modular import engine

# Sử dụng train() bằng cách gọi nó từ engine.py
engine.train(...)
```

## 5. Tạo một hàm để lưu mô hình (`utils.py`)

Thường thì bạn sẽ muốn lưu một mô hình trong khi nó đang huấn luyện hoặc sau khi huấn luyện.

Vì chúng ta đã viết code để lưu mô hình vài lần trong các notebook trước đó, việc biến nó thành một hàm và lưu vào file có ý nghĩa.

Đây là thực hành phổ biến để lưu trữ các helper functions trong một file gọi là `utils.py` (viết tắt của utilities - tiện ích).

Let's save our `save_model()` function to a file called `utils.py` with the line `%%writefile going_modular/utils.py`: 

```python title="utils.py"
%%writefile going_modular/utils.py
"""
Chứa các utility functions khác nhau cho việc huấn luyện và lưu PyTorch model.
"""
import torch
from pathlib import Path

def save_model(model: torch.nn.Module,
               target_dir: str,
               model_name: str):
  """Lưu một PyTorch model vào thư mục đích.

  Args:
    model: Một target PyTorch model để lưu.
    target_dir: Một thư mục để lưu model vào.
    model_name: Một filename cho model được lưu. Nên bao gồm
      ".pth" hoặc ".pt" làm file extension.
  
  Example usage:
    save_model(model=model_0,
               target_dir="models",
               model_name="05_going_modular_tingvgg_model.pth")
  """
  # Tạo target directory
  target_dir_path = Path(target_dir)
  target_dir_path.mkdir(parents=True,
                        exist_ok=True)
  
  # Tạo model save path
  assert model_name.endswith(".pth") or model_name.endswith(".pt"), "model_name should end with '.pt' or '.pth'"
  model_save_path = target_dir_path / model_name

  # Lưu model state_dict()
  print(f"[INFO] Saving model to: {model_save_path}")
  torch.save(obj=model.state_dict(),
             f=model_save_path)
```

Bây giờ nếu chúng ta muốn sử dụng hàm `save_model()` của chúng ta, thay vì viết tất cả lại, chúng ta có thể import nó và sử dụng thông qua:

```python
# Import utils.py
from going_modular import utils

# Lưu một model vào file
save_model(model=...
           target_dir=...,
           model_name=...)
```

## 6. Huấn luyện, đánh giá và lưu mô hình (`train.py`)

Như đã thảo luận trước đó, bạn sẽ thường gặp các PyTorch repositories kết hợp tất cả chức năng của chúng lại với nhau trong một file `train.py`.

File này về cơ bản đang nói "huấn luyện mô hình sử dụng bất kỳ data nào có sẵn".

Trong file `train.py` của chúng ta, chúng ta sẽ kết hợp tất cả chức năng của các Python scripts khác mà chúng ta đã tạo và sử dụng nó để huấn luyện một mô hình.

Bằng cách này chúng ta có thể huấn luyện một PyTorch model sử dụng một dòng code duy nhất trên command line:

```
python train.py
```

Để tạo `train.py` chúng ta sẽ thực hiện các bước sau:

1. Import các dependencies khác nhau, cụ thể là `torch`, `os`, `torchvision.transforms` và tất cả các scripts từ thư mục `going_modular`, `data_setup`, `engine`, `model_builder`, `utils`.
  * **Lưu ý:** Vì `train.py` sẽ *ở trong* thư mục `going_modular`, chúng ta có thể import các modules khác thông qua `import ...` thay vì `from going_modular import ...`.
2. Setup các hyperparameters khác nhau như batch size, number of epochs, learning rate và number of hidden units (những thứ này có thể được set trong tương lai thông qua [Python's `argparse`](https://docs.python.org/3/library/argparse.html)).
3. Setup training và test directories.
4. Setup device-agnostic code.
5. Tạo necessary data transforms.
6. Tạo DataLoaders sử dụng `data_setup.py`.
7. Tạo model sử dụng `model_builder.py`.
8. Setup loss function và optimizer.
9. Huấn luyện model sử dụng `engine.py`.
10. Lưu model sử dụng `utils.py`. 

Và chúng ta có thể tạo file từ một notebook cell sử dụng dòng `%%writefile going_modular/train.py`:

```python title="train.py"
%%writefile going_modular/train.py
"""
Huấn luyện một PyTorch image classification model sử dụng device-agnostic code.
"""

import os
import torch
import data_setup, engine, model_builder, utils

from torchvision import transforms

# Setup hyperparameters
NUM_EPOCHS = 5
BATCH_SIZE = 32
HIDDEN_UNITS = 10
LEARNING_RATE = 0.001

# Setup directories
train_dir = "data/pizza_steak_sushi/train"
test_dir = "data/pizza_steak_sushi/test"

# Setup target device
device = "cuda" if torch.cuda.is_available() else "cpu"

# Tạo transforms
data_transform = transforms.Compose([
  transforms.Resize((64, 64)),
  transforms.ToTensor()
])

# Tạo DataLoaders với sự giúp đỡ từ data_setup.py
train_dataloader, test_dataloader, class_names = data_setup.create_dataloaders(
    train_dir=train_dir,
    test_dir=test_dir,
    transform=data_transform,
    batch_size=BATCH_SIZE
)

# Tạo model với sự giúp đỡ từ model_builder.py
model = model_builder.TinyVGG(
    input_shape=3,
    hidden_units=HIDDEN_UNITS,
    output_shape=len(class_names)
).to(device)

# Set loss và optimizer
loss_fn = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(),
                             lr=LEARNING_RATE)

# Bắt đầu training với sự giúp đỡ từ engine.py
engine.train(model=model,
             train_dataloader=train_dataloader,
             test_dataloader=test_dataloader,
             loss_fn=loss_fn,
             optimizer=optimizer,
             epochs=NUM_EPOCHS,
             device=device)

# Lưu model với sự giúp đỡ từ utils.py
utils.save_model(model=model,
                 target_dir="models",
                 model_name="05_going_modular_script_mode_tinyvgg_model.pth")
```

Woohoo!

Bây giờ chúng ta có thể huấn luyện một PyTorch model bằng cách chạy dòng sau trên command line:

```
python train.py
```

Làm điều này sẽ tận dụng tất cả các code scripts khác mà chúng ta đã tạo.

Và nếu chúng ta muốn, chúng ta có thể điều chỉnh file `train.py` của chúng ta để sử dụng argument flag inputs với module `argparse` của Python, điều này sẽ cho phép chúng ta cung cấp các hyperparameter settings khác nhau như đã thảo luận trước đó:

```
python train.py --model MODEL_NAME --batch_size BATCH_SIZE --lr LEARNING_RATE --num_epochs NUM_EPOCHS
```

## Bài tập (Exercises)

**Tài nguyên (Resources):**

* [Exercise template notebook for 05](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/extras/exercises/05_pytorch_going_modular_exercise_template.ipynb)
* [Example solutions notebook for 05](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/extras/solutions/05_pytorch_going_modular_exercise_solutions.ipynb)
    * Live coding run through của [solutions notebook for 05 on YouTube](https://youtu.be/ijgFhMK3pp4)

**Bài tập (Exercises):**

1. Biến code để lấy data (từ section 1. Get Data ở trên) thành một Python script, như `get_data.py`.
    * Khi bạn chạy script bằng `python get_data.py` nó nên kiểm tra xem data đã tồn tại hay chưa và bỏ qua việc download nếu đã có.
    * Nếu data download thành công, bạn nên có thể truy cập các images `pizza_steak_sushi` từ thư mục `data`.
2. Sử dụng [Python's `argparse` module](https://docs.python.org/3/library/argparse.html) để có thể gửi các custom hyperparameter values cho `train.py` cho các training procedures.
    * Thêm một argument để sử dụng một:
        * Training/testing directory khác
        * Learning rate khác
        * Batch size khác  
        * Number of epochs để train khác
        * Number of hidden units trong TinyVGG model khác
    * Giữ các default values cho mỗi argument ở trên như những gì chúng đã có (như trong notebook 05).
    * Ví dụ, bạn nên có thể chạy một thứ tương tự như dòng sau để train một TinyVGG model với learning rate là 0.003 và batch size là 64 trong 20 epochs: `python train.py --learning_rate 0.003 --batch_size 64 --num_epochs 20`.
    * **Lưu ý:** Vì `train.py` tận dụng các scripts khác mà chúng ta đã tạo trong section 05, như `model_builder.py`, `utils.py` và `engine.py`, bạn sẽ phải đảm bảo chúng có sẵn để sử dụng. Bạn có thể tìm thấy chúng trong [`going_modular` folder trên course GitHub](https://github.com/mrdbourke/pytorch-deep-learning/tree/main/going_modular/going_modular). 
3. Tạo một script để predict (như `predict.py`) trên một target image được cung cấp file path với một saved model.
    * Ví dụ, bạn nên có thể chạy command `python predict.py some_image.jpeg` và có một trained PyTorch model predict trên image và trả về prediction của nó.
    * Để xem example prediction code, kiểm tra [predicting on a custom image section trong notebook 04](https://www.learnpytorch.io/04_pytorch_custom_datasets/#113-putting-custom-image-prediction-together-building-a-function). 
    * Bạn cũng có thể phải viết code để load một trained model.

## Học thêm (Extra-curriculum)

* Để học thêm về việc cấu trúc một Python project, kiểm tra hướng dẫn của Real Python về [Python Application Layouts](https://realpython.com/python-application-layouts/). 
* Để có ý tưởng về việc styling PyTorch code của bạn, kiểm tra [PyTorch style guide by Igor Susmelj](https://github.com/IgorSusmelj/pytorch-styleguide#recommended-code-structure-for-training-your-model) (phần lớn styling trong chương này được dựa trên guide này + các PyTorch repositories tương tự khác).
* Để có một example `train.py` script và các PyTorch scripts khác được viết bởi PyTorch team để train các state-of-the-art image classification models, kiểm tra [`classification` repository của họ trên GitHub](https://github.com/pytorch/vision/tree/main/references/classification). 
