## **Giới thiệu**
- Trong bài tập về nhà lần này, chúng ta sẽ implement mạng LeNet sử dụng PyTorch, và chúng ta sẽ train và đánh giá mô hình trên tập dữ liệu FashionMNIST.
- Dưới đây là kiến trúc mô hình mà chúng ta sẽ implement: ![](https://drive.google.com/uc?export=view&id=1MyiyOZnioz2WegCNjhyv_VXETFPYn_yN)



### **FashionMNIST dataset** 
Giới thiệu về Dataset

Fashion-MNIST là một tập dữ liệu về các hình ảnh bài viết của Zalando — bao gồm một tập huấn luyện gồm 60.000 mẫu và một tập test 10.000 mẫu. Mỗi mẫu là một hình ảnh grayscale 28x28, được liên kết với một nhãn từ 10 lớp. Zalando dự định Fashion-MNIST sẽ phục vụ như một sự thay thế trực tiếp cho tập dữ liệu MNIST ban đầu cho các thuật toán máy học điểm chuẩn. Nó có cùng kích thước hình ảnh và cấu trúc của các phần đào tạo và thử nghiệm.

Mỗi hình ảnh có chiều cao 28 pixel và chiều rộng 28 pixel, tổng cộng là 784 pixel. Mỗi pixel có một giá trị pixel duy nhất được liên kết với nó, cho biết độ sáng hoặc tối của pixel đó, với các con số cao hơn có nghĩa là tối hơn. Giá trị pixel này là một số nguyên từ 0 đến 255. Tập dữ liệu đào tạo và kiểm tra có 785 cột. Cột đầu tiên bao gồm các nhãn lớp (xem ở trên) và đại diện cho mặt hàng quần áo. Phần còn lại của các cột chứa các giá trị pixel của hình ảnh được liên kết.

**Label**

0 T-shirt/top

1 Trouser

2 Pullover

3 Dress

4 Coat

5 Sandal

6 Shirt

7 Sneaker

8 Bag

9 Ankle boot

## Import Libraries

In [None]:
import torch
import torchvision
import torch.nn.functional as F
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt
from torch import nn
from torch import optim

from torchsummary import summary

## Setup

- Chúng ta sẽ setup một số hyper-parameters cũng như một số giá trị cần dùng theo hướng dẫn nhé
- Ở đây, các bạn vào Runtime, chọn Change the runtime type và chọn GPU nhé.

### Download MNIST dataset in local system

In [None]:
# Định nghĩa tham số transform
transform=transforms.Compose([
    transforms.ToTensor(), # Chuyển ảnh sang dạng Tensor
    transforms.Normalize((0.5,), (0.5,)) # Normalize ảnh với mean và standard deviation là 0.5
    ])

# Load the train and test data
train_set = torchvision.datasets.FashionMNIST(root = "data", train=True, download=True, transform = transform)
test_set = torchvision.datasets.FashionMNIST(root = "data", train=False, download=True, transform = transform)

torch.manual_seed(0)

In [None]:
# Kiểm thử số chiều của dataset
print('The dimension of the train data:')
print(train_set.data.size())
print('\nThe dimension of the train labels:')
print(train_set.targets.size())

print('\n\nThe dimension of the validation data:')
print(test_set.data.size())
print('\nThe dimension of the validation labels:')
print(test_set.targets.size())

Visualization of FashionMNIST dataset

In [None]:
figure = plt.figure(figsize=(10, 8))
cols, rows = 5, 5
for i in range(1, cols * rows + 1):
    sample_idx = torch.randint(len(train_set), size=(1,)).item()
    img, label = train_set[sample_idx]
    figure.add_subplot(rows, cols, i)
    plt.title(label)
    plt.axis("off")
    plt.imshow(img.squeeze(), cmap="gray")
plt.show()

### Hyperparameters

In [None]:
# Số classes trong tập FashionMNIST
num_classes = None

# Số epoch
epochs = 2

# Các tham số cần thiết trong quá trình training
learning_rate = 0.001
batch_size = 128
display_step = 100

# Model path
checkpoint = 'model.pth'

# Khởi tạo một số list để lưu loss và accuracy
loss_epoch_array = []
train_accuracy = []
test_accuracy = []
valid_accuracy = []

# device: cuda
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

### Preparing data for training with DataLoaders
- Để tiện cho việc xử lý dữ dữ liệu vào các batches cũng như reshuffle dữ liệu qua mỗi epoch thì chúng ta sẽ sử dụng hàm sẵn có của PyTorch là [DataLoader](https://pytorch.org/docs/stable/data.html) 

In [None]:
train_loader = torch.utils.data.DataLoader(None , batch_size=None, shuffle = False)
test_loader = torch.utils.data.DataLoader(None, batch_size=None, shuffle = False)

## Model

- Dưới đây là kiến trúc mô hình mà chúng ta sẽ implement: ![](https://drive.google.com/uc?export=view&id=1MyiyOZnioz2WegCNjhyv_VXETFPYn_yN)

In [None]:
class CNN_Net(nn.Module):

    def __init__(self):
        super(CNN_Net, self).__init__()
        self.conv1 = nn.Conv2d(None, None, None)
        self.conv2 = nn.Conv2d(None, None, None)
        self.max_pool1 = nn.MaxPool2d(None, None)
        self.max_pool2 = nn.MaxPool2d(None)
        self.fc1 = nn.Linear(None, None)
        self.fc2 = nn.Linear(None, None)
        self.fc3 = nn.Linear(None, None)
        # self.dropout = nn.Dropout(p=0.3)
        self.flatten = nn.Flatten()
        self.relu = nn.ReLU()
    
    def forward(self, x):
        ### START CODE HERE ≈ 9-15 lines

        ### END CODE HERE
        return x

In [None]:
# Tạo model instance và đưa vào device
model = None
summary(model, (1, 28, 28))

## Training phase



### Training loop

In [None]:
# Định nghĩa hàm khởi tạo tham số
def weights_init(model):
    if isinstance(model, nn.Linear):
        # Xavier Distribution
        torch.nn.init.xavier_uniform_(model.weight)

# Định nghĩa hàm train
def train(dataloader, epoch):
    loss_epoch = 0
    for i, (data,targets) in enumerate(dataloader):
        # Đưa dữ liệu vào GPU
        data, targets = None, None

        # Clear gradient
        None
        outputs = cnn_net(data)

        # Backpropagation, compute gradients
        loss = loss_function(outputs, targets)
        None

        # Apply gradients
        None
        
        # Lưu lại loss
        loss_epoch += None
        if i % display_step == 0:
            accuracy = float(test(test_loader))
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.4f}, Accuracy: {:.4f}%'.format(
                epoch + 1, i * 32, len(dataloader.dataset), 100.0 * i / len(dataloader), 
                loss.item(), accuracy))
    return loss_epoch

# Định nghĩa hàm test
def test(dataloader):
    test_loss = 0
    correct = 0
    for i, (data, targets) in enumerate(dataloader):
        data, targets = None, None
        outputs = cnn_net(data)
        _, pred = torch.max(outputs, 1)
        test_loss += targets.size(0)
        correct += torch.sum(pred == targets)
    return 100.0 * correct / test_loss

In [None]:
# Tạo một instance của model và vào GPU
cnn_net = None

# Khỏi tạo weight với hàm đã tạo
cnn_net.apply(weights_init)

# Sử dụng loss funtion Cross Entropy Loss
loss_function = None

# Sử dụng Adam optimizer
optimizer = None

# Print structure of model
print(cnn_net)

In [None]:
# Driver code to iterate through epochs and store loss and accuracy
for epoch in range(epochs):
    loss_epoch = 0
    loss_epoch = train(None, None)
    loss_epoch_array.append(None)
    
    train_accuracy.append(test(None))
    valid_accuracy.append(test(None))
    print("Epoch {}: loss: {:.4f}, train accuracy: {:.4f}, valid accuracy:{:.4f}".format(epoch + 1, 
                                        loss_epoch_array[-1], train_accuracy[-1], valid_accuracy[-1]))

In [None]:
# Plot model history
plt.rcParams['figure.dpi'] = 300
epochs = range(epochs)
plt.plot(epochs, train_accuracy, 'g', label='Training accuracy')
plt.plot(epochs, valid_accuracy, 'b', label='Test accuracy')
plt.title('Training and Test accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()