## First Neural Network: Image Classification 

Objectives:
- Train a minimal image classifier on [MNIST](https://paperswithcode.com/dataset/mnist) using PyTorch
- Usese PyTorch and torchvision

In [1]:
# The usual imports

import torch#导入PyTorch库
import torch.nn as nn#导入PyTorch的神经网络模块
import torchvision#导入PyTorch的计算机视觉库
import torchvision.transforms as transforms#导入PyTorch计算机视觉库中的变换模块

In [2]:
# load the data

class ReshapeTransform:#定义一个自定义变换类，用于重塑图像大小
    def __init__(self, new_size): # 初始化方法，存储新的图像大小
        self.new_size = new_size
    
    def __call__(self, img):# 重写 __call__ 方法，接受一个图像参数并返回处理后的图像
        return torch.reshape(img, self.new_size)# # 调用 PyTorch 的 reshape 方法改变图像形状，并返回新的张量
#定义一个变换序列，将图像转换为张量，并将类型转换为float32，然后应用自定义变换类
transformations = transforms.Compose([
                                transforms.ToTensor(),
                                transforms.ConvertImageDtype(torch.float32),
                                ReshapeTransform((-1,))
                                ])
# 使用 torchvision.datasets.MNIST 加载训练集，指定数据集目录、是否训练集、是否下载数据、以及应用的变换器
trainset = torchvision.datasets.MNIST(root='./data', train=True,
                                        download=True, transform=transformations)
# 使用 torchvision.datasets.MNIST 加载测试集，指定数据集目录、是否训练集、是否下载数据、以及应用的变换器
testset = torchvision.datasets.MNIST(root='./data', train=False,
                                       download=True, transform=transformations)

In [3]:
# check shape of data

trainset.data.shape, testset.data.shape#获取训练集和测试集的图像形状

(torch.Size([60000, 28, 28]), torch.Size([10000, 28, 28]))

In [4]:
# data loader

BATCH_SIZE = 128#定义一个批次大小为128的常量
train_dataloader = torch.utils.data.DataLoader(trainset, 
                                               batch_size=BATCH_SIZE,
                                               shuffle=True, 
                                               num_workers=0)
#创建一个用于训练的数据加载器对象，它会从 trainset 中加载数据，并且把数据分割成大小为 BATCH_SIZE 的批次进行训练
test_dataloader = torch.utils.data.DataLoader(testset, 
                                              batch_size=BATCH_SIZE,
                                              shuffle=False, 
                                              num_workers=0)
#创建一个用于测试的数据加载器对象，它跟训练数据加载器对象类似，只是 shuffle 参数设置为 False，因为在测试过程中不需要重新洗牌

In [5]:
# model

model = nn.Sequential(# 创建一个神经网络模型，其输入维度为 784，输出维度为 10
    nn.Linear(784, 512), # 创建一个全连接层，其输入维度为 784，输出维度为 512
    nn.ReLU(),# 创建一个激活函数层 ReLU，将其作为第一层的输出，用于增加网络的非线性表示能力
    nn.Linear(512, 10))# 创建一个全连接层，其输入维度为 512，输出维度为 10，作为神经网络的输出层

In [6]:
# training preparation

trainer = torch.optim.RMSprop(model.parameters())#定义了一个 RMSprop 优化器，用于更新模型中的参数
loss = nn.CrossEntropyLoss()#定义了一个交叉熵损失函数，用于计算模型预测值与真实值之间的误差

In [7]:
def get_accuracy(output, target, batch_size):## 获取模型预测的结果中最大概率所对应的标签，并将其 resize 到与实际标签相同的大小
    # Obtain accuracy for training round
    corrects = (torch.max(output, 1)[1].view(target.size()).data == target.data).sum()# 统计正确预测的数量
    accuracy = 100.0 * corrects/batch_size# 计算预测准确率并返回
    return accuracy.item()

In [8]:
# train

for ITER in range(5):
    train_acc = 0.0# 初始化训练过程中的损失值为0
    train_running_loss = 0.0

    model.train()# 将模型设置为训练模式
    for i, (X, y) in enumerate(train_dataloader):# 遍历训练集数据迭代器
        output = model(X) # 前向传播计算模型输出
        l = loss(output, y)# 计算预测结果与真实标签之间的损失

        # update the parameters
        l.backward()# 反向传播，计算参数的梯度
        trainer.step() # 使用优化器更新参数
        trainer.zero_grad()# 梯度清零，以便下次计算

        # gather metrics
        train_acc += get_accuracy(output, y, BATCH_SIZE) # 计算当前 mini-batch 的预测准确率和总损失
        train_running_loss += l.detach().item()

    print('Epoch: %d | Train loss: %.4f | Train Accuracy: %.4f' \
          %(ITER+1, train_running_loss / (i+1),train_acc/(i+1)))# 打印当前 epoch 的平均损失和准确率

Epoch: 1 | Train loss: 0.9943 | Train Accuracy: 91.7344
Epoch: 2 | Train loss: 0.1334 | Train Accuracy: 95.9422
Epoch: 3 | Train loss: 0.1030 | Train Accuracy: 96.8767
Epoch: 4 | Train loss: 0.0845 | Train Accuracy: 97.4997
Epoch: 5 | Train loss: 0.0735 | Train Accuracy: 97.8811


### Other things to try

- Evaluate on test set
- Plot loss curve
- Add more layers to the model