# Pytorch Tutorial

Pytorch is a popular deep learning framework and it's easy to get started.

In [1]:
import torch
import torch.nn as nn
import torch.utils.data as data
import torchvision
import torchvision.transforms as transforms
from tqdm import tqdm
import time
from torch.autograd import Variable

BATCH_SIZE = 128
NUM_EPOCHS = 10

First, we read the mnist data, preprocess them and encapsulate them into dataloader form.

In [2]:
# preprocessing
normalize = transforms.Normalize(mean=[.5], std=[.5]) 
#先将输入归一化到(0,1)，再使用公式”(x-mean)/std”，将每个元素分布到(-1,1) 
transform = transforms.Compose([transforms.ToTensor(), normalize])

# download and load the data
train_dataset = torchvision.datasets.MNIST(root='./mnist/', train=True, transform=transform, download=True)
test_dataset = torchvision.datasets.MNIST(root='./mnist/', train=False, transform=transform, download=False)
#root用于指定数据集在下载之后的存放路径，这里存放在根目录下的data文件夹中；transform用于指定导入数据集时需要对数据进行哪种
#变换操作，在后面会介绍详细的变换操作类型，注意，要提前定义这些变换操作；train用于指定在数据集下载完成后需要载入哪部分数据
#，如果设置为True，则说明载入的是该数据集的训练集部分；如果设置为False，则说明载入的是该数据集的测试集部分。

# encapsulate them into dataloader form
train_loader = data.DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True, drop_last=True)
test_loader = data.DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, drop_last=True)
#装载就是打包的过程。在装载时通过batch_size的值来确认每个包的大小，通过shuffle的值来确认是否在装载的过程中打乱顺序。

Then, we define the model, object function and optimizer that we use to classify.

In [5]:
#我们想要搭建一个包含了卷积层，激活函数，池化层，全连接层的卷积神经网络来解决这个问题，所以模型在结构上会和之前简单的
#神经网络有所区别，当然，各个部分的功能实现依然是通过torch.nn中的类来完成的，比如卷积层使用torch.nn.Conv2d类方法来搭建
#，激活层使用torch.nn.ReLU类来搭建；池化层使用torch.nn.MaxPool2d类方法来搭建；全连接层使用torch.nn.Linear类方法来搭建。
#卷积神经网络CNN的结构一般包含这几层：输入层：用于数据的输入   卷积层：使用卷积核进行特征提取和特征映射
#激励层：由于卷积也是一种线性运算，因此需要增加非线性映射    池化层：进行下采样，对特征图稀疏处理，减少特征信息的损失
#输出层：用于输出结果

class SimpleNet(nn.Module):
# TODO:define model
    def __init__(self):
        super(SimpleNet,self).__init__()
        self.conv1=nn.Sequential(
            nn.Conv2d(1,32,kernel_size=3,stride=1,padding=1),     #28,28,32
            nn.ReLU(),
            nn.Conv2d(32,64,kernel_size=3,stride=1,padding=1),    #28,28,64
            nn.ReLU(),
            nn.MaxPool2d(stride=2,kernel_size=2))             #14,14,64
        self.dense = torch.nn.Sequential(
            nn.Linear(14*14*64,1024),              #14*14*64->1024
            nn.ReLU(),
            nn.Dropout(p = 0.4),        
            nn.Linear(1024,10))               #1024->10

    def forward(self, x):
        x = self.conv1(x)
        x = x.view(-1,14*14*64)         #对参数实现扁平化
        x = self.dense(x)
        return x
    
model = SimpleNet().cuda()

# TODO:define loss function and optimiter
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters())
#在编写完搭建卷积神经网络模型的代码后，我们就可以开始对模型进行训练和对参数进行优化了。
#首先，定义在训练之前使用哪种损失函数和优化函数
#计算损失值的损失函数使用的是交叉熵,优化函数使用的额是Adam自适应优化算法
print(model)

SimpleNet(
  (conv1): Sequential(
    (0): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (dense): Sequential(
    (0): Linear(in_features=12544, out_features=1024, bias=True)
    (1): ReLU()
    (2): Dropout(p=0.4)
    (3): Linear(in_features=1024, out_features=10, bias=True)
  )
)


Next, we can start to train and evaluate!

In [6]:
# train and evaluate
for epoch in range(NUM_EPOCHS):
    training_correct=0
    print('epoch:',epoch)
    for images, labels in tqdm(train_loader):
        # TODO:forward + backward + optimize
        images,labels=Variable(images).cuda(),Variable(labels).cuda()
        outputs=model(images)
        _,pred=torch.max(outputs.data,1)
        optimizer.zero_grad()
        loss=criterion(outputs,labels)
        
        loss.backward()
        optimizer.step()
        training_correct+=torch.sum(pred==labels)
           
    # evaluate
    # TODO:calculate the accuracy using traning and testing dataset
    testing_correct=0
    for images,labels in tqdm(test_loader):
        images,labels=Variable(images).cuda(),Variable(labels).cuda()
        outputs=model(images)
        _,pred=torch.max(outputs.data,1)
        testing_correct+=torch.sum(pred==labels)
    
    print("Train Accuracy is:{:.4f}%，Test Accuracy is:{:.4f}"
          .format(100*training_correct/len(train_dataset),100*testing_correct/len(test_dataset)))

epoch: 0



  0%|                                                                                          | 0/468 [00:00<?, ?it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:29<00:00, 23.64it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 55.91it/s]


Train Accuracy is:94.0000%，Test Accuracy is:98.0000
epoch: 1


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 22.86it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.68it/s]


Train Accuracy is:98.0000%，Test Accuracy is:98.0000
epoch: 2


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.65it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.29it/s]


Train Accuracy is:98.0000%，Test Accuracy is:98.0000
epoch: 3


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.77it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.97it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 4


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.36it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.66it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 5


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 23.64it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 55.73it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 6


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.57it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.60it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 7


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.72it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 57.15it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 8


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 23.62it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 56.51it/s]


Train Accuracy is:99.0000%，Test Accuracy is:98.0000
epoch: 9


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 20.61it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:01<00:00, 50.97it/s]


Train Accuracy is:99.0000%，Test Accuracy is:99.0000


In [None]:
#从以上运行结果看来，Train Accuracy is:99.0000%，Test Accuracy is:99.0000%

#### Q5:
Please print the training and testing accuracy.