# Pytorch Tutorial

Pytorch is a popular deep learning framework and it's easy to get started.

In [1]:
import torch
import torch.nn as nn
import torch.utils.data as data
import torchvision
import torchvision.transforms as transforms
from tqdm import tqdm
import time

BATCH_SIZE = 128
NUM_EPOCHS = 10

First, we read the mnist data, preprocess them and encapsulate them into dataloader form.

In [2]:
# preprocessing
normalize = transforms.Normalize(mean=[.5], std=[.5])
transform = transforms.Compose([transforms.ToTensor(), normalize])

# download and load the data
train_dataset = torchvision.datasets.MNIST(root='./mnist/', train=True, transform=transform, download=True)
test_dataset = torchvision.datasets.MNIST(root='./mnist/', train=False, transform=transform, download=False)

# encapsulate them into dataloader form
train_loader = data.DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True, drop_last=True)
test_loader = data.DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, drop_last=True)

Then, we define the model, object function and optimizer that we use to classify.

In [3]:
class SimpleNet(nn.Module):
# TODO:define model
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.conv1 = nn.Sequential(     #input_size=(1*28*28)
            nn.Conv2d(1, 6, 5, 1, 2), #padding=2保证输入输出尺寸相同
            nn.ReLU(),      #input_size=(6*28*28)
            nn.MaxPool2d(kernel_size=2, stride=2),#output_size=(6*14*14)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(6, 16, 5),
            nn.ReLU(),      #input_size=(16*10*10)
            nn.MaxPool2d(2, 2)  #output_size=(16*5*5)
        )
        self.fc1 = nn.Sequential(
            nn.Linear(16 * 5 * 5, 120),
            nn.ReLU()
        )
        self.fc2 = nn.Sequential(
            nn.Linear(120, 84),
            nn.ReLU()
        )
        self.fc3 = nn.Linear(84, 10)

    # 定义前向传播过程，输入为x
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        # nn.Linear()的输入输出都是维度为一的值，所以要把多维度的tensor展平成一维
        x = x.view(x.size()[0], -1)
        x = self.fc1(x)
        x = self.fc2(x)
        x = self.fc3(x)
        return x


    
model = SimpleNet()

# TODO:define loss function and optimiter
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.99))

Next, we can start to train and evaluate!

In [5]:
# train and evaluate
for epoch in range(NUM_EPOCHS):
    model.train()
    for images, labels in tqdm(train_loader):
        # TODO:forward + backward + optimize
        optimizer.zero_grad()
        output=model(images)
        loss = criterion(output,labels)
        loss.backward()
        optimizer.step()
        
        
    # evaluate
    # TODO:calculate the accuracy using traning and testing dataset
    correct = 0 
    model.eval()
    for images, labels in tqdm(train_loader):
        output=model(images)
        _, pred = torch.max(output.data, 1)
        correct += (pred==labels).sum()
    train_acc = correct / len(train_loader.dataset)
    correct = 0 
    model.eval()
    for images, labels in tqdm(test_loader):
        output=model(images)
        _, pred = torch.max(output.data, 1)
        correct += (pred==labels).sum()
    test_acc = correct / len(test_loader.dataset)
    print('train_acc',train_acc)
    print('test_acc',test_acc)
    


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:19<00:00, 24.60it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.69it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 33.17it/s]
  0%|▎                                                                                 | 2/468 [00:00<00:23, 19.58it/s]

train_acc tensor(0.9792)
test_acc tensor(0.9810)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.32it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.93it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 32.34it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:20, 22.72it/s]

train_acc tensor(0.9833)
test_acc tensor(0.9824)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 23.15it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.68it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 29.31it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:21, 21.24it/s]

train_acc tensor(0.9871)
test_acc tensor(0.9840)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.93it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.56it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 32.32it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:20, 22.93it/s]

train_acc tensor(0.9888)
test_acc tensor(0.9862)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 31.40it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 30.06it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:21, 21.49it/s]

train_acc tensor(0.9915)
test_acc tensor(0.9863)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.95it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 33.24it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 31.16it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:19, 24.22it/s]

train_acc tensor(0.9915)
test_acc tensor(0.9854)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.86it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 33.00it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 29.57it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:21, 21.59it/s]

train_acc tensor(0.9937)
test_acc tensor(0.9881)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:22<00:00, 20.39it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:16<00:00, 28.35it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 28.48it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:22, 20.92it/s]

train_acc tensor(0.9900)
test_acc tensor(0.9831)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:21<00:00, 21.75it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.92it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 32.92it/s]
  1%|▌                                                                                 | 3/468 [00:00<00:18, 24.72it/s]

train_acc tensor(0.9942)
test_acc tensor(0.9885)


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:20<00:00, 22.87it/s]
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [00:14<00:00, 32.04it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:02<00:00, 33.00it/s]

train_acc tensor(0.9961)
test_acc tensor(0.9878)





#### Q5:
Please print the training and testing accuracy.