# Pytorch Tutorial

Pytorch is a popular deep learning framework and it's easy to get started.

In [1]:
import torch
import torch.nn as nn
import torch.utils.data as data
import torchvision
import torchvision.transforms as transforms
from tqdm import tqdm
import time

BATCH_SIZE = 128
NUM_EPOCHS = 10

First, we read the mnist data, preprocess them and encapsulate them into dataloader form.

In [2]:
# preprocessing
normalize = transforms.Normalize(mean=[.5], std=[.5])
transform = transforms.Compose([transforms.ToTensor(), normalize])

# download and load the data
train_dataset = torchvision.datasets.MNIST(root='./mnist/', train=True, transform=transform, download=True)
test_dataset = torchvision.datasets.MNIST(root='./mnist/', train=False, transform=transform, download=False)

# encapsulate them into dataloader form
train_loader = data.DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True, drop_last=True)
test_loader = data.DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, drop_last=True)

Then, we define the model, object function and optimizer that we use to classify.

In [3]:
class SimpleNet(nn.Module):
# TODO:define model

    def __init__(self):
        super(SimpleNet, self).__init__()
        self.conv1 = nn.Sequential(
        nn.Conv2d(1, 32, 3, 1, 1),
        nn.ReLU(),
        nn.MaxPool2d(2))
        self.conv2 = torch.nn.Sequential(
        nn.Conv2d(32, 64, 3, 1, 1),
        nn.ReLU(),
        nn.MaxPool2d(2)
        )
        self.conv3 = torch.nn.Sequential(
        nn.Conv2d(64, 64, 3, 1, 1),
        nn.ReLU(),
        nn.MaxPool2d(2)
        )
        self.dense = torch.nn.Sequential(
        nn.Linear(64 * 3 * 3, 128),
        nn.ReLU(),
        nn.Linear(128, 10)
        )

    def forward(self, x):
        conv1_out = self.conv1(x)
        conv2_out = self.conv2(conv1_out)
        conv3_out = self.conv3(conv2_out)
        res = conv3_out.view(conv3_out.size(0), -1)
        out = self.dense(res)
        return out

model = SimpleNet()

# TODO:define loss function and optimiter
optimizer = torch.optim.Adam(model.parameters())
loss_func = nn.CrossEntropyLoss()

Next, we can start to train and evaluate!

In [4]:
# train and evaluate
for epoch in range(NUM_EPOCHS):
    train_loss = 0.
    train_acc = 0.
    for images, labels in tqdm(train_loader):
        # TODO:forward + backward + optimize
        out = model(images)
        loss = loss_func(out, labels)
        train_loss += loss.data[0]
        pred = torch.max(out, 1)[1]
        train_correct = (pred == labels).sum()
        train_acc += train_correct.data[0]
       # print(train_acc)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    print(train_acc)
    print('Train Loss: {:.6f}, Acc: {:.6f}'.format(train_loss / (len(train_dataset)), float(train_acc) / (len(train_dataset))))      
    # evaluate
    # TODO:calculate the accuracy using traning and testing dataset
    model.eval()
    eval_loss = 0.
    eval_acc = 0.
    for images, labels in tqdm(test_loader):
        out = model(images)
        loss = loss_func(out, labels)
        eval_loss += loss.data[0]
        pred = torch.max(out, 1)[1]
        num_correct = (pred == labels).sum()
        eval_acc += num_correct.data[0]
    print('Test Loss: {:.6f}, Acc: {:.6f}'.format(eval_loss / (len(test_dataset)), float(eval_acc) / (len(test_dataset))))

  if __name__ == '__main__':
  if sys.path[0] == '':
100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:09<00:00,  1.88it/s]


tensor(55729)
Train Loss: 0.001804, Acc: 0.928817


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.70it/s]


Test Loss: 0.000424, Acc: 0.980200


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:11<00:00,  1.81it/s]


tensor(58919)
Train Loss: 0.000408, Acc: 0.981983


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.68it/s]


Test Loss: 0.000298, Acc: 0.986600


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:12<00:00,  1.85it/s]


tensor(59223)
Train Loss: 0.000288, Acc: 0.987050


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.76it/s]


Test Loss: 0.000242, Acc: 0.987800


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:11<00:00,  1.88it/s]


tensor(59363)
Train Loss: 0.000220, Acc: 0.989383


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.68it/s]


Test Loss: 0.000185, Acc: 0.990700


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:11<00:00,  1.88it/s]


tensor(59457)
Train Loss: 0.000178, Acc: 0.990950


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.80it/s]


Test Loss: 0.000218, Acc: 0.989100


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:10<00:00,  1.87it/s]


tensor(59549)
Train Loss: 0.000145, Acc: 0.992483


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.76it/s]


Test Loss: 0.000268, Acc: 0.987200


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:09<00:00,  1.87it/s]


tensor(59573)
Train Loss: 0.000129, Acc: 0.992883


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.95it/s]


Test Loss: 0.000216, Acc: 0.990200


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:09<00:00,  1.85it/s]


tensor(59636)
Train Loss: 0.000114, Acc: 0.993933


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.80it/s]


Test Loss: 0.000232, Acc: 0.988700


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:08<00:00,  1.92it/s]


tensor(59670)
Train Loss: 0.000089, Acc: 0.994500


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:19<00:00,  3.92it/s]


Test Loss: 0.000200, Acc: 0.990700


100%|████████████████████████████████████████████████████████████████████████████████| 468/468 [04:09<00:00,  1.89it/s]


tensor(59709)
Train Loss: 0.000077, Acc: 0.995150


100%|██████████████████████████████████████████████████████████████████████████████████| 78/78 [00:20<00:00,  3.85it/s]


Test Loss: 0.000226, Acc: 0.990100


#### Q5:
Please print the training and testing accuracy.