In [50]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
import torchvision.transforms as transforms
import torch.optim as optim
from tqdm import tqdm

# Create a CNN with two Convolutional Layers

In [36]:
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, 3)
        self.conv2 = nn.Conv2d(16, 32, 3)
        self.fc1 = nn.Linear(5*5*32, 64)
        self.fc2 = nn.Linear(64, 10)
        
    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        
        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        
        x = x.view(-1, 5*5*32)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        
        return x

# Preprocessing Data to Use Tensor and Normalize them to 0-1

In [37]:
transform = transforms.Compose(
    [transforms.ToTensor(),
    transforms.Normalize((0.5, ),(0.5,))])

# Download Data

In [38]:
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)

In [39]:
print(len(trainset))
print(len(testset))

60000
10000


In [41]:
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 32, shuffle=True, num_workers=4)
testloader = torch.utils.data.DataLoader(testset, batch_size = 32, shuffle=True, num_workers=4)

In [42]:
cnn = CNN()

# To Compute the Error we Choose as Loss Function the Cross Entropy Loss

In [43]:
loss = nn.CrossEntropyLoss()

# To Optimize the network we choose Gradient Descent

In [44]:
optimizer = optim.SGD(cnn.parameters(), lr=0.001, momentum=0.9)

In [67]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

  6%|████▌                                                                          | 108/1875 [00:05<01:24, 20.83it/s]


KeyboardInterrupt: 

In [56]:
def accuracy(loader, cnn):
    correct = 0
    total = 0
    for data, labels in loader:
        outputs = cnn(data)
        _, predicted = torch.max(outputs, 1)
        correct += torch.sum(predicted == labels).item()
        total += labels.size(0)
    return 100*correct/total
        

In [57]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.135
test accuracy =  98.64


In [59]:
optimizer = optim.SGD(cnn.parameters(), lr=0.001)

In [60]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:34<00:00, 54.69it/s]


Epoch 1  loss =  57.75456703970849


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.19it/s]


Epoch 2  loss =  55.539215009717736


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:33<00:00, 55.40it/s]


Epoch 3  loss =  53.39614859687572


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:33<00:00, 56.42it/s]


Epoch 4  loss =  51.32466742352699


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.26it/s]


Epoch 5  loss =  49.867901199279004


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.46it/s]


Epoch 6  loss =  47.634841752573266


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 62.30it/s]


Epoch 7  loss =  46.4871524610644


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:29<00:00, 63.19it/s]


Epoch 8  loss =  44.40229218760214


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 62.04it/s]


Epoch 9  loss =  42.2516931913633


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.09it/s]

Epoch 10  loss =  40.192903797238614





In [62]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.46333333333334
test accuracy =  98.73


In [63]:
optimizer = optim.Adam(cnn.parameters(), lr=0.001)

In [64]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 59.67it/s]


Epoch 1  loss =  115.0695500959846


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 59.10it/s]


Epoch 2  loss =  90.0372210890273


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 58.94it/s]


Epoch 3  loss =  74.26258194294496


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 58.73it/s]


Epoch 4  loss =  63.0343574351391


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.33it/s]


Epoch 5  loss =  55.2318566850563


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.32it/s]


Epoch 6  loss =  49.80297874459302


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.45it/s]


Epoch 7  loss =  43.81581812477816


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:35<00:00, 52.55it/s]


Epoch 8  loss =  42.083619960782016


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:37<00:00, 49.84it/s]


Epoch 9  loss =  33.27841637709844


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:37<00:00, 50.20it/s]

Epoch 10  loss =  33.30760930474048





In [65]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.10166666666667
test accuracy =  98.51
