In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
import torchvision.transforms as transforms
import torch.optim as optim
from tqdm import tqdm

# Create a CNN with two Convolutional Layers

In [3]:
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, 3)
        self.conv2 = nn.Conv2d(16, 32, 3)
        self.fc1 = nn.Linear(5*5*32, 64)
        self.fc2 = nn.Linear(64, 10)
        
    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        
        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        
        x = x.view(-1, 5*5*32)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        
        return x

# Preprocessing Data to Use Tensor and Normalize them to 0-1

In [4]:
transform = transforms.Compose(
    [transforms.ToTensor(),
    transforms.Normalize((0.5, ),(0.5,))])

# Download Data

In [5]:
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./data\MNIST\raw\train-images-idx3-ubyte.gz


  0%|          | 0/9912422 [00:00<?, ?it/s]

Extracting ./data\MNIST\raw\train-images-idx3-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./data\MNIST\raw\train-labels-idx1-ubyte.gz


  0%|          | 0/28881 [00:00<?, ?it/s]

Extracting ./data\MNIST\raw\train-labels-idx1-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./data\MNIST\raw\t10k-images-idx3-ubyte.gz


  0%|          | 0/1648877 [00:00<?, ?it/s]

Extracting ./data\MNIST\raw\t10k-images-idx3-ubyte.gz to ./data\MNIST\raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./data\MNIST\raw\t10k-labels-idx1-ubyte.gz


  0%|          | 0/4542 [00:00<?, ?it/s]

Extracting ./data\MNIST\raw\t10k-labels-idx1-ubyte.gz to ./data\MNIST\raw



In [6]:
print(len(trainset))
print(len(testset))

60000
10000


In [7]:
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 32, shuffle=True, num_workers=4)
testloader = torch.utils.data.DataLoader(testset, batch_size = 32, shuffle=True, num_workers=4)

In [8]:
cnn = CNN()

# To Compute the Error we Choose as Loss Function the Cross Entropy Loss

In [9]:
loss = nn.CrossEntropyLoss()

# To Optimize the network we choose Gradient Descent

In [10]:
optimizer = optim.SGD(cnn.parameters(), lr=0.001, momentum=0.9)

In [11]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.08it/s]


Epoch 1  loss =  1286.409510044381


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.46it/s]


Epoch 2  loss =  249.93742497731


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.66it/s]


Epoch 3  loss =  175.88535537850112


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 60.15it/s]


Epoch 4  loss =  144.00067072128877


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.47it/s]


Epoch 5  loss =  123.47938445338514


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 60.65it/s]


Epoch 6  loss =  108.69675427413313


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 60.59it/s]


Epoch 7  loss =  99.2630225578323


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 60.57it/s]


Epoch 8  loss =  89.76691469358047


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 59.27it/s]


Epoch 9  loss =  82.4356387576554


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.26it/s]

Epoch 10  loss =  75.99707796104485





In [12]:
def accuracy(loader, cnn):
    correct = 0
    total = 0
    for data, labels in loader:
        outputs = cnn(data)
        _, predicted = torch.max(outputs, 1)
        correct += torch.sum(predicted == labels).item()
        total += labels.size(0)
    return 100*correct/total
        

In [13]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.00166666666667
test accuracy =  98.63


In [14]:
optimizer = optim.SGD(cnn.parameters(), lr=0.001)

In [15]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 62.19it/s]


Epoch 1  loss =  61.06500275884173


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 60.89it/s]


Epoch 2  loss =  59.66704258671962


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.92it/s]


Epoch 3  loss =  59.083588748413604


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.99it/s]


Epoch 4  loss =  58.10600831973716


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 62.08it/s]


Epoch 5  loss =  57.799762152688345


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:29<00:00, 63.57it/s]


Epoch 6  loss =  56.97352880804101


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.07it/s]


Epoch 7  loss =  56.53863484028261


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 61.37it/s]


Epoch 8  loss =  56.26622276875423


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:30<00:00, 62.27it/s]


Epoch 9  loss =  55.51764722043299


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:29<00:00, 63.02it/s]

Epoch 10  loss =  55.09323511752882





In [16]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.17
test accuracy =  98.65


In [17]:
optimizer = optim.Adam(cnn.parameters(), lr=0.001)

In [18]:
for i in range (10):
    epoch_loss = 0
    for data, label in tqdm(trainloader):
        optimizer.zero_grad()
        output = cnn(data)
        current_loss = loss(output, label)
        current_loss.backward()
        epoch_loss += current_loss.item()
        optimizer.step()
    print('Epoch', i+1, ' loss = ', epoch_loss)

100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 58.93it/s]


Epoch 1  loss =  114.92205542465672


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 57.40it/s]


Epoch 2  loss =  72.82317129461444


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 58.69it/s]


Epoch 3  loss =  55.03619346355117


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.24it/s]


Epoch 4  loss =  41.44548222398953


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 59.03it/s]


Epoch 5  loss =  32.64063858143163


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.51it/s]


Epoch 6  loss =  27.89101482638648


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 57.59it/s]


Epoch 7  loss =  23.85525645626535


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:32<00:00, 58.56it/s]


Epoch 8  loss =  19.69871533702093


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 59.56it/s]


Epoch 9  loss =  18.389345672748732


100%|██████████████████████████████████████████████████████████████████████████████| 1875/1875 [00:31<00:00, 58.84it/s]

Epoch 10  loss =  15.136445413564303





In [19]:
print('train accuracy = ',accuracy(trainloader, cnn))
print('test accuracy = ',accuracy(testloader, cnn))

train accuracy =  99.83166666666666
test accuracy =  99.02
