In [1]:
import _pickle as c_pickle, gzip
import numpy as np
from tqdm import tqdm
import torch
import torch.autograd as autograd
import torch.nn.functional as F
import torch.nn as nn
import sys
sys.path.append("..")
import utils
from utils import *
from train_utils import batchify_data, run_epoch, train_model, Flatten

In [3]:
def main():
    # Load the dataset
    num_classes = 10
    X_train, y_train, X_test, y_test = get_MNIST_data()

    # We need to rehape the data back into a 1x28x28 image
    X_train = np.reshape(X_train, (X_train.shape[0], 1, 28, 28))
    X_test = np.reshape(X_test, (X_test.shape[0], 1, 28, 28))

    # Split into train and dev
    dev_split_index = int(9 * len(X_train) / 10)
    X_dev = X_train[dev_split_index:]
    y_dev = y_train[dev_split_index:]
    X_train = X_train[:dev_split_index]
    y_train = y_train[:dev_split_index]
    
    permutation = np.array([i for i in range(len(X_train))])
    np.random.shuffle(permutation)
    X_train = [X_train[i] for i in permutation]
    y_train = [y_train[i] for i in permutation]

    # Split dataset into batches
    batch_size = 32
    train_batches = batchify_data(X_train, y_train, batch_size)
    dev_batches = batchify_data(X_dev, y_dev, batch_size)
    test_batches = batchify_data(X_test, y_test, batch_size)
    
    
    #################################
    ## Model specification TODO
    model = nn.Sequential(nn.Conv2d(1, 32, (3, 3)), 
                          nn.ReLU(),
                          nn.MaxPool2d((2, 2)), 
                          nn.Conv2d(32, 64, (3,3)), 
                          nn.ReLU(), 
                          nn.MaxPool2d((2,2)), 
                          Flatten(), 
                          nn.Linear(1600, 128), 
                          nn.Dropout(p=0.5, inplace=False), 
                          nn.Linear(128,10)
)
    ##################################

    train_model(train_batches, dev_batches, model, nesterov=True)

    ## Evaluate the model on test data
    loss, accuracy = run_epoch(test_batches, model.eval(), None)

    print ("Loss on test set:"  + str(loss) + " Accuracy on test set: " + str(accuracy))


if __name__ == '__main__':
    # Specify seed for deterministic behavior, then shuffle. Do not change seed for official submissions to edx
    np.random.seed(12321)  # for reproducibility
    torch.manual_seed(12321)
    main()

-------------
Epoch 1:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:37<00:00, 45.54it/s]


Train loss: 0.243937 | Train accuracy: 0.923829


100%|████████████████████████████████████████████████████████████████████████████████| 187/187 [00:02<00:00, 88.75it/s]


Val loss:   0.060175 | Val accuracy:   0.983456
-------------
Epoch 2:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:41<00:00, 40.99it/s]


Train loss: 0.078229 | Train accuracy: 0.976419


100%|████████████████████████████████████████████████████████████████████████████████| 187/187 [00:02<00:00, 90.96it/s]


Val loss:   0.043665 | Val accuracy:   0.987968
-------------
Epoch 3:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:38<00:00, 43.79it/s]


Train loss: 0.057286 | Train accuracy: 0.983032


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 125.88it/s]


Val loss:   0.041048 | Val accuracy:   0.986965
-------------
Epoch 4:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:29<00:00, 58.12it/s]


Train loss: 0.045129 | Train accuracy: 0.986274


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 120.88it/s]


Val loss:   0.034992 | Val accuracy:   0.988469
-------------
Epoch 5:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:29<00:00, 58.08it/s]


Train loss: 0.039354 | Train accuracy: 0.987793


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 119.65it/s]


Val loss:   0.033818 | Val accuracy:   0.989973
-------------
Epoch 6:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:29<00:00, 57.31it/s]


Train loss: 0.032898 | Train accuracy: 0.989534


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 119.88it/s]


Val loss:   0.035682 | Val accuracy:   0.989639
-------------
Epoch 7:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:30<00:00, 56.00it/s]


Train loss: 0.028753 | Train accuracy: 0.990868


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 117.49it/s]


Val loss:   0.037134 | Val accuracy:   0.988302
-------------
Epoch 8:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:30<00:00, 56.02it/s]


Train loss: 0.024694 | Train accuracy: 0.992072


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 122.13it/s]


Val loss:   0.033368 | Val accuracy:   0.990307
-------------
Epoch 9:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:30<00:00, 55.19it/s]


Train loss: 0.022775 | Train accuracy: 0.992627


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 123.77it/s]


Val loss:   0.038466 | Val accuracy:   0.989806
-------------
Epoch 10:



100%|██████████████████████████████████████████████████████████████████████████████| 1687/1687 [00:29<00:00, 56.32it/s]


Train loss: 0.020310 | Train accuracy: 0.993646


100%|███████████████████████████████████████████████████████████████████████████████| 187/187 [00:01<00:00, 126.13it/s]


Val loss:   0.035708 | Val accuracy:   0.990642


100%|███████████████████████████████████████████████████████████████████████████████| 312/312 [00:02<00:00, 125.48it/s]

Loss on test set:0.028700249319047525 Accuracy on test set: 0.9901842948717948



