### MLP

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
from train_utils import batchify_data, run_epoch, train_model, Flatten
import utils_multiMNIST as U

In [2]:
path_to_data_dir = '../Datasets/'
use_mini_dataset = True

batch_size = 64
nb_classes = 10
nb_epoch = 30
num_classes = 10
img_rows, img_cols = 42, 28 # input image dimensions

In [3]:
class MLP(nn.Module):

    def __init__(self, input_dimension):
        super(MLP, self).__init__()
        self.flatten = Flatten()
    
        # initialize model layers here
        self.flatten = Flatten()
        self.linear1 = nn.Linear(input_dimension, 64)
        self.linear2 = nn.Linear(64, 20)
        self.softmax = nn.Softmax()
        

    def forward(self, x):
        xf = self.flatten(x)
        
        xr = self.linear1(xf)
        xl2 = self.linear2(xr)
        out_first_digit = self.softmax(xl2[:,:10])
        out_second_digit = self.softmax(xl2[:,10:]) 
        xl1 = self.linear1(xf)
        xl2 = self.linear2(xl1)
        
        out_first_digit = xl2[:,:10]
        out_second_digit = xl2[:,10:]


        # use model layers to predict the two digits

        return out_first_digit, out_second_digit

In [4]:
def main():
    X_train, y_train, X_test, y_test = U.get_data(path_to_data_dir, use_mini_dataset)

    # Split into train and dev
    dev_split_index = int(9 * len(X_train) / 10)
    X_dev = X_train[dev_split_index:]
    y_dev = [y_train[0][dev_split_index:], y_train[1][dev_split_index:]]
    X_train = X_train[:dev_split_index]
    y_train = [y_train[0][:dev_split_index], y_train[1][:dev_split_index]]

    permutation = np.array([i for i in range(len(X_train))])
    np.random.shuffle(permutation)
    X_train = [X_train[i] for i in permutation]
    y_train = [[y_train[0][i] for i in permutation], [y_train[1][i] for i in permutation]]

    # Split dataset into batches
    train_batches = batchify_data(X_train, y_train, batch_size)
    dev_batches = batchify_data(X_dev, y_dev, batch_size)
    test_batches = batchify_data(X_test, y_test, batch_size)

    # Load model
    input_dimension = img_rows * img_cols
    model = MLP(input_dimension) # TODO add proper layers to MLP class above

    # Train
    train_model(train_batches, dev_batches, model)

    ## Evaluate the model on test data
    loss, acc = run_epoch(test_batches, model.eval(), None)
    print('Test loss1: {:.6f}  accuracy1: {:.6f}  loss2: {:.6f}   accuracy2: {:.6f}'.format(loss[0], acc[0], loss[1], acc[1]))


In [5]:
if __name__ == '__main__':
    # Specify seed for deterministic behavior, then shuffle. Do not change seed for official submissions to edx
    np.random.seed(12321)  # for reproducibility
    torch.manual_seed(12321)  # for reproducibility
    main()

-------------
Epoch 1:



  out_first_digit = self.softmax(xl2[:,:10])
  out_second_digit = self.softmax(xl2[:,10:])
100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 753.38it/s]


Train | loss1: 0.776068  accuracy1: 0.792538 | loss2: 0.798555  accuracy2: 0.777441


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1344.09it/s]


Valid | loss1: 0.430175  accuracy1: 0.878780 | loss2: 0.457375  accuracy2: 0.860887
-------------
Epoch 2:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 795.69it/s]


Train | loss1: 0.396823  accuracy1: 0.886927 | loss2: 0.426801  accuracy2: 0.870357


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1453.48it/s]


Valid | loss1: 0.382405  accuracy1: 0.889113 | loss2: 0.403938  accuracy2: 0.875504
-------------
Epoch 3:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 784.67it/s]


Train | loss1: 0.360463  accuracy1: 0.896769 | loss2: 0.390284  accuracy2: 0.883285


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1470.60it/s]


Valid | loss1: 0.367611  accuracy1: 0.894405 | loss2: 0.386381  accuracy2: 0.880544
-------------
Epoch 4:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 789.04it/s]


Train | loss1: 0.342956  accuracy1: 0.901246 | loss2: 0.372160  accuracy2: 0.889290


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1470.57it/s]


Valid | loss1: 0.360734  accuracy1: 0.895161 | loss2: 0.376846  accuracy2: 0.886341
-------------
Epoch 5:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 773.42it/s]


Train | loss1: 0.331562  accuracy1: 0.904443 | loss2: 0.360041  accuracy2: 0.893127


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1436.76it/s]


Valid | loss1: 0.356971  accuracy1: 0.896421 | loss2: 0.370512  accuracy2: 0.887853
-------------
Epoch 6:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 796.25it/s]


Train | loss1: 0.323069  accuracy1: 0.906973 | loss2: 0.350922  accuracy2: 0.895880


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.08it/s]


Valid | loss1: 0.354749  accuracy1: 0.899950 | loss2: 0.365907  accuracy2: 0.890625
-------------
Epoch 7:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 804.16it/s]


Train | loss1: 0.316259  accuracy1: 0.909169 | loss2: 0.343622  accuracy2: 0.898354


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.12it/s]


Valid | loss1: 0.353413  accuracy1: 0.900202 | loss2: 0.362405  accuracy2: 0.893397
-------------
Epoch 8:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 792.91it/s]


Train | loss1: 0.310557  accuracy1: 0.910698 | loss2: 0.337544  accuracy2: 0.900328


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1388.90it/s]


Valid | loss1: 0.352648  accuracy1: 0.899698 | loss2: 0.359679  accuracy2: 0.894153
-------------
Epoch 9:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 771.84it/s]


Train | loss1: 0.305646  accuracy1: 0.912172 | loss2: 0.332348  accuracy2: 0.901968


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.08it/s]


Valid | loss1: 0.352283  accuracy1: 0.898942 | loss2: 0.357529  accuracy2: 0.894909
-------------
Epoch 10:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 800.19it/s]


Train | loss1: 0.301333  accuracy1: 0.913201 | loss2: 0.327817  accuracy2: 0.903025


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1388.90it/s]


Valid | loss1: 0.352215  accuracy1: 0.898438 | loss2: 0.355823  accuracy2: 0.895665
-------------
Epoch 11:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 780.89it/s]


Train | loss1: 0.297492  accuracy1: 0.914202 | loss2: 0.323807  accuracy2: 0.904220


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1543.20it/s]


Valid | loss1: 0.352375  accuracy1: 0.899194 | loss2: 0.354468  accuracy2: 0.897429
-------------
Epoch 12:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 766.10it/s]


Train | loss1: 0.294033  accuracy1: 0.915036 | loss2: 0.320212  accuracy2: 0.904665


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1436.79it/s]


Valid | loss1: 0.352714  accuracy1: 0.898438 | loss2: 0.353398  accuracy2: 0.896925
-------------
Epoch 13:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 773.42it/s]


Train | loss1: 0.290891  accuracy1: 0.916342 | loss2: 0.316959  accuracy2: 0.905333


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.09it/s]


Valid | loss1: 0.353195  accuracy1: 0.898185 | loss2: 0.352561  accuracy2: 0.898185
-------------
Epoch 14:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 776.07it/s]


Train | loss1: 0.288017  accuracy1: 0.916787 | loss2: 0.313989  accuracy2: 0.906611


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1524.38it/s]


Valid | loss1: 0.353787  accuracy1: 0.898942 | loss2: 0.351919  accuracy2: 0.898185
-------------
Epoch 15:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 785.76it/s]


Train | loss1: 0.285370  accuracy1: 0.917427 | loss2: 0.311259  accuracy2: 0.907724


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.10it/s]


Valid | loss1: 0.354469  accuracy1: 0.898942 | loss2: 0.351440  accuracy2: 0.898185
-------------
Epoch 16:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 794.58it/s]


Train | loss1: 0.282918  accuracy1: 0.918038 | loss2: 0.308734  accuracy2: 0.908697


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1388.89it/s]


Valid | loss1: 0.355223  accuracy1: 0.897933 | loss2: 0.351099  accuracy2: 0.897933
-------------
Epoch 17:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 772.37it/s]


Train | loss1: 0.280636  accuracy1: 0.918789 | loss2: 0.306384  accuracy2: 0.909419


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1388.88it/s]


Valid | loss1: 0.356033  accuracy1: 0.899194 | loss2: 0.350877  accuracy2: 0.898438
-------------
Epoch 18:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 764.04it/s]


Train | loss1: 0.278502  accuracy1: 0.919623 | loss2: 0.304189  accuracy2: 0.910365


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1420.45it/s]


Valid | loss1: 0.356888  accuracy1: 0.897933 | loss2: 0.350755  accuracy2: 0.899194
-------------
Epoch 19:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 768.18it/s]


Train | loss1: 0.276497  accuracy1: 0.920485 | loss2: 0.302129  accuracy2: 0.911032


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1404.52it/s]


Valid | loss1: 0.357780  accuracy1: 0.896925 | loss2: 0.350721  accuracy2: 0.899446
-------------
Epoch 20:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 803.02it/s]


Train | loss1: 0.274608  accuracy1: 0.920930 | loss2: 0.300188  accuracy2: 0.911727


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1453.50it/s]


Valid | loss1: 0.358699  accuracy1: 0.897429 | loss2: 0.350763  accuracy2: 0.899194
-------------
Epoch 21:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 816.92it/s]


Train | loss1: 0.272821  accuracy1: 0.921319 | loss2: 0.298353  accuracy2: 0.912200


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1623.40it/s]


Valid | loss1: 0.359640  accuracy1: 0.896169 | loss2: 0.350871  accuracy2: 0.898942
-------------
Epoch 22:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 803.59it/s]


Train | loss1: 0.271126  accuracy1: 0.921625 | loss2: 0.296614  accuracy2: 0.912978


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1582.29it/s]


Valid | loss1: 0.360598  accuracy1: 0.895917 | loss2: 0.351037  accuracy2: 0.899446
-------------
Epoch 23:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 786.85it/s]


Train | loss1: 0.269513  accuracy1: 0.922070 | loss2: 0.294962  accuracy2: 0.913089


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1488.09it/s]


Valid | loss1: 0.361567  accuracy1: 0.895413 | loss2: 0.351254  accuracy2: 0.899194
-------------
Epoch 24:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 803.59it/s]


Train | loss1: 0.267976  accuracy1: 0.922375 | loss2: 0.293387  accuracy2: 0.913562


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1562.50it/s]


Valid | loss1: 0.362544  accuracy1: 0.894909 | loss2: 0.351516  accuracy2: 0.899194
-------------
Epoch 25:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 769.75it/s]


Train | loss1: 0.266507  accuracy1: 0.922848 | loss2: 0.291884  accuracy2: 0.914229


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1404.47it/s]


Valid | loss1: 0.363526  accuracy1: 0.894909 | loss2: 0.351818  accuracy2: 0.898690
-------------
Epoch 26:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 782.50it/s]


Train | loss1: 0.265100  accuracy1: 0.923376 | loss2: 0.290447  accuracy2: 0.914591


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1436.78it/s]


Valid | loss1: 0.364511  accuracy1: 0.894153 | loss2: 0.352155  accuracy2: 0.899194
-------------
Epoch 27:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 768.18it/s]


Train | loss1: 0.263751  accuracy1: 0.923682 | loss2: 0.289070  accuracy2: 0.915008


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1453.50it/s]


Valid | loss1: 0.365495  accuracy1: 0.893649 | loss2: 0.352524  accuracy2: 0.899194
-------------
Epoch 28:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 790.14it/s]


Train | loss1: 0.262455  accuracy1: 0.924266 | loss2: 0.287748  accuracy2: 0.915453


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1389.05it/s]


Valid | loss1: 0.366478  accuracy1: 0.892893 | loss2: 0.352921  accuracy2: 0.899446
-------------
Epoch 29:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 794.58it/s]


Train | loss1: 0.261209  accuracy1: 0.924600 | loss2: 0.286478  accuracy2: 0.915897


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1373.63it/s]


Valid | loss1: 0.367456  accuracy1: 0.892893 | loss2: 0.353343  accuracy2: 0.898438
-------------
Epoch 30:



100%|███████████████████████████████████████████████████████████████████████████████| 562/562 [00:00<00:00, 771.84it/s]


Train | loss1: 0.260008  accuracy1: 0.924766 | loss2: 0.285256  accuracy2: 0.916315


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1562.50it/s]


Valid | loss1: 0.368430  accuracy1: 0.892389 | loss2: 0.353787  accuracy2: 0.898185


100%|████████████████████████████████████████████████████████████████████████████████| 62/62 [00:00<00:00, 1436.79it/s]

Test loss1: 0.400817  accuracy1: 0.892389  loss2: 0.374367   accuracy2: 0.893901



