In [2]:
import os
import struct
import numpy as np
import matplotlib.pyplot as plt
from sklearn import neural_network as mlp

def load_mnist(path, kind='train'):
    #Load MNIST data from `path`

    labels_path = os.path.join(path, '%s-labels-idx1-ubyte' % kind)

    images_path = os.path.join(path, '%s-images-idx3-ubyte' % kind)

    with open(labels_path, 'rb') as lbpath:

        magic, n = struct.unpack('>II', lbpath.read(8))

        labels = np.fromfile(lbpath, dtype=np.uint8)

    with open(images_path, 'rb') as imgpath:

        magic, num, rows, cols = struct.unpack(">IIII", imgpath.read(16))

        images = np.fromfile(imgpath, dtype=np.uint8).reshape(len(labels), 784)

    return images, labels
imgs, labels = load_mnist("./")  
    

In [5]:
import time

t0 = time.time()
perc = mlp.MLPClassifier(activation='logistic', alpha= 0.0001, hidden_layer_sizes=20, 
                         learning_rate= 'adaptive', max_iter= 200, verbose=True)

perc.fit(imgs, labels)
t1 = time.time()
print("Training time: " + str(abs(t0 - t1)))



testImgs, testLabels = load_mnist("./", "t10k")

print(perc.score(testImgs, testLabels))

Iteration 1, loss = 1.32388419
Iteration 2, loss = 0.67556134
Iteration 3, loss = 0.49396520
Iteration 4, loss = 0.42634775
Iteration 5, loss = 0.39736997
Iteration 6, loss = 0.37445806
Iteration 7, loss = 0.36229706
Iteration 8, loss = 0.34451525
Iteration 9, loss = 0.33691368
Iteration 10, loss = 0.32816468
Iteration 11, loss = 0.31399155
Iteration 12, loss = 0.31673255
Iteration 13, loss = 0.32387180
Iteration 14, loss = 0.31407277
Iteration 15, loss = 0.30315119
Iteration 16, loss = 0.29798449
Iteration 17, loss = 0.29284797
Iteration 18, loss = 0.29691661
Iteration 19, loss = 0.29513159
Iteration 20, loss = 0.28755253
Iteration 21, loss = 0.30105077
Iteration 22, loss = 0.28868981
Iteration 23, loss = 0.27665240
Iteration 24, loss = 0.27014624
Iteration 25, loss = 0.27589458
Iteration 26, loss = 0.27201819
Iteration 27, loss = 0.26801904
Iteration 28, loss = 0.26695095
Iteration 29, loss = 0.27996115
Iteration 30, loss = 0.27326975
Iteration 31, loss = 0.27445452
Iteration 32, los

In [21]:
predicted = perc.predict(testImgs)
#_, axes = plt.subplots(nrows=1, ncols=4, figsize=(10, 3))
for image, prediction, actual in zip(testImgs, predicted, testLabels):
    if (prediction != actual):
        print("P: " + str(prediction) + " A: " + str(actual))

P: 7 A: 7
P: 2 A: 2
P: 1 A: 1
P: 0 A: 0
P: 4 A: 4
P: 1 A: 1
P: 4 A: 4
P: 9 A: 9
P: 6 A: 5
P: 6 A: 5
P: 9 A: 9
P: 0 A: 0
P: 6 A: 6
P: 9 A: 9
P: 0 A: 0
P: 1 A: 1
P: 5 A: 5
P: 9 A: 9
P: 7 A: 7
P: 8 A: 3
P: 8 A: 3
P: 4 A: 4
P: 9 A: 9
P: 6 A: 6
P: 6 A: 6
P: 5 A: 5
P: 4 A: 4
P: 0 A: 0
P: 7 A: 7
P: 4 A: 4
P: 0 A: 0
P: 1 A: 1
P: 3 A: 3
P: 1 A: 1
P: 3 A: 3
P: 0 A: 4
P: 0 A: 4
P: 7 A: 7
P: 2 A: 2
P: 7 A: 7
P: 1 A: 1
P: 2 A: 2
P: 1 A: 1
P: 1 A: 1
P: 7 A: 7
P: 4 A: 4
P: 2 A: 2
P: 3 A: 3
P: 5 A: 5
P: 1 A: 1
P: 2 A: 2
P: 4 A: 4
P: 4 A: 4
P: 6 A: 6
P: 3 A: 3
P: 5 A: 5
P: 5 A: 5
P: 6 A: 6
P: 0 A: 0
P: 4 A: 4
P: 1 A: 1
P: 9 A: 9
P: 5 A: 5
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 3 A: 3
P: 7 A: 7
P: 4 A: 4
P: 6 A: 6
P: 4 A: 4
P: 3 A: 3
P: 0 A: 0
P: 7 A: 7
P: 0 A: 0
P: 2 A: 2
P: 9 A: 9
P: 1 A: 1
P: 7 A: 7
P: 3 A: 3
P: 2 A: 2
P: 9 A: 9
P: 7 A: 7
P: 7 A: 7
P: 6 A: 6
P: 2 A: 2
P: 7 A: 7
P: 8 A: 8
P: 4 A: 4
P: 7 A: 7
P: 3 A: 3
P: 6 A: 6
P: 1 A: 1
P: 3 A: 3
P: 6 A: 6
P: 4 A: 9
P: 4 A: 9
P: 3 A: 3
P: 1 A: 1
P: 4 A: 4


P: 0 A: 0
P: 3 A: 3
P: 0 A: 0
P: 3 A: 3
P: 1 A: 1
P: 4 A: 4
P: 0 A: 0
P: 3 A: 3
P: 7 A: 7
P: 2 A: 2
P: 7 A: 7
P: 1 A: 1
P: 8 A: 8
P: 0 A: 0
P: 7 A: 7
P: 0 A: 0
P: 4 A: 4
P: 3 A: 3
P: 1 A: 1
P: 9 A: 9
P: 8 A: 8
P: 7 A: 7
P: 7 A: 7
P: 1 A: 1
P: 4 A: 4
P: 9 A: 9
P: 9 A: 9
P: 3 A: 3
P: 7 A: 2
P: 7 A: 2
P: 1 A: 1
P: 7 A: 7
P: 9 A: 9
P: 0 A: 0
P: 2 A: 2
P: 0 A: 0
P: 3 A: 3
P: 3 A: 3
P: 7 A: 7
P: 4 A: 6
P: 4 A: 6
P: 9 A: 9
P: 2 A: 2
P: 3 A: 3
P: 3 A: 3
P: 7 A: 7
P: 7 A: 7
P: 0 A: 0
P: 0 A: 0
P: 7 A: 7
P: 5 A: 5
P: 2 A: 2
P: 9 A: 9
P: 8 A: 8
P: 7 A: 7
P: 4 A: 4
P: 4 A: 4
P: 2 A: 2
P: 6 A: 6
P: 5 A: 6
P: 5 A: 6
P: 1 A: 1
P: 9 A: 9
P: 6 A: 6
P: 8 A: 8
P: 2 A: 2
P: 9 A: 9
P: 0 A: 0
P: 8 A: 8
P: 7 A: 3
P: 7 A: 3
P: 1 A: 1
P: 1 A: 1
P: 6 A: 6
P: 3 A: 3
P: 5 A: 5
P: 1 A: 1
P: 1 A: 1
P: 1 A: 1
P: 3 A: 3
P: 1 A: 1
P: 3 A: 2
P: 3 A: 2
P: 3 A: 3
P: 0 A: 0
P: 2 A: 2
P: 0 A: 0
P: 1 A: 1
P: 3 A: 3
P: 5 A: 5
P: 5 A: 5
P: 7 A: 7
P: 4 A: 4
P: 8 A: 8
P: 9 A: 9
P: 6 A: 6
P: 9 A: 9
P: 6 A: 6
P: 8 A: 8
P: 3 A: 3


P: 4 A: 7
P: 6 A: 6
P: 9 A: 9
P: 1 A: 1
P: 8 A: 8
P: 4 A: 4
P: 1 A: 1
P: 1 A: 1
P: 9 A: 9
P: 9 A: 9
P: 9 A: 4
P: 9 A: 4
P: 3 A: 3
P: 6 A: 6
P: 8 A: 8
P: 1 A: 1
P: 6 A: 6
P: 0 A: 0
P: 4 A: 4
P: 1 A: 1
P: 3 A: 3
P: 7 A: 7
P: 7 A: 7
P: 4 A: 4
P: 9 A: 9
P: 5 A: 5
P: 1 A: 1
P: 0 A: 0
P: 0 A: 0
P: 1 A: 1
P: 1 A: 1
P: 8 A: 6
P: 8 A: 6
P: 2 A: 2
P: 1 A: 1
P: 9 A: 9
P: 8 A: 8
P: 4 A: 4
P: 0 A: 0
P: 3 A: 3
P: 6 A: 6
P: 4 A: 4
P: 9 A: 9
P: 0 A: 0
P: 7 A: 7
P: 1 A: 1
P: 6 A: 6
P: 5 A: 5
P: 7 A: 7
P: 5 A: 5
P: 2 A: 2
P: 5 A: 5
P: 1 A: 1
P: 8 A: 8
P: 8 A: 5
P: 8 A: 5
P: 4 A: 4
P: 7 A: 7
P: 0 A: 0
P: 5 A: 6
P: 5 A: 6
P: 7 A: 7
P: 2 A: 0
P: 2 A: 0
P: 2 A: 2
P: 5 A: 5
P: 8 A: 8
P: 1 A: 1
P: 0 A: 0
P: 4 A: 4
P: 3 A: 5
P: 3 A: 5
P: 7 A: 7
P: 1 A: 1
P: 6 A: 8
P: 6 A: 8
P: 5 A: 5
P: 1 A: 1
P: 9 A: 9
P: 0 A: 0
P: 0 A: 0
P: 6 A: 6
P: 0 A: 0
P: 7 A: 7
P: 3 A: 3
P: 1 A: 1
P: 8 A: 8
P: 3 A: 3
P: 9 A: 9
P: 7 A: 7
P: 0 A: 0
P: 0 A: 0
P: 8 A: 8
P: 4 A: 9
P: 4 A: 9
P: 5 A: 5
P: 9 A: 9
P: 8 A: 8
P: 3 A: 3
P: 2 A: 2


P: 7 A: 7
P: 7 A: 7
P: 4 A: 4
P: 7 A: 7
P: 7 A: 7
P: 3 A: 3
P: 7 A: 7
P: 4 A: 4
P: 5 A: 5
P: 4 A: 4
P: 2 A: 3
P: 2 A: 3
P: 3 A: 3
P: 8 A: 8
P: 4 A: 4
P: 1 A: 1
P: 1 A: 1
P: 9 A: 9
P: 7 A: 7
P: 4 A: 4
P: 3 A: 3
P: 7 A: 7
P: 3 A: 3
P: 3 A: 3
P: 0 A: 0
P: 2 A: 2
P: 6 A: 5
P: 6 A: 5
P: 5 A: 5
P: 6 A: 6
P: 6 A: 6
P: 3 A: 3
P: 8 A: 5
P: 8 A: 5
P: 2 A: 2
P: 5 A: 5
P: 9 A: 9
P: 9 A: 9
P: 8 A: 8
P: 4 A: 4
P: 1 A: 1
P: 0 A: 0
P: 2 A: 6
P: 2 A: 6
P: 6 A: 0
P: 6 A: 0
P: 9 A: 9
P: 6 A: 6
P: 8 A: 8
P: 8 A: 8
P: 5 A: 5
P: 6 A: 6
P: 1 A: 1
P: 1 A: 1
P: 9 A: 9
P: 8 A: 8
P: 9 A: 9
P: 2 A: 2
P: 3 A: 3
P: 5 A: 5
P: 5 A: 5
P: 9 A: 9
P: 4 A: 4
P: 2 A: 2
P: 1 A: 1
P: 9 A: 9
P: 2 A: 3
P: 2 A: 3
P: 9 A: 9
P: 2 A: 2
P: 6 A: 0
P: 6 A: 0
P: 6 A: 6
P: 6 A: 0
P: 6 A: 0
P: 4 A: 4
P: 0 A: 0
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 4 A: 4
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 4 A: 4
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9


P: 9 A: 9
P: 0 A: 0
P: 0 A: 0
P: 0 A: 0
P: 3 A: 3
P: 7 A: 7
P: 1 A: 1
P: 6 A: 6
P: 4 A: 4
P: 6 A: 6
P: 0 A: 0
P: 4 A: 4
P: 5 A: 5
P: 4 A: 4
P: 1 A: 1
P: 3 A: 3
P: 8 A: 8
P: 6 A: 6
P: 3 A: 3
P: 9 A: 9
P: 9 A: 9
P: 5 A: 5
P: 9 A: 9
P: 3 A: 3
P: 7 A: 7
P: 8 A: 8
P: 5 A: 5
P: 6 A: 6
P: 4 A: 4
P: 7 A: 7
P: 6 A: 6
P: 2 A: 2
P: 2 A: 2
P: 0 A: 0
P: 9 A: 9
P: 4 A: 4
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 4 A: 4
P: 5 A: 5
P: 6 A: 6
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 4 A: 4
P: 5 A: 5
P: 6 A: 6
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 0 A: 0
P: 1 A: 1
P: 2 A: 2
P: 3 A: 3
P: 4 A: 4
P: 5 A: 5
P: 6 A: 6
P: 7 A: 7
P: 8 A: 8
P: 9 A: 9
P: 6 A: 6
P: 4 A: 4
P: 2 A: 2
P: 6 A: 6
P: 4 A: 4
P: 7 A: 7
P: 5 A: 5
P: 5 A: 5
P: 4 A: 4
P: 7 A: 7
P: 2 A: 2
P: 9 A: 9
P: 3 A: 3
P: 9 A: 9
P: 3 A: 3
P: 8 A: 8
P: 2 A: 2
P: 0 A: 0
P: 9 A: 9
P: 5 A: 5
P: 6 A: 6
P: 0 A: 0
P: 1 A: 1
P: 0 A: 0
P: 6 A: 6
P: 5 A: 5
P: 3 A: 3
P: 5 A: 5
P: 3 A: 3
P: 8 A: 8
P: 0 A: 0
P: 0 A: 0
P: 3 A: 3
P: 4 A: 4


In [3]:
from sklearn.model_selection import GridSearchCV

mlpCV = mlp.MLPClassifier()
parameter_space = {
    'verbose': [True],
    'hidden_layer_sizes': [10],
    'activation': ['logistic'],
    'alpha': [0.0001, 0.05],
    'learning_rate': ['constant','adaptive'],
    'max_iter': [50, 100, 150],
    'batch_size': [100, 200, 300]
}


best = GridSearchCV(mlpCV, parameter_space, n_jobs=-1, cv=5)
best.fit(imgs, labels)

print('Best parameters found:\n', best.best_params_)

Iteration 1, loss = 1.79881104
Iteration 2, loss = 1.30574311
Iteration 3, loss = 1.05460548
Iteration 4, loss = 0.89946749
Iteration 5, loss = 0.77750381
Iteration 6, loss = 0.69273501
Iteration 7, loss = 0.64176964
Iteration 8, loss = 0.59890768
Iteration 9, loss = 0.57719742
Iteration 10, loss = 0.54993996
Iteration 11, loss = 0.54863130
Iteration 12, loss = 0.52257918
Iteration 13, loss = 0.51625675
Iteration 14, loss = 0.50643306
Iteration 15, loss = 0.49558643
Iteration 16, loss = 0.49698624
Iteration 17, loss = 0.48844613
Iteration 18, loss = 0.48737020
Iteration 19, loss = 0.47727121
Iteration 20, loss = 0.47779745
Iteration 21, loss = 0.46453772
Iteration 22, loss = 0.46240698
Iteration 23, loss = 0.46134431
Iteration 24, loss = 0.46251530
Iteration 25, loss = 0.44717806
Iteration 26, loss = 0.44789823
Iteration 27, loss = 0.45112791
Iteration 28, loss = 0.44675441
Iteration 29, loss = 0.44197399
Iteration 30, loss = 0.44350091
Iteration 31, loss = 0.44387857
Iteration 32, los