# Multi-class classification test using MLP.

In [4]:
import sys
import os

# Add parent directory (project/) to sys.path
sys.path.append(os.path.abspath(".."))

from tensorflow.keras.datasets import mnist
from sklearn.metrics import accuracy_score
import numpy as np
from NNLite.loss.BCE.BCE import BCE
from NNLite.loss.CrossEntropyLoss.crossentropyloss import CrossEntropyLoss
from NNLite.activation.relu.relu import Relu
from NNLite.activation.logistic.logistic import Logistic
from NNLite.network.sequential.sequential import Sequential
from NNLite.layer.linear.linear import Linear
from NNLite.optimizer.SGD.SGD import SGD
from NNLite.regularization.L2.L2 import L2

(x_train, y_train), (x_test, y_test) = mnist.load_data()



x_train_flat = x_train.reshape(x_train.shape[0], -1)  # flatten to (num_samples, 784)
x_test_flat = x_test.reshape(x_test.shape[0], -1)

x_train_flat = x_train_flat.astype('float32') / 255.0
x_test_flat  = x_test_flat.astype('float32') / 255.0

In [5]:
batch_size = 100
num_samples = x_train.shape[0]

indices = np.random.permutation(num_samples)
x_train_flat = x_train_flat[indices]
y_train = y_train[indices]

num_classes = 10
y_train_onehot = np.eye(num_classes)[y_train]
y_test_onehot = np.eye(num_classes)[y_test]

In [6]:
model = Sequential(
    Linear(784, 128),
    Relu(alpha=0.01),
    Linear(128, 64),
    Relu(alpha=0.01),
    Linear(64, 10),
)
loss = CrossEntropyLoss()

optim = SGD(model.params(),reg=L2(0.01), lr=0.05)

NUM_EPOCH=30

In [7]:
print("training accuracy")
for j in range(0, NUM_EPOCH):
    
    correct=0
    for i in range(0, num_samples, batch_size):

        x_batch = x_train_flat[i:i+batch_size]
        y_batch = y_train_onehot[i:i+batch_size]

        result = model.forward(x_batch)

        pred_indices = np.argmax(result, axis=1)
        true_indices = np.argmax(y_batch, axis=1)


        correct+=np.sum(pred_indices==true_indices)

        loss.forward(result, y_batch)
        model.backward(loss)
        optim.step()
    print(correct/num_samples)

training accuracy
0.8675333333333334
0.9199833333333334
0.92745
0.9315833333333333
0.9349833333333334
0.9373
0.9390166666666667
0.9404166666666667
0.9415166666666667
0.9425166666666667
0.9432
0.9440666666666667
0.9446833333333333
0.9453833333333334
0.94575
0.9462
0.9466
0.9468333333333333
0.9471833333333334
0.9477666666666666
0.9479666666666666
0.9482
0.9484
0.9485666666666667
0.9487166666666667
0.9487666666666666
0.9489333333333333
0.9491833333333334
0.9493333333333334
0.9494666666666667


In [8]:
print("validation accuracy")

result = model.forward(x_test_flat)

pred_indices = np.argmax(result, axis=1)
true_indices = np.argmax(y_test_onehot, axis=1)

print(accuracy_score(pred_indices, true_indices))

validation accuracy
0.9519
