mnist.py

import numpy as np
import torch

import mnistdataset
import models

imageSize = (28, 28)
inputSize = imageSize[0] * imageSize[1]
outputSize = 10


def tensorToNumpy(tensor) -> np.ndarray:
    return tensor.cpu().data.numpy()


def initializeDevice(model):
    shouldUseCuda = torch.cuda.is_available()
    device = torch.device("cuda" if shouldUseCuda else "cpu")
    model.to(device)
    if shouldUseCuda:
        model.cuda()
    return device


def createTensor(array, device, numCols):
    return torch.tensor(array, device=device, dtype=torch.float32).view(-1, numCols)


def createLabelsArray(y, numCols):
    """
    input:
        y -- (N,) integer labels
    output:
        labelArray -- (N, 10) consisting of zeros except where integer labels
                assign a 1.0
    """
    labelsArray = np.zeros((y.shape[0], numCols))
    labelsArray[np.arange(y.shape[0]),y] = 1.0
    return labelsArray


def trainModel(model, inputTensorTrain, labelTensorTrain, learningRate, numEpochs):
    losses = []
    criterion = torch.nn.MSELoss()
    optimizer = torch.optim.SGD(model.parameters(), lr=learningRate)

    for epoch in range(numEpochs):
        optimizer.zero_grad()
        outputsTensor = model(inputTensorTrain)

        loss = criterion(outputsTensor, labelTensorTrain)
        lossValue = loss.cpu().data.numpy()
        losses.append(lossValue)

        loss.backward()

        optimizer.step()
        print(f"epoch {epoch:05d}, loss {loss.item():0.6f}", end="\r")
    print()
    return losses


def main():
    modelClass, numEpochs, learningRate = models.MnistModelLinear, 10_000, 0.1
    model = modelClass()
    device = initializeDevice(model)

    datasetDict = mnistdataset.loadDataset()
    x = datasetDict["train"]["images"]
    y = datasetDict["train"]["labels"]
    inputTensorTrain = createTensor(x / 255, device, inputSize)
    labelsArray = createLabelsArray(y, outputSize)
    labelTensorTrain = createTensor(labelsArray, device, outputSize)

    losses = trainModel(model, inputTensorTrain, labelTensorTrain, learningRate, numEpochs)

    xtest = datasetDict["test"]["images"]
    ytest = datasetDict["test"]["labels"]
    labelTensorTest = createTensor(xtest / 255, device, inputSize)

    with torch.no_grad():
        predictedArray = model(labelTensorTest).cpu().data.numpy()
        predictedLabels = np.argmax(predictedArray, axis=1)
        numCorrectlyPredicted = np.sum(predictedLabels == ytest)
        print(f"Error rate: {100 - 100 * numCorrectlyPredicted/predictedLabels.shape[0]:0.2f}%")


if __name__ == "__main__":
    main()