Twoim zadaniem jest wytrenowanie klasyfikatora binarnego na podzbiorze zbioru MNIST, w którym wyróżniamy klasy (cyfry 0 i 1 mają zostać wyłączone ze zbioru):
 - Liczby pierwsze (2,3,5,7)
 - Liczby złożone (4,6,8,9)

Napisz wydajną implementację modelu **regresji logistycznej** trenowanego algorytmem ***SGD z momentum***. Cały proces trenowania musisz napisać samodzielnie, w języku Python, korzystając z biblioteki numpy. Na potrzeby zadania niedozwolone jest korzystanie z gotowych implementacji optimizerów i modeli oraz bibliotek do automatycznego różniczkowania funkcji (np. Tensorflow, pytorch, autograd). 

Dobierz hiperparametry tak, aby uzyskać jak najlepszy wynik na zbiorze walidacyjnym. 
Wyciągnij i zapisz wnioski z przeprowadzonych eksperymentów.

Zbiór MNIST dostępny jest pod linkami: 

(zbiór treningowy):
 - http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
 - http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz

(zbiór walidacyjny):
 - http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
 - http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz



# Przygotowanie danych
Zostają utworzone cztery macierze, dwie służące do trenowania modelu, oraz pozostałe dwie do jego walidacji. Następnie dane w macierzach z klasami zostają zamienione na 1 dla liczb pierwszych, 0 dla liczb złożonych, -1 dla 0 lub 1. Na koniec usuwane są wszystkie komórki zawierające -1 oraz odpowiadający im wektor w macierzach wejścia. Aby proces przebiegł poprawnie archiwa ze zbiorem MNIST muszą znajdować się w tym samym folderze co ten notatnik.

In [9]:
import gzip
import numpy as np
import time
import matplotlib.pyplot as plt 

In [11]:
IMAGE_SIZE = 28

validation_image = gzip.open(".\\t10k-images-idx3-ubyte.gz", "r")
validation_labels = gzip.open(".\\t10k-labels-idx1-ubyte.gz", "r")

train_image = gzip.open(".\\train-images-idx3-ubyte.gz", "r")
train_labels = gzip.open(".\\train-labels-idx1-ubyte.gz", "r")

validation_image.read(16)
validation_labels.read(8)
train_image.read(16)
train_labels.read(8)

def is_prime(x):
    if x in [2,3,5,7]:
        return 1
    elif x in [4,6,8]:
        return 0 
    return -1

is_prime = np.vectorize(is_prime)

def generate_matrices(buffer, length):
    M = np.frombuffer(buffer, dtype=np.uint8)
    M = M.reshape(int(M.shape[0]/(length**2)), -1)

    return M

def generate_map(labels):
    map = np.argwhere(labels == -1)
    return map.T[0]


X = generate_matrices(train_image.read(), IMAGE_SIZE)
y = is_prime(generate_matrices(train_labels.read(), 1))
map = generate_map(y)

X = np.delete(X, map, 0)
y = np.delete(y, map, 0)



v_X = generate_matrices(validation_image.read(), IMAGE_SIZE)
v_y = is_prime(generate_matrices(validation_labels.read(), 1))
map = generate_map(v_y)

v_X = np.delete(v_X, map, 0)
v_y = np.delete(v_y, map, 0)

print(X.shape)
print(y.shape)


(41386, 784)
(41386, 1)


# Model
W celu wytrenowania modelu będę maksymalizował funkcję celu zadaną wzorem $$J(\Theta)=\frac{1}{m}\sum_{i=0}^m $$


In [8]:
import numpy as np


class Model:

  def fit(self, X: np.ndarray, y: np.ndarray) -> None:
    pass

  def predict(self, X: np.ndarray) -> np.ndarray:
    pass

  @staticmethod
  def evaluate(y_true: np.ndarray, y_pred: np.ndarray) -> float:
    # calculate accuracy
    pass
