# Zadania - metodologia testowania

### Walidacja krzyżowa

1. (15 pkt) Zaimplementuj 4-krotną walidację krzyżową na danych treningowych ze zbioru MNIST. W jej wyniku powinny powstać cztery różne modele $M_i$ dla $i=1\dots4$. Dla każdego modelu dobierz wspólne początkowe parametry ($\alpha$, rozmiar wsadu, liczba epok), zastosuj randomizację danych między epokami.
1. (10 pkt) Oblicz jakość każdego modelu na jego zbiorze walidacyjnym oraz średnią poprawność klasyfikacyjną na całym zbiorze treningowym poprzez uśrednienie wyników każdego z czterech zbiorów walidacyjnych.
1. (15 pkt) Dobierz najlepsze parametry dla modeli $M_i$ na podstawie skuteczności osiąganej na zbiorze treningowym. Podaj skuteczności, podobnie jak w punkcie 2. 
1. (10 pkt) Zbuduj model z tak dobranymi parametrami (uśrednij, jeżeli są różne dla $M_i$) na całych danych treningowych i sprawdź jego skuteczność na zbiorze testowym. Czy model z takimi parametrami da najlepszy możliwy wynik na zbiorze testowym? Odpowiedź uzasadnij.

In [None]:
import numpy as np

def safeSigmoid(x, eps=0):
    y = 1.0/(1.0 + np.exp(-x))
    if eps > 0:
        y[y < eps] = eps
        y[y > 1 - eps] = 1 - eps
    return y

def h(theta, X, eps=0.0):
    return safeSigmoid(X*theta, eps)

def J(h,theta,X,y):
    m = len(y)
    f = h(theta, X, eps=10**-7)
    return -np.sum(np.multiply(y, np.log(f)) + 
                   np.multiply(1 - y, np.log(1 - f)), axis=0)/m

def dJ(h,theta,X,y):
    return 1.0/len(y)*(X.T*(h(theta,X)-y))

def softmax(X):
    return np.exp(X)/np.sum(np.exp(X))

In [None]:
def SGD(h, fJ, fdJ, theta, X, y, 
        alpha=0.001, maxEpochs=1, batchSize=100):
    m, n = X.shape
    start, end = 0, batchSize
    
    maxSteps = (m * float(maxEpochs)) / batchSize
    for i in range(int(maxSteps)):
        XBatch, yBatch =  X[start:end,:], y[start:end,:]

        theta = theta - alpha * fdJ(h, theta, XBatch, yBatch)
        
        if start + batchSize < m:
            start += batchSize
        else:
            start = 0
        end = min(start + batchSize, m)
        
    return theta