# Test del mio algoritmo sul dataset dell'ammissione al college

### 0) Importo le librerie necessarie

In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

### 1) Sigmoid o Logistic function
Per effettuare la classificazione serve una funzione con codominio [0,1]. Infatti la predizione si baserà sulla probabilità della stima di appartenere ad una o all'altra classe

In [4]:
def logistic(z):
    den = 1 + np.exp(-z)
    sigm = 1.0/den
    return sigm

### 2) Funzione di ipotesi
Per approssimare una probabilità, la funzione di costo sarà basta sulla funzione logisitca

In [5]:
def hyp(W,X):
    param = np.dot(W,X.T)
    return logistic(param)

### 3) Funzione di costo
Da massimizzare nello step di ottimizzazione. IN particolare il logaritmo della funzione di coston

In [6]:
def cost(W,X,Y):
    m = X.shape[0]
    h = hyp(W,X)
    log_h = np.log(h)
    log_one_h = np.log(1-h)
    l_cost = float((-1.0/m) * ((np.dot(log_h,Y)) + (np.dot(log_one_h,(1-Y)))))
    return l_cost

### 4) Carico e preparo i dati

In [73]:
# Carico il dataset
path = './ex2data1.txt'
data = pd.read_csv(path, header=None, names=["Ex1","Ex2","Cl"])

# Creo train e test set
X_train, X_test, Y_train, Y_test = train_test_split(data[["Ex1","Ex2"]], data[['Cl']], test_size=0.13)

m_tr, n_tr = X_train.shape
X_train = np.concatenate((np.ones((m_tr,1)), X_train), axis=1)
n_tr +=1

m_te, n_te = X_test.shape
X_test = np.concatenate((np.ones((m_te,1)), X_test), axis=1)
n_te += 1

W = np.array(np.zeros((1,n_te)))
#W = np.matrix(np.random.randn((n_te)))

Y_train = Y_train.to_numpy()
Y_test = Y_test.to_numpy()

# Normalizzo i dati
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.fit_transform(X_test)

#cost(W,X_train,Y_train)
X_train.shape, Y_train.shape, W.shape
W

array([[0., 0., 0.]])

### 5) Fit dell'algoritmo con gradient ascent
Cerco il punto di massimo della funzione di costo per trovare i pesi ottimi

In [74]:
def gradient_ascent(X,W,Y,alpha,stop):
    m,n = X.shape
    cost_old = np.inf
    cost_new = cost(W,X,Y)
    print(cost_old - cost(W,X,Y))
    sum = 0
    iter = 0

    while(abs(cost_old-cost_new) > stop):
        for j in range(0,n):
            for i in range(0,m):
                sum += (Y[i][0] - hyp(W,X[i])) * X[i][j]
            W[0][j] = W[0][j] + (alpha/m) * sum
        cost_old = cost_new
        cost_new = cost(W,X,Y)
        print(cost_old - cost(W,X,Y))
        iter += 1

    return W, iter  

gradient_ascent(X_train,W,Y_train,0.05,0.000001)

inf
0.010264215354685247
0.022949480752735618
0.033455584740426425
0.04080272910367244
0.04445910530831099
0.04448052433150834
0.041492497979092546
0.036477457455924844
0.03046794306464523
0.02430386176791588
0.01853453924976073
0.013440681644504238
0.009110104772303063
0.005516323897164999
0.002577837814809081
0.00019526198533376116
-0.0017287017233652557
-0.003280314652713723
-0.004532059650734999
-0.0055429895202230295
-0.0063603687332557945
-0.007021669044733947
-0.007556479062908739
-0.007988155963630617
-0.008335180368336192
-0.008612234473379943
-0.008831044834770096
-0.009001034594406876
-0.009129825732145158
-0.009223625256038703
-0.009287522442206764
-0.009325718242332748
-0.009341703053224126
-0.009338395154023627
-0.00931824911645307
-0.009283341211711149
-0.009235437116968226
-0.009176045932774213
-0.009106463554959698
-0.009027807719406256
-0.008941046493807225
-0.008847021580907999
-0.008746467488395582
-0.008640027385990567
-0.008528266291570996
-0.008411682091282402
-0

  log_one_h = np.log(1-h)


(array([[14.05884715, 14.61477251, 14.16826208]]), 271)

### 6) Model Assestement
Train accurancy dell'esercitazione: 0,89

In [75]:
def prediction(W,X,Y):
    m = X.shape[0]
    Y_hat = hyp(X, W) > 0.5
    accuracy = 1.0/m * np.sum(Y == Y_hat)
    return accuracy, Y_hat

prediction(W,X_train,Y_train)[0],prediction(W,X_test,Y_test)[0]

(0.8505747126436781, 0.8461538461538463)