# Implementazione di un classificatore con Logistic Regression

### 0) Importo le librerie necessarie

In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

### 1) Sigmoid o Logistic function
Per effettuare la classificazione serve una funzione con codominio [0,1]. Infatti la predizione si baserà sulla probabilità della stima di appartenere ad una o all'altra classe

In [2]:
def logistic(z):
    den = 1 + np.exp(-z)
    sigm = 1.0/den
    return sigm

### 2) Funzione di ipotesi
Per approssimare una probabilità, la funzione di costo sarà basta sulla funzione logisitca

In [3]:
def hyp(W,X):
    param = np.dot(W,X.T)
    return logistic(param)

### 3) Funzione di costo
Da massimizzare nello step di ottimizzazione. IN particolare il logaritmo della funzione di coston

In [4]:
def cost(W,X,Y):
    m = X.shape[0]
    h = hyp(W,X)
    log_h = np.log(h)
    log_one_h = np.log(1-h)
    l_cost = float((-1.0/m) * ((np.dot(log_h,Y)) + (np.dot(log_one_h,(1-Y)))))
    return l_cost

### 4) Carico e preparo i dati

In [5]:
# Carico il dataset
path = '../color_extr/data.csv'
data = pd.read_csv(path, usecols = [i for i in range(5)])

# Creo train e test set
X_train, X_test, Y_train, Y_test = train_test_split(data[['presenza_foglie','assenza_foglie','presenza_bachi_sfondo','assenza_bachi_sfondo']], data[['classificazione']], test_size=0.13)

m_tr, n_tr = X_train.shape
X_train = np.concatenate((np.ones((m_tr,1)), X_train), axis=1)
n_tr +=1

m_te, n_te = X_test.shape
X_test = np.concatenate((np.ones((m_te,1)), X_test), axis=1)
n_te += 1

W = np.array(np.zeros((1,n_te)))
#W = np.matrix(np.random.randn((n_te)))

Y_train = Y_train.to_numpy()
Y_test = Y_test.to_numpy()

# Normalizzo i dati
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.fit_transform(X_test)

#cost(W,X_train,Y_train)
X_train.shape

(1175, 5)

### 5) Fit dell'algoritmo con gradient ascent
Cerco il punto di massimo della funzione di costo per trovare i pesi ottimi

In [6]:
def gradient_ascent(X,W,Y,alpha,stop):
    m,n = X.shape
    cost_old = np.inf
    cost_new = cost(W,X,Y)
    print(cost_old - cost(W,X,Y))
    sum = 0
    iter = 0

    while(abs(cost_old-cost_new) > stop):
        for j in range(0,n):
            for i in range(0,m):
                sum += (Y[i][0] - hyp(W,X[i])) * X[i][j]
            W[0][j] = W[0][j] + (alpha/m) * sum
        cost_old = cost_new
        cost_new = cost(W,X,Y)
        print(cost_old - cost(W,X,Y))
        iter += 1

    return W, iter  

gradient_ascent(X_train,W,Y_train,0.04,0.000001)

inf
0.014131560750698768
0.013590274619246112
0.013070650734030798
0.012572292681329311
0.012094729948498584
0.011637430716693542
0.011199813841708539
0.010781259893272832
0.010381121174170671
0.0099987306840158
0.00963341002816931
0.00928447630028717
0.008951247987959543
0.008633049965628081
0.008329217648358589
0.00803910038503719
0.007762064171044414
0.007497493759254237
0.007244794245041264
0.007003392196426983
0.006772736395105949
0.006552298248210187
0.006341571924651956
0.006140074263910722
0.005947344499408924
0.0057629438332281735
0.005586454893935611
0.00541748110476048
0.005255645985274671
0.005100592406098836
0.004951981812955197
0.004809493433578449
0.004672823478570787
0.004541684345182262
0.004415803831210208
0.004294924364676211
0.004178802253654079
0.0040672069595352744
0.00395992039611287
0.0038567362561204854
0.0037574593662401123
0.003661905071094651
0.0035698986463371107
0.003481274740618323
0.003395876845970869
0.0033135567959358125
0.0032341742906254467
0.0031575

KeyboardInterrupt: 

### 6) Model Assestement

In [201]:
def prediction(W,X,Y):
    m = X.shape[0]
    Y_hat = hyp(X, W) > 0.5
    accuracy = 1.0/m * np.sum(Y == Y_hat)
    return accuracy, Y_hat

prediction(W,X_train,Y_train)[0],prediction(W,X_test,Y_test)[0]

(0.9753191489361702, 0.9261363636363636)