# Logistic Regression - NumPy

El objetivo de éste ejercicio es que implementen paso a paso los building blocks del modelo de regresión logística, para finalmente crear una clase del modelo.

## Cargamos las Librerías

In [1]:
import numpy as np
import time
import matplotlib.pyplot as plt

## Implementación de Building Blocks del Modelo

A continuación, se deberán implementar paso a paso los distintos bloques de código que conforman el modelo, junto con algunas funciones auxiliares.

### Función Sigmoid

Implementar la función: $g(z) = \frac{1}{1 + e^{-z}}$ en NumPy

In [2]:
def sigmoid(z):
     return 1 / (1 + np.exp(-z))

### Binary Cross Entropy

Implementar la función de costo: $J(w) = \frac{1}{n}\sum_{i=1}^{n}L\left ( \hat{y},y \right )= \frac{1}{n}\sum_{i=1}^{n}\left [y^{(i)}log(\hat{y}^{(i)})+ (1-y^{(i)})log(1-\hat{y}^{(i)}) \right ]$

In [20]:
def cost_entropy(Y, A, n):
    return np.sum(np.multiply(Y,np.log(A)) + np.multiply((1 - A), (1 - Y)), axis=1)

### Gradiente

Implementar el gradiente de la función costo respecto de los parámetros: $\frac{\partial J(w)}{\partial w} = \frac{1}{n}\sum_{i=1}^{n}\left ( \hat{y}^{i}-y^{i}\right )\bar{x}^i$

In [None]:
dz = A-Y
dw = (1/n)*np.dot(X,dz.T)
db = (1/m)*np.sum(dz)

### Normalización

Implementar normalización Z-score de las features de entrada

In [4]:
with open('X_train_nonull.npy', 'rb') as f:
    X_train_nonull = np.load(f)

In [6]:
with open('y_train_nonull.npy', 'rb') as f:
    y_train_nonull = np.load(f)

In [10]:
X_train_stand = (X_train_nonull - np.mean(X_train_nonull))/np.std(X_train_nonull)

In [12]:
X_train_stand.shape[1]


29

### Métricas (Precision, Recall y Accuracy)

Implementar las métricas en NumPy

In [None]:
# TODO

### Implementar función fit

Utilizas los bloques anteriores, junto con la implementación en NumPy del algoritmo Mini-Batch gradient descent, para crear la función fit de nuestro modelo de regresión logística. Cada un determinado número de epochs calculen el loss, almacénenlo en una lista y hagan un log de los valores. La función debe devolver los parámetros ajustados.

In [16]:
def initialize(dim):
    w = np.zeros((dim,1))
    b = 0  
    return w, b

In [13]:
def momentum_update(W,b, dw, db, states, lr):
  # hyper-param typical values: learning_rate=0.01, momentum=0.9
    W_ant = W
    b_ant = b
    W = W + hyper_params['momentum'] * states[0] - lr * dw
    b = b + hyper_params['momentum'] * states[1] - lr * db
    states = [W-W_ant, b-b_ant]
    return W,b, states

In [36]:
# TODO
def fit(X_train, y_train, lr, batch, epochs, momentum_rate):

    w, b = initialize(X_train.shape[1])
    
    n = X_train.shape[0]
    m = X_train.shape[1]
    states = np.zeros((m,1))
    
    #Estandarizo los datos
    X_train_stand = (X_train - np.mean(X_train))/np.std(X_train)
    
    for i in range(epochs):
        idx = np.random.permutation(X_train.shape[0])
        X_train = X_train[idx]
        y_train = y_train[idx]

        batch_size = int(len(X_train) / batch)
        for i in range(0, len(X_train), batch_size):
            end = i + batch_size if i + batch_size <= len(X_train) else len(X_train)
            batch_X = X_train[i: end]
            batch_y = y_train[i: end]
            
            z = np.dot(X_train,w) + b
            A = sigmoid(z)
            print(w.shape)
            cost = cost_entropy(y_train, A, n)

            dz = A-y_train
            dw = (1/n)*np.dot(X_train,dz.T)
            db = (1/m)*np.sum(dz)

            if momentum_rate > 0:
                w, b, states = momentum_update(W,b, dw, db, states, 0.9)
            else:
                w = w-lr*dw
                b = b-lr*db
    return w, b

In [37]:
fit(X_train_nonull, y_train_nonull, 0.01, 16, 100, 0.9)

(29, 1)


MemoryError: Unable to allocate 7.08 GiB for an array with shape (30837, 30837) and data type float64

### Implementar función predict

Implementar la función predict usando los parámetros calculados y la función sigmoid. Prestar atención a las transformaciones de los datos de entrada. Asimismo, se debe tomar una decisión respecto de los valores de salida como: $p\geq 0.5 \to 1, p<0.5 \to 0$

In [None]:
# TODO
def predict(self, X):
    return NotImplemented

## Armar una clase LogisticRegression

Armar una clase LogisticRegression que herede de BaseModel y tenga la siguiente estructura:

In [None]:
class LogisticRegression(BaseModel):
    
    def sigmoid(self, x):
        return NotImplemented

    def fit(self, X, y, lr, b, epochs, bias=True):
        #self.model = W
        return NotImplemented
        
    def predict(self, X):
        return NotImplemented

## Testear con Datasets sintéticos

La librería Scikit-Learn tiene una función make_classification que nos permite armar datasets de prueba para problemas de clasificación. Prueben con datasets que tengan varios clusters por clase, que tengan menor o mayor separación y calculen las métricas en cada caso.

In [None]:
from sklearn.datasets import make_classification
# X, y = make_classification(n_features=2, n_redundant=0, n_informative=2, random_state=1, n_clusters_per_class=1)