# Logistic Regression - NumPy

El objetivo de éste ejercicio es que implementen paso a paso los building blocks del modelo de regresión logística, para finalmente crear una clase del modelo.

## Cargamos las Librerías

In [None]:
import numpy as np
import time
import matplotlib.pyplot as plt

## Implementación de Building Blocks del Modelo

A continuación, se deberán implementar paso a paso los distintos bloques de código que conforman el modelo, junto con algunas funciones auxiliares.

### Función Sigmoid

Implementar la función: $g(z) = \frac{1}{1 + e^{-z}}$ en NumPy

In [None]:
# TODO
def sigmoid(x):
  return 1/(1 + np.exp(-x))

### Binary Cross Entropy

Implementar la función de costo: $J(w) = \frac{1}{n}\sum_{i=1}^{n}L\left ( \hat{y},y \right )= \frac{1}{n}\sum_{i=1}^{n}\left [y^{(i)}log(\hat{y}^{(i)})+ (1-y^{(i)})log(1-\hat{y}^{(i)}) \right ]$

In [None]:
# TODO
def loss(y_true, y_pred):
  return np.mean(y_true*np.log(y_pred)+(1-y_true)*np.log(1-y_pred))

### Gradiente

Implementar el gradiente de la función costo respecto de los parámetros: $\frac{\partial J(w)}{\partial w} = \frac{1}{n}\sum_{i=1}^{n}\left ( \hat{y}^{i}-y^{i}\right )\bar{x}^i$

In [None]:
# TODO
def grad_loss(y_true, y_pred, x):
  return np.mean((y_pred-y_true)*x)

### Normalización

Implementar normalización Z-score de las features de entrada

In [None]:
# TODO
def z_score(x):
  return (x-np.mean(x))/np.var(x)

### Métricas (Precision, Recall y Accuracy)

Implementar las métricas en NumPy

In [None]:
# TODO
def metricas(y_pred, y_true):
  Tr = np.array(x)
  Pr = np.array(y)
  TP = np.size(np.where(Pr+Tr==0)) #sum(Tr & Pr)
  TN = np.size(np.where(Pr+Tr==2))
  FN = np.size(np.intersect1d(np.where(Pr+Tr==1),np.where(Tr)))
  FP = np.size(np.intersect1d(np.where(Pr+Tr==1),np.where(Pr)))
    
  P = TP/(TP+FP) #Precision
  R = TP/(TP+FN) #Recall
  A = (TP+TN)/(TP+TN+FN+FP) #Accuracy
    
  return P, R, A

### Implementar función fit

Utilizas los bloques anteriores, junto con la implementación en NumPy del algoritmo Mini-Batch gradient descent, para crear la función fit de nuestro modelo de regresión logística. Cada un determinado número de epochs calculen el loss, almacénenlo en una lista y hagan un log de los valores. La función debe devolver los parámetros ajustados.

In [None]:
# TODO
def fit(self, X, y, lr, b, epochs, bias=True):
    # si decidimos utilizar bias, agregamos como siempre una columna con '1' al dataset de entrada
    if bias:
        X = np.hstack((np.ones((X.shape[0], 1)), X))

    # inicializamos aleatoriamente los pesos
    w = np.random.rand(len(X))
    
    loss_list = []

    # corremos Mini-Batch para optimizar los parámetros
    for j in range(epochs):
        idx = np.random.permutation(X.shape[0])
        X_train = X[idx]
        y_train = y[idx]
        batch_size = int(len(X_train)/b)

        for i in range(0, len(X_train), batch_size):
            # Seleccionar los elementos del batch actual
            end = i + batch_size if i + batch_size <= len(X_train) else len(X_train)
            batch_X = X_train[i: end]
            batch_y = y_train[i: end]

            # cálculo de predicciones
            z = np.dot(batch_X, W) 
            prediction = self.sigomid(z) #Llamada a la funcion sigmoidea
            # cálculo del error
            error = prediction.reshape(-1, 1) - batch_y.reshape(-1, 1)
            # cálculo del grandiente
            grad_sum = np.sum(error*batch_X, axis=0)
            grad_mul = 1/batch_size*grad_sum
            gradient = np.transpose(grad_mul).reshape(-1, 1)
            #actualizar pesos
            W = W  - lr*gradient

        z = np.dot(X_train, W)
        l_epoch = self.loss(y_train, self.sigmoid(z))
        loss_list.append(l_epoch)
    
    self.model = W
    self.losses = loss_list
    return loss_list, W

### Implementar función predict

Implementar la función predict usando los parámetros calculados y la función sigmoid. Prestar atención a las transformaciones de los datos de entrada. Asimismo, se debe tomar una decisión respecto de los valores de salida como: $p\geq 0.5 \to 1, p<0.5 \to 0$

In [None]:
# TODO
def predict(self, X):
    X = np.hstack((np.ones((X.shape[0], 1)), X))
    z = np.dot(X, self.model)
    p = self.sigmoid(z)
    mask_true = p >= 0.5
    mask_false = p < 0.5
    p[mask_true] = 1
    p[mask_false] = 0
    return p

## Armar una clase LogisticRegression

Clase BaseModel

In [None]:
class BaseModel(object):

    def __init__(self):
        self.model = None

    def fit(self, X, Y):
        return NotImplemented

    def predict(self, X):
        return NotImplemented

Armar una clase LogisticRegression que herede de BaseModel y tenga la siguiente estructura:

In [None]:
class LogisticRegression(BaseModel):
    
    def sigmoid(self, x):
        return 1/(1 + np.exp(-x))

    def loss(self, y_true, y_pred):
        return np.mean(y_true*np.log(y_pred)+(1-y_true)*np.log(1-y_pred))

    def fit(self, X, y, lr, b, epochs, bias=True):
        # si decidimos utilizar bias, agregamos como siempre una columna con '1' al dataset de entrada
        if bias:
            X = np.hstack((np.ones((X.shape[0], 1)), X))

        # inicializamos aleatoriamente los pesos
        w = np.random.rand(len(X))
        
        loss_list = []

        # corremos Mini-Batch para optimizar los parámetros
        for j in range(epochs):
            idx = np.random.permutation(X.shape[0])
            X_train = X[idx]
            y_train = y[idx]
            batch_size = int(len(X_train)/b)

            for i in range(0, len(X_train), batch_size):
                # Seleccionar los elementos del batch actual
                end = i + batch_size if i + batch_size <= len(X_train) else len(X_train)
                batch_X = X_train[i: end]
                batch_y = y_train[i: end]

                # cálculo de predicciones
                z = np.dot(batch_X, W) 
                prediction = self.sigomid(z) #Llamada a la funcion sigmoidea
                # cálculo del error
                error = prediction.reshape(-1, 1) - batch_y.reshape(-1, 1)
                # cálculo del grandiente
                grad_sum = np.sum(error*batch_X, axis=0)
                grad_mul = 1/batch_size*grad_sum
                gradient = np.transpose(grad_mul).reshape(-1, 1)
                #actualizar pesos
                W = W  - lr*gradient

            z = np.dot(X_train, W)
            l_epoch = self.loss(y_train, self.sigmoid(z))
            loss_list.append(l_epoch)
        
        self.model = W
        self.losses = loss_list
        # return loss_list, W
        
    def predict(self, X):
        X = np.hstack((np.ones((X.shape[0], 1)), X))
        z = np.dot(X, self.model)
        p = self.sigmoid(z)
        mask_true = p >= 0.5
        mask_false = p < 0.5
        p[mask_true] = 1
        p[mask_false] = 0
        return p

## Testear con Datasets sintéticos

La librería Scikit-Learn tiene una función make_classification que nos permite armar datasets de prueba para problemas de clasificación. Prueben con datasets que tengan varios clusters por clase, que tengan menor o mayor separación y calculen las métricas en cada caso.

In [None]:
from sklearn.datasets import make_classification
X, y = make_classification(n_features=2, n_redundant=0, n_informative=3, random_state=1, n_clusters_per_class=3)

ValueError: ignored

In [None]:
print(X.shape)

(100, 4)
