## Regresión Logística

regresión lineal:
$$ y = \beta_0 + \beta_1 x $$

regresión logística:
$$ log\left(\frac{y}{1-y}\right) = \beta_0 + \beta_1 x $$

¿Cuál es la función que se usa para estimar la probabilidad de y?

In [None]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

In [None]:
def logit(x, b0, b1):
    return 1/(1 + np.exp(-(b0 + b1 * x)))

In [None]:
x = np.linspace(-2, 2, 100)

plt.plot(x, logit(10,0.01,x), 'r', label='b0: ' + str(10) + ' , b1: ' + str(0.01))
plt.plot(x, logit(3,0.01,x), 'b', label='b0: ' + str(3) + ' , b1: ' + str(0.01))
plt.plot(x, logit(10,5,x), 'k', label='b0: ' + str(10) + ' , b1: ' + str(5))
plt.plot(x, logit(-10,0.01,x), 'g', label='b0: ' + str(-3) + ' , b1: ' + str(0.01))
plt.legend()
plt.show()

## No lineal

In [None]:
np.random.seed(10)
datos = pd.DataFrame({
    'x1': np.random.normal(0, 5, size=200),
    'x2': np.random.normal(size=200)
}).assign(clase=lambda x: (x.x1 - x.x2 * 3 + x.x1).apply(lambda y: 1*(y + np.random.normal(0,1.2)**3 < 0)))

plt.plot(datos[datos.clase == 0].x1, datos[datos.clase == 0].x2, 'rx')
plt.plot(datos[datos.clase == 1].x1, datos[datos.clase == 1].x2, 'bo')
plt.show()

In [None]:
datos.clase.mean()

In [None]:
from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()
lr_fit = lr.fit(datos.drop('clase', axis=1), datos.clase)

In [None]:
xx, yy = np.meshgrid(np.linspace(datos.x1.min(), datos.x1.max(), 50),
                     np.linspace(datos.x2.min(), datos.x2.max(), 50))
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())

#plot background colors
ax = plt.gca()
Z = lr_fit.predict_proba(np.c_[xx.ravel(), yy.ravel()])[:, 1]
Z = Z.reshape(xx.shape)
cs = ax.contourf(xx, yy, Z, cmap='RdBu', alpha=.5)
cs2 = ax.contour(xx, yy, Z, cmap='RdBu', alpha=.5)
plt.clabel(cs2, fmt = '%2.1f', colors = 'k', fontsize=14)

# Plot the points
plt.plot(datos[datos.clase == 0].x1, datos[datos.clase == 0].x2, 'rx')
plt.plot(datos[datos.clase == 1].x1, datos[datos.clase == 1].x2, 'bo')

plt.show()

### Cuadrado

In [None]:
datos['x1x1'] = datos.x1 * datos.x1
datos['x2x2'] = datos.x2 * datos.x2
datos['x1x2'] = datos.x1 * datos.x2
datos.head()

In [None]:
lr = LogisticRegression()
lr_fit = lr.fit(datos.drop('clase', axis=1), datos.clase)

xx, yy = np.meshgrid(np.linspace(datos.x1.min(), datos.x1.max(), 50),
                     np.linspace(datos.x2.min(), datos.x2.max(), 50))
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())

#plot background colors
ax = plt.gca()
Z = lr_fit.predict_proba(np.c_[xx.ravel(), yy.ravel(), 
                              xx.ravel() * xx.ravel(),
                              yy.ravel() * yy.ravel(),
                              xx.ravel() * yy.ravel()])[:, 1]
Z = Z.reshape(xx.shape)
cs = ax.contourf(xx, yy, Z, cmap='RdBu', alpha=.5)
cs2 = ax.contour(xx, yy, Z, cmap='RdBu', alpha=.5)
plt.clabel(cs2, fmt = '%2.1f', colors = 'k', fontsize=14)

# Plot the points
plt.plot(datos[datos.clase == 0].x1, datos[datos.clase == 0].x2, 'rx')
plt.plot(datos[datos.clase == 1].x1, datos[datos.clase == 1].x2, 'bo')

plt.show()

### Cúbicos

In [None]:
datos['x1x1x1'] = datos.x1 * datos.x1 * datos.x1
datos['x2x2x2'] = datos.x2 * datos.x2 * datos.x2
datos.head()

In [None]:
lr = LogisticRegression()
lr_fit = lr.fit(datos.drop('clase', axis=1), datos.clase)

xx, yy = np.meshgrid(np.linspace(datos.x1.min(), datos.x1.max(), 50),
                     np.linspace(datos.x2.min(), datos.x2.max(), 50))
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())

#plot background colors
ax = plt.gca()
Z = lr_fit.predict_proba(np.c_[xx.ravel(), yy.ravel(), 
                               xx.ravel() * xx.ravel(),
                              yy.ravel() * yy.ravel(),
                               xx.ravel() * yy.ravel(),
                              xx.ravel() * xx.ravel() * xx.ravel(),
                              yy.ravel() * yy.ravel() * yy.ravel()])[:, 1]
Z = Z.reshape(xx.shape)
cs = ax.contourf(xx, yy, Z, cmap='RdBu', alpha=.5)
cs2 = ax.contour(xx, yy, Z, cmap='RdBu', alpha=.5)
plt.clabel(cs2, fmt = '%2.1f', colors = 'k', fontsize=14)

# Plot the points
plt.plot(datos[datos.clase == 0].x1, datos[datos.clase == 0].x2, 'rx')
plt.plot(datos[datos.clase == 1].x1, datos[datos.clase == 1].x2, 'bo')

plt.show()

### Entrenamiento - Prueba

In [None]:
datos.head()

In [None]:
indices_ent = np.random.rand(datos.shape[0]) < 0.6
indices_pru = ~indices_ent

In [None]:
X_ent = datos.drop('clase', axis=1)[indices_ent]
y_ent = datos.clase[indices_ent]

X_pru = datos.drop('clase', axis=1)[indices_pru]
y_pru = datos.clase[indices_pru]

In [None]:
print(X_ent.shape)
print(X_pru.shape)

In [None]:
xx, yy = np.meshgrid(np.linspace(datos.x1.min(), datos.x1.max(), 50),
                     np.linspace(datos.x2.min(), datos.x2.max(), 50))

X_graf = np.c_[xx.ravel(), 
               yy.ravel(), 
               xx.ravel() * xx.ravel(),
               yy.ravel() * yy.ravel(),
               xx.ravel() * yy.ravel(),
               xx.ravel() * xx.ravel() * xx.ravel(),
               yy.ravel() * yy.ravel() * yy.ravel()]

In [None]:
from sklearn.metrics import f1_score

In [None]:
f1_ent = []
f1_pru = []
for num_vars in range(2, datos.shape[1]):
    mod = lr.fit(X_ent.iloc[:,0:num_vars], y_ent)
    f1_ent.append(f1_score(y_ent, mod.predict(X_ent.iloc[:,0:num_vars])))
    f1_pru.append(f1_score(y_pru, mod.predict(X_pru.iloc[:,0:num_vars])))

plt.plot(f1_ent, 'r', label='Entrenamiento')
plt.plot(f1_pru, 'b', label='Prueba')
plt.legend()
plt.show()