# Regresión Logística
Se muestran dos ejemplos de regresión logística: clasificación binaria y clasificación multi-clase.

### (1) Regresión Logística Binaria
Se utiliza el conjunto de datos "Titanic" provisto originalmente en una competencia Kaggle:
https://www.kaggle.com/c/titanic/

#### Importación de librerías

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

#### Datos

In [None]:
datos = pd.read_csv("titanic_train.csv")
datos.head(8)

#### Limpieza del conjunto de datos
* Los valores NaN de la edad se reemplazan por la media de la edad
* Se elimina la columna de la cabina
* Se eliminan los registros con valores faltantes

In [None]:
datos['Age'] = datos['Age'].fillna(int(datos['Age'].mean()))
datos.drop("Cabin",inplace=True,axis=1)
datos.dropna(inplace=True)

datos.head(8)

Se cambian los valores categóricos a valores numéricos (binarización)

In [None]:
sex = pd.get_dummies(datos["Sex"],drop_first=True)
embarked = pd.get_dummies(datos["Embarked"],drop_first=True)
pclass = pd.get_dummies(datos["Pclass"],drop_first=True)

datos = pd.concat([datos,pclass,sex,embarked],axis=1)

datos.head(8)

Se eliminan las columnas que no se utilizarán en el modelo

In [None]:
datos.drop(["PassengerId","Pclass","Name","Sex","Ticket","Embarked"],axis=1,inplace=True)

datos.head(8)

#### Creación del modelo

In [None]:
x = datos.drop("Survived",axis=1)
y = datos["Survived"]

In [None]:
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3, random_state = 0)

In [None]:
# Crear modelo de regresión logística

#### Evaluación del modelo
Como referencia, se puede utilizar el recurso siguiente:
https://towardsdatascience.com/multi-class-metrics-made-simple-part-i-precision-and-recall-9250280bddc2

In [None]:
# Estimar la clase

In [None]:
# Estimar la probabilidad de clase

In [None]:
# Mostrar las estadísticas del desempeño

In [None]:
# Mostrar la matriz de confusión

In [None]:
import seaborn as sns

score = modelo.score(x_test,y_test)

sns.heatmap(cm, annot=True, fmt=".1f", linewidths=2, square = True, cmap = 'Blues_r');
plt.ylabel('Actual label');
plt.xlabel('Predicted label');
all_sample_title = 'Accuracy Score: {0}'.format(score)
plt.title(all_sample_title, size = 15);

### (2) Regresión Logística Multi-clase
Se utiliza el conjunto de datos de dígitos escritos a mano MNIST

#### Datos

In [None]:
from sklearn.datasets import load_digits
digitos = load_digits()

In [None]:
import numpy as np 
import matplotlib.pyplot as plt

plt.figure(figsize=(20,4))

for i, (imagen, etiqueta) in enumerate(zip(digitos.data[0:5], digitos.target[0:5])):
    plt.subplot(1, 5, i + 1)
    plt.imshow(np.reshape(imagen, (8,8)), cmap = plt.cm.gray)
    plt.title('Training: %i\n' % etiqueta, fontsize = 20)

#### Creación del modelo

In [None]:
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(digitos.data, digitos.target, test_size=0.25, random_state=0)

In [None]:
# Crear modelo de regresión logística

#### Evaluación del modelo
Como referencia, se puede utilizar el recurso siguiente:
https://towardsdatascience.com/multi-class-metrics-made-simple-part-i-precision-and-recall-9250280bddc2

In [None]:
# Estimar la clase

In [None]:
# Estimar la probabilidad de clase

In [None]:
from sklearn.metrics import classification_report

print(classification_report(y_test,y_pred))

In [None]:
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test,y_pred)

print(cm)

In [None]:
import seaborn as sns

score = modelo.score(x_test,y_test)

sns.heatmap(cm, annot=True, fmt=".1f", linewidths=2, square = True, cmap = 'Blues_r');
plt.ylabel('Actual label');
plt.xlabel('Predicted label');
all_sample_title = 'Accuracy Score: {0}'.format(score)
plt.title(all_sample_title, size = 15);

In [None]:
# Índice en el subconjunto de datos de prueba x_test
indice = 9

plt.imshow(np.reshape(x_test[indice], (8,8)), cmap = plt.cm.gray)
plt.title('Etiqueta: %i\nPrediccion: %i\n' % (y_test[indice],y_pred[indice]), fontsize = 20)