# 3. Regresión Logística
Entrenaremos usando scikit-learn una regresión logística para clasificar dígitos manuscritos.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
import numpy as np
np.set_printoptions(suppress=True)  # no usar notacion "e"

## Conjunto de Datos

Usaremos el ["digits dataset"](https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html) que viene con scikit-learn.


In [None]:
from sklearn import datasets

# Cargamos el dataset entero:
digits = datasets.load_digits()

#Display the first digit
plt.figure(1, figsize=(3, 3))
plt.imshow(digits.images[1], cmap=plt.cm.gray_r, interpolation='nearest')
plt.show()

In [None]:
digits.target[1]

In [None]:
digits.images[1]

In [None]:
# Cargamos sólo vectores X e y:
X, y = datasets.load_digits(return_X_y=True)

In [None]:
X.shape

In [None]:
# Cuántas imágenes hay para cada dígito?
from collections import Counter

Counter(y)

## División en Entrenamiento y Evaluación

Dividiremos aleatoriamente los datos en una parte para entrenamiento (80%) y otra para evaluación (20%).

Usaremos 
[train_test_split](https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html) de scikit-learn:

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_val, y_train, y_val = train_test_split(X, y, train_size=0.8, random_state=0)

In [None]:
X_train.shape, X_val.shape

## Instanciar y Entrenar

In [None]:
from sklearn.linear_model import LogisticRegression

model = LogisticRegression()
model.fit(X_train, y_train)  # entrenamiento

## Inspeccionar Parámetros

In [None]:
model.classes_

In [None]:
# coef_[i, j] es el score que aporte el feature j a la clase i
model.coef_

In [None]:
model.coef_[:,0]  # pixel esquina superior izquierda

In [None]:
model.coef_[:,3]  # un pixel arriba al medio

In [None]:
model.coef_[:,3 + 4 * 8]  # un pixel del medio

In [None]:
model.intercept_  # bias

## Evaluar

In [None]:
from sklearn.metrics import accuracy_score

y_pred = model.predict(X_val)
accuracy_score(y_val, y_pred)

## Predecir

Definimos un nuevo dato de entrada para ver como se comporta el clasificador

In [None]:
x = np.array([[ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.],
              [ 0.,  0.,  0.,  16., 16.,  0.,  0.,  0.]])

In [None]:
plt.imshow(x,cmap=plt.cm.gray_r)

In [None]:
x = x.ravel()  # aplanar la matriz en un vector

Haciendo uso del modelo entrenado veamos como lo clasifica:

In [None]:
# Clase más probable:
model.predict([x])

También podemos ver que probabilidad le asigno a cada clase:

In [None]:
# Probabilidad de cada clase (resultado del softmax):
model.predict_proba([x])

In [None]:
model.predict_proba([x]).sum()

In [None]:
# "Score" para cada clase (antes del softmax):
model.decision_function([x])

In [None]:
# El mismo score a mano:
model.coef_.dot(x) + model.intercept_

Podemos ver las salidas de las distintas funciones softmax para el dato de entrada x

In [None]:
clases = model.classes_
fig, ax = plt.subplots()

scatter = ax.scatter(model.decision_function([x]), model.predict_proba([x]), c=clases, cmap="tab10")
#plt.yscale("log")

# produce a legend with the unique colors from the scatter
legend1 = ax.legend(*scatter.legend_elements(num=10), title="Clases")
ax.add_artist(legend1)
plt.xlabel("w*x + bias")
plt.ylabel("Probabilidad - Salida SoftMax")
ax.grid(True)
plt.show()

## Ejercicios

1. Calcular el softmax a mano para un ejemplo y verificar que da igual que predict_proba.
2. Buscar en el conjunto de test una imagen mal clasificada. Graficarla. ¿Qué tan lejos estuvo de ser correctamente clasificada?
3. Con la imagen anterior, ¿qué píxeles influyeron más en la clasificación incorrecta? Intentar modificar los valores para que la clasifiación sea correcta.
4. Buscar en el conjunto de test la imagen **peor** clasificada. Graficarla. ¿Qué tan difícil es para un humano identificar el dígito?