# Regularización

En la clase pasada observamos como aumentando el grado del polinomio, obtenemos modelos mas flexibles que logran ajustar mejor los datos de entrenamiento. Sin embargo, esta mejora generaba fronteras de decisión más complejas que generalizaban peor, y la performance del conjunto de test empeoraba. Este fenómeno es lo que se conoce como **sobreajuste**: Es el punto en el que nuestro modelo comienza a ajustar no solo el _patrón_ de los datos de entrenamiento, sino también el _ruido_ aleatorio que hay en ellos, y deteriora el poder predictivo.

La forma de combatir este problema es disminuir la flexiblidad del modelo, lo que se conoce como **regularización**. Esto se hace eligiendo apropiadamente los hiperparámetros que determinan la flexibilidad (en nuestro caso, el grado del polinomio). 

Una forma sistemática de elegir los hiperparámetros es monitorear la performance del modelo sobre un conjunto de datos que no ha visto anteriormente, al que llamaremos _validación_, y elegir los hiperparámetros (en este caso, el grado del polinomio) que resultan en el modelo que mejor generaliza a este conjunto. 

Así como los parámetros del modelo se ajustan para mejorar la performance en el conjunto de entrenamiento, los hiperparámetros lo hacen para mejorar la performance en el conjunto de validación. Por este motivo, es de esperar que la performance sobre estos conjuntos este sobre-estimada, y para tener una medida objetiva sobre nuestro modelo final reservamos un conjunto de _evaluación_ (o _test_) que no será utilizado para tomar ninguna decisión. 

En este notebook visitaremos el problema de la clase anterior, y separaremos el dataset en tres partes:
- Entrenamiento
- Validación
- Evaluación

De esta forma encontraremos sistemáticamente el grado óptimo para nuestro modelo de regresión logística polinomial. Luego, introduciremos las técnicas más genéricas de regularización L1, L2 y ElasticNet, y aplicaremos el mismo método para encontrar el modelo óptimo.



## Utils
Misma función utilitaria que la clase anterior.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import sklearn

def plot_regions(classifier, x, t):
    """Plot results from classification."""
    plt.figure(figsize=(9, 7))

    xx, yy = np.meshgrid(np.linspace(x[:, 0].min()-1, x[:, 0].max()+1, 200),
                         np.linspace(x[:, 1].min()-1, x[:, 1].max()+1, 200))

    # evaluate decision function
    Z = classifier.decision_function(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    # colour regions
    plt.pcolormesh(xx, yy, Z<0, cmap=plt.cm.bwr, shading='auto', alpha=0.4)
    # decision boundary
    plt.contour(xx, yy, 1/(1 + np.exp(-Z)), [0.05, 0.5, 0.95], colors=['0.5', 'k', '0.5'], zorder=1)

    xc1 = x[t == np.unique(t.flatten()).max()]
    xc2 = x[t == np.unique(t.flatten()).min()]

    plt.plot(*xc1.T, 'ob', mfc='None', label='C1')
    plt.plot(*xc2.T, 'or', mfc='None', label='C2')

    # Remove ticks
    plt.xticks(())
    plt.yticks(())
    plt.axis('tight')

    return


## Dataset
Corra la siguiente línea para generar un dataset como el de la clase anterior. Esta vez, generaremos 60 puntos extra que serán destinados a evaluación.

In [None]:
import numpy as np
from sklearn.datasets import make_moons
X, y = make_moons(360, noise=0.25, random_state=42)

## Ejercicio 1
- Separe el dataset, utilizando el método `train_test_split` de scikit-learn, en:
    - Entrenamiento (240)
    - Validación (60)
    - Evaluación (60)
- Grafique en un plano los tres conjuntos.

In [None]:
# Tu turno...


## Ejercicio 2

- Defina una función que dado el grado del polinomio, devuelve un `Pipeline` consistente de un pre-procesado polinómico y un regresor logístico (usando `penalty='none'`). Opcionalmente puede introducir un `StandardScaler` como paso intermedio
- Itere sobre los grados polinóomicos de 1 a 10, fiteando un regresor polinómico sobre el conjunto de entrenamiento. Guarde en arrays su exactitud sobre los conjuntos de entrenamiento y validación.
- Plotee los arrays de exactitud sobre los conjuntos de entrenamiento y validación en función del grado polinómico.
- Encuentre el grado polinómico que maximiza la exactitud de validación.
- Entrene un regresor polinómico del grado óptimo encontrado sobre el dataset extendido de entrenamiento+validación. Este es su modelo final.
- Mida la exactitud del modelo final sobre el conjunto de evaluación.
- Opcional: Grafique la frontera de decisión.

In [None]:
# Tu turno...


## Regularización

## Ejercicio 3
- Elija un tipo de regularización (L1 o L2)
- Modifique la función del ejercicio anterior para que acepte como parametros el argumento `C` e inicialice el regresor logístico con ese parámetro y el `penalty` correspondiente a la regularización escogida.
- Entrene y compare las fronteras de decisión de los siguientes regresores logísticos polinómicos (del grado óptimo obtenido en el ejericio 2):
    - sin regularizar (`penalty='none'` o bien `C=1e16`)
    - medianamente regularizado (`C~1`)
    - altamente regularizado (`C ≤ 0.001`)


In [None]:
# Tu turno...


## Ejercicio 4

- Defina una grilla de hiperparámetros (para `C` y `degree`).
- Entrene (sobre el conjunto de entrenamiento) regresores logísticos polinómicos para cada combinación de hiperparámetros de la grilla, registrando sus exactitudes sobre el conjunto de validación.
- Encuentre la combinación de hiperparámetros óptima para este modelo y dataset
- Entrene el modelo óptimo sobre el conjunto extendido de entrenamiento + validación.
- Mida la exactitud de este modelo final sobre el conjunto de evaluación. Compare con la obtenida en el Ejercicio 2.
- Opcional: Grafique la frontera de decisión.

_Pista:_ 
- _Para hacerlo simple, considere dos bucles anidados._

In [None]:
# Tu turno...


## Ejercicio 5: Regresión

En la [guía 2](https://github.com/LCD-UNSAM/iaa2023c1/blob/main/guias/IAA_Guia_2_RegresionLineal_Ejercitacion.ipynb) se le pidió que realice un ajuste lineal para un caso de regresión. Repita el ejercicio, pero ahora en vez de utilizar la clase `sklearn.linear_model.LinearRegression`, utilice alguna(s) de las siguientes:
- `sklearn.linear_model.Ridge`: Regresión lineal que implementa la regularización L2
- `sklearn.linear_model.Lasso`: Regresión lineal que implementa la regularización L1
- `sklearn.linear_model.ElasticNet`: Regresión lineal que implementa la regularización ElasticNet (una combinación lineal de L1 y L2)

In [None]:
# Tu turno...


### Formulario de asistencia
Por favor, no olviden completar el siguiente formulario antes del miércoles 26/04 a la 23:59.

https://forms.gle/EswyadMHbhj6SVj88