# __Regresiones Robustas__

Son tecnicas de regresion que resisten mejor los efectos de valores atipicos en los datos. A diferencia de la regresion lineal estandar, que minimiza el error cuadratico medio (MSE) y puede verse afectada por outliers, las regresiones robustas utilizan funciones de perdida menos sensibles a los outliers.

Por lo general siempre se cuenta con una fase de preprocesamiento en la cual se eliminan o transforman datos y se tratan los outliers. Sin embargo, hay ocasiones donde se requiere tratar estos valores directamente durante la aplicacion del modelo y es alli donde toman relevancia los modelos robustos que facilitan este proceso. 

Debemos entender que los valores atipicos son observaciones que no siguen el patron de las demas observaciones y violan los supuestos en los que se basa MSE lo que compromete el resultado de la regresion lineal.

Las tecnicas de regresion robusta que nos ofrece Scikit - Learn son:

- Huger Regressor.
- RANSAC Regressor.
- TheilSenRegressor.

En lo que sigue veamos como funciona y como se implementa cada una de ellas

# __Huger Regressor__

La regresion Huber modifica la funcion de perdida de la regresion lineal para reducir el impacto de los valores atipicos. Combina las fortalezas del Error Cuadratico Medio (MSE) y del Error Absoluto Medio (MAE), cambiando de MSE a MAE cuando los errores superan un umbral especifico representado por $\delta$

La funcion de perdida de Huber viene representada por:

$$L_{\delta}(r) = \left\{\begin{matrix}
\frac{1}{2}r^2 & si \left | r\right | \leq \delta\\
\delta(\left | r\right | - \frac{1}{2}\delta) &  si \left | r\right | > \delta\\
\end{matrix}\right.$$

Donde,

- $r = y_i - \hat{y_{i}}$, es el error entre la prediccion y el valor real (MSE).

- $\delta$ es un parametro que define cuando el error deja de ser cuadratico (MSE) y pasa a ser lineal (MAE).

Si el error es pequeno ($\left | r\right | \leq \delta$) tratamos el outlier como un dato confiable y lo penalizamos con MSE. En cambio, si el error es grande ($\left | r\right | > \delta$) tratamos el outlier con mayor severidad penalizandolo con MAE

## Como funciona?

Vamos a ajustar un modelo a un conjunto de datos que contiene outliers usando la regresion Huber. Los datos vienen representados en la siguiente tabla:

| $x_i$ | $y_i$               |
| ----- | ------------------- |
| 1     | 2                   |
| 2     | 4                   |
| 3     | 100       ← outlier |

Probemos un modelo cuyos parametros los definimos como $w = 1.5$ y $b=0.5$. La ecuacion del modelo nos queda:

$$\hat{y} = 1.5x + 0.5$$

Procedemos a calcular las predicciones $\hat{y_i}$ que arroja el modelo para cada dato.

- Para $x=1$:   $\hat{y_1} = 1.5(1) + 0.5 = 1.5 + 0.5 \Rightarrow \hat{y_1} = 2$

- Para $x=2$:   $\hat{y_2} = 1.5(2) + 0.5 = 3.0 + 0.5 \Rightarrow \hat{y_1} = 3.5$

- Para $x=3$:   $\hat{y_3} = 1.5(3) + 0.5 = 4.5 + 0.5 \Rightarrow \hat{y_1} = 5$

Ahora calculamos error entre las predicciones del modelo y el valor real.

- $r_1 = y_1 - \hat{y_1} = 2 - 2 = 0$

- $r_2 = y_2 - \hat{y_2} = 4 - 3.5 = 0.5$

- $r_3 = y_1 - \hat{y_1} = 100 - 5 = 95$

Sabemos que la funcion de perdida de Huber viene dada por:

$$L_{\delta}(r) = \left\{\begin{matrix}
\frac{1}{2}r^2 & si \left | r\right | \leq \delta\\
\delta(\left | r\right | - \frac{1}{2}\delta) &  si \left | r\right | > \delta\\
\end{matrix}\right.$$

Calculamos la funcion de costo de Huber para cada dato, seleccionando el valor del delta como $\delta = 1$. 

__Para__ $r_1 = 0$, vemos que $\left | r\right | \leq \delta$ por tanto, utilizamos la ecuacion que cumple esta condicion:

$$L(r_1) = \frac{1}{2}(0)^2 = 0$$

__Para__ $r_2 = 0.5$, vemos que $\left | r\right | \leq \delta$ por tanto, utilizamos la misma ecuacion anterior:

$$L(r_2) = \frac{1}{2}(0.5)^2 = 0.125$$

__Para__ $r_3 = 95$, vemos que $\left | r\right | > \delta$ por tanto, utilizamos la ecuacion que cumple la condicion:

$$L(r_3) = 1(95 - 0.5) = 94.5$$

El costo total de Huber viene dado por el promedio de la perdida de Huber para cada dato:

$$L_{\delta} = \frac{1}{3}(L_1 + L_2 + L_3) = \frac{1}{3}(0 + 0.125 + 94.5) = 31.54$$