# Métricas de Regresión

En el presente notebook, se analizarán distintas métricas que nor sirven para medir el nivel de rendimiento y funcionamiento de modelos de regresión. Recordemos que los algoritmos de regresión (como la regresión lineal) son aquellos que, básicamente, en función de una serie de valores o variables independientes (pueden ser una o más), nos permiten predecir un valor o variable objetivo, también conocida como variable dependiente.

La diferencia entre en valor predicho por nuestro modelo y el valor real es lo que se conoce como **error o residuo**.

![Metricas para regresion](./img/metrica_regresion1.png)

## Error Absoluto Máximo (M)

El **Error Absoluto Máximo (MAE)** es una métrica que mide la diferencia entre las predicciones de un modelo y los valores reales, pero de forma que considera el valor más grande entre todas las diferencias absolutas.

La fórmula para el **Error Absoluto Máximo (Maximal Absolute Error)** es:

$E_{\text{max}} = \max \left( |y_i - \hat{y}_i| \right)$

donde:

- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $\max$ representa el valor máximo entre todas las diferencias absolutas $ |y_i - \hat{y}_i| $.


El **Error Absoluto Máximo (E_max)** nos da el valor de la mayor discrepancia entre las predicciones del modelo y los valores reales. Este valor es útil para identificar la peor predicción en un conjunto de datos.


In [1]:
from sklearn.metrics import max_error

In [2]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
max_error(y_verdadero, y_predicho)

10

En este caso, claramente vemos que la diferencia mayor radica en el -5 predicho con respecto al 5 real: $|5 - (-5)| = 10$.

Esto en un caso práctico nos serviría para evaluar cuál es el error máximo que puede tener un modelo y saber si este no supera un cierto umbral detemrinado.

## Error Absoluto Medio (Absolute Mean Error MAE)

El **Error Absoluto Medio (MAE)** es una métrica que mide la media de las diferencias absolutas entre las predicciones y los valores reales. 

La fórmula para el **Error Absoluto Medio (MAE)** es:

$MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$

donde:

- $n$ es el número total de observaciones.
- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $|y_i - \hat{y}_i|$ es la diferencia absoluta entre el valor real y el valor predicho para cada observación.

El **Error Absoluto Medio (MAE)** calcula el promedio de las diferencias absolutas entre las predicciones y los valores reales. Esta métrica es fácil de interpretar y no se ve afectada por los valores atípicos de manera tan fuerte como el **Error Cuadrático Medio (MSE)**, aunque no proporciona información sobre la magnitud de los errores en comparación con el **Error Cuadrático Medio**.

In [3]:
from sklearn.metrics import mean_absolute_error

In [5]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_absolute_error(y_verdadero, y_predicho)

2.0

## Error Cuadrático Medio (Mean Squared Error MSE)

El **Error Cuadrático Medio (MSE)** es una métrica que mide el promedio de los errores al cuadrar las diferencias entre las predicciones y los valores reales. Es uno de los más ampliamente utilizados en la evaluación de modelos de regresión.

La fórmula para el **Error Cuadrático Medio (MSE)** es:

$MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

donde:

- $n$ es el número total de observaciones.
- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $(y_i - \hat{y}_i)^2$ es la diferencia al cuadrado entre el valor real y el valor predicho para cada observación.

El **Error Cuadrático Medio (MSE)** mide la media de los errores cuadrados, lo que significa que penaliza más fuertemente los errores grandes debido al efecto del cuadrado. Esta métrica es útil cuando queremos minimizar las grandes discrepancias entre las predicciones y los valores reales. Sin embargo, su sensibilidad a los valores atípicos puede hacer que el MSE sea más alto cuando haya grandes errores en las predicciones.


In [6]:
from sklearn.metrics import mean_squared_error

In [7]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_squared_error(y_verdadero, y_predicho)

20.0

## Suma de los Cuadrados de los residuos (RSS)

La **Suma de los Cuadrados de los Residuos** (RSS) mide la cantidad total de error en un modelo de regresión. Es la suma de los cuadrados de las diferencias entre los valores reales y las predicciones del modelo. 

La fórmula para la **Suma de los Cuadrados de los Residuos** (RSS) es:

$RSS = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

donde:

- $n$ es el número total de observaciones.
- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $(y_i - \hat{y}_i)^2$ es el cuadrado de la diferencia entre el valor real y el valor predicho para la $i$-ésima observación.

La **Suma de los Cuadrados de los Residuos (RSS)** nos da una medida de la cantidad total de error (o discrepancia) entre los valores observados y los valores predichos por el modelo. Un RSS más pequeño indica que el modelo ha hecho predicciones más cercanas a los valores reales.

Es una de las métricas fundamentales en la evaluación de modelos de regresión, ya que ayuda a entender cuánto "desajuste" existe entre las predicciones y los valores reales.

`scikit-learn` no provee una función directa para aplicar esta métrica, pero se puede calcular aplicando el error cuadrático medio y luego multiplicando ese resultado por la cantidad de observaciones, ya que básicamente la suma de los residuos al cuadrado es como el error cuadrático medio pero sin sacar el promedio (es decir, sin dividir por el número de observaciones).

In [8]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_squared_error(y_verdadero, y_predicho) * len(y_verdadero)

100.0

## Raíz Cuadrada del Error Cuadrático Medio (RMSE)

La **Raíz Cuadrada del Error Cuadrático Medio (RMSE)** es una métrica que mide la desviación estándar de los errores de predicción. Es una versión más interpretable del **Error Cuadrático Medio (MSE)** porque está en las mismas unidades que las observaciones originales, a diferencia del MSE, que tiene unidades al cuadrado.

La fórmula para la **Raíz Cuadrada del Error Cuadrático Medio (RMSE)** es:

$RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}$

donde:

- $n$ es el número total de observaciones.
- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $(y_i - \hat{y}_i)^2$ es el cuadrado de la diferencia entre el valor real y el valor predicho para la $i$-ésima observación.

El **RMSE** proporciona una medida de cuánto se desvían en promedio las predicciones del modelo de los valores reales. Es útil porque, a diferencia del MSE, tiene las mismas unidades que los datos originales, lo que hace que sea más fácil de interpretar. Sin embargo, al igual que el MSE, penaliza fuertemente los errores grandes debido a la operación de elevar al cuadrado.

### Propiedades:
- **Interpretabilidad**: Al estar en las mismas unidades que los datos originales, es más fácil de interpretar que el MSE.
- **Sensibilidad a errores grandes**: Al igual que el MSE, el RMSE es muy sensible a los valores atípicos o errores grandes, ya que estos afectan significativamente el valor del error cuadrático.

In [11]:
from sklearn.metrics import root_mean_squared_error

In [12]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
root_mean_squared_error(y_verdadero, y_predicho)

4.47213595499958

## $R^2$ (Coeficiente de Determinación)

El **Coeficiente de Determinación ($R^2$)** es una métrica que indica qué tan bien las predicciones de un modelo se ajustan a los datos reales. Representa la proporción de la variabilidad de la variable dependiente que puede ser explicada por el modelo.

La fórmula para el **R²** es:

$R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}$

donde:

- $n$ es el número total de observaciones.
- $y_i$ es el valor real (o verdadero) de la \(i\)-ésima observación.
- $\hat{y}_i$ es el valor predicho por el modelo para la \(i\)-ésima observación.
- $\bar{y}$ es la media de los valores reales $( \bar{y} = \frac{1}{n} \sum_{i=1}^{n} y_i $).
- $(y_i - \hat{y}_i)^2$ es la suma de los errores cuadráticos (residuos).
- $(y_i - \bar{y})^2$ es la suma de los cuadrados totales, que mide la variabilidad de los valores reales respecto a su media.

El **R²** mide la proporción de la variabilidad total de los datos que es explicada por el modelo. Su valor está entre 0 y 1:

- **$R^2 = 1$** indica que el modelo explica perfectamente toda la variabilidad de los datos.
- **$R^2 = 0$** indica que el modelo no explica ninguna variabilidad de los datos, y su rendimiento es equivalente al de una media constante.
- **Valores negativos** de **$R^2$** pueden ocurrir cuando el modelo se desempeña peor que un modelo que simplemente predice la media de las observaciones.

### Propiedades:
- **Interpretabilidad**: Un **R²** más alto indica un mejor ajuste del modelo a los datos.
- **Limitaciones**: Aunque un **R²** alto indica un buen ajuste, no siempre garantiza un buen modelo, especialmente si se ajusta demasiado a los datos (sobreajuste). Por lo tanto, se deben considerar otras métricas complementarias, como el **RMSE** o el **AIC** (Criterio de Información de Akaike).
- **Utilidad en modelos lineales**: es importante tener en cuenta que la métrica del $R^2$ se debe utilizar para evaluar el rendimiento ÚNICAMENTE de modelos **lineales**.


In [13]:
from sklearn.metrics import r2_score

In [14]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
r2_score(y_verdadero, y_predicho)

-9.0

In [15]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, 4]
r2_score(y_verdadero, y_predicho)

0.9

In [16]:
y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, 5]
r2_score(y_verdadero, y_predicho)

1.0