# Métricas para Evaluar Modelos de Regresión con Scikit-Learn: R2, MSE, RMSE, MAE, etc.

- Un modelo de regresión es una función que nos premite explicar la relación entre una o multiples variables y una variable objetivo.
- En otras palabras, es una función que nos premite predecir un valor en función de ciertas variables.
>
> ![metricas_para_regresion.png](attachment:metricas_para_regresion.png)

In [1]:
# Ejemplo 1:
# ERROR ABSOLUTO MAXIMO (M) - Cuál es la diferencia máxima entre el valor predicho y el valor real.

# y: valore verdadero
# ŷ: valor predicho

# M(y, ŷ) = max(|y_i - ŷ_i|)

from sklearn.metrics import max_error

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
max_error(y_verdadero, y_predicho)

10

In [2]:
# ERROR ABSOLUTO MEDIO (MAE)

# y: valor verdadero
# ŷ: valor predicho
# n: tamaño de la muestra

# MAE(y, ŷ) = 1/n |y_i, ŷ_i|

from sklearn.metrics import mean_absolute_error

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_absolute_error(y_verdadero, y_predicho)

2.0

In [3]:
# ERROR CUADRATICO MEDIO (MSE)

# # y: valor verdadero
# ŷ: valor predicho
# n: tamaño de la muestra

# MSE(y, ŷ) = 1/n (y_i - ŷ_i)²

from sklearn.metrics import mean_squared_error

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_squared_error(y_verdadero, y_predicho)

20.0

In [4]:
# SUMA DE LOS CUADRADOS DE LOS RESIDUOS (RSS)

# # y: valor verdadero
# ŷ: valor predicho
# n: tamaño de la muestra

# RSS(y, ŷ) = (y_i - ŷ_i)²

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_squared_error(y_verdadero, y_predicho)*len(y_predicho)

100.0

In [5]:
# RAIZ CUADRADA DEL ERROR CUADRATICO MEDIO (RMSE)

# y: valor verdadero
# ŷ: valor predicho
# n: tamaño de la muestra

# RMSE(y, ŷ) = RaizCuadrada de 1/n (y_i - ŷ_i)²

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
mean_squared_error(y_verdadero , y_predicho, squared=False)



4.47213595499958

In [6]:
# R² (COEFICIENTE DE DETERMINACION)

# y: valor verdadero
# ŷ: valor predicho
# n: tamaño de la muestra
# yRayaArriba: promedio de los valores verdaderos

# R²(y, ŷ) = 1 - (y_i - ŷ_i)² / (y_i - yRayaArriba)²

from sklearn.metrics import r2_score

y_verdadero = [1, 2, 3, 4, 5]
y_predicho = [1, 2, 3, 4, -5]
r2_score(y_verdadero, y_predicho)

-9.0