<a href="https://colab.research.google.com/github/MiguelAngelDLA/Notebooks_TallerIA_AD2024/blob/main/Metricas_Evaluacion_Regresiones.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Métricas de Evaluación para Análisis de Regresión

En este cuaderno, exploraremos algunas de las métricas de evaluación más comunes para modelos de regresión. Las métricas que cubriremos incluyen:

- **MAE (Error Absoluto Medio)**
- **MSE (Error Cuadrático Medio)**
- **RMSE (Raíz del Error Cuadrático Medio)**
- **R² (Coeficiente de Determinación)**

Estas métricas nos ayudarán a entender la precisión y calidad de los modelos de regresión.
    


## 1. MAE (Error Absoluto Medio)

El **Error Absoluto Medio (MAE)** mide el promedio de los errores absolutos entre las predicciones y los valores reales. Es una métrica simple que indica, en promedio, cuánto difiere cada predicción de su valor real.

La fórmula para calcular el MAE es:

# $ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| $

donde:
- $ y_i $ son los valores reales
- $ \hat{y}_i $ son las predicciones
- $ n $ es el número total de observaciones.
    

In [None]:
#Aquí, y_true es una lista que contiene los valores reales, y y_pred es una lista que contiene los valores predichos por el modelo.
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

#Se inicializa la variable total_error en 0. Esta variable se usará para acumular los errores absolutos entre los valores reales y predichos.
total_error = 0

for actual, predicted in zip(y_true, y_pred):
    error = abs(actual - predicted)
    total_error += error

mae = total_error / len(y_true)

print(f"MAE: {mae}")


MAE: 0.5


- El bucle for utiliza `zip(y_true, y_pred)` para iterar sobre ambos conjuntos de datos `(y_true y y_pred)` simultáneamente.
- En cada iteración, actual toma un valor de `y_true`, y predicted toma el valor correspondiente de `y_pred`.
- `error = abs(actual - predicted)` calcula la diferencia absoluta entre el valor real `actual` y el valor predicho `predicted`.
`total_error += error` suma este error absoluto al `total_error`, acumulando los errores en cada iteración.

- Se calcula el MAE dividiendo el total_error entre el número total de observaciones `len(y_true)`. Esto da el promedio de los errores absolutos.





## 2. MSE (Error Cuadrático Medio)

El **Error Cuadrático Medio (MSE)** calcula el promedio de los errores al cuadrado. A diferencia del MAE, penaliza más los errores grandes debido a la elevación al cuadrado.

La fórmula para calcular el MSE es:

# $ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $
    

In [None]:
total_error = 0

# Bucle para calcular el error cuadrático
for actual, predicted in zip(y_true, y_pred):

    error = (actual - predicted) ** 2
    total_error += error

mse = total_error / len(y_true)

print(f"MSE: {mse}")


MSE: 0.375



## 3. RMSE (Raíz del Error Cuadrático Medio)

El **RMSE (Raíz del Error Cuadrático Medio)** es simplemente la raíz cuadrada del MSE. Es útil porque devuelve la métrica a las mismas unidades que las del valor objetivo, facilitando la interpretación.

La fórmula para calcular el RMSE es:

# $ RMSE = \sqrt{MSE} $
    

In [None]:
total_error = 0

for actual, predicted in zip(y_true, y_pred):

    error = (actual - predicted) ** 2
    total_error += error

mse = total_error / len(y_true)

# Calcular el RMSE como la raíz cuadrada del MSE
rmse = mse ** 0.5

print(f"RMSE: {rmse}")


RMSE: 0.6123724356957945



## 4. R² (Coeficiente de Determinación)

El **Coeficiente de Determinación (R²)** mide qué tan bien las predicciones se ajustan a los datos reales. Un valor de R² cercano a 1 indica un buen ajuste del modelo, mientras que un valor cercano a 0 indica un mal ajuste.

La fórmula para calcular el R² es:

# $ R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2} $

donde:
- $ \bar{y} $

 es el valor medio de los valores reales.
    

In [None]:
#Se calcula la media de los valores reales (y_true). Esta media se utiliza para comparar cuánto se desvían los valores reales de sus predicciones y de su propia media.
mean_y_true = sum(y_true) / len(y_true)


'''
ss_total es la suma de los cuadrados totales, que mide la variabilidad total de los datos reales con respecto a su media.
ss_res es la suma de los cuadrados residuales, que mide la variabilidad de los datos reales con respecto a las predicciones.
'''
ss_total = 0
ss_res = 0

'''
Se usa zip(y_true, y_pred) para iterar sobre los pares de valores reales y predichos.
ss_total += (actual - mean_y_true) ** 2 acumula los cuadrados de las diferencias entre los valores reales y la media.
ss_res += (actual - predicted) ** 2 acumula los cuadrados de las diferencias entre los valores reales y los predichos.
'''
for actual, predicted in zip(y_true, y_pred):

    ss_total += (actual - mean_y_true) ** 2
    ss_res += (actual - predicted) ** 2

r2 = 1 - (ss_res / ss_total)

print(f"R²: {r2}")

R²: 0.9486081370449679


#Tabla de comparación

Para finalizar, tenemos una tabla de comparación entre las 4 metricas para regresiones, elijan las que se ajuste mejor al objetivo de su modelo:

| Métrica | Definición | Ventajas | Desventajas | Rango de Valores |
|---------|------------|----------|-------------|------------------|
| **MAE** | Error Absoluto Medio: mide el promedio de los errores absolutos entre las predicciones y los valores reales. | Fácil de interpretar y no penaliza tanto los errores grandes. | No considera la magnitud de los errores grandes, lo que puede ser problemático en algunos contextos. | 0 a ∞, donde valores más bajos indican un mejor ajuste. |
| **MSE** | Error Cuadrático Medio: calcula el promedio de los errores al cuadrado, penalizando más los errores grandes. | Penaliza más los errores grandes, lo que es útil para identificar grandes desviaciones. | Dificulta la interpretación debido a que está en unidades al cuadrado de la variable objetivo. | 0 a ∞, con valores más bajos indicando un mejor ajuste. |
| **RMSE** | Raíz del Error Cuadrático Medio: es la raíz cuadrada del MSE, devolviendo la métrica a las unidades originales. | Devuelve la métrica a las mismas unidades de la variable objetivo, facilitando la interpretación. | Similar al MSE pero con mejor interpretación, aunque sigue penalizando errores grandes. | 0 a ∞, valores más bajos indican un mejor ajuste, pero interpretado en las mismas unidades de los datos. |
| **R²** | Coeficiente de Determinación: mide qué tan bien las predicciones se ajustan a los valores reales, indicando el porcentaje de variabilidad explicada. | Proporciona una medida del ajuste general del modelo, útil para evaluar su efectividad. | No muestra el tamaño real de los errores y puede ser engañoso si se usa solo sin otros indicadores. | 0 a 1, donde 1 indica un ajuste perfecto y 0 indica que el modelo no explica la variabilidad de los datos. |
