# Métricas de Evaluación de Modelos de Regresión

En el contexto de modelos de regresión lineal, como los que utilizamos para predecir los pesos de las partes del cangrejo, es crucial evaluar qué tan bien se desempeñan nuestras predicciones. Para ello, usamos métricas que cuantifican la diferencia entre los valores predichos por el modelo y los valores reales. Las dos métricas principales que empleamos son el **Error Absoluto Medio (MAE)** y el **Coeficiente de Determinación ($R^2$)**.

---

## 1. Error Absoluto Medio (MAE - Mean Absolute Error)

El **Error Absoluto Medio (MAE)** es una métrica que mide la **magnitud promedio de los errores** en un conjunto de predicciones. Su principal característica es que no tiene en cuenta la dirección del error (es decir, si el modelo predijo por encima o por debajo del valor real).

### Cálculo:
Se calcula como el promedio de los valores absolutos de las diferencias entre las predicciones ($\hat{y}_i$) y los valores reales ($y_i$).

$$MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$$

Donde:
* $n$: Es el número total de observaciones.
* $y_i$: Es el valor real observado para la $i$-ésima observación.
* $\hat{y}_i$: Es el valor predicho por el modelo para la $i$-ésima observación.
* $|...|$: Denota el valor absoluto.

### Interpretación:
* **MAE más bajo es mejor**: Un valor de MAE cercano a cero indica que las predicciones del modelo están, en promedio, muy cerca de los valores reales.
* **Unidades**: Se expresa en las mismas unidades que la variable dependiente que estamos prediciendo (en nuestro caso, gramos). Esto facilita su comprensión práctica. Por ejemplo, un MAE de 0.5 gramos significa que, en promedio, nuestras predicciones se desvían en 0.5 gramos de los pesos reales.
* **Robustez**: Es una métrica robusta frente a los *outliers* (valores atípicos) en comparación con el Error Cuadrático Medio (MSE), ya que no eleva al cuadrado los errores grandes.

---

## 2. Coeficiente de Determinación ($R^2$ - R-squared)

El **Coeficiente de Determinación ($R^2$)**, también conocido como **R-cuadrado**, es una métrica que indica la **proporción de la varianza en la variable dependiente que es predecible a partir de las variables independientes** del modelo. En términos más simples, nos dice qué tan bien el modelo de regresión se ajusta a los datos observados.

### Cálculo:
Se calcula como 1 menos la relación entre la suma de los cuadrados de los residuos ($SS_{res}$) y la suma total de los cuadrados ($SS_{tot}$).

$$R^2 = 1 - \frac{SS_{res}}{SS_{tot}}$$

Donde:
* $SS_{res}$ (Suma de Cuadrados de los Residuos): Mide la variabilidad no explicada por el modelo.
    $$SS_{res} = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$$
* $SS_{tot}$ (Suma Total de Cuadrados): Mide la variabilidad total de la variable dependiente ($y$) respecto a su media ($\bar{y}$).
    $$SS_{tot} = \sum_{i=1}^{n} (y_i - \bar{y})^2$$

### Interpretación:
* **Rango**: El valor de $R^2$ generalmente oscila entre 0 y 1. Un valor de 1 (o 100%) indica que el modelo explica toda la variabilidad de la variable dependiente. Un valor de 0 indica que el modelo no explica ninguna variabilidad (es tan bueno como simplemente usar la media de $y$).
* **Bondad de Ajuste**: Un **$R^2$ más alto** (más cercano a 1) sugiere que el modelo se ajusta mejor a los datos y puede explicar una mayor proporción de la variabilidad en la variable dependiente.
* **Precaución**: Un $R^2$ alto no siempre significa que el modelo es el mejor o que las predicciones son precisas, especialmente si hay *overfitting* (sobreajuste). Por eso es importante evaluarlo junto con otras métricas y en conjuntos de datos de prueba.

---

## 3. Conjuntos de Entrenamiento y Prueba

Es fundamental dividir los datos en dos subconjuntos:

* **Conjunto de Entrenamiento (Training Set)**: Se utiliza para **entrenar** el modelo, es decir, para que el algoritmo aprenda los patrones y las relaciones en los datos. El 80% de tus datos se usa para esto.
* **Conjunto de Prueba (Test Set)**: Se utiliza para **evaluar** el rendimiento del modelo en datos que **nunca ha visto** durante el entrenamiento. El 20% restante de tus datos se destina a esto.

### Interpretación de Métricas en Cada Conjunto:
* **Métricas de Entrenamiento**: Indican qué tan bien el modelo **aprendió** los datos sobre los que fue entrenado. Un buen rendimiento aquí es esperado.
* **Métricas de Prueba**: Son la verdadera medida de la **generalización** del modelo. Indican qué tan bien se espera que el modelo funcione con datos nuevos e invisibles. Si las métricas de entrenamiento son mucho mejores que las de prueba, podría ser un signo de **sobreajuste** (el modelo memorizó los datos de entrenamiento pero no aprendió patrones generalizables).

---

## Tabla Resumen de Métricas de Evaluación

| Métrica                         | ¿Qué Mide?                                                                  | Interpretación Ideal                          | Rango Común | Unidades          |
| :------------------------------ | :-------------------------------------------------------------------------- | :-------------------------------------------- | :---------- | :---------------- |
| **Error Absoluto Medio (MAE)** | Magnitud promedio de los errores (diferencia absoluta entre real y predicho). | Más bajo (cercano a 0) es mejor.              | $[0, \infty)$ | Unidades de $y$   |
| **Coeficiente de Determinación ($R^2$)** | Proporción de la varianza de $y$ explicada por el modelo.               | Más alto (cercano a 1) es mejor.              | $(-\infty, 1]$ | Sin unidades (0-1) |