# Evaluacion de desempeño del modelo

## Coeficiente de Determinación ($𝑅^2$)

El coeficiente de determinación $R^2$ mide la proporción de la variabilidad en la variable dependiente que es explicada por el modelo de regresión. Es una métrica que indica qué tan bien se ajusta el modelo a los datos observados. Un valor de $R^2$ de 1 indica un ajuste perfecto, mientras que un valor de 0 indica que el modelo no explica ninguna de las variaciones de la variable dependiente.

$R^2 = 1 - \frac{\text{Suma de los Cuadrados de los Residuos (SSR)}}{\text{Suma Total de los Cuadrados (SST)}}$

donde:
- $\text{SSR}$ (Suma de los Cuadrados de los Residuos) es $\sum (y_i - \hat{y}_i)^2$
- $\text{SST}$ (Suma Total de los Cuadrados) es $\sum (y_i - \bar{y})^2$
- $y_i$ son los valores observados, $\hat{y}_i$ son los valores predichos por el modelo y $\bar{y}$ es la media de los valores observados.

## Coeficiente de Determinacion Ajustado ($R^2$ ajustado)

El coeficiente de determinación ajustado ($R^2$ ajustado) es una versión modificada del $R^2$ que tiene en cuenta el número de variables predictoras en el modelo. Penaliza la inclusión de variables adicionales que no mejoran el modelo significativamente. Es útil para comparar modelos con diferentes números de variables.

$R^2_{\text{ajustado}} = 1 - \left( \frac{(1 - R^2)(n - 1)}{n - p - 1} \right)$

donde:
- $R^2$ es el coeficiente de determinación.
- $n$ es el número de observaciones.
- $p$ es el número de predictores (variables independientes) en el modelo.

El $R^2_{\text{ajustado}}$ puede ser menor que $R^2$ y es más útil cuando se agregan más variables al modelo, ya que penaliza el exceso de variables no informativas.

## Valor-p de los coeficientes

El valor p mide la evidencia en contra de la hipótesis nula de que el coeficiente de una variable es igual a cero (sin efecto). Un valor p bajo indica que es poco probable que el coeficiente sea cero, sugiriendo que la variable tiene un efecto significativo en la variable dependiente.

Se calcula usando una prueba t de Student para cada coeficiente en el modelo de regresión.
- **Estadístico t:**
  $t = \frac{\hat{\beta}_j}{\text{SE}(\hat{\beta}_j)}$
  donde $\hat{\beta}_j$ es el coeficiente estimado y $\text{SE}(\hat{\beta}_j)$ es el error estándar del coeficiente.

## Intervalo de confianza

Los intervalos de confianza proporcionan un rango dentro del cual se espera que se encuentre el valor verdadero del coeficiente con un nivel de confianza determinado (por ejemplo, 95%). Un intervalo que no incluye cero sugiere que el coeficiente es significativo.

  $$\hat{\beta}_j \pm t_{\alpha/2} \times \text{SE}(\hat{\beta}_j)$$
donde:
 - $\hat{\beta}_j$ es el coeficiente estimado,
 - $t_{\alpha/2}$ es el valor crítico de la distribución t de Student,
 - $\text{SE}(\hat{\beta}_j)$ es el error estándar del coeficiente.

## Error Cuadrático Medio (MSE) y Raíz del Error Cuadrático Medio (RMSE)

- MSE: Mide la media de los cuadrados de los errores, es decir, la diferencia entre los valores observados y los valores predichos. Penaliza los errores más grandes de manera cuadrática.
- RMSE: Es la raíz cuadrada del MSE. Proporciona una medida del error en las mismas unidades que la variable dependiente, facilitando la interpretación.

- **MSE:**
  $\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
- **RMSE:**
  $\text{RMSE} = \sqrt{\text{MSE}}$
donde:
- $y_i$ son los valores observados, $\hat{y}_i$ son los valores predichos y $n$ es el número de observaciones.

## Gráfico de residuos

Un gráfico de residuos muestra la diferencia entre los valores observados y los valores predichos en función de las predicciones del modelo. Es útil para verificar si los residuos tienen patrones sistemáticos que indican problemas con el modelo, como no linealidad o heteroscedasticidad.
