# 💯 R2 Score

El coeficiente de determinación, comúnmente conocido como R2 Score, **es una medida que indica qué tan bien se ajustan los valores observados a los valores predichos por un modelo de regresión**. 

Este valor varía entre 0 y 1, donde 1 indica un ajuste perfecto y 0 indica que el modelo no es mejor que simplemente predecir la media de los valores observados.

Aquí tienes un ejemplo simple en Python utilizando la librería `scikit-learn`:

In [1]:
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
import numpy as np

In [2]:
# Datos de ejemplo
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 3, 4, 5, 6])

In [3]:
# Ajuste del modelo de regresión lineal
model = LinearRegression()
model.fit(x.reshape(-1, 1), y)

In [4]:
# Predicciones del modelo
y_pred = model.predict(x.reshape(-1, 1))

In [5]:
# Calculando el R2 Score
r2 = r2_score(y, y_pred)
print("R2 Score:", r2)

R2 Score: 1.0


Este código ajusta un modelo de regresión lineal a los datos `x` e `y`, luego predice los valores de `y` utilizando el modelo y calcula el R2 Score para evaluar qué tan bien se ajustan las predicciones del modelo a los datos observados.

---
### ¿Como se calcula el coeficiente de determinación (R2 Score)?

El coeficiente de determinación, también conocido como R2 Score, se calcula utilizando la siguiente fórmula:

$ R^2 = 1 - \frac{SS_{res}}{SS_{tot}} $

Donde:

- $SS_{res}$ es la suma de los cuadrados de las diferencias entre los valores observados y los valores predichos por el modelo.
- $SS_{tot}$ es la suma de los cuadrados de las diferencias entre los valores observados y la media de los valores observados.

Aquí tienes una explicación más detallada de cada término:

- $SS_{res} = \sum_{i} (y_i - \hat{y}_i)^2$
- $SS_{tot} = \sum_{i} (y_i - \bar{y})^2$

Donde:
- $y_i$ son los valores observados.
- $\hat{y}_i$ son los valores predichos por el modelo.
- $\bar{y}$ es la media de los valores observados.

El valor de $R^2$ está entre 0 y 1. Un valor más cercano a 1 indica un mejor ajuste del modelo a los datos, mientras que un valor más cercano a 0 indica un ajuste deficiente del modelo.

En resumen, el R2 Score mide la proporción de la varianza en la variable dependiente que es predecible a partir de la variable independiente(s) en el modelo de regresión.