# Regresión lineal por mínimos cuadrados: evaluación

## Gráfica de residuos

Si la entrada es unidimensional, podemos evaluar el modelo mediante una **gráfica de residuos** que muestre $r_n=y_n-\hat{y}_n$ en función de $x_n$.

**Ejemplo:** $\;$ Seguimos con el ejemplo de regresión cuadrática. Primero generamos los datos:

In [1]:
import numpy as np
import matplotlib.pyplot as plt

w0 = 0; w1 = -1.5; w2 = 1/9; sigma = 2; N = 21; np.random.seed(0)
X_train = np.linspace(0.0, 20, N); X_test = np.arange(0.0, 20, 0.1)
y_train = w0 + w1 * X_train + w2 * X_train * X_train + np.random.normal(0, sigma, X_train.shape)
y_test = w0 + w1 * X_test + w2 * X_test * X_test + np.random.normal(0, sigma, X_test.shape)

A continuación escalamos los datos en $[-1, 1]$ para evitar problemas numéricos con el cálculo de características polinómicas.

In [2]:
from sklearn.preprocessing import MinMaxScaler 

scaler = MinMaxScaler(feature_range=(-1, 1))
X_train_scaled = scaler.fit_transform(X_train.reshape(-1, 1))
X_test_scaled = scaler.transform(X_test.reshape(-1, 1))

Ajustamos un modelo de regresión polinómica.

In [4]:
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression

degree = 2
model = LinearRegression()
poly_features = PolynomialFeatures(degree=degree, include_bias=False)
X_train_scaled_poly = poly_features.fit_transform(X_train_scaled)
model.fit(X_train_scaled_poly, y_train)
y_train_pred = model.predict(X_train_scaled_poly)