
# Regularización en Modelos Lineales

La **regularización** es una técnica que busca evitar el sobreajuste penalizando la complejidad del modelo. Se utiliza especialmente en regresión lineal y regresión logística cuando hay muchas variables o colinealidad.

---

## ¿Por qué es necesaria la regularización?

- Para evitar que los coeficientes crezcan excesivamente.
- Para mejorar la capacidad de generalización del modelo.
- Para seleccionar características relevantes (Lasso).

---

## Tipos principales:

1. **Ridge Regression (L2)**
2. **Lasso Regression (L1)**
3. **Elastic Net (combinación de L1 y L2)**


In [None]:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Simular datos con multicolinealidad
np.random.seed(0)
n = 100
X1 = np.random.normal(0, 1, n)
X2 = X1 + np.random.normal(0, 0.1, n)
X3 = np.random.normal(0, 1, n)
epsilon = np.random.normal(0, 1, n)
Y = 3*X1 + 0.5*X2 + 2*X3 + epsilon

df = pd.DataFrame({'X1': X1, 'X2': X2, 'X3': X3, 'Y': Y})

X = df[['X1', 'X2', 'X3']]
y = df['Y']

# Escalar variables
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)



## Ridge Regression (L2)

La regresión **Ridge** añade una penalización proporcional al cuadrado de los coeficientes.

### Fórmula del costo:

\[
J(\beta) = RSS + \alpha \sum_{j=1}^{p} \beta_j^2
\]

Donde \( \alpha \) controla la fuerza de la penalización. A mayor \( \alpha \), mayor regularización.

- Reduce la varianza.
- No lleva coeficientes exactamente a cero.


In [None]:

from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error

ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)
y_pred_ridge = ridge.predict(X_test)

print("Coeficientes Ridge:", ridge.coef_)
print("MSE Ridge:", mean_squared_error(y_test, y_pred_ridge))



## Lasso Regression (L1)

La regresión **Lasso** penaliza la suma de los valores absolutos de los coeficientes.

### Fórmula del costo:

\[
J(\beta) = RSS + \alpha \sum_{j=1}^{p} |\beta_j|
\]

- Puede llevar coeficientes exactamente a cero.
- Ideal para selección de variables.


In [None]:

from sklearn.linear_model import Lasso

lasso = Lasso(alpha=0.1)
lasso.fit(X_train, y_train)
y_pred_lasso = lasso.predict(X_test)

print("Coeficientes Lasso:", lasso.coef_)
print("MSE Lasso:", mean_squared_error(y_test, y_pred_lasso))



## Elastic Net

Elastic Net combina L1 y L2.

### Fórmula del costo:

\[
J(\beta) = RSS + \alpha_1 \sum_{j=1}^{p} |\beta_j| + \alpha_2 \sum_{j=1}^{p} \beta_j^2
\]

- Combina beneficios de Lasso y Ridge.
- Útil cuando hay muchas variables correlacionadas.


In [None]:

from sklearn.linear_model import ElasticNet

elastic = ElasticNet(alpha=0.1, l1_ratio=0.5)
elastic.fit(X_train, y_train)
y_pred_elastic = elastic.predict(X_test)

print("Coeficientes ElasticNet:", elastic.coef_)
print("MSE ElasticNet:", mean_squared_error(y_test, y_pred_elastic))


In [None]:

modelos = pd.DataFrame({
    'Modelo': ['Ridge', 'Lasso', 'ElasticNet'],
    'MSE': [
        mean_squared_error(y_test, y_pred_ridge),
        mean_squared_error(y_test, y_pred_lasso),
        mean_squared_error(y_test, y_pred_elastic)
    ]
})

modelos.plot(x='Modelo', y='MSE', kind='bar', legend=False)
plt.ylabel("Error Cuadrático Medio")
plt.title("Comparación de Regularización")
plt.grid(True)
plt.show()



## Ejercicio Final

1. Usa el dataset `load_boston` o `load_diabetes` de sklearn.
2. Aplica Ridge, Lasso y ElasticNet.
3. Ajusta el valor de `alpha` y analiza cómo afecta los coeficientes y el error.

¿Puedes identificar qué variables se seleccionan o eliminan con Lasso?
