# Regresiones Regularizadas: Ridge, Lasso y Elastic Net
Este notebook explica teóricamente y de forma práctica tres técnicas de regresión regularizada: Ridge, Lasso y Elastic Net, utilizando el conjunto de datos de diabetes precargado en `scikit-learn`.

## Objetivos:
- Explicar la motivación detrás de la regularización
- Comparar matemáticamente y gráficamente las tres técnicas
- Evaluar y comparar modelos usando un ejemplo real


## Fundamento teórico

**Regresión Ridge:** penaliza la suma de los cuadrados de los coeficientes (L2).
$$\text{min} \left\{ \|y - X\beta\|^2 + \lambda \|\beta\|_2^2 \right\}$$

**Regresión Lasso:** penaliza la suma de los valores absolutos de los coeficientes (L1), promoviendo sparsity (coeficientes exactamente cero).
$$\text{min} \left\{ \|y - X\beta\|^2 + \lambda \|\beta\|_1 \right\}$$

**Elastic Net:** combinación de L1 y L2.
$$\text{min} \left\{ \|y - X\beta\|^2 + \lambda_1 \|\beta\|_1 + \lambda_2 \|\beta\|_2^2 \right\}$$

In [None]:
from sklearn.datasets import load_diabetes
from sklearn.linear_model import Ridge, Lasso, ElasticNet
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, r2_score
import numpy as np
import matplotlib.pyplot as plt

# Cargar datos
X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
# Ajustar modelos con alpha=1
ridge = Ridge(alpha=1.0).fit(X_train_scaled, y_train)
lasso = Lasso(alpha=0.1).fit(X_train_scaled, y_train)
enet = ElasticNet(alpha=0.1, l1_ratio=0.5).fit(X_train_scaled, y_train)

# Predicciones
preds = {
    "Ridge": ridge.predict(X_test_scaled),
    "Lasso": lasso.predict(X_test_scaled),
    "ElasticNet": enet.predict(X_test_scaled)
}

# Evaluación
for name, y_pred in preds.items():
    print(f"{name}: RMSE = {np.sqrt(mean_squared_error(y_test, y_pred)):.3f}, R2 = {r2_score(y_test, y_pred):.3f}")

In [None]:
# Visualizar coeficientes
plt.figure(figsize=(10, 5))
plt.plot(ridge.coef_, label='Ridge')
plt.plot(lasso.coef_, label='Lasso')
plt.plot(enet.coef_, label='ElasticNet')
plt.axhline(0, color='gray', linestyle='--')
plt.title("Comparación de coeficientes")
plt.xlabel("Índice de variable")
plt.ylabel("Valor del coeficiente")
plt.legend()
plt.grid(True)
plt.show()

## Conclusión
- Ridge mantiene todos los coeficientes pequeños
- Lasso fuerza varios a cero (selección de variables)
- Elastic Net ofrece un compromiso, útil para variables correlacionadas
