# Regularización

La **regularización** es una técnica utilizada en los modelos de machine learning para evitar el **sobreajuste** (overfitting), que ocurre cuando un modelo se ajusta demasiado a los datos de entrenamiento y, por lo tanto, tiene un rendimiento deficiente en datos nuevos o no vistos. El objetivo principal de la regularización es encontrar un equilibrio entre el ajuste del modelo a los datos de entrenamiento y su capacidad de generalización.

Cuando un modelo es demasiado complejo, como puede ser el caso con muchos parámetros o características, corre el riesgo de memorizar los datos en lugar de aprender patrones subyacentes. Esto puede llevar a que el modelo tenga un bajo error en los datos de entrenamiento, pero un alto error en datos de prueba o de validación.

La regularización aborda este problema al agregar un **término de penalización** a la función de costo o pérdida del modelo, que restringe o reduce el tamaño de los coeficientes del modelo, lo que impide que el modelo se ajuste demasiado a los datos.

## Tipos de Regularización

Existen varios tipos de regularización, pero los dos más comunes son **L2** (Ridge) y **L1** (Lasso):

1. **Regularización L2 (Ridge)**:
   En la regularización L2, se añade una penalización proporcional al cuadrado de la magnitud de los coeficientes del modelo. La función de costo modificada se define como:

   $$
   J(\theta) = \text{L}(\theta) + \lambda \sum_{j=1}^p \theta_j^2
   $$

   Donde:
   - $\text{L}(\theta)$ es la función de pérdida (por ejemplo, error cuadrático medio).
   - $\lambda$ es el parámetro de regularización que controla la fuerza de la penalización.
   - $\theta_j$ son los coeficientes del modelo.
   
   Esto favorece coeficientes más pequeños, pero no necesariamente cero, por lo que tiende a reducir la varianza del modelo sin eliminar características por completo.

2. **Regularización L1 (Lasso)**:
   En la regularización L1, la penalización es proporcional a la magnitud absoluta de los coeficientes. La función de costo se define como:

   $$
   J(\theta) = \text{L}(\theta) + \lambda \sum_{j=1}^p |\theta_j|
   $$

   Este tipo de regularización tiende a reducir algunos coeficientes a cero, lo que efectivamente elimina características irrelevantes. Esto también la convierte en una técnica útil para la **selección de características**.

3. **Elastic Net**
    Elastic Net es una combinación de L1 y L2, que incluye ambos términos de regularización:

$$
J(\theta) = \text{L}(\theta) + \lambda_1 \sum_{j=1}^p |\theta_j| + \lambda_2 \sum_{j=1}^p \theta_j^2
$$

## Efecto de la Regularización

- **Evita el sobreajuste**: Al penalizar grandes coeficientes, la regularización fuerza al modelo a ser más simple y menos propenso a aprender ruido o variabilidad aleatoria en los datos de entrenamiento.
- **Mejora la generalización**: Ayuda al modelo a ser más robusto frente a datos no vistos, mejorando su capacidad de generalizar.
- **Control de complejidad**: El parámetro $\lambda$ controla la cantidad de regularización. Un $\lambda$ grande puede hacer que el modelo sea demasiado simple, mientras que un $\lambda$ pequeño puede hacer que el modelo se ajuste demasiado a los datos de entrenamiento.

## Elección de $\lambda$

El valor de $\lambda$ se elige a través de técnicas como la **validación cruzada**, donde el modelo se entrena varias veces con diferentes valores de $\lambda$, y se selecciona el que ofrece el mejor rendimiento en datos de validación.

## Aplicaciones de la Regularización

- **Regresión lineal y logística**: Regularización L1 y L2 se utilizan comúnmente para mejorar estos modelos, especialmente cuando el número de características es grande.
- **Redes neuronales**: En redes neuronales, técnicas como **dropout** también se utilizan como un tipo de regularización para evitar el sobreajuste.


In [1]:
# Importar las librerías necesarias
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Crear un conjunto de datos de ejemplo
# Variables de entrada X (características)
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5], [5, 6], [6, 7],
              [1, 0], [2, 1], [3, 2], [4, 3], [5, 4], [6, 5]])

# Etiquetas de salida y (0 o 1)
y = np.array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1])

# Dividir el conjunto de datos en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear el modelo de regresión logística regularizada (Ridge)
# El parámetro 'C' es el inverso de la regularización. Cuanto menor es, más fuerte es la regularización.
model = LogisticRegression(penalty='l2', C=1.0, solver='liblinear')

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train, y_train)

# Realizar predicciones con los datos de prueba
y_pred = model.predict(X_test)

# Evaluar el desempeño del modelo
print("Exactitud del modelo:", accuracy_score(y_test, y_pred))
print("\nReporte de clasificación:\n", classification_report(y_test, y_pred))

# Mostrar los coeficientes aprendidos por el modelo
print("\nCoeficientes del modelo:", model.coef_)
print("Intercepto:", model.intercept_)


Exactitud del modelo: 1.0

Reporte de clasificación:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00         1
           1       1.00      1.00      1.00         3

    accuracy                           1.00         4
   macro avg       1.00      1.00      1.00         4
weighted avg       1.00      1.00      1.00         4


Coeficientes del modelo: [[ 0.83259795 -1.04303454]]
Intercepto: [0.23036366]
