# Regularización

## Mantener el modelo simple

La regularización funciona añadiendo un término adicional a la función de pérdida del modelo. Este término penaliza ciertas características del modelo que tienden a causar sobreajuste. Matemáticamente, la función de pérdida con regularización se puede expresar como:

$$
L_{\text{regularizada}} = L_{\text{original}} + \lambda \cdot R(\theta)
$$

Donde:
- $ L_{\text{original}} $: Es la función de pérdida original del modelo (por ejemplo, error cuadrático medio para regresión o log-loss para clasificación).
- $ \lambda $: Es un hiperparámetro llamado **factor de regularización** que controla la intensidad de la penalización. Un valor mayor de $ \lambda $ impone una penalización más fuerte.
- $ R(\theta) $: Es el término de regularización, que depende de los parámetros del modelo ($ \theta $).

El objetivo es minimizar $ L_{\text{regularizada}} $, lo que equilibra el ajuste a los datos de entrenamiento ($ L_{\text{original}} $) con la simplicidad del modelo ($ R(\theta) $).


![image-3.png](attachment:image-3.png)

![image.png](attachment:image.png)


## L2 hace todos los coeficientes más pequeños - Ridge

![image.png](attachment:image.png)

Función de pérdida (loss):

![image-3.png](attachment:image-3.png)

- Esto fomenta que los pesos sean pequeños pero no exactamente cero. 
- Como resultado, Ridge reduce la magnitud de los pesos sin eliminar completamente ninguna característica.


## L1 es útil para soluciones dispersas/poco densas - Lasso

![image.png](attachment:image.png)

Función de pérdida (loss):

![image-3.png](attachment:image-3.png)

- Esto tiende a hacer que algunos pesos sean exactamente **cero**, efectivamente realizando una selección de características (feature selection). 
- Las características con pesos cero son ignoradas por el modelo.


## Elastic Net:
- Combina las penalizaciones L1 y L2:
  
  $$
  R(\theta) = \alpha \sum_{i} |\theta_i| + (1 - \alpha) \sum_{i} \theta_i^2
  $$

- Aquí, $ \alpha $ controla la proporción entre L1 y L2.

## ¿Por Qué Funciona la Regularización?

1. **Reducción de la Complejidad del Modelo:**
   - Al penalizar grandes valores de los pesos, la regularización fuerza al modelo a ser más "simple". Un modelo más simple es menos propenso a capturar patrones irrelevantes o ruido en los datos de entrenamiento.

2. **Control del Trade-off entre Ajuste y Simplicidad:**
   - El hiperparámetro $ \lambda $ permite ajustar el equilibrio entre:
     - Ajustarse bien a los datos de entrenamiento ($ L_{\text{original}} $).
     - Mantener los pesos pequeños ($ R(\theta) $).

3. **Mejora de la Generalización:**
   - Al evitar que el modelo se ajuste perfectamente a los datos de entrenamiento, la regularización mejora su capacidad para generalizar a nuevos datos.



## Modelos con Regularización en sklearn

| **Modelo**                      | **Tipo de Regularización** | **Parámetros Clave**                     |
|----------------------------------|----------------------------|------------------------------------------|
| Ridge                           | L2                        | `alpha`                                 |
| Lasso                           | L1                        | `alpha`                                 |
| ElasticNet                      | L1 + L2                   | `alpha`, `l1_ratio`                     |
| Regresión Logística             | L1/L2/ElasticNet          | `penalty`, `C`                          |
| Support Vector Machines (SVM)   | L2                        | `C`                                     |
| SGD                             | L1/L2/ElasticNet          | `penalty`, `alpha`                      |
| Árboles/Random Forest           | Regularización implícita  | `max_depth`, `min_samples_split`, etc.  |
| Gradient Boosting               | Regularización implícita  | `learning_rate`, `max_depth`, etc.      |
| XGBoost                         | L1/L2                     | `lambda`, `alpha`                       |
| LightGBM                        | L1/L2                     | `lambda_l1`, `lambda_l2`                |
| CatBoost                        | L2                        | `l2_leaf_reg`                           |
