- La regularización es una técnica utilizada en el aprendizaje automático y la estadística para prevenir el sobreajuste (overfitting) de los modelos. El sobreajuste ocurre cuando un modelo se ajusta demasiado a los datos de entrenamiento y captura el ruido en lugar de los patrones subyacentes, lo que puede llevar a un rendimiento deficiente en datos nuevos y no vistos.

- La idea detrás de la regularización es agregar una penalización a la función de costo del modelo en función de ciertos parámetros, lo que hace que el modelo sea más reacio a ajustarse en exceso a los datos. Las dos formas más comunes de regularización son la L1 (regularización Lasso) y la L2 (regularización Ridge).

### Regularización L1 (Lasso): 
La regularización L1 agrega la suma de los valores absolutos de los coeficientes a la función de costo. Esto tiende a forzar algunos coeficientes a ser exactamente cero, lo que puede llevar a la selección automática de características y, por lo tanto, simplificar el modelo.

### Regularización L2 (Ridge): 
La regularización L2 agrega la suma de los cuadrados de los coeficientes a la función de costo. Esto tiende a empujar los coeficientes hacia valores pequeños pero no exactamente cero, lo que reduce su magnitud sin eliminarlos por completo.

### Cómo aplicar la regularización:

En muchas bibliotecas de aprendizaje automático, como scikit-learn en Python, la regularización se implementa automáticamente en los algoritmos. Aquí tienes un ejemplo de cómo aplicar la regularización en una regresión lineal utilizando scikit-learn:

In [None]:
from sklearn.linear_model import Ridge, Lasso
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

# Carga y preparación de datos
X, y = '/home/jhonfypy/CursoML_Scikit_learni_jf/heart.csv'()  # Carga tus datos aquí
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Estandarización de características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Regularización L2 (Ridge)
ridge_model = Ridge(alpha=0.1)  # 'alpha' es el parámetro de regularización
ridge_model.fit(X_train_scaled, y_train)
y_pred_ridge = ridge_model.predict(X_test_scaled)
ridge_mse = mean_squared_error(y_test, y_pred_ridge)

# Regularización L1 (Lasso)
lasso_model = Lasso(alpha=0.1)  # 'alpha' es el parámetro de regularización
lasso_model.fit(X_train_scaled, y_train)
y_pred_lasso = lasso_model.predict(X_test_scaled)
lasso_mse = mean_squared_error(y_test, y_pred_lasso)


En este ejemplo, estamos aplicando la regularización L2 (Ridge) y L1 (Lasso) en regresiones lineales. El parámetro alphacontrola la fuerza de la regularización. Valores más altos de alphaaumentarán la penalización y reducirán la magnitud de los coeficientes.

La elección del valor de alphadebe basarse en la validación cruzada y la comprensión de los datos. Un valor demasiado alto puede suprimir demasiado los coeficientes, mientras que un valor demasiado bajo no logrará la reducción del sobreajuste.

![image.png](attachment:image.png)