<h1 style="text-align: center; font-weight: bolder">
    Regularización
</h1>

Consiste en reducir la complejidad del modelo a través de una penalización aplicada a sus variables más irrelavantes.

## **Tipos de regularización**

- **L1 Lasso** Reducir la complejidad a través de la eliminación de featurees que no aportan demasiado al modelo. Es una buena alternativa cuando hay pocos features que se relacionan directamente con la variable a predecir.

- **L2 Ridge** Reducir la complejidad disminuyendo el impacto de ciertos features a nuestro modelo. Es una buena alternativa cuando hay varios features relacionados con la variable a predecir.

- **ElasticNet** Es una combinación de L1 Lasso y L2 Ridge.

## **Librerias**

In [2]:
import pandas as pd
import numpy as np

In [41]:
import sklearn

from sklearn.linear_model import LinearRegression, Lasso, Ridge, ElasticNet
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

## **Datos**

### **1. Cargue de los datos**

In [6]:
df = pd.read_csv('data/felicidad.csv')

In [8]:
df.sample()

Unnamed: 0,country,rank,score,high,low,gdp,family,lifexp,freedom,generosity,corruption,dystopia
27,Uruguay,28,6.454,6.545906,6.362094,1.21756,1.412228,0.719217,0.579392,0.175097,0.178062,2.17241


### **2. Preparamos nuestros datos**

In [12]:
features = df[['gdp', 'family', 'lifexp', 'freedom', 'corruption', 'generosity', 'dystopia']].copy()
target = df[['score']].copy()

In [16]:
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.25, random_state=13)

### **3. Modelo de Regresión Lineal**

In [18]:
# Instanciamos el modelo
linear_model = LinearRegression()

In [19]:
# Entrenamos el modelo
linear_model.fit(X_train, y_train)

LinearRegression()

In [22]:
# Realizamos nuestra predicción
y_linear_pred = linear_model.predict(X_test)

In [38]:
# Evaluamos el modelo
linear_loss = mean_squared_error(y_test, y_linear_pred)
linear_loss

1.112802039936069e-07

#### **Modelo de Regresión Lineal - Lasso**

In [29]:
# Instanciamos el modelo (Mientras mayor sea alpha, mayor sera la penalización)
lasso_model = Lasso(alpha=0.02)

In [30]:
# Entrenamos el modelo
lasso_model.fit(X_train, y_train)

Lasso(alpha=0.02)

In [31]:
# Realizamos nuestra predicción
y_lasso_pred = lasso_model.predict(X_test)

In [39]:
# Evaluamos el modelo
lasso_loss = mean_squared_error(y_test, y_lasso_pred)
lasso_loss

0.03468350926957627

#### **Modelo de Regresión Lineal - Ridge**

In [33]:
# Instanciamos el modelo
ridge_model = Ridge(alpha=1)

In [34]:
# Entrenamos el modelo
ridge_model.fit(X_train, y_train)

Ridge(alpha=1)

In [35]:
# Realizamos nuestra predicción
y_ridge_pred = ridge_model.predict(X_test)

In [40]:
# Evaluamos el modelo
ridge_loss = mean_squared_error(y_test, y_ridge_pred)
ridge_loss

0.00450331722342369

#### **Modelo de Regresión Lineal - ElasticNet**

In [42]:
# Instanciamos el modelo
elasticnet_model = ElasticNet()

In [43]:
# Entrenamos el modelo
elasticnet_model.fit(X_train, y_train)

ElasticNet()

In [44]:
# Realizamos nuestra predicción
y_elasticnet_pred = elasticnet_model.predict(X_test)

In [45]:
# Evaluamos el modelo
elasticnet_loss = mean_squared_error(y_test, y_elasticnet_pred)
elasticnet_loss

1.351971311197073