![](./images/regularizacion1.png)

![](./images/regularizacion2.png)

![](./images/regularizacion3.png)

In [3]:
# Importar librerias
import pandas as pd 
import sklearn

from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Lasso
from sklearn.linear_model import Ridge

from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

In [5]:
# Agregamos el dataset
dataset = pd.read_csv('./documents/felicidad.csv')
dataset.head()

Unnamed: 0,country,rank,score,high,low,gdp,family,lifexp,freedom,generosity,corruption,dystopia
0,Norway,1,7.537,7.594445,7.479556,1.616463,1.533524,0.796667,0.635423,0.362012,0.315964,2.277027
1,Denmark,2,7.522,7.581728,7.462272,1.482383,1.551122,0.792566,0.626007,0.35528,0.40077,2.313707
2,Iceland,3,7.504,7.62203,7.38597,1.480633,1.610574,0.833552,0.627163,0.47554,0.153527,2.322715
3,Switzerland,4,7.494,7.561772,7.426227,1.56498,1.516912,0.858131,0.620071,0.290549,0.367007,2.276716
4,Finland,5,7.469,7.527542,7.410458,1.443572,1.540247,0.809158,0.617951,0.245483,0.382612,2.430182


In [6]:
# Dividimos las features y el target de nuestro dataset
X = dataset[['gdp', 'family', 'lifexp', 'freedom', 'corruption', 'generosity', 'dystopia']]
Y = dataset[['score']]

print(X.shape)
print(Y.shape)

(155, 7)
(155, 1)


In [7]:
# Dividimos el dataset en datos de entrenamiento y de prueba
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.25)

In [14]:
# Creamos nuestro modelo regresor lineal
modelLinear = LinearRegression().fit(X_train, Y_train)
# Prediccion 
y_predict_linear = modelLinear.predict(X_test)

In [15]:
# Creamos nuestro modelo regresor lasso
modelLasso = Lasso(alpha=0.02).fit(X_train, Y_train)
# Prediccion 
y_predict_lasso = modelLasso.predict(X_test)

In [16]:
# Creamos nuestro modelo regresor ridge
modelRidge = Ridge(alpha=1).fit(X_train, Y_train)
# Prediccion 
y_predict_ridge = modelRidge.predict(X_test)

In [17]:
# Obtener la perdida del modelo lineal
linear_loss = mean_squared_error(Y_test, y_predict_linear)
print('Perdida lineal: ', linear_loss)

Perdida lineal:  6.274884576073594e-08


In [18]:
# Obtener la perdida del modelo lasso
lasso_loss = mean_squared_error(Y_test, y_predict_lasso)
print('Perdida lasso: ', lasso_loss)

Perdida lasso:  0.04071778626013754


In [19]:
# Obtener la perdida del modelo ridge
ridge_loss = mean_squared_error(Y_test, y_predict_ridge)
print('Perdida ridge: ', ridge_loss)

Perdida ridge:  0.00533479979288854


In [20]:
# Mostrar los coeficinetes de los modelos
print('Coeficientes Lasso: ', modelLasso.coef_)
print('Coeficientes Ridge: ', modelRidge.coef_)

Coeficientes Lasso:  [1.25292847 0.86295476 0.55046176 0.83287726 0.         0.23860983
 0.89899487]
Coeficientes Ridge:  [[1.06915443 0.94916303 0.87554229 0.91008067 0.62561819 0.76420966
  0.96069981]]


## Actualizacion: Implementando regularizacion ElasticNet

Es común encontrarnos en la literatura con un camino intermedio llamado ElasticNet. Esta técnica consiste en combinar las dos penalizaciones anteriores en una sola función. Así, nuestra ecuación de optimización quedará:

![](./images/elasticnet.png)

Donde tenemos ahora un parámetro adicional 𝛂 que tiene un rango de valores entre 0 y 1. Si 𝛂 = 0 , ElasticNet se comportará como Ridge, y si 𝛂 = 1 , se comportará como Lasso. Por lo tanto, nos brinda todo el espectro lineal de posibles combinaciones entre estos dos extremos.

1. Tenemos una forma de probar ambas L1 y L2 al tiempo sin perder información.
2. Supera las limitaciones individuales de ellas.
3. Si hace falta experiencia, o el conocimiento matemático de fondo, puede ser la opción preferente para probar la regularización.

In [4]:
# Importando librerias necesarias para la implementacion de esta regularizacion

from sklearn.linear_model import ElasticNet

In [8]:
# Creamos nuestro modelo regresor lasso
modelElasticNet = ElasticNet(random_state=0).fit(X_train, Y_train)
# Prediccion
y_pred_elastic = modelElasticNet.predict(X_test)

In [9]:
# Obtener la perdida del modelo ElasticNet
elastic_loss = mean_squared_error(Y_test, y_pred_elastic)
print('ElasticNet Loss: ', elastic_loss)

ElasticNet Loss:  1.052633403945417


In [10]:
print('Coeficientes ElasticNet: ', modelElasticNet.coef_)

Coeficientes ElasticNet:  [0. 0. 0. 0. 0. 0. 0.]
