<a href="https://colab.research.google.com/github/OpenMindPB/BasicPython/blob/main/LinearRegression/linear_models_normal_lasso_ridge_elasticnet_random_case.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
from sklearn import linear_model
from sklearn.metrics import r2_score
import numpy as np
import pandas as pd

In [2]:
# neste exemplo tem duas colunas de variaveis independentes repetidas 
# o modelo é y = x (caso exclua a variável repetida) e y = 0.5*x1+0.5*x2 (sem excluir)
# o código mostra que o método regressao lasso (l1) consegue excluir uma das
# variáveis ou seja além de regressão também atua na seleção de variáveis
# já a regressão ridge (l2) não fez esta seleção

In [3]:
# generate an independent variable 
x = np.linspace(-10, 30, 100)
# generate a normally distributed residual
e = np.random.normal(5, 10, 100)
# generate ground truth
y = 10 + 100*x + e
df = pd.DataFrame({'x1':x,'x2':x, 'y':y})
df.head()

Unnamed: 0,x1,x2,y
0,-10.0,-10.0,-995.237571
1,-9.59596,-9.59596,-960.759322
2,-9.191919,-9.191919,-895.728532
3,-8.787879,-8.787879,-851.389362
4,-8.383838,-8.383838,-827.005651


In [4]:
X=np.array(df[['x1','x2']])
y = np.array(df['y'])
y_test = np.copy(y)

In [5]:
# modelo de regressão tradicional
reg = linear_model.LinearRegression()
reg.fit(X, y)
y_pred = reg.predict(X)
print(reg.coef_)
print(reg.intercept_)
print(r2_score(y_test, y_pred))

[50.07256063 50.07256063]
12.787407115455721
0.9999455851382101


In [6]:
# modelo de regressão lasso
# note que ele forneceu apenas uma das varávies (a outra tem coef angular zero)
reg_lasso = linear_model.Lasso(alpha=0.1)
reg_lasso.fit(X,y)
y_pred = reg_lasso.predict(X)

print('coeficientes angulares=',reg_lasso.coef_)
print('coeficiente linear=',reg_lasso.intercept_)
print('r^2=',r2_score(y_test, y_pred))

coeficientes angulares= [100.14438612   0.        ]
coeficiente linear= 12.794758600604041
r^2= 0.9999455850843252


In [7]:
# modelo de regressão ridge
# note que ele forneceu as duas varávies 
reg_ridge = linear_model.Ridge(alpha=1)
reg_ridge.fit(X, y)
y_pred = reg_ridge.predict(X)

print('coeficientes angulares=',reg_ridge.coef_)
print('coeficiente linear=',reg_ridge.intercept_)
print('r^2=',r2_score(y_test, y_pred))

coeficientes angulares= [50.07072016 50.07072016]
coeficiente linear= 12.824216531019943
r^2= 0.9999455837872746


In [8]:
# modelo de regressão elasticNet considerando l1_ration = 0.5
# obs: l2_ratio = 1 -l1_ration
# note que ele forneceu as duas varávies com pesos difentes para 
# este caso específico
reg_ElasticNet = linear_model.ElasticNet(alpha=0.1,l1_ratio =0.5)
reg_ElasticNet.fit(X, y)
y_pred = reg_ElasticNet.predict(X)

print('coeficientes angulares=',reg_ElasticNet.coef_)
print('coeficiente linear=',reg_ElasticNet.intercept_)
print('r^2=',r2_score(y_test, y_pred))

coeficientes angulares= [74.07724315 26.05793231]
coeficiente linear= 12.88686510923526
r^2= 0.9999455752755024


  coef_, l1_reg, l2_reg, X, y, max_iter, tol, rng, random, positive
