# Imports básicos

In [1]:
from sklearn import datasets
from sklearn.linear_model import Ridge, Lasso, ElasticNet
from sklearn.model_selection import cross_val_score

In [2]:
boston = datasets.load_boston()

# Descrição do Dataset

In [3]:
print(boston.DESCR)

.. _boston_dataset:

Boston house prices dataset
---------------------------

**Data Set Characteristics:**  

    :Number of Instances: 506 

    :Number of Attributes: 13 numeric/categorical predictive. Median Value (attribute 14) is usually the target.

    :Attribute Information (in order):
        - CRIM     per capita crime rate by town
        - ZN       proportion of residential land zoned for lots over 25,000 sq.ft.
        - INDUS    proportion of non-retail business acres per town
        - CHAS     Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)
        - NOX      nitric oxides concentration (parts per 10 million)
        - RM       average number of rooms per dwelling
        - AGE      proportion of owner-occupied units built prior to 1940
        - DIS      weighted distances to five Boston employment centres
        - RAD      index of accessibility to radial highways
        - TAX      full-value property-tax rate per $10,000
        - PTRATIO  pu

# Separação dos dados

In [4]:
X = boston.data
y = boston.target

# Forma básica dos modelos

Os modelos que veremos a seguir necessitam receber o hiperparâmetro alpha ($\alpha$), que foi apresentado no texto.



## Ridge

In [5]:
# definição da regressão por Ridge com alpha = 1
ridge_regr = Ridge(alpha=1)
score_ridge = cross_val_score(ridge_regr, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_ridge.mean())

-34.07824620925938


## Lasso

In [6]:
# definição da regressão de Lasso com alpha = 0.1
lasso_regr = Lasso(alpha=0.1)
score_lasso = cross_val_score(lasso_regr, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_lasso.mean())

-34.17996192308159


## ElasticNet

In [7]:
# definição da regressão por ElasticNet com alpha = 1 e l1_ratio = 0.5
en_regr = ElasticNet(alpha=1, l1_ratio=0.5)
score_en = cross_val_score(en_regr, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_en.mean())

-31.164573714249762


# Escolha automátizada dos hiperparâmtros com validação cruzada

Usando os métodos acima temos que enfrentar o problema de obter os hiperparâmetros ótimos para o problema. Porém, é possível usar validação cruzada para determiná-los.

In [8]:
from sklearn.linear_model import RidgeCV, LassoCV, ElasticNetCV

## [RidgeCV](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RidgeCV.html#sklearn.linear_model.RidgeCV)

In [9]:
regr_ridgeCV = RidgeCV(cv=10)
score_ridge = cross_val_score(regr_ridgeCV, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_ridge.mean())

-33.60560958359869


In [10]:
# Valor encontrado por validação cruzada
regr_ridgeCV.fit(X, y)
regr_ridgeCV.alpha_

10.0

## [LassoCV](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LassoCV.html#sklearn.linear_model.LassoCV)

In [11]:
regr_lassoCV = LassoCV(cv=10, eps=1e-4)
score_lasso = cross_val_score(regr_lassoCV, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_lasso.mean())

-33.7098803600206


In [12]:
# Valor encontrado por validação cruzada
regr_lassoCV.fit(X, y)
regr_lassoCV.alpha_

0.5612021341578892


## [ElasticNetCV](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ElasticNetCV.html#sklearn.linear_model.ElasticNetCV)

In [13]:
regr_enCV = ElasticNetCV(l1_ratio=0.5, cv=10, eps=1e-4)
score_en = cross_val_score(regr_enCV, X, y, cv=10, scoring="neg_mean_squared_error")
print(score_en.mean())

-33.735162042260114


In [14]:
# Valores encontrado por validação cruzada
regr_enCV.fit(X, y)
regr_enCV.alpha_, regr_enCV.l1_ratio_

(0.4382691496523373, 0.5)