# Aprendizagem de Máquina I

## Hugo Tremonte de Carvalho

#### hugo@dme.ufrj.br

Esta aula é inspirada no Ex. 10 do Cap. 6 de [ITSL], e tem como objetivo estudar, em dados sintéticos, o comportamento dos procedimentos de seleção de modelos que vimos em sala (Lasso, Ridge e Elastic Net).

## Parte 1

a) Gere um conjunto de dados $\mathbf{X}$ com $p = 20$ atributos e $n = 1.000$ observações. Após isso, gere um vetor de variáveis respostas de acordo com a equação $$\mathbf{Y} = \mathbf{X}\boldsymbol{\beta} + \varepsilon,$$ onde o vetor $\boldsymbol{\beta}$ contém a maioria das entradas iguais a zero.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from sklearn.metrics import mean_squared_error as MSE
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.linear_model import LinearRegression, Ridge, Lasso, ElasticNet

In [None]:
n = 1000
p = 20
dom_range = 10
err_stdv = 100

X = dom_range*np.random.random(size = (n, p))
epsl = np.random.normal(loc = 0, scale = err_stdv, size = n)
beta = np.array([0, 0, 0, 8, 0, -1, 0, 0, 0, 0, -3, 0, 7, 0, 18, 0, 0, 5, 0, -15])
y = X@beta + epsl

In [None]:
plt.scatter(X[:,3], y)

b) Divida seu conjunto em treinamento e teste, com proporção de 90% e 10%, respectivamente.

In [None]:
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size = 0.1)

c) Estude o *help* das funções `LinearRegression`, `Lasso`, `Ridge` e `ElasticNet` do `scikit-learn`.

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Ridge.html

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ElasticNet.html

d) Ajuste modelos, escolhendo os hiperparâmetros a priori, através das funções `LinearRegression`, `Lasso`, `Ridge` e `ElasticNet`. Compare os resultados para os $\boldsymbol{\beta}$ obtidos.

In [None]:
LinReg = LinearRegression()
Las = Lasso()
Rid = Ridge()
ElaNet = ElasticNet()

In [None]:
LinReg.fit(X_tr, y_tr)
Las.fit(X_tr, y_tr)
Rid.fit(X_tr, y_tr)
ElaNet.fit(X_tr, y_tr)

In [None]:
fig, ax = plt.subplots(figsize = (15,10))
plt.stem(beta, markerfmt = 'kx', label = 'Verdadeiro')
plt.stem(LinReg.coef_, markerfmt = 'b*', label = 'LinReg')
plt.stem(Las.coef_, markerfmt = 'cd', label = 'Lasso')
plt.stem(Rid.coef_, markerfmt = 'gp', label = 'Ridge')
plt.stem(ElaNet.coef_, markerfmt = 'm.', label = 'ElasticNet')
plt.legend()

e) Faça as previsões com os modelos treinados acima no conjunto de teste, e calcule o MSE. Calcule também o MSE para o conjunto de treinamento.

In [None]:
y_tr_pred_LinReg = LinReg.predict(X_tr)
y_tr_pred_Las = Las.predict(X_tr)
y_tr_pred_Rid = Rid.predict(X_tr)
y_tr_pred_ElaNet = ElaNet.predict(X_tr)

y_te_pred_LinReg = LinReg.predict(X_te)
y_te_pred_Las = Las.predict(X_te)
y_te_pred_Rid = Rid.predict(X_te)
y_te_pred_ElaNet = ElaNet.predict(X_te)

In [None]:
MSE_tr_LinReg = MSE(y_tr_pred_LinReg, y_tr)
MSE_tr_Las = MSE(y_tr_pred_Las, y_tr)
MSE_tr_Rid = MSE(y_tr_pred_Rid, y_tr)
MSE_tr_ElaNet = MSE(y_tr_pred_ElaNet, y_tr)

MSE_te_LinReg = MSE(y_te_pred_LinReg, y_te)
MSE_te_Las = MSE(y_te_pred_Las, y_te)
MSE_te_Rid = MSE(y_te_pred_Rid, y_te)
MSE_te_ElaNet = MSE(y_te_pred_ElaNet, y_te)

In [None]:
print(MSE_tr_LinReg)
print(MSE_tr_Las)
print(MSE_tr_Rid)
print(MSE_tr_ElaNet)

In [None]:
print(MSE_te_LinReg)
print(MSE_te_Las)
print(MSE_te_Rid)
print(MSE_te_ElaNet)

## Parte 2

f) Agora, vamos encontrar o "melhor" valor do hiperparâmetro referente às penalizações acima e repetir as comparações que realizamos. Para isso, primeiramente, familiarize-se com a função `GridSearchCV`, lendo a sua documentação aqui: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html.

g) Implemente a busca em grade da função `GridSearchCV` para o `Lasso`, `Ridge` e `ElasticNet` e encontre os hiperparâmetros ótimos, dentro da grade que você definiu.

h) Compare os $\boldsymbol{\beta}$ obtidos com esses procedimentos com os $\boldsymbol{\beta}$ obtidos anteriormente.

i) Faça as previsões com os novos modelos no conjunto de teste, e calcule o MSE. Calcule também o MSE para o conjunto de treinamento. Compare com o resultado obtido no item e).