---
# SGD Regression


A maioria dos aplicativos de aprendizado de máquina / aprendizado profundo usa uma variante de descida de gradiente chamada descida de gradiente estocástico (SGD), na qual, em vez de atualizar parâmetros com base na derivada do conjunto de dados em cada etapa, você atualiza com base na derivada de uma amostra escolhida aleatoriamente . Além de ser menos tributável computacionalmente, a pesquisa mostrou que a aleatoriedade envolvida no SGD permite convergir e superar os mínimos locais mais rapidamente.

---

In [2]:
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns
import os
import random
from sklearn.model_selection import train_test_split
RANDOM_SEED = 42
np.random.seed(RANDOM_SEED)



In [2]:
os.getcwd()

'C:\\Users\\User\\Desktop\\2ºsemestre\\Ciência dos dados\\Proj3\\CD_Projeto3'

In [3]:
RANDOM_SEED = 42
np.random.seed(RANDOM_SEED)

In [4]:
dados = pd.read_excel("HappinessAlcoholConsumption.xls")

In [5]:
X =  dados[['HDI', 'GDP_PerCapita', 'Beer_PerCapita', 'Spirit_PerCapita', 'Wine_PerCapita']]
y = dados["HappinessScore"]

In [6]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=RANDOM_SEED)


## Testando códigos do livro!!

In [12]:
from sklearn.linear_model import SGDRegressor

In [13]:
sgd_reg = SGDRegressor(n_iter=1000000, penalty="l2", eta0=0.1)

In [26]:
model = sgd_reg.fit(X_train, y_train)



In [22]:
sgd_reg.intercept_, sgd_reg.coef_

(array([6.35955528e+10]),
 array([-3.15510177e+11,  2.84326854e+11, -4.52968065e+11, -9.15374514e+11,
        -3.60542642e+11]))

In [23]:
sgd_reg.predict([[0,0,0,0,0]])

array([6.35955528e+10])

# Teste

In [25]:
sgd_reg.predict(X_test)

array([-5.82867131e+14, -4.48590496e+14, -5.34881116e+14, -8.27230148e+12,
       -5.53073627e+14, -3.00532453e+14, -5.58260741e+14, -2.46674817e+14,
       -5.15609032e+14, -5.44342073e+14, -6.64367255e+14,  3.91068057e+13,
       -3.68897741e+14])

In [27]:
model.predict(X_test)

array([5.17932739e+14, 4.58863272e+14, 4.25606608e+14, 2.52111147e+14,
       5.51082371e+14, 3.44425000e+14, 5.05027621e+14, 2.86157033e+14,
       3.90521158e+14, 5.26336970e+14, 5.56206917e+14, 3.30440009e+14,
       4.57941870e+14])

In [75]:
y_train

90     4.574
109    3.956
11     7.119
76     5.151
56     5.743
115    3.739
0      7.526
26     6.573
44     5.976
66     5.389
98     4.272
24     6.650
42     5.987
105    4.121
93     4.362
36     6.218
100    4.236
12     7.104
15     6.952
72     5.177
22     6.705
116    3.695
91     4.513
83     5.033
30     6.478
77     5.145
65     5.488
9      7.291
33     6.361
25     6.596
       ...  
75     5.155
32     6.375
114    3.763
59     5.560
63     5.517
101    4.219
37     6.168
29     6.481
108    3.974
1      7.509
52     5.822
21     6.725
2      7.501
23     6.701
103    4.193
99     4.252
87     4.795
110    3.916
74     5.161
86     4.871
82     5.045
121    3.069
20     6.739
60     5.546
71     5.185
106    4.073
14     6.994
92     4.459
51     5.835
102    4.217
Name: HappinessScore, Length: 109, dtype: float64

# Fazendo a análise com IDH

Como a SGD Regression feita com a HDI, GDP_PerCapit, Beer_PerCapita, Spirit_PerCapita, Wine_PerCapita, com a saida sendo o happiness não resultou dados coerentes.

Este proeblema, talvez seja devido a falta de relação entre os dados de entrada e a saída. Para confirmar a análise agora será feita com a entreda sendo o IDH e a saída happiness

In [28]:
X2 =  dados[['HDI']]
y2 = dados["HappinessScore"]

In [29]:
X2_train, X2_test, y2_train, y2_test = train_test_split(X2, y2, test_size=0.1, random_state=RANDOM_SEED)

In [30]:
from sklearn.linear_model import SGDRegressor

In [35]:
sgd_reg2 = SGDRegressor(n_iter=1000000, penalty="l2", eta0=0.1)

In [41]:
model2 = sgd_reg2.fit(X2_train, y2_train)



In [42]:
sgd_reg2.intercept_, sgd_reg2.coef_

(array([1.19598102e+11]), array([-4.763729e+11]))

In [45]:
sgd_reg2.predict(X2_test)

array([-4.30521504e+14, -3.37628788e+14, -3.79549603e+14, -1.96622410e+14,
       -4.37190724e+14, -3.23337601e+14, -3.84313332e+14, -2.36161360e+14,
       -3.56207331e+14, -4.25757775e+14, -4.07179232e+14, -2.43783327e+14,
       -4.29568758e+14])

In [46]:
model2.predict(X2_test)

array([-4.30521504e+14, -3.37628788e+14, -3.79549603e+14, -1.96622410e+14,
       -4.37190724e+14, -3.23337601e+14, -3.84313332e+14, -2.36161360e+14,
       -3.56207331e+14, -4.25757775e+14, -4.07179232e+14, -2.43783327e+14,
       -4.29568758e+14])

## A hipótese estava errada

Dado que pelas demais regressões, por exemplo a regressão linear, o IDH tinha ata influência no happiness, e mesmo com essa análise o resultado ainda é incoerente, portando o problema nessa técnica não é a falta de relação entre as varieáveis