# **REDES NEURAIS ARTIFICIAIS: REGRESSÃO**

Este projeto tem por objetivo desenvolver um algoritmo de Machine Learning para prever o valor do preço médio de casas em Boston. 

Os dados foram extraídos do site do Kaggle:

https://www.kaggle.com/schirmerchad/bostonhoustingmlnd

In [1]:
import numpy as np
import pandas as pd

In [2]:
df = pd.read_csv('/content/drive/MyDrive/Cursos_Udemy/Machine_Learning_com_Python/housing.csv',
                    sep=',', encoding='iso-8859-1')

In [3]:
df.head()

**Atributos previsores**

RM: é o número médio de cômodos entre os imóveis no bairro.

LSTAT: é a porcentagem de proprietários no bairro considerados de "classe baixa" (proletariado).

PTRATIO: é a razão entre estudantes e professores nas escolas de ensino fundamental e médio no bairro.

**Variável alvo**

MEDV: valor médio das casas

In [4]:
df.shape

In [5]:
independente = df.iloc[:, 0:3].values
independente

In [6]:
independente.shape

In [7]:
dependente = df.iloc[:, 3].values

In [8]:
dependente.shape

## **TREINAMENTO**

In [10]:
from sklearn.model_selection import train_test_split
x_treino, x_teste, y_treino, y_teste = train_test_split(independente, dependente, test_size = 0.3, random_state = 0)

In [11]:
x_treino.shape, x_teste.shape

In [12]:
from sklearn.neural_network import MLPRegressor

In [82]:
redes = MLPRegressor(hidden_layer_sizes=(100, 100), activation='relu', verbose=True, max_iter=2000,
                    solver='lbfgs', random_state = 12)

In [83]:
redes.fit(x_treino, y_treino)

In [84]:
redes.n_layers_

In [85]:
redes.score(x_treino, y_treino)

## **TESTE**

In [86]:
redes.score(x_teste, y_teste)

In [87]:
previsoes_teste = redes.predict(x_teste)

## **MÉTRICAS**

In [19]:
from sklearn.metrics import mean_absolute_error, mean_squared_error

In [88]:
# Erro médio Absoluto
mean_absolute_error(y_teste, previsoes_teste)

In [89]:
# Raiz do erro quadrático médio (RMSE)
np.sqrt(mean_squared_error(y_teste, previsoes_teste))

### **Validação Cruzada**

In [90]:
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score

In [91]:
# Separando os dados em folds
kfold = KFold(n_splits = 12, shuffle=True, random_state = 5)

In [92]:
# Criando o modelo
from sklearn.neural_network import MLPRegressor
modelo = MLPRegressor(hidden_layer_sizes=(100, 100), activation='relu', verbose=True, max_iter=2000,
                    solver='lbfgs', random_state = 12)
resultado = cross_val_score(modelo, independente, dependente, cv = kfold)
resultado

In [93]:
# Usamos a média e o desvio padrão
print("Acurácia Média: %.2f%%" % (resultado.mean() * 100.0))

## **RESULTADOS**

**REGRESSÃO LINEAR SIMPLES:** R^2 = 0,57/0,60; RMSE = 99315,5; R^2 Validação Cruzada: 55,97%

**REGRESSÃO LINEAR MÚLTIPLA:** R^2 = 0,73/0,68; RMSE = 96087,3; R^2 Validação Cruzada: 69,25%

**REGRESSÃO POLINOMIAL:** R^2 = 0,59/0,54; RMSE = 114670,6.

**REGRESSÃO SVR:** R^2 = 0,87/0,81; RMSE = 73422,7. R^2 Validação Cruzada: 82,37%.

**REGRESSÃO ÁRVORE DE DECISÃO:** R^2 = 0,91/0,83; RMSE = 71114,5. R^2 Validação Cruzada: 74,60%.

**REGRESSÃO COM RANDOM FOREST:** R^2 = 0,92/0,85; RMSE = 66729,3. R^2 Validação Cruzada: 82,85%.

**REGRESSÃO COM XGBOOST:** R^2 = 0,93/0,84; RMSE = 67788,8. R^2 Validação Cruzada: 83,22%.

**REGRESSÃO COM LIGHT GBM:** R^2 = 0,88/0,82; RMSE = 71906,4. R^2 Validação Cruzada: 82,38%.

**REGRESSÃO COM CATBOOST:** R^2 = 0,90/0,84; RMSE = 69053,3 R^2 Validação Cruzada: 83,40%.

**REGRESSÃO COM REDES NEURAIS:** R^2 = 0,88/0,83; RMSE = 69717,4. R^2 Validação Cruzada: 77,15%. Escalonado.

## **Padronização de escala**

In [94]:
from sklearn.preprocessing import StandardScaler
x_scaler = StandardScaler()
x_treino_scaler = x_scaler.fit_transform(x_treino)

In [95]:
x_treino_scaler

In [134]:
y_scaler = StandardScaler()
y_treino_scaler = y_scaler.fit_transform(y_treino.reshape(-1,1))

In [None]:
y_treino_scaler

In [None]:
x_teste_scaler = x_scaler.transform(x_teste)
x_teste_scaler

In [None]:
y_teste_scaler = y_scaler.transform(y_teste.reshape(-1,1))
y_teste_scaler

In [153]:
redes = MLPRegressor(hidden_layer_sizes=(6,6,6), activation='relu', verbose=True, max_iter=1500,
                    solver='lbfgs', random_state = 12)

In [154]:
redes.fit(x_treino_scaler, y_treino_scaler.ravel())

In [155]:
redes.n_layers_

In [156]:
redes.score(x_treino_scaler, y_treino_scaler)

**TESTE**

In [157]:
redes.score(x_teste_scaler, y_teste_scaler)

In [158]:
previsoes_teste_scaler = redes.predict(x_teste_scaler)

In [None]:
previsoes_teste_scaler

## **MÉTRICAS**

**Revertendo a transformação**

In [None]:
previsoes_teste_scaler

In [176]:
previsoes_teste_inverse = y_scaler.inverse_transform(previsoes_teste_scaler.reshape(-1,1))

In [None]:
previsoes_teste_inverse

In [None]:
y_teste

In [160]:
from sklearn.metrics import mean_absolute_error, mean_squared_error

In [180]:
# Erro médio Absoluto
mean_absolute_error(y_teste, previsoes_teste_inverse)

In [181]:
# Raiz do erro quadrático médio (RMSE)
np.sqrt(mean_squared_error(y_teste, previsoes_teste_inverse))

**Revertendo a transformação**

In [163]:
x_treino_inverse = x_scaler.inverse_transform(x_treino_scaler)

In [None]:
x_treino_inverse

In [None]:
x_treino

In [166]:
y_treino_inverse = y_scaler.inverse_transform(y_treino_scaler)

In [None]:
y_treino_inverse

In [168]:
x_teste_inverse = x_scaler.inverse_transform(x_teste_scaler)

In [None]:
x_teste_inverse

In [170]:
y_teste_inverse = y_scaler.inverse_transform(y_teste_scaler)

In [None]:
y_teste_inverse

In [None]:
y_teste

# **DESAFIO 4**

DESENVOLVER UM ALGORITMO DE REDES NEURAIS ARTFICIAIS DE REGRESSÃO PARA DATASET DO LINK A SEGUIR:

https://www.kaggle.com/mirichoi0218/insurance/code