# Regressão com Redes Neurais

Esse Jupyter é uma adaptação de https://scikit-learn.org/stable/auto_examples/compose/plot_transformed_target.html

## Introdução


Qua a diferença entre um problema de Classificação e Regressão?

"O problema de classificação ocorre quando a variável alvo possui valores categóricos. Por outro lado, a regressão ocorre quando a variável alvo é contínua." Source: https://www.researchgate.net/publication/352749819_Ciencia_dos_Dados_pelo_Processo_de_KDD


## Gerandando a base de dados

In [None]:
from sklearn.datasets import make_regression
import numpy as np

X, y = make_regression(n_samples=10000, noise=100, random_state=0)

y = np.expm1((y + abs(y.min())) / 200)

## Treinando ANN no Keras

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)


In [None]:
# Normalizar
from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test  = scaler.transform(X_test)

In [None]:
from keras.models  import Sequential
from keras.layers import InputLayer, Dense
from keras.optimizers import adam_v2

In [None]:
# Criar o modelo

input_neuron, hidden_neuron, output_neuron = 100, 3, 1

mlp = Sequential([                  
    InputLayer(input_neuron),
    Dense(hidden_neuron, activation="relu"),
    Dense(output_neuron)
])

In [None]:
# Usar a função summary()
mlp.summary()

In [None]:
# Compile o modelo
mlp.compile(optimizer="adam", loss="mse")

In [None]:
# Treine o modelo
batch_size = 16
Log = mlp.fit(X_train, y_train, batch_size=batch_size, epochs=50)

## Medidas Desempenho

* **r2_score**(y_test, y_pred)

* **median_absolute_error**(y_test, y_pred)

* **Gráfico de Dispersão**

In [None]:
import matplotlib
import matplotlib.pyplot as plt
from sklearn.metrics import median_absolute_error, r2_score

y_pred = mlp.predict(X_test)

r2 = r2_score(y_test, y_pred)

mae = median_absolute_error(y_test, y_pred)

# Plot results
ax0 = plt.axes()

ax0.scatter(y_test, y_pred)
ax0.plot([0, 2000], [0, 2000], '--k')
ax0.set_ylabel('Target predicted')
ax0.set_xlabel('True Target')
ax0.set_title('Sem transformação logarítmica do alvo')
ax0.text(100, 1750, r'$R^2$=%.2f, MAE=%.2f' % (
    r2, mae))
ax0.set_xlim([0, 2000])
ax0.set_ylim([0, 2000])

## Importância do log

A função logarítmica é usada para linearizar os alvos, permitindo uma melhor previsão. 

In [None]:
y_trans = np.log1p(y)

In [None]:
import matplotlib
import matplotlib.pyplot as plt

f, (ax0, ax1) = plt.subplots(1, 2)

ax0.hist(y, bins=100, density=True)
ax0.set_xlim([0, 2000])
ax0.set_ylabel('Probability')
ax0.set_xlabel('Target')
ax0.set_title('Target distribution')

ax1.hist(y_trans, bins=100, density=True)
ax1.set_ylabel('Probability')
ax1.set_xlabel('Target')
ax1.set_title('Transformed target distribution')

f.suptitle("Synthetic data", y=0.06, x=0.53)
f.tight_layout(rect=[0.05, 0.05, 0.95, 0.95])



# Treinando com o Log

In [None]:
y_train = np.log1p(y_train)

In [None]:
Log = mlp.fit(X_train, y_train, batch_size=batch_size, epochs=50)

In [None]:
from sklearn.metrics import median_absolute_error, r2_score

y_pred = np.expm1(mlp.predict(X_test))

r2 = r2_score(y_test, y_pred)

mae = median_absolute_error(y_test, y_pred)

# Plot results
ax0 = plt.axes()

ax0.scatter(y_test, y_pred)
ax0.plot([0, 2000], [0, 2000], '--k')
ax0.set_ylabel('Target predicted')
ax0.set_xlabel('True Target')
ax0.set_title('Sem transformação logarítmica do alvo')
ax0.text(100, 1750, r'$R^2$=%.2f, MAE=%.2f' % (
    r2, mae))
ax0.set_xlim([0, 2000])
ax0.set_ylim([0, 2000])