In [None]:
# Importando todas as bibliotecas necessárias
import numpy as np
from numpy.polynomial.polynomial import polyfit
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error

%matplotlib inline

### Importando o banco de dados

In [None]:
dados = pd.read_csv('BD 1.csv', sep=';')
dados.drop(['Temperatura_ensaio',
                    'Temperatura_AISWEB', 
                     'Umidade_ensaio', 
                     'Operacoes_anual',
                     'Operacoes_medicoes'], 
                     axis=1,
                     inplace=True)

### Separando o conjunto de dados de entrada, X, e de saída, Y

In [None]:
X = dados.loc[:, ['Distancia', 'Macrotextura', 'Lado', 'Remocao', 'Idade_pavimento_meses', 'Umidade_AISWEB', 'Operacoes_remocoes']]
Y = dados['Coeficiente de atrito']

### Dividindo os conjuntos de dados entre 90% para Treinamento e 10% para Teste

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0)
print('Shape X_train:', X_train.shape) # Imprime a matriz dos dados de entrada de treinamento
print('Shape X_test:', X_test.shape) # Imprime a matriz dos dados de saída de treinamento
print('Shape y_train:', y_train.shape) # Imprime a matriz dos dados de entrada de teste
print('Shape y_test:', y_test.shape)  # Imprime a matriz dos dados de saída de teste

### Pré-processando os dados de entrada utilizando o pré-processamento Standard Scaler

In [None]:
scaler_x = StandardScaler()
scaler_x.fit(X_train) # Ajustando os dados para a média e desvio padrão do conjunto de teste
X_train = pd.DataFrame(scaler_x.transform(X_train), columns=X.columns) # Aplicando a transformação no conjunto de treinamento
X_test = pd.DataFrame(scaler_x.transform(X_test), columns=X.columns) # O conjunto de teste é pré-processado de acordo com o conjunto de treinamento

### Estatística descritiva do conjunto de treinamento

In [None]:
X_train.describe().round(2)

### Estatística descritiva do conjunto de teste

In [None]:
X_test.describe().round(2)

# Rede Neural Artificial

In [None]:
# A variável reg armazena os hiperparâmetros da Rede Neural Artificial
reg = MLPRegressor(hidden_layer_sizes=(21), # Quantidade de camadas ocultas e seus respectivos neurônios
                   activation='relu', # Função de ativação
                   solver='lbfgs', # Solver utilizado para otimizar os pesos
                   alpha=0.1, # Regularizador, atua evitando "overfitting"
                   random_state=0, # Armazena a inicialização dos pesos, permitindo replicabilidade
                   max_iter=500) # Número máximo de iterações
reg.fit(X_train, y_train) # Treinando a RNA com o conjunto de dados de treinamento, X_train
mae_teste = mean_absolute_error(y_test, reg.predict(X_test))
score_teste = reg.score(X_test, y_test)
mse_teste = mean_squared_error(y_test, reg.predict(X_test))

mae_treino = mean_absolute_error(y_train, reg.predict(X_train))
score_treino = reg.score(X_train, y_train)
mse_treino = mean_squared_error(y_train, reg.predict(X_train))

print('mae_teste: %.3f' %mae_teste, 'mse_teste: %.3f' %mse_teste, 'score_teste: %.2f' %(100*score_teste))
print('mae_treinamento: %.3f' %mae_treino, 'mse_treinamento: %.3f' %mse_treino, 'score_treinamento: %.2f' %(100*score_treino))