In [None]:
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report,confusion_matrix
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
df = pd.read_csv('../Dados/academicos_historico_balanceado.csv')
df.head()

In [None]:
colunas = df.columns
lista_colunas = list(df.columns)
lista_colunas

In [None]:
lista_colunas.remove('chave')
lista_colunas.remove('evadido')
lista_colunas

In [None]:
x = df[lista_colunas]
y = df['evadido']

In [None]:
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=18)

In [None]:
mlp = MLPClassifier(max_iter=100, random_state=20)

In [None]:
param_grid = {
    'hidden_layer_sizes': [(24, 12, 6),(16, 8),(16, 8, 2),(32, 16, 8), (25,15,5), (128, 64, 32, 1)],  
    'activation': ['relu', 'tanh'],  # Comparando ReLU e Tanh como função de ativação
    'solver': ['adam'],  # Optando por Adam como solver
    'learning_rate': ['constant', 'adaptive'],  # Comparando taxa de aprendizado constante e adaptativa
    'learning_rate_init': [0.001, 0.01],  # Variando a taxa de aprendizado inicial
    'shuffle': [True],
    'validation_fraction': [0.2, 0.1]  # Testando diferentes frações de validação
}


In [None]:
# Configurando o GridSearch com validação cruzada de 5 folds
grid_search = GridSearchCV(mlp, param_grid, cv=5, verbose=2, n_jobs=-1)

# Ajustando o GridSearch ao conjunto de dados (X_train, y_train)
grid_search.fit(X_train, y_train)

In [None]:
# Exibindo os melhores parâmetros encontrados
print("Melhores parâmetros encontrados pelo GridSearch:")
print(grid_search.best_params_)

In [None]:
import time
inicio = time.time()  # Tempo inicial

In [None]:
# Treinando o modelo com os melhores parâmetros
best_model = grid_search.best_estimator_

# Avaliando o desempenho no conjunto de teste
accuracy = best_model.score(X_test, y_test)
print(f"Acurácia do modelo otimizado: {accuracy:.4f}")

In [None]:
fim = time.time()  # Tempo final
tempo_execucao = fim - inicio

print(f"Tempo de execução: {tempo_execucao} segundos")

In [None]:
print('Dados de treinamento')

predicao = best_model.predict(X_train)

print(confusion_matrix(y_train,predicao))
print(classification_report(y_train,predicao))

In [None]:
print('Dados de teste')

predicao = best_model.predict(X_test)

print(confusion_matrix(y_test,predicao))
print(classification_report(y_test,predicao))