In [1]:
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report,confusion_matrix
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

In [2]:
df = pd.read_csv('academicos_historico_balanceado.csv')
df.head()

Unnamed: 0,chave,idade,corRaca,trancamentos,notaIngresso,escolaPublica,nota,falta,ultimoSemestre,quantidadeRematricula,...,estadoCivil_code,deficiencia_code,matutino,vespertino,noturno,tipoVaga_code,moraCampus,grande_area,tempo_2_grau_superior,evadido
0,899F5044-7AD1-4CCE-88B1-38A1C6B0A0C4,24.0,0,0,657.3,0,3.15013,20.597403,8.0,12,...,0,0,1,1,0,0,0,5,2,1
1,17A24172-777E-46D9-BFDF-D9465B1DCE4D,33.0,1,0,543.4,0,7.463425,2.849315,9.0,11,...,0,0,1,1,0,0,1,5,0,0
2,BCB43225-578A-48EC-99DA-E242A4DF0B64,24.0,0,2,575.66,0,3.061905,16.619048,1.0,4,...,0,0,1,1,0,0,1,5,2,1
3,DB643205-09FF-4E5A-8E24-0B8E4E7FF4C2,38.0,1,1,521.84,0,6.229167,13.555556,4.0,4,...,0,0,0,0,1,1,0,5,6,1
4,C4E050D5-0EAD-4686-8806-F703B41C8439,25.0,1,0,657.3,1,7.877632,2.552632,8.0,8,...,0,0,1,1,0,0,0,4,2,0


In [3]:
colunas = df.columns
lista_colunas = list(df.columns)
lista_colunas

['chave',
 'idade',
 'corRaca',
 'trancamentos',
 'notaIngresso',
 'escolaPublica',
 'nota',
 'falta',
 'ultimoSemestre',
 'quantidadeRematricula',
 'numDisciplinaUltimo',
 'tempoUniversidade',
 'aprovados',
 'matriculado',
 'reprovado_falta',
 'reprovado_media',
 'sexo_code',
 'estadoCivil_code',
 'deficiencia_code',
 'matutino',
 'vespertino',
 'noturno',
 'tipoVaga_code',
 'moraCampus',
 'grande_area',
 'tempo_2_grau_superior',
 'evadido']

In [4]:
lista_colunas.remove('chave')
lista_colunas.remove('evadido')
lista_colunas

['idade',
 'corRaca',
 'trancamentos',
 'notaIngresso',
 'escolaPublica',
 'nota',
 'falta',
 'ultimoSemestre',
 'quantidadeRematricula',
 'numDisciplinaUltimo',
 'tempoUniversidade',
 'aprovados',
 'matriculado',
 'reprovado_falta',
 'reprovado_media',
 'sexo_code',
 'estadoCivil_code',
 'deficiencia_code',
 'matutino',
 'vespertino',
 'noturno',
 'tipoVaga_code',
 'moraCampus',
 'grande_area',
 'tempo_2_grau_superior']

In [5]:
x = df[lista_colunas]
y = df['evadido']

In [6]:
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=18)

In [7]:
mlp = MLPClassifier(max_iter=100, random_state=20)

In [8]:
param_grid = {
    'hidden_layer_sizes': [(24, 12, 6),(16, 8),(16, 8, 2),(32, 16, 8), (25,15,5), (128, 64, 32, 1)],  
    'activation': ['relu', 'tanh'],  # Comparando ReLU e Tanh como função de ativação
    'solver': ['adam'],  # Optando por Adam como solver
    'learning_rate': ['constant', 'adaptive'],  # Comparando taxa de aprendizado constante e adaptativa
    'learning_rate_init': [0.001, 0.01],  # Variando a taxa de aprendizado inicial
    'shuffle': [True],
    'validation_fraction': [0.2, 0.1]  # Testando diferentes frações de validação
}


In [9]:
# Configurando o GridSearch com validação cruzada de 5 folds
grid_search = GridSearchCV(mlp, param_grid, cv=5, verbose=2, n_jobs=-1)

# Ajustando o GridSearch ao conjunto de dados (X_train, y_train)
grid_search.fit(X_train, y_train)

Fitting 5 folds for each of 96 candidates, totalling 480 fits




In [10]:
# Exibindo os melhores parâmetros encontrados
print("Melhores parâmetros encontrados pelo GridSearch:")
print(grid_search.best_params_)

Melhores parâmetros encontrados pelo GridSearch:
{'activation': 'tanh', 'hidden_layer_sizes': (128, 64, 32, 1), 'learning_rate': 'constant', 'learning_rate_init': 0.001, 'shuffle': True, 'solver': 'adam', 'validation_fraction': 0.2}


In [11]:
import time
inicio = time.time()  # Tempo inicial

In [12]:
# Treinando o modelo com os melhores parâmetros
best_model = grid_search.best_estimator_

# Avaliando o desempenho no conjunto de teste
accuracy = best_model.score(X_test, y_test)
print(f"Acurácia do modelo otimizado: {accuracy:.4f}")

Acurácia do modelo otimizado: 0.8831


In [13]:
fim = time.time()  # Tempo final
tempo_execucao = fim - inicio

print(f"Tempo de execução: {tempo_execucao} segundos")

Tempo de execução: 0.03169679641723633 segundos


In [14]:
print('Dados de treinamento')

predicao = best_model.predict(X_train)

print(confusion_matrix(y_train,predicao))
print(classification_report(y_train,predicao))

Dados de treinamento
[[7325 1287]
 [ 519 8120]]
              precision    recall  f1-score   support

           0       0.93      0.85      0.89      8612
           1       0.86      0.94      0.90      8639

    accuracy                           0.90     17251
   macro avg       0.90      0.90      0.90     17251
weighted avg       0.90      0.90      0.90     17251



In [15]:
print('Dados de teste')

predicao = best_model.predict(X_test)

print(confusion_matrix(y_test,predicao))
print(classification_report(y_test,predicao))

Dados de teste
[[1813  357]
 [ 147 1996]]
              precision    recall  f1-score   support

           0       0.93      0.84      0.88      2170
           1       0.85      0.93      0.89      2143

    accuracy                           0.88      4313
   macro avg       0.89      0.88      0.88      4313
weighted avg       0.89      0.88      0.88      4313

