In [25]:
from sklearn.model_selection import KFold
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report, f1_score
import pandas as pd 

In [26]:
# Carrega dataset pré-processado
df = pd.read_csv('./data/heart_disease_clean_normalized.csv')

# Separa features e num (alvo)
X = df.drop('num', axis=1)
y = df['num']
    

In [27]:
model_60_40 = MLPClassifier(hidden_layer_sizes=(6,), max_iter=2000, learning_rate_init=0.32, momentum=0.72)

# Divide o dataset em 60% treino e 40% teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=42)

# Exibe os tamanhos dos conjuntos de treino e teste
print(f'Tamanho do conjunto de treino: {X_train.shape[0]}')
print(f'Tamanho do conjunto de teste: {X_test.shape[0]}')

# Treina o modelo
model_60_40.fit(X_train, y_train)

# Avalia o modelo
score = model_60_40.score(X_test, y_test)
print(f'Acurácia: {score}')

# Predizendo valores
y_pred = model_60_40.predict(X_test)

# Matriz de confusão
cm = confusion_matrix(y_test, y_pred)
print('Matriz de Confusão:')
print(cm)

# Relatório de classificação
cr = classification_report(y_test, y_pred)
print('Relatório de Classificação:')
print(cr)

# F1 Score
f1 = f1_score(y_test, y_pred)
print(f'F1 Score: {f1}')

Tamanho do conjunto de treino: 178
Tamanho do conjunto de teste: 119
Acurácia: 0.8319327731092437
Matriz de Confusão:
[[53  7]
 [13 46]]
Relatório de Classificação:
              precision    recall  f1-score   support

       False       0.80      0.88      0.84        60
        True       0.87      0.78      0.82        59

    accuracy                           0.83       119
   macro avg       0.84      0.83      0.83       119
weighted avg       0.84      0.83      0.83       119

F1 Score: 0.8214285714285714


In [28]:
splits = 5
# Define número de folds
kf = KFold(n_splits=splits, shuffle=True)

print("Treinamento da rede utilizando KFold com", splits, "folds")

# Treina e avalia modelo
# 12 neurônios na camada de entradauuu
# 2 neurônios na camada de saída
# 1 camada oculta com 6 neurônios
# 2000 épocas
# 0.32 de taxa de aprendizado
# 0.72 de momento
# 0.199 de performance
model_kfold = MLPClassifier(hidden_layer_sizes=(6,), max_iter=2000, learning_rate_init=0.32, momentum=0.72)

# Itera sobre os folds
count = 0
for train_index, test_index in kf.split(X):
    X_train, X_test = X.iloc[train_index], X.iloc[test_index]
    y_train, y_test = y.iloc[train_index], y.iloc[test_index]

    count += 1
    print('Treinando modelo... Fold numero:', count)

    model_kfold.fit(X_train, y_train)
    score = model_kfold.score(X_test, y_test)
    print('Score:', score)

Treinamento da rede utilizando KFold com 5 folds
Treinando modelo... Fold numero: 1
Score: 0.8
Treinando modelo... Fold numero: 2
Score: 0.7166666666666667
Treinando modelo... Fold numero: 3
Score: 0.5423728813559322
Treinando modelo... Fold numero: 4
Score: 0.864406779661017
Treinando modelo... Fold numero: 5
Score: 0.847457627118644
