## Importar as bibliotecas

In [None]:
import numpy as np
import pandas as pd
from sklearn.neural_network import MLPClassifier
from sklearn import model_selection
from sklearn.metrics import confusion_matrix, precision_score, recall_score, f1_score, ConfusionMatrixDisplay
from sklearn.datasets import load_breast_cancer, load_digits
from sklearn.model_selection import train_test_split, GridSearchCV 
from tabulate import tabulate

## Modelo K-NEAREST NEIGHBORS

In [None]:
from sklearn.neighbors import KNeighborsClassifier

# Carregando a base de dados
X, y=load_breast_cancer(return_X_y=True)
X.shape

# Separando da base original uma parte para validação
X, x_val, y, y_val = train_test_split(X,y,test_size=0.2,random_state=42, stratify=y)

clf=KNeighborsClassifier()

param_KNN=[{'n_neighbors':[1,3,5,7,9,11], 'weights': ['uniform', 'distance'], 'p':[1,2]}]

# Execução do GridSearch
gs=GridSearchCV(clf, param_KNN, scoring='accuracy', cv=3, n_jobs=-1)
gs.fit(x_val, y_val)
 
#df=gs.cv_results_
#print(tabulate(df, headers='keys', tablefmt='psql'))
print("Melhores parâmetros encontrados: ", gs.best_params_)

clf=gs.best_estimator_

## Modelo ÁRVORE DE DECISÃO

In [None]:
# MODELO ÁRVORE DE DECISÃO
from sklearn.tree import DecisionTreeClassifier

# Carregando a base de dados
X, y=load_breast_cancer(return_X_y=True)
X.shape

# Separando da base original uma parte para validação
X, x_val, y, y_val = train_test_split(X,y,test_size=0.2,random_state=42, stratify=y)

clf=DecisionTreeClassifier()

# parâmetros para árvore de classificação (DecisionTree)
param_Tree=[{'criterion':['gini', 'entropy', 'log_loss'], 'max_depth': [None, 5, 10], 'min_samples_split':[2, 5], 
             'splitter':['random', 'best']}]

# Execução do GridSearch
gs=GridSearchCV(clf, param_Tree, scoring='accuracy', cv=3, n_jobs=-1)
gs.fit(x_val, y_val)
 
#df=gs.cv_results_
#print(tabulate(df, headers='keys', tablefmt='psql'))
print("Melhores parâmetros encontrados: ", gs.best_params_)

# Recuperando os melhores resultados
clf=gs.best_estimator_

## Modelo NAIVE BAYES

In [None]:
From sklearn.naive_bayes import GaussianNB

# Carregando a base de dados
X, y=load_breast_cancer(return_X_y=True)
X.shape

# Separando da base original uma parte para validação
X, x_val, y, y_val = train_test_split(X,y,test_size=0.2,random_state=42, stratify=y)

clf=GaussianNB()

#parâmetros Naive Bayes
param_Naive=[{'var_smoothing':[1e-09, 1e-03, 1e-06]}]

# Execução do GridSearch
gs=GridSearchCV(clf, param_Naive, scoring='accuracy', cv=3, n_jobs=-1)
gs.fit(x_val, y_val)
 
#df=gs.cv_results_
#print(tabulate(df, headers='keys', tablefmt='psql'))
print("Melhores parâmetros encontrados: ", gs.best_params_)

# Recuperando os melhores resultados
clf=gs.best_estimator_

## Modelo MULTILAYER PERCEPTRON

In [None]:
# MODELO MULTILAYER PERCEPTRON
clf = MLPClassifier(max_iter=300, early_stopping=False)

# parâmetros para árvore de classificação (Rede Neural Artificial - Multilayer Perceptron)
parameters=[{'hidden_layer_sizes':[16, (16, 8), (16, 8, 4)],
             'learning_rate': ['constant', 'invscaling'],
             'learning_rate_init': [0.01, 0.001, 0.0001],
             'activation': ['relu', 'logist', 'tanh'],
             'random_state': [10, 46, 37]}]


# Execução do GridSearch
gs=GridSearchCV(clf, parameters, scoring='accuracy', cv=3, n_jobs=-1)
gs.fit(x_val, y_val)
 
df=gs.cv_results_
print(tabulate(df, headers='keys', tablefmt='psql'))
print("Melhores parâmetros encontrados: ", gs.best_params_)

# Recuperando os melhores resultados
clf=gs.best_estimator_

## Métricas de Validação

In [None]:
# Usando validação cruzada com T=5 folds
result=model_selection.cross_val_score(clf, X, y, cv=5)
print("Acurácia média: %.3f" % result.mean())
print("Desvio padrão: %.3f" % result.std())

# Calculando a predição para cada exemplo de teste
y_pred=model_selection.cross_val_predict(clf, X, y, cv=5)

# Calculando a predição para cada exemplo de teste
#y_pred_proba=model_selection.cross_val_predict(clf, X, y, cv=5, method='predict_proba')

# Calcular precisão
precision=precision_score(y, y_pred, average='weighted')

# Calcular revocação
recall=recall_score(y, y_pred, average='weighted')

# Calcular revocação
f1=f1_score(y, y_pred, average='weighted')

print("Precision: %.3f" % precision)
print("Recall: %.3f" % recall)
print("f1: %.3f" % f1)

print("Matriz de Confusão")
matrix=confusion_matrix(y, y_pred)
#print(matrix)
disp=ConfusionMatrixDisplay(confusion_matrix=matrix,display_labels=clf.classes_)
disp.plot()