In [None]:
from sklearn.datasets import load_breast_cancer
import pandas as pd

# Para mostrar todas as colunas
pd.set_option('display.max_columns', 30)

# Carrega o dataset
dados = load_breast_cancer()

# Divide em variaveis preditoras e variavel alvo
x = pd.DataFrame(dados.data, columns=[dados.feature_names])
y = pd.Series(dados.target)

In [None]:
# Mostra as 5 primeiras linhas
x.head()

In [None]:
import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import GridSearchCV

# Normalizando as variaveis preditoras
normalizador = MinMaxScaler(feature_range=(0,1))
x_norm = normalizador.fit_transform(x)

# Definindo os valores que serão testados no KNN
valores_k = np.array([3, 5, 7, 9, 11])              # k: número de vizinhos
calculo_distancia = ['minkowski', 'chebyshev']      # metric: método de cálculo da distância
valores_p = np.array([1, 2, 3, 4])                  # p: valor de p para o cálculo da distância
valores_grid = {
    'n_neighbors':valores_k,
    'metric':calculo_distancia,
    'p':valores_p
}

# Criação do modelo
modelo = KNeighborsClassifier()

# Criando os grids
gridKNN = GridSearchCV(estimator=modelo, param_grid=valores_grid, cv=5)

# Treinando o modelo
gridKNN.fit(x_norm, y)

# Imprimindo os melhores parametros
print(f'Melhor acurácia: {gridKNN.best_score_}')
print(f'Melhor K: {gridKNN.best_estimator_.n_neighbors}')
print(f'Método distancia: {gridKNN.best_estimator_.metric}')
print(f'Melhor valor p: {gridKNN.best_estimator_.p}')