In [7]:
from sklearn import datasets
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import StratifiedKFold
from sklearn.model_selection import GridSearchCV

from sklearn.neighbors import KNeighborsClassifier

import time

In [None]:
iris = datasets.load_iris()
X = iris.data
y = iris.target

Para configurar os parâmetros que o KNN irá utilizar para fazer a busca, defini a quantidade de visinhos como **3**, **5** e **7**, os pesos como **Uniforme** e **Distância** (https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html) e a métrica de distância como **Euclideana** e **Manhattan** (https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.distance_metrics.html#sklearn.metrics.pairwise.distance_metrics)

$3 visinhos * 2 pesos * 2 métricas$ totaliza uma busca por 12 combinações diferentes de parâmetros possíveis para essa configuração. Se aumentar a busca de vizinhos para 4 opções, o total salta de 12 para 16 combinações ($4 vizinhos * 2 pesos * 2 métricas = 16 combinações$).

Tudo isso, multiplicado pela quantidade de pastas que foram definidas no *Cross Validation*. Neste caso são 10 pastas, então o total de combinações possíveis é multiplicado por 10, chegando a 120 iterações.

In [None]:
param_grid = [{'n_neighbors':[3,5,7],
               'weights':['uniform', 'distance'],
               'metric':['euclidean','manhattan']}]

In [12]:
knn = KNeighborsClassifier()

inicio = time.time()

grid_search_knn = GridSearchCV(knn, param_grid, cv=10, verbose=3 )
resultado_modelo = grid_search_knn.fit(X,y)

termino = time.time()
print("--- %s segundos para treinar o modelo ---" % (termino - inicio))

Fitting 10 folds for each of 12 candidates, totalling 120 fits
[CV 1/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1.000 total time=   0.0s
[CV 2/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=0.933 total time=   0.0s
[CV 3/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1.000 total time=   0.0s
[CV 4/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=0.933 total time=   0.0s
[CV 5/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=0.867 total time=   0.0s
[CV 6/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1.000 total time=   0.0s
[CV 7/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=0.933 total time=   0.0s
[CV 8/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1.000 total time=   0.0s
[CV 9/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1.000 total time=   0.0s
[CV 10/10] END metric=euclidean, n_neighbors=3, weights=uniform;, score=1

In [10]:
print("Melhores Parâmetros")
print(grid_search_knn.best_params_)
print("**************")
print("Melhores Estimadores")
print(grid_search_knn.best_estimator_)
print("**************")
print("Melhores Pontuações")
print(grid_search_knn.best_score_)

Melhores Parâmetros
{'metric': 'euclidean', 'n_neighbors': 5, 'weights': 'uniform'}
**************
Melhores Estimadores
KNeighborsClassifier(metric='euclidean')
**************
Melhores Pontuações
0.9666666666666668
