In [1]:
# *******************************************************
# IGTI - Bootcamp Analista de Machine Learning
# Módulo 3 - Seleção de Modelos de ML
# Aula 8.3 - Aula Prática - Otimização de Hiperparâmetros
# *******************************************************

In [2]:
# Carregando o dataset

from sklearn.datasets import load_wine

wine = load_wine()

In [3]:
# Exemplos de acesso aos dados

X = wine.data[:, :] # Features de cada elemento
y = wine.target # Classes de cada elemento

In [4]:
# ------------------------------
# É preciso treinar o classificador, e testar o seu desempenho com dados "novos"
# Aqui, dividimos os dados em treino e teswte, para podermos testar nosso desempenho depois.

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split( X, y, test_size = 0.33, random_state = 42)
# o uso dessa função facilita, mas não é obrigatório. Você pode dividir os seus dados manualmente.

In [5]:
# ------------------------------
# Carregando e treinando os classificadores

In [6]:
# Ramdom Forest

from sklearn.ensemble import RandomForestClassifier

rfc = RandomForestClassifier()
rfc.fit( X_train, y_train)
y_pred = rfc.predict( X_test)

In [7]:
# Métricas do Ramdom Forest

from sklearn.metrics import accuracy_score, recall_score, precision_score

rfc_acc = round( accuracy_score( y_test, y_pred), 6) # round é para arredondar
rfc_recall = round( recall_score( y_test, y_pred, average = 'weighted'), 6) # round é para arredondar
rfc_precision = round( precision_score( y_test, y_pred, average = 'weighted'), 6) # round é para arredondar

In [8]:
# ------------------------------
# KNN

from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier( n_neighbors = 3)
knn.fit( X_train, y_train)
y_pred = knn.predict( X_test)

In [9]:
# Métricas do KNN

knn_acc = round( accuracy_score( y_test, y_pred), 6) # round é para arredondar
knn_recall = round( recall_score( y_test, y_pred, average = 'weighted'), 6) # round é para arredondar
knn_precision = round( precision_score( y_test, y_pred, average = 'weighted'), 6) # round é para arredondar

In [10]:
# ------------------------------
# Comparação

print( "KNN vs Random Forests\n")
print( "Classes: {0}\n".format( wine.target_names))
print( "Acurácia: {0} vs {1}".format( knn_acc, rfc_acc))
print( "Recall: {0} vs {1}".format( knn_recall, rfc_recall))
print( "Precisão: {0} vs {1}".format( knn_precision, rfc_precision))

KNN vs Random Forests

Classes: ['class_0' 'class_1' 'class_2']

Acurácia: 0.694915 vs 1.0
Recall: 0.694915 vs 1.0
Precisão: 0.698231 vs 1.0


In [11]:
# ------------------------------
# Na Validação Cruzada

from sklearn.model_selection import cross_val_score

cv_knn = cross_val_score( knn, X, y)
cv_rfc = cross_val_score( rfc, X, y)

print( "\nValidação Cruzada KNN: {}".format( cv_knn))
print( "\nValidação Cruzada RFC: {}".format( cv_rfc))


Validação Cruzada KNN: [0.63888889 0.69444444 0.66666667 0.65714286 0.85714286]

Validação Cruzada RFC: [0.91666667 0.94444444 0.97222222 1.         1.        ]


In [12]:
# Verifica médias
# RFC

sum_cv_rfc = 0

for cv_score in cv_rfc:
  sum_cv_rfc = sum_cv_rfc + cv_score

print("\nResultado RFC: {0}".format( sum_cv_rfc/5))


Resultado RFC: 0.9666666666666668


In [13]:
# Verifica médias
# KNN

sum_cv_knn = 0

for cv_score in cv_knn:
  sum_cv_knn = sum_cv_knn + cv_score

print("\nResultado KNN: {0}".format( sum_cv_knn/5))


Resultado KNN: 0.7028571428571428


In [14]:
# ------------------------------
# Buscando hiperparâmetros
from sklearn.model_selection import GridSearchCV

In [17]:
# RFC
parameters = {'min_samples_split':(2,6)}
rfc_hps = GridSearchCV( rfc, parameters)
rfc_hps.fit( X, y)
print("Melhor valor RFC para 'min_samples_split': {0}".format( rfc_hps.best_params_['min_samples_split']))

Melhor valor RFC para 'min_samples_split': 6


In [16]:
# KNN
parameters = {'n_neighbors':(1,20)}
knn_hps = GridSearchCV( knn, parameters)
knn_hps.fit( X, y)
print("Melhor valor KNN para 'n_neighbors': {0}".format( knn_hps.best_params_['n_neighbors']))

Melhor valor KNN para 'n_neighbors': 1


In [None]:
# *******************************************************
# Fim
# *******************************************************