# Aprimorando de parâmetros dos classificadores

Nesta etapa vamos testar os diversos parâmetros que podem ser utilizados pelo classificador SVM, além de realizar etapas anteriores de normalização dos dados.

In [1]:
# carregamento de dados das etapas anteriores

import numpy as np

X = np.load('temp_data/khushaba_feat.npy')
y = np.load('temp_data/khushaba_lab.npy')

NameError: name 'np' is not defined

## Normalização

In [None]:
from sklearn.preprocessing import (StandardScaler, MinMaxScaler, MaxAbsScaler, RobustScaler)
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC


for scaler in (StandardScaler(), MinMaxScaler(), MaxAbsScaler(), RobustScaler()):
    X_scaled = scaler.fit_transform(X)
    X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, shuffle=True)
    clf = SVC(kernel='rbf', gamma='scale')
    clf.fit(X_train, y_train)
    res = clf.predict(X_test)
    tot_hit = sum([1 for i in range(len(res)) if res[i] == y_test[i]])
    print('Acurácia: {:.2f}%'.format(tot_hit / X_test.shape[0] * 100))

## Hiperparametrização

Podemos utilizar diversas variações ligadas ao classificador SVM, além de elementos que contribuem com a **validação cruzada** dos dados.

Primeiramente, vamos exemplificar os `kernels`. Você pode selecionar o `kernel` especificando o parâmetro `kernel` no objeto `SVC`. Os valores possíveis são "`linear`", "`poly`", "`rbf`" (padrão) e outros. Por exemplo: `svm_model = SVC(kernel='linear')`.

Para cada `kernel` ainda podemos selecionar um ajuste para o parâmetro específico. Se você estiver usando um `kernel` polinomial, pode ajustar o grau do polinômio especificando o parâmetro `degree` no objeto `SVC`. Se estiver usando um `kernel RBF`, pode ajustar o parâmetro de largura de `banda gamma` especificando o parâmetro `gamma`. Por exemplo: `svm_model = SVC(kernel='poly', degree=3)`.

O parâmetro de regularização `C` pode ser ajustado especificado no objeto `SVC`. Você pode experimentar diferentes valores de `C` usando validação cruzada para encontrar o melhor. Por exemplo: `svm_model = SVC(C=1.0)`.

Existem outros hiperparâmetros disponíveis para ajustar o desempenho do `SVM`, como `coef0` (coeficiente na função `kernel`) e `tol` (tolerância para critério de parada). **Pesquise como deve ser adicionado estes parâmetros**.

Para testar os diversos hiperparâmetros, podemos utilizar a classe `GridSearchCV` para realizar a validação cruzada e encontrar os melhores automaticamente. É necessário definir um dicionário com os parâmetros que deseja ajustar e seus respectivos valores a serem testados. Em seguida, você pode fornecer esse dicionário e o objeto `SVC` ao `GridSearchCV` para executar a pesquisa. **Pesquise como ocorre o funcionamento da aplicação do `GridSearchCV` para todos os tipos de hiperparametrização citados acima**. Por fim, para obter a lista dos melhores, declaramos algo do tipo: `best_params = object_grid_search.best_params_`