**GridSearchCV**

Pesquisa em Grade

O Grid Seach pode ser denominado como uma versão automatizada da otimização de hiperparâmetros de pesquisa manual. A biblioteca Scikit-Learn vem com uma implementação GridSearchCV. GridSearch não é computacionalmente amigável, pois leva muito tempo para otimizar, mas pode-se ficar livre de escrever várias linhas de código.

Pode-se alimentar o modelo de treinamento e a lista de hiperparâmetros em formato de dicionário para a função GridSeachCV, e seus retornos com o modelo de desempenho e sua métrica de pontuação.



In [None]:
from sklearn.model_selection import GridSearchCV

grid_cv = GridSearchCV(clf, param_grid, scoring="accuracy", n_jobs=-1, cv=3)
grid_cv.fit(X_train, y_train)

print("Best Params", grid_cv.best_params_)
print("Best CV Score", grid_cv.best_score_)
print(f'Accuracy on Model 1 = {round(accuracy_score(y_test, grid_cv.predict(X_test)), 5)}')


**RandomizedSearchCV**

Pesquisa Randomizada

O Grid Search tenta todas as combinações de hiperparâmetros, aumentando assim a complexidade do tempo do cálculo. A pesquisa aleatória treina o modelo na combinação de hiperparâmetros aleatórios. O número total de combinações nas quais os vários modelos são treinados é menor para a pesquisa aleatória em comparação com a pesquisa em grade.

O pacote Scikit-Learn também vem com implementação RandomSearchCV.

In [None]:
from sklearn.model_selection import RandomizedSearchCV

grid_cv = RandomizedSearchCV(clf, param_grid, scoring="accuracy", n_jobs=-1, cv=3)
grid_cv.fit(X_train, y_train)

print("Best Params", grid_cv.best_params_)
print("Best CV Score", grid_cv.best_score_)
print(f'Accuracy on Model 1 = {round(accuracy_score(y_test, grid_cv.predict(X_test)), 5)}')


**HalvingGridSearchCV:**

Reduzindo a pesquisa de grade pela metade:

Reduzir o Grid Search à metade é uma versão otimizada da otimização de hiperparâmetros do Grid Search. Reduzir pela metade A pesquisa de grade pesquisa uma lista especificada de hiperparâmetros usando uma abordagem de redução sucessiva à metade. A estratégia de pesquisa começa avaliando todos os candidatos em uma pequena amostra dos dados e seleciona iterativamente os melhores candidatos usando amostras cada vez maiores.

Reduzir a pesquisa em grade é menos dispendioso em termos computacionais do que a abordagem de pesquisa em grade. A biblioteca Scikit-Learn vem com a implementação HalvingGridSearch.

In [None]:
from sklearn.model_selection import HalvingGridSearchCV

halving_cv = HalvingGridSearchCV(clf, param_grid, scoring="accuracy", factor=3)
halving_cv.fit(X_train, y_train)

print("Best Params", halving_cv.best_params_)
print("Best CV Score", halving_cv.best_score_)
print(f'Accuracy on Model 1 = {round(accuracy_score(y_test, halving_cv.predict(X_test)), 5)}')


**Reduzindo a pesquisa aleatória pela metade:**

HalvingRandomSearchCV

Reduzir pela metade a pesquisa aleatória usa a mesma abordagem de redução pela metade sucessiva e é ainda mais otimizada em comparação com a redução pela metade da pesquisa de grade. Ao contrário da pesquisa de grade ao meio, ele não treina em todas as combinações de hiperparâmetros, em vez de escolher aleatoriamente um conjunto de combinações de hiperparâmetros. A biblioteca Scikit-Learn também vem com HalvingRandomizedSeachCV.

In [None]:
from sklearn.model_selection import HalvingRandomSearchCV

halving_cv = HalvingRandomSearchCV(clf, param_grid, scoring="accuracy", factor=3)
halving_cv.fit(X_train, y_train)

print("Best Params", halving_cv.best_params_)
print("Best CV Score", halving_cv.best_score_)
print(f'Accuracy on Model 1 = {round(accuracy_score(y_test, halving_cv.predict(X_test)), 5)}')


**Hyperopt-Sklearn:**

Hyperopt é uma biblioteca Python de código aberto para Otimização Bayesiana, projetada para otimizações em grande escala de modelos com centenas de parâmetros. Ele permite que a otimização do hiperparâmetro seja dimensionada em vários núcleos da CPU.

Hyperopt-Sklearn é uma extensão da biblioteca Hyperopt, que permite a pesquisa automática de algoritmos de aprendizado de máquina e hiperparâmetros de modelo para tarefas de classificação e regressão.

**Bayes Grid Search:**

O Bayes Grid Search usa a técnica de otimização bayesiana para modelar o espaço de busca para chegar aos valores dos parâmetros otimizados o mais rápido possível. Ele usa a estrutura do espaço de busca para otimizar o tempo de busca. A abordagem do Bayes Search usa os resultados da avaliação anterior para criar uma amostra de novos candidatos com maior probabilidade de apresentar melhores resultados.

A biblioteca Scikit-Optimize vem com implementação BayesSearchCV.

In [None]:
from skopt import BayesSearchCV
# parameter ranges are specified by one of below
from skopt.space import Real, Categorical, Integer


# Pipeline parameters search spaces
search_spaces = {"vect__max_features": Integer(1000, 1500),
                 "vect__max_df": Real(0, 1, prior='uniform'),
                 "clf__n_estimators": Integer(200,  400)}

# Bayesian grid search on the pipeline
opt = BayesSearchCV(model, search_spaces, cv=3)
opt.fit(X_train, y_train)