# **Selecionando os Hiperparâmetros**

Outra etapa fundamental na criação de modelos de machine learning, selecionar os melhores hiperparâmetros é tão importante quanto selecionar as melhores features, esta sintonia fina deixa o nosso modelo mais aperfeiçoado para fazer previsões mais corretas.

Hyperopt-sklearn é um algoritmo de seleção de hiperparâmetros para modelos de Machine Learning do scikit-learn baseado no Hyperopt. Em linhas gerais é um framework que em poucas linhas de código seleciona quais os melhores parâmetros e também modelos para os seus dados. Ele funciona basicamente como um pipeline de seleção de modelo, hiperparâmetros e ainda retorna o valor previsto de métricas de avaliação.

Para saber mais e ver alguns exemplos de utilização, acesse o pdf do framework e o seu Github:

Komer B., Bergstra J., and Eliasmith C. "Hyperopt-Sklearn: automatic hyperparameter configuration for Scikit-learn" Proc. SciPy 2014. http://conference.scipy.org/proceedings/scipy2014/pdfs/komer.pdf

https://github.com/hyperopt/hyperopt-sklearn

## **Qual é o melhor modelo de Machine Learning quando aplicamos a função RemoveCorrVarr?**

In [None]:
# Seleciona os melhores hiperparâmetros baseado nos dados

# Dados
np.random.seed(3165)
dados_finais = dados_finais.sample(frac=1)
y = dados_finais['ICU']
x = dados_finais.drop(['ICU', 'WINDOW', 'PATIENT_VISIT_IDENTIFIER'], axis=1)

# Seleção das features
seletor = RemoveCorrVar()
x_treino1 = seletor.fit(dados_finais)
x_treino2 = seletor.transform(dados_finais)
x = x_treino2.drop(['ICU', 'WINDOW', 'PATIENT_VISIT_IDENTIFIER'], axis=1)
y = dados_finais['ICU']
x_treino, x_teste, y_treino, y_teste = train_test_split(x,y, test_size=0.30, random_state=3165)

# Instanciando o HyperoptEstimator

estim = HyperoptEstimator(classifier=any_classifier('random_forest'),
                          preprocessing=[],
                          algo=tpe.suggest,
                          max_evals=100,
                          trial_timeout=120)

estim.fit(x_treino, y_treino)

# Imprimindo os resultados
print('\n')
print(f'----- Melhor modelo para a função RemoveCorrVar --------')
print('\n')
print(estim.score(x_teste, y_teste))
# 1.0
print('\n')
print(estim.best_model())

100%|██████████| 1/1 [00:00<00:00,  8.36it/s, best loss: 0.36]
100%|██████████| 1/1 [00:00<00:00, 10.29it/s, best loss: 0.36]
100%|██████████| 1/1 [00:00<00:00,  2.82it/s, best loss: 0.28]
100%|██████████| 1/1 [00:00<00:00, 11.16it/s, best loss: 0.28]
100%|██████████| 1/1 [00:00<00:00, 11.26it/s, best loss: 0.28]
100%|██████████| 1/1 [00:02<00:00,  2.29s/it, best loss: 0.28]
100%|██████████| 1/1 [00:00<00:00,  1.02it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  6.33it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  6.77it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  3.83it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  5.20it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00, 11.03it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  3.33it/s, best loss: 0.21999999999999997]
100%|██████████| 1/1 [00:00<00:00,  2.43it/s, best loss: 0.21999999999999997

## **Qual é o melhor modelo de Machine Learning quando aplicamos a função SelectKBest?**

In [None]:
# Seleciona os melhores hiperparâmetros baseado nos dados

# Dados
np.random.seed(3165)
dados_finais = dados_finais.sample(frac=1)
y = dados_finais['ICU']
x = dados_finais.drop(['ICU','WINDOW', 'PATIENT_VISIT_IDENTIFIER'], axis=1)

# Seleção das features
seletor = SelectKBest(k=100)
x_treino = seletor.fit_transform(x, y)
mask = seletor.get_support()
best_features = x.columns[mask]
x2 = dados_finais[best_features]

x_treino, x_teste, y_treino, y_teste = train_test_split(x2,y, test_size=0.30, random_state=3165)


estim = HyperoptEstimator(classifier=any_classifier('random_forest'),
                          preprocessing=[],
                          algo=tpe.suggest,
                          max_evals=100,
                          trial_timeout=120)

estim.fit(x_treino, y_treino)

# Imprimindo os resultados
print('\n')
print(f'----- Melhor modelo para a função SelectKBest --------')
print('\n')
print(estim.score(x_teste, y_teste))
# 1.0
print('\n')
print(estim.best_model())

100%|██████████| 1/1 [00:03<00:00,  3.48s/it, best loss: 0.42000000000000004]
100%|██████████| 1/1 [00:01<00:00,  1.40s/it, best loss: 0.42000000000000004]
100%|██████████| 1/1 [00:02<00:00,  2.36s/it, best loss: 0.38]
100%|██████████| 1/1 [00:00<00:00,  5.44it/s, best loss: 0.38]
100%|██████████| 1/1 [00:29<00:00, 29.87s/it, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:01<00:00,  1.48s/it, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:00<00:00,  5.63it/s, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:00<00:00,  8.99it/s, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:01<00:00,  1.98s/it, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:00<00:00,  9.46it/s, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:00<00:00,  6.67it/s, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:00<00:00,  9.24it/s, best loss: 0.33999999999999997]
100%|██████████| 1/1 [00:01<00:00,  1.66s/it, best loss: 0.33999999999999997]
100%|██████████|

## **Qual é o melhor modelo de Machine Learning quando aplicamos a função VarianceThreshold?**

In [None]:
# Seleciona os melhores hiperparâmetros baseado nos dados

# Dados
np.random.seed(3165)
dados_finais = dados_finais.sample(frac=1)
y = dados_finais['ICU']
x = dados_finais.drop(['ICU', 'WINDOW', 'PATIENT_VISIT_IDENTIFIER'], axis=1)
 
# Seleção das features 
x_treino, x_teste, y_treino, y_teste = train_test_split(x,y, test_size=0.30, random_state=3165)
seletor = VarianceThreshold()
x_treino2 = seletor.fit_transform(x_treino, y_treino)
x_teste2 = seletor.transform(x_teste)
mask = seletor.get_support()
best_features = x.columns[mask]
x2 = dados_finais[best_features]

x_treino, x_teste, y_treino, y_teste = train_test_split(x2,y, test_size=0.30, random_state=3165)


estim = HyperoptEstimator(classifier=any_classifier('random_forest'),
                          preprocessing=[],
                          algo=tpe.suggest,
                          max_evals=100,
                          trial_timeout=120)

estim.fit(x_treino, y_treino)

# Imprimindo os resultados
print('\n')
print(f'----- Melhor modelo para a função SelectKBest --------')
print('\n')
print(estim.score(x_teste, y_teste))
# 1.0
print('\n')
print(estim.best_model())

100%|██████████| 1/1 [00:00<00:00,  1.03it/s, best loss: 0.42000000000000004]
100%|██████████| 1/1 [00:00<00:00,  8.43it/s, best loss: 0.28]
100%|██████████| 1/1 [00:01<00:00,  1.08s/it, best loss: 0.28]
100%|██████████| 1/1 [00:00<00:00, 10.55it/s, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  1.81it/s, best loss: 0.24]
100%|██████████| 1/1 [00:03<00:00,  3.85s/it, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00, 11.32it/s, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  9.52it/s, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  5.10it/s, best loss: 0.24]
100%|██████████| 1/1 [00:02<00:00,  2.77s/it, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  9.36it/s, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  4.03it/s, best loss: 0.24]
100%|██████████| 1/1 [00:01<00:00,  1.62s/it, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  9.19it/s, best loss: 0.24]
100%|██████████| 1/1 [00:02<00:00,  2.41s/it, best loss: 0.24]
100%|██████████| 1/1 [00:00<00:00,  8.33

**Nota importante:** Os algoritmos e hiperparâmetros que foram escolhidos por mim, foram os selecionados pelo Hyperopt-Sklearn quando este foi executado pela primeira vez. Este é um lado negativo deste framework, ele sofre muita variância no retorno dos modelos e hiperparâmetros ideais, e às vezes  retorna resultados diferentes cada vez que executamos o HyperoptEstimator. Isso deixa o cientista de dados mais inseguro quanto à configuração ideal e se fizemos uma boa escolha, principalmente se o cientista estiver iniciando os estudos e for inexperiente.