# Hyperparameter

O ajuste de hiperparâmetros, também conhecido como otimização de hiperparâmetros, é o processo de encontrar os melhores hiperparâmetros para um modelo de machine learning para atingir o desempenho ideal

## Examples of hyperparameters include:
1. Learning Rate: A taxa de aprendizado define o tamanho do passo ao atualizar os parâmetros do modelo durante o treinamento. Pode influenciar tanto a velocidade de convergência quanto a precisão final do modelo.

2. Number of Trees (para métodos de ensemble): Em algoritmos como Random Forest e Gradient Boosting, o número de árvores no ensemble é um hiperparâmetro fundamental.

3. Kernel Choice (para Support Vector Machines): Em SVMs, a escolha do kernel (por exemplo, linear, polinomial ou função de base radial) é um hiperparâmetro que influencia o formato da fronteira de decisão.

4. Depth of Trees (para Decision Trees): A profundidade máxima das árvores de decisão controla a complexidade das árvores e sua capacidade de ajustar aos dados de treinamento.ng data.

In [1]:
from sklearn.model_selection import GridSearchCV, RandomizedSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Load the dataset
iris = load_iris()
X, y = iris.data, iris.target

In [2]:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


clf = RandomForestClassifier()


param_grid = {
    'n_estimators': [50, 100, 200],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10],
    'min_samples_leaf': [1, 2, 4],
    'max_features': ['auto', 'sqrt', 'log2'],
}

## Grid Search

Grid Search é uma técnica simples e de força bruta. Ela envolve especificar uma lista de valores de hiperparâmetros para explorar exaustivamente. Ela cria uma grade de todas as combinações possíveis de hiperparâmetros e avalia o modelo para cada combinação para encontrar a melhor.

In [3]:
# Grid Search
grid_search = GridSearchCV(clf, param_grid, cv=5, n_jobs=-1)
grid_search.fit(X_train, y_train)


print("Best Hyperparameters - Grid Search:", grid_search.best_params_)

# avaliar modelos com melhores hiperparametros
grid_search_best_model = grid_search.best_estimator_
grid_search_accuracy = grid_search_best_model.score(X_test, y_test)
print("Grid Search Test Accuracy:", grid_search_accuracy)

540 fits failed out of a total of 1620.
The score on these train-test partitions for these parameters will be set to nan.
If these failures are not expected, you can try to debug them by setting error_score='raise'.

Below are more details about the failures:
--------------------------------------------------------------------------------
158 fits failed with the following error:
Traceback (most recent call last):
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\model_selection\_validation.py", line 895, in _fit_and_score
    estimator.fit(X_train, y_train, **fit_params)
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\base.py", line 1467, in wrapper
    estimator._validate_params()
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\base.py", line 666, in _validate_params
    validate_parameter_constraints(
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\utils\_param_validation.py", line 95, in validate_parameter_constraints
    raise InvalidParam

Best Hyperparameters - Grid Search: {'max_depth': 10, 'max_features': 'sqrt', 'min_samples_leaf': 2, 'min_samples_split': 10, 'n_estimators': 100}
Grid Search Test Accuracy: 1.0


### Best Hyperparameters - Grid Search: 
{'max_depth': 10, 'max_features': 'sqrt', 'min_samples_leaf': 2, 'min_samples_split': 10, 'n_estimators': 100}
Grid Search Test Accuracy: 1.0

## Random Search

Seleciona aleatoriamente um conjunto de valores de hiperparâmetros para avaliação. Esse método pode frequentemente encontrar bons hiperparâmetros mais rápido porque explora um intervalo mais amplo.

In [5]:
# Busca aleatória
random_search = RandomizedSearchCV(clf, param_distributions=param_grid, n_iter=10, cv=5, n_jobs=-1) 
random_search.fit(X_train, y_train) 

# Imprime os melhores hiperparâmetros encontrados por cada método
print( "Best Hyperparameters - Random Search:" , random_search.best_params_) 

# Avalia os modelos com os melhores hiperparâmetros no conjunto de testes
random_search_best_model = random_search.best_estimator_ 
random_search_accuracy = random_search_best_model.score(X_test, y_test) 
print( "Random Search Test Accuracy:" , random_search_accuracy)

20 fits failed out of a total of 50.
The score on these train-test partitions for these parameters will be set to nan.
If these failures are not expected, you can try to debug them by setting error_score='raise'.

Below are more details about the failures:
--------------------------------------------------------------------------------
18 fits failed with the following error:
Traceback (most recent call last):
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\model_selection\_validation.py", line 895, in _fit_and_score
    estimator.fit(X_train, y_train, **fit_params)
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\base.py", line 1467, in wrapper
    estimator._validate_params()
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\base.py", line 666, in _validate_params
    validate_parameter_constraints(
  File "C:\ProgramData\anaconda3\Lib\site-packages\sklearn\utils\_param_validation.py", line 95, in validate_parameter_constraints
    raise InvalidParameter

Best Hyperparameters - Random Search: {'n_estimators': 200, 'min_samples_split': 5, 'min_samples_leaf': 4, 'max_features': 'sqrt', 'max_depth': 20}
Random Search Test Accuracy: 1.0


## Best Hyperparameters - Random Search: 
{'n_estimators': 200, 'min_samples_split': 5, 'min_samples_leaf': 4, 'max_features': 'sqrt', 'max_depth': 20}
Random Search Test Accuracy: 1.00

## Bayesian Optimization 
Usa modelos probabilísticos para modelar a função objetiva (como precisão do modelo) e decide onde avaliar em seguida com base nas previsões do modelo. Ela tende a selecionar hiperparâmetros que provavelmente melhorarão o modelo, tornando-o altamente eficiente em encontrar boas configurações em menos iterações.

In [8]:
#!pip install scikit-optimize
from skopt import BayesSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split


iris = load_iris()
X, y = iris.data, iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

clf = RandomForestClassifier()

In [12]:
# define hiperparametros

param_space = {
    'n_estimators': (50, 200),
    'max_depth': (1, 20),
    'min_samples_split': (2, 10),
    'min_samples_leaf': (1, 4),
    'max_features': ['sqrt', 'log2', None],
}

In [13]:
opt = BayesSearchCV(
    clf, param_space, cv=5, n_iter=50, n_jobs=-1, random_state=42, verbose=1
)
opt.fit(X_train, y_train)

print("Best Hyperparameters - Bayesian Optimization:", opt.best_params_)

best_model = opt.best_estimator_
test_accuracy = best_model.score(X_test, y_test)
print("Test Accuracy:", test_accuracy)

Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Fitting 5 folds for each of 1 candidates, totalling 5 fi

## Best Hyperparameters - Bayesian Optimization: 
OrderedDict({'max_depth': 9, 'max_features': 'log2', 'min_samples_leaf': 4, 'min_samples_split': 10, 'n_estimators': 50})
Test Accuracy: 1.0

## Resumo

- A Pesquisa em Grade é simples e confiável, mas pode ser computacionalmente cara para grandes espaços de pesquisa.

- A busca aleatória é mais eficiente para espaços de busca maiores e geralmente encontra boas soluções rapidamente.

- A otimização bayesiana é eficiente para espaços de busca complexos e requer menos iterações do que a busca em grade ou aleatória.