# Grid Search

Grid Search é uma técnica de otimização de hiperparâmetros utilizada em aprendizado de máquina para encontrar a melhor combinação de parâmetros para um modelo. O objetivo é testar exaustivamente todas as combinações possíveis de um conjunto pré-definido de parâmetros e selecionar a combinação que resulta no melhor desempenho do modelo.

## Como Funciona

1. **Definição dos Hiperparâmetros**: Primeiro, você define os hiperparâmetros que deseja otimizar e os valores possíveis para cada um deles. Por exemplo, para um modelo de Support Vector Machine (SVM), você pode querer otimizar os parâmetros `C` e `gamma`.

2. **Criação da Grade de Parâmetros**: Com os hiperparâmetros definidos, você cria uma grade (grid) que contém todas as combinações possíveis desses parâmetros. Por exemplo, se `C` pode ser [0.1, 1, 10] e `gamma` pode ser [0.01, 0.1, 1], a grade terá 9 combinações diferentes.

3. **Treinamento e Validação**: Para cada combinação de parâmetros na grade, o modelo é treinado e avaliado usando validação cruzada. Isso garante que o desempenho do modelo seja avaliado de forma robusta e não dependa de uma única divisão dos dados.

4. **Seleção do Melhor Modelo**: Após avaliar todas as combinações, a combinação de parâmetros que resulta no melhor desempenho (por exemplo, maior acurácia, menor erro, etc.) é selecionada como a melhor.

## Exemplo de Uso com Scikit-Learn

Aqui está um exemplo de como realizar Grid Search usando a biblioteca Scikit-Learn em Python:

```python
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC

# Definindo o modelo
model = SVC()

# Definindo os hiperparâmetros e seus valores possíveis
param_grid = {
    'C': [0.1, 1, 10],
    'gamma': [0.01, 0.1, 1],
    'kernel': ['rbf']
}

# Configurando o Grid Search com validação cruzada
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, scoring='accuracy')

# Treinando o modelo com Grid Search
grid_search.fit(X_train, y_train)

# Melhor combinação de hiperparâmetros
print("Melhores hiperparâmetros:", grid_search.best_params_)

# Melhor modelo treinado
best_model = grid_search.best_estimator_
```

## Vantagens

- **Exaustividade**: Testa todas as combinações possíveis de hiperparâmetros, garantindo que a melhor combinação seja encontrada.
- **Facilidade de Implementação**: Ferramentas como Scikit-Learn facilitam a implementação do Grid Search.

## Desvantagens

- **Custo Computacional**: Pode ser computacionalmente caro, especialmente com grandes grades de parâmetros e grandes conjuntos de dados.
- **Tempo de Execução**: Pode levar muito tempo para ser concluído, dependendo do número de combinações e do tamanho dos dados.

Grid Search é uma técnica poderosa para otimização de hiperparâmetros, mas deve ser usada com cuidado devido ao seu custo computacional.

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import accuracy_score


from sklearn.model_selection import (
    GridSearchCV,
    train_test_split
)

In [3]:
breast_cancer_X, breast_cancer_y = load_breast_cancer(return_X_y=True)
X = pd.DataFrame(breast_cancer_X)
y = pd.Series(breast_cancer_y).map({0: 1, 1: 0})

X.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,20,21,22,23,24,25,26,27,28,29
0,17.99,10.38,122.8,1001.0,0.1184,0.2776,0.3001,0.1471,0.2419,0.07871,...,25.38,17.33,184.6,2019.0,0.1622,0.6656,0.7119,0.2654,0.4601,0.1189
1,20.57,17.77,132.9,1326.0,0.08474,0.07864,0.0869,0.07017,0.1812,0.05667,...,24.99,23.41,158.8,1956.0,0.1238,0.1866,0.2416,0.186,0.275,0.08902
2,19.69,21.25,130.0,1203.0,0.1096,0.1599,0.1974,0.1279,0.2069,0.05999,...,23.57,25.53,152.5,1709.0,0.1444,0.4245,0.4504,0.243,0.3613,0.08758
3,11.42,20.38,77.58,386.1,0.1425,0.2839,0.2414,0.1052,0.2597,0.09744,...,14.91,26.5,98.87,567.7,0.2098,0.8663,0.6869,0.2575,0.6638,0.173
4,20.29,14.34,135.1,1297.0,0.1003,0.1328,0.198,0.1043,0.1809,0.05883,...,22.54,16.67,152.2,1575.0,0.1374,0.205,0.4,0.1625,0.2364,0.07678


In [4]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Grid Search for Hyperparameters

In [6]:
# Set up the model
gbm = GradientBoostingClassifier(random_state=42)

# Determine the hyperparameters space
param_grid = {
    'n_estimators': [10, 20, 50, 100],
    'min_samples_split': [2, 5, 10],
    'max_depth': [1, 2, 3, 4, None]
}

print('Number of hyperparam combinations: ',
      len(param_grid['n_estimators']) *
      len(param_grid['min_samples_split']) *
      len(param_grid['max_depth']))

Number of hyperparam combinations:  60


In [12]:
#Set up the grid search
search = GridSearchCV(gbm, param_grid,refit = True , cv=5, scoring='accuracy')

#Find best hyperparameters
search.fit(X_train, y_train)

In [14]:
# The best parameters are stored in an attribute
search.best_params_

{'max_depth': 1, 'min_samples_split': 2, 'n_estimators': 100}

In [9]:
#We also find athe data for all models evoluated
results = pd.DataFrame(search.cv_results_)
print(results.head())

   mean_fit_time  std_fit_time  mean_score_time  std_score_time  \
0       0.012997      0.001602         0.001599        0.001203   
1       0.022111      0.001347         0.001504        0.000447   
2       0.054444      0.003020         0.001187        0.000753   
3       0.105343      0.001232         0.001503        0.000636   
4       0.012101      0.000290         0.001221        0.000351   

  param_max_depth  param_min_samples_split  param_n_estimators  \
0               1                        2                  10   
1               1                        2                  20   
2               1                        2                  50   
3               1                        2                 100   
4               1                        5                  10   

                                              params  split0_test_score  \
0  {'max_depth': 1, 'min_samples_split': 2, 'n_es...           0.983542   
1  {'max_depth': 1, 'min_samples_split': 2, 'n_es.

In [16]:

from sklearn.metrics import roc_auc_score

X_train_preds = search.predict_proba(X_train)[:, 1]
X_test_preds = search.predict_proba(X_test)[:, 1]

print('Train ROC AUC: ', roc_auc_score(y_train, X_train_preds))
print('Test ROC AUC: ', roc_auc_score(y_test, X_test_preds))
train_accuracy = accuracy_score(y_train, search.predict(X_train))
test_accuracy = accuracy_score(y_test, search.predict(X_test))

print('Train Accuracy: ', train_accuracy)
print('Test Accuracy: ', test_accuracy)

Train ROC AUC:  0.9968138370505234
Test ROC AUC:  0.9927939731411726
Train Accuracy:  0.9912087912087912
Test Accuracy:  0.956140350877193
