Exemplo de GBM da documentação do *scikit_learn*

In [4]:
from sklearn.datasets import make_hastie_10_2
from sklearn.ensemble import HistGradientBoostingClassifier

# Carregando o conjunto de dados
X, y = make_hastie_10_2(random_state=0)
X_train, X_test = X[:2000], X[2000:]
y_train, y_test = y[:2000], y[2000:]

# Criando o classificador GradientBoostingClassifier
clf = HistGradientBoostingClassifier(max_iter=100).fit(X_train, y_train)
accuracy = clf.score(X_test, y_test)
print("Acurácia do modelo base:", accuracy)


Acurácia do modelo base: 0.8965


## Usando o GrindSearch, tentei melhorar o desenpenho do modelo:

In [None]:
# Importando as bibliotecas necessarias
from sklearn.datasets import make_hastie_10_2
from sklearn.experimental import enable_hist_gradient_boosting
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import GridSearchCV

# Hiperparâmetros a serem ajustados:
param_grid = {
    'loss': ['auto', 'binary_crossentropy'],  # Função de perda a ser otimizada (auto ou binary_crossentropy).
    'learning_rate': [0.05, 0.08, 0.1],  # Taxa de aprendizado que controla a contribuição de cada etapa de boosting.
    'max_iter': [50, 100, 200],  # Número máximo de estágios de boosting a serem executados.
    'max_leaf_nodes': [10, 15, 31],  # Número máximo de folhas em cada árvore.
    'min_samples_leaf': [1, 2, 4],  # Número mínimo de amostras em cada folha das árvores.
}

# Criando o objeto GridSearchCV
grid_search = GridSearchCV(clf, param_grid, cv=5)

# Executando a busca pelos melhores hiperparâmetros
grid_search.fit(X_train, y_train)


In [12]:
# Imprimindo os melhores hiperparâmetros encontrados
print("Melhores hiperparâmetros:", grid_search.best_params_)

Melhores hiperparâmetros: {'learning_rate': 0.1, 'loss': 'auto', 'max_iter': 200, 'max_leaf_nodes': 10, 'min_samples_leaf': 4}


In [13]:
# Calculando a acurácia com os melhores hiperparâmetros
best_clf = grid_search.best_estimator_
best_accuracy = best_clf.score(X_test, y_test)

In [14]:
# Imprimindo a acuracia do melhor modelo
print("Acurácia com melhores hiperparâmetros:", best_accuracy)

Acurácia com melhores hiperparâmetros: 0.9194


Houve uma melhora significativa de 2% na predição com os melhores Hiperparametros