### Exemplo usado na documentação do Scikit_learn:

In [25]:
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

In [26]:
X, y = load_iris(return_X_y=True)
clf = AdaBoostClassifier(n_estimators=100)
scores = cross_val_score(clf, X, y, cv=5)
print(f'A média usando cross_val_score é: {scores.mean()}')

A média usando cross_val_score é: 0.9466666666666665


### Usando o GrindSearch, tentei melhorar o desenpenho do modelo:

In [27]:
# Importando as bibliotecas necessárias
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier

In [28]:
# Carregando o conjunto de dados Iris
X, y = load_iris(return_X_y=True)

# Definindo os hiperparâmetros que deseja ajustar
param_grid = {
    'n_estimators': [50, 100, 200],
    'learning_rate': [0.1, 0.5, 1.0],
    'algorithm': ['SAMME', 'SAMME.R'],
    'random_state': [None, 42, 123],
    'estimator': [None, DecisionTreeClassifier(max_depth=1, min_samples_split=2)]
}

# Criando o classificador AdaBoost
clf = AdaBoostClassifier()

# Criando o objeto GridSearchCV
grid_search = GridSearchCV(clf, param_grid, cv=5)

# Executando a busca pelos melhores hiperparâmetros
grid_search.fit(X, y)


In [29]:
# Imprimindo os melhores hiperparâmetros encontrados
print("Melhores hiperparâmetros:", grid_search.best_params_)


Melhores hiperparâmetros: {'algorithm': 'SAMME', 'estimator': None, 'learning_rate': 0.1, 'n_estimators': 200, 'random_state': None}


In [30]:
# Obtendo a pontuação média da validação cruzada com os melhores hiperparâmetros
best_clf = grid_search.best_estimator_
scores = cross_val_score(best_clf, X, y, cv=5)


In [31]:
print("Pontuação média da validação cruzada com melhores hiperparâmetros:", scores.mean())

Pontuação média da validação cruzada com melhores hiperparâmetros: 0.96


Houve uma melhora significativa de 2% na predição com os melhores Hiperparametros