# Adaboost

### 5 diferenças entre o Random Forest e o AdaBoost

- Abordagem de treinamento: Random Forest usa um processo de treinamento de bootstrap, onde várias amostras são retiradas do conjunto de dados de treinamento para cada árvore individual. O AdaBoost, por outro lado, usa um processo de treinamento iterativo, onde os exemplos mal classificados são ponderados mais fortemente a cada iteração.


- Tamanho do conjunto de árvores: Random Forest usa várias árvores independentes para fazer previsões com todas as features, enquanto o AdaBoost usa uma floresta de árvores, que é construída e atualizada em cada iteração e tem um nó e duas folhas (stump) e apenas uma feature.

-  Processamento: Random Forest roda as árvores em paralelo, enquanto o AdaBoost usa uma abordagem sequencial

- Sensibilidade a ruídos: Random Forest é menos sensível a ruídos e valores discrepantes nos dados de treinamento do que o AdaBoost. Isso ocorre porque o Random Forest usa a média de várias previsões de árvores independentes, o que reduz a influência de valores discrepantes individuais. Enquanto o AdaBoost utiliza a soma dos pesos ponderadamente.

- Tolerância a sobreajuste: Random Forest tem uma tendência a sobreajustar menos do que o AdaBoost, especialmente em conjuntos de dados com muitas características. Isso ocorre porque a construção de várias árvores independentes reduz a probabilidade de que um conjunto específico de recursos seja superadaptado.

## Exemplo AdaBoost Scikit Learn

In [1]:
from sklearn.model_selection import cross_val_score
from sklearn.datasets import load_iris
from sklearn.ensemble import AdaBoostClassifier

X, y = load_iris(return_X_y=True)
clf = AdaBoostClassifier(n_estimators=100)
scores = cross_val_score(clf, X, y, cv=5)
scores.mean()

0.9466666666666665

## Hiperparâmetros do AdaBoost

- n_estimators: Número de estimadores
- base_estimator: Estimador que servirá de base para a construção do Ensemble. Por padrão, são árvores de decisão.
- max_depth: profundidade máxima de cada árvore de decisão. O padrão é 1.
- min_samples_split: mínimo de amostras em cada nó para fezer a divisão.
- learning_rate: Peso atribuido a cada classificador em cada iteração do Boosting.

## GridSearch para encontrar os melhores hyperparametros para o conjunto de dados do exemplo (load_iris)

In [11]:
import numpy as np
from sklearn.model_selection import GridSearchCV

clf = AdaBoostClassifier()

params = {
    'n_estimators': np.arange(1, 202, 20),
    'learning_rate': np.exp(np.arange(1, 20, 4))
}

grid = GridSearchCV(
    estimator = clf,
    param_grid = params,
    scoring = 'accuracy',
    cv = 3
)

grid.fit(X, y)

grid.score(X, y)

0.7933333333333333