# AdaBoost vs GBM.

## 5 Diferenças entre AdaBoost e GBM:

Diferença | AdaBoost | GBM
--- | --- | ---
Tipo de modelo base | Normalmente usa árvores de decisão rasas (stumps) como modelos base. | Pode usar árvores de decisão mais profundas ou outros modelos como base.
Peso dos modelos | Cada modelo é ponderado com base em sua precisão, e os erros são corrigidos nas iterações subsequentes. | Cada modelo é ajustado para corrigir os erros residuais do modelo anterior.
Foco no erro | Dá mais peso às amostras que foram classificadas incorretamente. | Foca na minimização do erro global, ajustando os resíduos.
Complexidade do modelo | Geralmente resulta em modelos mais simples e rápidos de treinar. | Pode resultar em modelos mais complexos e demorados para treinar.
Sensibilidade a ruído | Pode ser mais sensível a ruído nos dados devido ao foco em erros individuais. | Geralmente é mais robusto ao ruído, pois considera o erro global.

# Exemplo de uso do GBM

In [8]:
from sklearn.datasets import make_hastie_10_2
from sklearn.ensemble import GradientBoostingClassifier

X, y = make_hastie_10_2(random_state=0)
X_train, X_test = X[:2000], X[2000:]
y_train, y_test = y[:2000], y[2000:]

clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0,
    max_depth=1, random_state=0).fit(X_train, y_train)
clf.score(X_test, y_test)

0.913

# 5 Hyperparâmetros importantes do GBM:
- n_estimators: Número de árvores a serem construídas no ensemble.
- learning_rate: Taxa de aprendizado que controla o peso de cada árvore.
- max_depth: Profundidade máxima das árvores individuais.
- subsample: Fração de amostras a serem usadas para treinar cada árvore.
- random_state: Semente para o gerador de números aleatórios, garantindo reprodutibilidade dos resultados.

In [9]:
from sklearn.model_selection import GridSearchCV

param_grid = {
    'n_estimators': [50, 100, 150],
    'learning_rate': [0.01, 0.1, 1],
    'max_depth': [1, 3, 5],
    'subsample': [0.5, 0.75, 1.0]
}

grid_search = GridSearchCV(clf, param_grid, cv=5, n_jobs=-1)
grid_search.fit(X, y)
display(grid_search.best_params_)
display(grid_search.best_score_)



{'learning_rate': 1, 'max_depth': 3, 'n_estimators': 150, 'subsample': 0.75}

np.float64(0.94525)

# Agora falando sobre o Stochastic Gradient Boosting Machine (GBM):

Baseado em seu nome, sua maior diferença em relação ao Gradient Boosting Machine (GBM) tradicional é o uso de amostragem aleatória (stochastic) durante o treinamento. No Stochastic GBM, em cada iteração, uma amostra aleatória dos dados de treinamento é selecionada para treinar a próxima árvore. Isso ajuda a reduzir o overfitting e melhora a generalização do modelo.