# GBM vs AdaBoost

- O GBM trabalha com uma floresta de árvores, já o AdaBoost trabalha com uma floresta de stumps;
- O primeiro passo no GBM é a média do y (target) e no outro é um stump;
- O GBM dá o mesmo peso para todas as respostas das árvores;
- Com o GBM, todas as predições possuem um multiplicador em comum (ETA) que irá influenciar na resposta final;
- Enquanto o AdaBoost busca predizer o valor de y, as árvores do GBM irão buscar prever da melhor forma os resíduos de y.

# Exemplo GBM

In [2]:
#Classificação
>>> from sklearn.datasets import make_hastie_10_2
>>> from sklearn.ensemble import GradientBoostingClassifier

>>> X, y = make_hastie_10_2(random_state=0)
>>> X_train, X_test = X[:2000], X[2000:]
>>> y_train, y_test = y[:2000], y[2000:]

>>> clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0,
...     max_depth=1, random_state=0).fit(X_train, y_train)
>>> clf.score(X_test, y_test)

0.913

In [3]:
#Regressão
>>> import numpy as np
>>> from sklearn.metrics import mean_squared_error
>>> from sklearn.datasets import make_friedman1
>>> from sklearn.ensemble import GradientBoostingRegressor

>>> X, y = make_friedman1(n_samples=1200, random_state=0, noise=1.0)
>>> X_train, X_test = X[:200], X[200:]
>>> y_train, y_test = y[:200], y[200:]
>>> est = GradientBoostingRegressor(
...     n_estimators=100, learning_rate=0.1, max_depth=1, random_state=0,
...     loss='squared_error'
... ).fit(X_train, y_train)
>>> mean_squared_error(y_test, est.predict(X_test))

5.009154859960321

# 5 Hyperparâmetros do GBM

1. max_depth: Profundidade máxima dos estimadores de regressão.
2. random_state: Controla a semente aleatória dada a cada estimador da árvore em cada aumento de iteração.
3. ccp_alpha: Parâmetro de complexidade usado para a poda mínima de custo-complexidade.
4. verbose: Fonece detalhes do progresso dos cálculos.
5. criterion: Mede a qualidade de uma divisão.

# Diferença do Stochastic GBM para o GBM padrão.

> O Stochastic GBM faz um subsample dos dados de treino de forma aleatória e sem reposição, ou seja, ao contrário do Bootstrap, ele foca em diminuir o número de linhas, assim melhora a robustez do Base Learner e a velocidade de treino. 