## Diferenças entre AdaBoost e GBM:

1. **Método de Ponderação de Instâncias**:
   - **AdaBoost**: Atribui pesos diferentes às instâncias de treinamento, focando mais nas instâncias mal classificadas.
   - **GBM**: Usa gradient descent (descida do gradiente) para ajustar os erros residuais das previsões anteriores, não usando pesos de instância.


2. **Modelos Fracos**:
   - **AdaBoost**: Usa modelos fracos simples, como árvores de decisão rasas (stumps) por padrão.
   - **GBM**: Geralmente, utiliza árvores de decisão profundas como modelos fracos, que podem ser mais complexos.


3. **Combinação de Modelos**:
   - **AdaBoost**: Combina modelos de maneira sequencial, onde cada modelo fraco é ajustado com base nos erros do modelo anterior.
   - **GBM**: Combina modelos de maneira sequencial, ajustando cada modelo fraco para minimizar o gradiente da função de perda em relação aos erros residuais.
   
   
4. **Taxa de Aprendizado (Learning Rate)**:
   - **AdaBoost**: Possui uma taxa de aprendizado (learning rate) que controla o peso das previsões de cada modelo fraco.
   - **GBM**: Também possui uma taxa de aprendizado, que controla a contribuição de cada modelo fraco, mas é usado de maneira diferente do AdaBoost.


5. **Algoritmo de Construção de Árvores**:
    - **AdaBoost**: Usa árvores de decisão simples, como stumps (árvores com apenas um nó de decisão).
    - **GBM**: Utiliza uma técnica de crescimento de árvores chamada "leaf-wise" que pode ser mais eficiente em termos de tempo de treinamento e pode resultar em árvores mais profundas e complexas.

### Exemplo GradientBoostClassifier:

In [4]:
from sklearn.datasets import make_hastie_10_2
from sklearn.ensemble import GradientBoostingClassifier

In [13]:
X, y = make_hastie_10_2(random_state=0)
X_train, X_test = X[:2000], X[2000:]
y_train, y_test = y[:2000], y[2000:]

clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0, max_depth=1, random_state=0).fit(X_train,y_train)
clf.score(X_test,y_test)

0.913

### Exemplo GradientBoostRegressor:

In [14]:
from sklearn.datasets import make_regression
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import train_test_split

In [20]:
X, y = make_regression(random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
reg = GradientBoostingRegressor(random_state=0)
reg.fit(X_train, y_train)
print(reg.predict(X_test[1:2]))
reg.score(X_test, y_test)

[-61.05212593]


0.4233836905173889

### Hyperparametros GBM:

1. **Número de Árvores (n_estimators)**: Quantas árvores pequenas o modelo deve usar.
2. **Profundidade Máxima da Árvore (max_depth)**: Quão profunda cada árvore pode crescer.
3. **Taxa de Aprendizado (learning_rate)**: Quão rápido o modelo aprende com os erros.
4. **Número Mínimo de Amostras nas Folhas (min_samples_leaf)**: Quanto dados são necessários em uma folha das árvores.
5. **Subamostragem (subsample)**: Que fração dos dados é usada para treinar cada árvore.
