In [None]:
# 1. Como calculam os pesos/erros
# AdaBoost: Aumenta os pesos das amostras mal classificadas em cada iteração. O foco é forçar os próximos modelos a corrigirem os erros dos anteriores.

# GBM: Modela os resíduos (erros) da predição anterior, ou seja, cada novo modelo tenta prever o erro do modelo anterior.

# 2. Função de perda usada
# AdaBoost: Usa implicitamente uma função de perda exponencial (por isso é sensível a outliers).

# GBM: Permite escolher diversas funções de perda (ex: MSE, MAE, log-loss), tornando-o mais flexível.

# 3. Peso dos estimadores
# AdaBoost: Cada modelo fraco recebe um peso α com base em sua performance.

# GBM: Os modelos são somados com uma taxa de aprendizado, mas não recebem pesos explícitos baseados em erro.

# 4. Sensibilidade a outliers
#AdaBoost: É mais sensível a outliers, pois o erro exponencial penaliza fortemente erros grandes.

# GBM: É menos sensível a outliers dependendo da função de perda usada (ex: MAE é mais robusto).

# 5. Implementação e flexibilidade
#AdaBoost: Mais simples, com menos opções de customização.
#GBM: Mais flexível e poderoso, permite ajuste fino (função de perda, subsample, regularização, etc).

In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.datasets import fetch_california_housing
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.metrics import mean_squared_error, r2_score



In [3]:
iris = load_iris()
X, y = iris.data, iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

gbc = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)

gbc.fit(X_train, y_train)

y_pred = gbc.predict(X_test)

print("Acurácia:", accuracy_score(y_test, y_pred))
print("Relatório de Classificação:\n", classification_report(y_test, y_pred))


Acurácia: 1.0
Relatório de Classificação:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45



In [4]:
housing = fetch_california_housing()
X, y = housing.data, housing.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

gbr = GradientBoostingRegressor(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)

gbr.fit(X_train, y_train)

y_pred = gbr.predict(X_test)

print("RMSE:", mean_squared_error(y_test, y_pred, squared=False))
print("R²:", r2_score(y_test, y_pred))


RMSE: 0.5369947659860906
R²: 0.7803012822391022




In [None]:
# O Stochastic Gradient Boosting introduz uma amostragem aleatória (subamostragem) dos dados em cada iteração do boosting, ou seja, em vez de usar o dataset completo para treinar cada árvore base, ele usa uma amostra aleatória (sem reposição) de uma fração dos dados.