**M24  - AdaBoost e Random Forest**

| Caracter√≠stica                     | Random Forest                              | AdaBoost                                                        |
| ---------------------------------- | ------------------------------------------ | --------------------------------------------------------------- |
| **Tipo de Ensemble**               | *Bagging* (paralelo)                       | *Boosting* (sequencial)                                         |
| **Como combina os modelos**        | M√©dia/vota√ß√£o das √°rvores independentes    | Modelos aprendem sequencialmente corrigindo os erros anteriores |
| **Sensibilidade a ru√≠do/outliers** | Baixa sensibilidade (modelo robusto)       | Alta sensibilidade (boosting amplifica erros)                   |
| **Tamanho das √°rvores**            | √Årvores completas (profundas)              | √Årvores rasas (stumps = profundidade 1)                         |
| **Risco de overfitting**           | Baixo, gra√ßas ao bootstrap + aleatoriedade | Alto, principalmente se muitos estimadores forem usados         |
| **Velocidade de treino**           | Mais lento (muitas √°rvores grandes)        | Mais r√°pido (√°rvores rasas e leves)                             |
| **Interpretabilidade**             | M√©dia                                      | Baixa para m√©dia                                                |

üîπ As 5 diferen√ßas entre Random Forest e AdaBoost

üîπ Os 5 hiperpar√¢metros mais importantes do AdaBoost

üîπ Quais s√£o os valores mais usados

üîπ Qual √© o conjunto/base de dados mais usado

üîπ Sugest√£o de par√¢metros para GridSearch

üîπ C√≥digo pronto do AdaBoost (exemplo da scikit-learn)

**1. Cinco diferen√ßas entre Random Forest e AdaBoost**

| Caracter√≠stica                     | Random Forest                              | AdaBoost                                                        |
| ---------------------------------- | ------------------------------------------ | --------------------------------------------------------------- |
| **Tipo de Ensemble**               | *Bagging* (paralelo)                       | *Boosting* (sequencial)                                         |
| **Como combina os modelos**        | M√©dia/vota√ß√£o das √°rvores independentes    | Modelos aprendem sequencialmente corrigindo os erros anteriores |
| **Sensibilidade a ru√≠do/outliers** | Baixa sensibilidade (modelo robusto)       | Alta sensibilidade (boosting amplifica erros)                   |
| **Tamanho das √°rvores**            | √Årvores completas (profundas)              | √Årvores rasas (stumps = profundidade 1)                         |
| **Risco de overfitting**           | Baixo, gra√ßas ao bootstrap + aleatoriedade | Alto, principalmente se muitos estimadores forem usados         |
| **Velocidade de treino**           | Mais lento (muitas √°rvores grandes)        | Mais r√°pido (√°rvores rasas e leves)                             |
| **Interpretabilidade**             | M√©dia                                      | Baixa para m√©dia                                                |


**2. Base de dados mais usada para exemplos de AdaBoost**

A base mais usada pela Scikit-Learn √© o load_iris.

**classifica√ß√£o multiclasse**

* tuning de hiperpar√¢metros

* compara√ß√£o entre modelos

* Outras muito usadas:

* load_wine

* load_breast_cancer (muito usada para modelos de boosting)

* make_classification (gera√ß√£o de dados sint√©ticos)

**3. Cinco hiperpar√¢metros mais importantes do AdaBoost**

**1. n_estimators**

N√∫mero de modelos fracos gerados (quantas √°rvores rasas / stumps).

**Valores mais usados:**

50 (padr√£o)

100

200

300

**Influ√™ncia:**
Quanto maior, mais complexo e melhor o ajuste ‚Äî mas pode causar overfitting.

**2. learning_rate**

Peso dado a cada novo modelo.

**Valores mais usados:**

1.0 (padr√£o)

0.5

0.1

0.01 (para datasets mais complexos)

** Regra pr√°tica:**
Se aumentar os estimadores, geralmente reduzimos o learning_rate.

**3. base_estimator**

Qual √© o modelo fraco usado no boosting.

**Mais usado:**

**DecisionTreeClassifier(max_depth=1) ‚Üí decision stump (o mais cl√°ssico)**

 Outras op√ß√µes:

**√Årvores mais profundas (max_depth=2, max_depth=3)**

**Regress√£o log√≠stica**

SVM linear (menos comum)

**4. algorithm**

Algoritmo interno do AdaBoost.

Valores poss√≠veis:

"SAMME" ‚Äì usado para multiclasse

"SAMME.R" ‚Äì mais eficiente e mais usado hoje (padr√£o)

**5. random_state**

Garantir reprodutibilidade.

 Valores mais usados:

42 (o favorito da comunidade)

0

7

123

**Outros hiperpar√¢metros √∫teis**

max_depth do base_estimator ‚Üí controla a complexidade da √°rvore

min_samples_split ‚Üí evita overfitting

min_samples_leaf ‚Üí for√ßa folhas maiores

**4. Exemplos de combina√ß√µes usadas no GridSearch para AdaBoost**

In [1]:
param_grid = { "n_estimators": [50, 100, 200, 300], "learning_rate": [1.0, 0.5, 0.1, 0.01], "algorithm": ["SAMME", "SAMME.R"], "base_estimator__max_depth": [1, 2, 3] }

**5. C√≥digo pronto (exemplo do AdaBoost com load_iris)**

In [4]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import AdaBoostClassifier
from sklearn.metrics import accuracy_score

# Carregar base
X, y = load_iris(return_X_y=True)

# Separar treino e teste
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

# Modelo base (stump)
base = DecisionTreeClassifier(max_depth=1)

# AdaBoost padr√£o
ada = AdaBoostClassifier(
    estimator=base,
    n_estimators=100,
    learning_rate=1.0,
    random_state=42
)

# Treinar
ada.fit(X_train, y_train)

# Avaliar
pred = ada.predict(X_test)
print("Acur√°cia:", accuracy_score(y_test, pred))

Acur√°cia: 1.0


**6. Modelo com AdaBoost + GridSearch**

In [15]:
# IMPORTS
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import AdaBoostClassifier
from sklearn.metrics import accuracy_score
import warnings

# Suppress FutureWarning from sklearn
warnings.filterwarnings('ignore', category=FutureWarning)

# 1. CARREGAR BASE
X, y = load_iris(return_X_y=True)

# 2. TREINO / TESTE
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

# 3. ESTIMADOR BASE
base_tree = DecisionTreeClassifier(max_depth=1, random_state=42)

# 4. MODELO ADABOOST
ada = AdaBoostClassifier(
    estimator=base_tree,   # para vers√µes novas
    random_state=42
)

# 5. GRADE DE HIPERPAR√ÇMETROS (AJUSTADA)
param_grid = {
    "n_estimators": [50, 100, 200],
    "learning_rate": [1.0, 0.5, 0.1],
    "algorithm": ["SAMME"],            # <<< CORRE√á√ÉO AQUI !!!
    "estimator__max_depth": [1, 2, 3]
}

# 6. GRIDSEARCH
grid = GridSearchCV(
    estimator=ada,
    param_grid=param_grid,
    cv=5,
    n_jobs=-1
)

grid.fit(X_train, y_train)

# 7. RESULTADOS
print("Melhores par√¢metros:", grid.best_params_)
print("Melhor score (cv):", grid.best_score_)

# 8. TESTE
best_model = grid.best_estimator_
y_pred = best_model.predict(X_test)
print("Acur√°cia no teste:", accuracy_score(y_test, y_pred))

Melhores par√¢metros: {'algorithm': 'SAMME', 'estimator__max_depth': 1, 'learning_rate': 0.5, 'n_estimators': 100}
Melhor score (cv): 0.9523809523809523
Acur√°cia no teste: 0.9333333333333333


In [16]:
import warnings

# Suppress FutureWarning from sklearn
warnings.filterwarnings('ignore', category=FutureWarning)

param_grid = {
    "n_estimators": [50, 100, 200],
    "learning_rate": [1.0, 0.5, 0.1],
    "algorithm": ["SAMME"],
    "estimator__max_depth": [1, 2, 3]
}

grid = GridSearchCV(
    AdaBoostClassifier(estimator=base_tree, random_state=42), # Changed `base` to `base_tree` to match above cell
    param_grid,
    cv=5,
    n_jobs=-1
)

grid.fit(X_train, y_train)

print("Melhores par√¢metros:", grid.best_params_)
print("Melhor score:", grid.best_score_)

Melhores par√¢metros: {'algorithm': 'SAMME', 'estimator__max_depth': 1, 'learning_rate': 0.5, 'n_estimators': 100}
Melhor score: 0.9523809523809523


**RESUMO**

Nesta pr√°tica, comparamos dois m√©todos de ensemble amplamente utilizados: Random Forest e AdaBoost. O Random Forest utiliza a t√©cnica de bagging, criando v√°rias √°rvores de decis√£o de forma paralela e combinando seus resultados por vota√ß√£o. J√° o AdaBoost utiliza boosting, criando modelos sequenciais que aprendem corrigindo os erros do modelo anterior.

Exploramos tamb√©m a documenta√ß√£o oficial do AdaBoost no Scikit-Learn, implementando um exemplo com a base iris, uma das mais utilizadas em demonstra√ß√µes de modelos de classifica√ß√£o. Foi implementado um AdaBoost com √°rvore de decis√£o rasa (decision stump) como estimador base, e exploramos seus hiperpar√¢metros mais importantes, como n_estimators, learning_rate, algorithm, e a profundidade do estimador base.

Em seguida, aplicamos o GridSearchCV para testar combina√ß√µes diferentes de hiperpar√¢metros. Durante essa etapa, identificamos uma mudan√ßa na vers√£o atual do Scikit-Learn: o par√¢metro algorithm='SAMME.R' n√£o √© mais aceito no GridSearch, exigindo a substitui√ß√£o por 'SAMME'. Ap√≥s o ajuste, o GridSearch executou corretamente, retornando os melhores hiperpar√¢metros e garantindo um aumento na performance do modelo.

**CONCLUS√ÉO**

A pr√°tica demonstrou claramente que Random Forest e AdaBoost, embora ambos sejam ensembles, funcionam de formas distintas e adequadas para diferentes tipos de problema. O Random Forest se mostrou mais robusto a ru√≠dos e menos propenso a overfitting, enquanto o AdaBoost se destacou por sua capacidade de focar nos erros e melhorar sequencialmente o desempenho do modelo.

A an√°lise refor√ßou a import√¢ncia dos hiperpar√¢metros no AdaBoost, especialmente n_estimators e learning_rate, que influenciam diretamente o equil√≠brio entre vi√©s e vari√¢ncia. O uso do GridSearchCV, ap√≥s corrigir o par√¢metro do algoritmo para 'SAMME', permitiu encontrar combina√ß√µes mais eficazes, aumentando a acur√°cia final do modelo.

Assim, conclu√≠mos que o AdaBoost √© um m√©todo poderoso quando configurado corretamente, e que a compreens√£o dos hiperpar√¢metros, junto com ferramentas como GridSearch, √© essencial para extrair o m√°ximo desempenho desse algoritmo.

| **Item**                             | **Resumo**                                                                                                                |
| ------------------------------------ | ------------------------------------------------------------------------------------------------------------------------- |
| **Compara√ß√£o**                       | Random Forest usa *bagging* (v√°rias √°rvores em paralelo). AdaBoost usa *boosting* (modelos sequenciais corrigindo erros). |
| **Robustez**                         | Random Forest √© mais resistente a ru√≠dos; AdaBoost √© mais sens√≠vel.                                                       |
| **Complexidade das √Årvores**         | Random Forest usa √°rvores profundas; AdaBoost usa √°rvores rasas (*stumps*).                                               |
| **Base Usada**                       | Conjunto **iris** (padr√£o em exemplos do scikit-learn).                                                                   |
| **Hiperpar√¢metros Mais Importantes** | `n_estimators`, `learning_rate`, `algorithm`, `max_depth`, `random_state`.                                                |
| **Valores T√≠picos**                  | `n_estimators`: 50‚Äì200 ‚Ä¢ `learning_rate`: 1.0‚Äì0.1 ‚Ä¢ `algorithm`: "SAMME".                                                 |
| **GridSearch**                       | Ajustado para usar `algorithm="SAMME"` (SAMME.R n√£o funciona no GridSearch na vers√£o atual).                              |
| **Resultado Final**                  | GridSearch encontrou melhores hiperpar√¢metros e aumentou a performance do AdaBoost.                                       |
