### 1. Cite 5 diferenças entre o Random Forest e o AdaBoost

| Característica             | **Random Forest**                  | **AdaBoost**                                    |
| -------------------------- | ---------------------------------- | ----------------------------------------------- |
| **Tipo de ensemble**       | Bagging (paralelo)                 | Boosting (sequencial)                           |
| **Foco**                   | Reduz variância                    | Reduz viés                                      |
| **Construção das árvores** | Árvores completas e independentes  | Árvores rasas (stumps) e dependentes            |
| **Tratamento de erros**    | Cada árvore vê amostras aleatórias | Cada novo modelo foca nos erros do anterior     |
| **Peso dos modelos**       | Todas as árvores têm peso igual    | Modelos fracos têm pesos diferentes na predição |


### 2. Acesse o link Scikit-learn– adaboost , leia a explicação (traduza se for preciso) e crie um jupyter notebook contendo o exemplo do AdaBoost.

AdaBoost (Adaptive Boosting) é um método de ensemble que combina vários classificadores fracos (geralmente árvores de decisão rasas) em um modelo mais forte. Em cada etapa, ele ajusta os pesos dos exemplos de treino, focando mais nos que foram classificados incorretamente.

In [10]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

base_model = DecisionTreeClassifier(max_depth=1, random_state=42)

ada = AdaBoostClassifier(estimator=base_model, n_estimators=50, learning_rate=1.0, random_state=42)

ada.fit(X_train, y_train)

y_pred = ada.predict(X_test)
print("Acurácia do AdaBoost:", accuracy_score(y_test, y_pred))

Acurácia do AdaBoost: 1.0




### 3- Cite 5 Hyperparametros importantes no AdaBoost.

| Hiperparâmetro   | Função                                                                  |
| ---------------- | ----------------------------------------------------------------------- |
| `n_estimators`   | Número de modelos fracos (árvores) usados                               |
| `learning_rate`  | Peso que cada novo modelo tem na correção dos erros                     |
| `base_estimator` | Modelo fraco usado (por padrão, árvore de decisão com 1 nível)          |
| `algorithm`      | Algoritmo de boosting: "SAMME" ou "SAMME.R" (com ou sem probabilidades) |
| `random_state`   | Semente para garantir reprodutibilidade                                 |


In [1]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

In [2]:
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [4]:
import sklearn
print(sklearn.__version__)

1.5.1


In [5]:
base_model = DecisionTreeClassifier(max_depth=1, random_state=42)

ada = AdaBoostClassifier(estimator=base_model, n_estimators=50, learning_rate=1.0, random_state=42)

ada.fit(X_train, y_train)

y_pred = ada.predict(X_test)
print("Acurácia do AdaBoost:", accuracy_score(y_test, y_pred))

Acurácia do AdaBoost: 1.0




In [7]:
param_grid = {
    'n_estimators': [10, 50, 100],
    'learning_rate': [0.01, 0.1, 1.0],
    'estimator': [DecisionTreeClassifier(max_depth=1), DecisionTreeClassifier(max_depth=2)],
    'algorithm': ['SAMME', 'SAMME.R']
}

grid_search = GridSearchCV(AdaBoostClassifier(random_state=42), param_grid, cv=5)
grid_search.fit(X_train, y_train)

print("Melhores parâmetros encontrados:")
print(grid_search.best_params_)



Melhores parâmetros encontrados:
{'algorithm': 'SAMME', 'estimator': DecisionTreeClassifier(max_depth=2), 'learning_rate': 0.1, 'n_estimators': 50}


In [8]:
best_model = grid_search.best_estimator_
y_pred_best = best_model.predict(X_test)
print("Acurácia com melhores hiperparâmetros:", accuracy_score(y_test, y_pred_best))

Acurácia com melhores hiperparâmetros: 1.0
