In [None]:
#1. Estratégia de Aprendizado
#Random Forest: Usa o método de bagging (bootstrap aggregating) — cria múltiplas árvores independentes em subconjuntos aleatórios dos dados.

#AdaBoost: Usa o método de boosting — constrói os modelos de forma sequencial, onde cada novo modelo foca nos erros do anterior.

#2. Independência entre Árvores
#Random Forest: As árvores são treinadas independentemente umas das outras.

#AdaBoost: As árvores são dependentes, pois cada uma corrige os erros da anterior.

#3. Peso das Amostras
#Random Forest: Todas as amostras têm o mesmo peso ao longo do treinamento.

#AdaBoost: As amostras erradas recebem mais peso, para forçar o modelo seguinte a focar nelas.

#4. Tipo de Árvores Utilizadas
#Random Forest: Usa árvores profundas (não podadas) como base learners.

#AdaBoost: Costuma usar árvores rasas (geralmente stumps, com apenas uma divisão) como base learners.

#5. Robustez a Outliers
#Random Forest: Mais robusto a outliers e dados ruidosos.

#AdaBoost: Mais sensível a outliers, pois tenta corrigir todos os erros, mesmo os causados por ruído.

In [2]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report

iris = load_iris()
X, y = iris.data, iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

base_clf = DecisionTreeClassifier(max_depth=1)

ada_model = AdaBoostClassifier(
    estimator=base_clf,
    n_estimators=50,
    learning_rate=1.0,
    random_state=42
)

ada_model.fit(X_train, y_train)

y_pred = ada_model.predict(X_test)

print("Acurácia:", accuracy_score(y_test, y_pred))
print("Relatório de Classificação:\n", classification_report(y_test, y_pred))




Acurácia: 1.0
Relatório de Classificação:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45



In [3]:
# n_estimators
# learning_rate
# estimator
# algorithm
# random_state


In [9]:
from sklearn.datasets import load_iris
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report

base_model = DecisionTreeClassifier()

param_grid = {
    'n_estimators': [10, 50, 100],
    'learning_rate': [0.01, 0.1, 1.0],
    'estimator__max_depth': [1, 2, 3],
    'algorithm': ['SAMME', 'SAMME.R']
}

ada = AdaBoostClassifier(estimator=base_model, random_state=42)

grid_search = GridSearchCV(estimator=ada, param_grid=param_grid,
                           cv=5, scoring='accuracy', n_jobs=-1)

grid_search.fit(X_train, y_train)

print("Melhores hiperparâmetros encontrados:")
print(grid_search.best_params_)

best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)

print("\nRelatório de Classificação no Teste:")
print(classification_report(y_test, y_pred))

Melhores hiperparâmetros encontrados:
{'algorithm': 'SAMME', 'estimator__max_depth': 3, 'learning_rate': 0.1, 'n_estimators': 10}

Relatório de Classificação no Teste:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45

