Métodos Ensemble: Bagging
o	Implemente o método Bagging (Bootstrap Aggregating) a partir do zero usando árvores de decisão. Compare a precisão do modelo Bagging com uma única árvore de decisão.


In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score


In [2]:
# 1. Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

In [3]:
# 2. Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [4]:
# Função para implementar o Bagging
class Bagging:
    def __init__(self, base_estimator, n_estimators):
        self.base_estimator = base_estimator
        self.n_estimators = n_estimators
        self.models = []
        
    def fit(self, X, y):
        n_samples = X.shape[0]
        for _ in range(self.n_estimators):
            # Amostragem com reposição
            indices = np.random.choice(range(n_samples), size=n_samples, replace=True)
            X_sample = X[indices]
            y_sample = y[indices]
            model = self.base_estimator()
            model.fit(X_sample, y_sample)
            self.models.append(model)
    
    def predict(self, X):
        # Fazer previsões para cada modelo
        predictions = np.array([model.predict(X) for model in self.models])
        # Retornar a maioria das previsões (votação)
        return np.array([np.bincount(pred).argmax() for pred in predictions.T])


In [5]:
# 3. Treinar uma única árvore de decisão
single_tree = DecisionTreeClassifier(random_state=42)
single_tree.fit(X_train, y_train)
y_pred_single = single_tree.predict(X_test)
accuracy_single = accuracy_score(y_test, y_pred_single)

In [6]:
# 4. Treinar o modelo Bagging
n_estimators = 10  # Número de árvores no ensemble
bagging_model = Bagging(base_estimator=DecisionTreeClassifier, n_estimators=n_estimators)
bagging_model.fit(X_train, y_train)
y_pred_bagging = bagging_model.predict(X_test)
accuracy_bagging = accuracy_score(y_test, y_pred_bagging)

In [7]:
# 5. Comparar a precisão
print(f'Acurácia de uma única árvore de decisão: {accuracy_single * 100:.2f}%')
print(f'Acurácia do modelo Bagging: {accuracy_bagging * 100:.2f}%')

Acurácia de uma única árvore de decisão: 100.00%
Acurácia do modelo Bagging: 100.00%
