# Bagging
Bagging, que vem de "Bootstrap Aggregating", é uma técnica de aprendizado de máquina que ajuda a melhorar a precisão e a estabilidade dos modelos.
# 1 - Amostragem Bootstrap:
Cria várias amostras a partir de um conjunto de dados, a amostragem é feita com reposição. Isso significa que um mesmo dado pode aparecer várias vezes em uma mesma amostra.  
É como se você tivesse um saco de bolinhas coloridas e, para criar cada amostra, você pegasse algumas bolinhas, anotasse as cores e devolvesse as bolinhas para o saco. Assim, algumas cores podem ser repetidas em cada amostra.

# 2 - Treinamento de Modelos:
Para cada amostra criada na etapa anterior, um modelo de aprendizado de máquina é treinado. Esses modelos são chamados de modelos base ou base models.  
Podemos usar diversos algoritmos para treinar os modelos base. Podemos usar Arvore de decisão.

# 3 - Agregação de Previsões:
Depois que todos os modelos base são treinados é feita as previsões para cada um dos modelos.
As previsões dos modelos base são combinadas para gerar a previsão final. A forma de combinar as previsões depende do tipo de problema:  
- Classificação: A previsão final é a classe que recebeu mais votos dos modelos base.
- Regressão: A previsão final é a média das previsões dos modelos base.


In [78]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris

In [79]:
#Carregando o dataset iris
iris = load_iris()
X, y = iris.data, iris.target

In [80]:
#Dividindo o dataset em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [81]:
#Criando o modelo base
base_model = DecisionTreeClassifier(random_state=42)

In [82]:
#Criando o modelo de Bagging e usando o modelo base
bagging_model = BaggingClassifier(estimator=base_model, n_estimators=100, random_state=42)

In [83]:
#Treinando o modelo bagging
bagging_model.fit(X_train, y_train)

In [84]:
#Predizendo os valores de teste de Iris target
y_pred = bagging_model.predict(X_test)

In [85]:
#Calculando a acurácia do modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo Bagging: {accuracy:.2f}")

Acurácia do modelo Bagging: 1.00
