# Passo a Passo para Implementar Bagging

1. **Importar bibliotecas:** Carregue as bibliotecas necessárias, como `pandas`, `numpy` e classes de Bagging do `sklearn`.

2. **Carregar os dados:** Use pandas para carregar o conjunto de dados no formato desejado.

3. **Pré-processar os dados:** Limpe e trate os dados, incluindo lidar com valores nulos, escalonamento e codificação de variáveis categóricas.

4. **Dividir o conjunto de dados:** Separe os dados em conjuntos de treinamento e teste utilizando `train_test_split`.

5. **Definir o modelo base:** Escolha o modelo base para o Bagging, como uma árvore de decisão ou regressor linear.

6. **Configurar o Bagging:** Instancie o `BaggingClassifier` ou `BaggingRegressor` com o modelo base e parâmetros como o número de estimadores.

7. **Treinar o modelo:** Ajuste o modelo Bagging ao conjunto de treinamento com o método `.fit()`.

8. **Avaliar o desempenho:** Utilize métricas como `accuracy_score` ou `mean_squared_error` no conjunto de teste.

9. **Interpretar resultados:** Analise o desempenho do modelo em relação à abordagem sem Bagging.

10. **Iterar ou otimizar:** Ajuste hiperparâmetros como o número de estimadores e a profundidade do modelo base para melhorar os resultados.


# Explicando o que é O Bagging (Bootstrap Aggregating)
É uma técnica de aprendizado de máquina usada para melhorar a performance e reduzir a variância de modelos, tornando-os mais robustos e estáveis.

**Como funciona:**

1. Ele cria várias amostras aleatórias do conjunto de dados original com reposição (o que signfica que um mesmo dado pode ser usado mais de uma vez)
Modelos independentes: Treina um modelo separado para cada uma dessas amostras. Normalmente, o modelo base é simples, como árvores de decisão.

2. Combinação de previsões:
- Para classificação: Combina as previsões dos modelos usando votação (a classe mais votada é escolhida).
- Para regressão: Faz a média das previsões de todos os modelos.

**Resumindo:**
O Bagging cria vários modelos a partir de subconjuntos dos dados, treina cada um deles e depois combina os resultados para aumentar a precisão e evitar que o modelo final se ajuste demais (overfitting).


# Implementar o código em Python

In [13]:
# Importando bibliotecas necessárias
import numpy as np
import pandas as pd
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregando o conjunto de dados (Exemplo com iris do sklearn)
from sklearn.datasets import load_iris
data = load_iris()
X, y = data.data, data.target

# Dividindo o conjunto de dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelo base: Árvore de Decisão
base_model = DecisionTreeClassifier(random_state=42)

# Criando o modelo Bagging
bagging_model = BaggingClassifier(estimator=base_model, n_estimators=10, random_state=42)

# Treinando o modelo
bagging_model.fit(X_train, y_train)

# Fazendo previsões
y_pred = bagging_model.predict(X_test)

# Avaliando o desempenho
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo Bagging: {accuracy:.2f}")


Acurácia do modelo Bagging: 1.00
