## 1. Monte um passo a passo para o Bagging
Bagging (Bootstrap Aggregating) é uma técnica de ensemble usada para melhorar a estabilidade e a acurácia de algoritmos de aprendizado de máquina. O processo pode ser dividido nos seguintes passos:

Bootstrap (amostragem):

Gerar várias amostras (com reposição) do conjunto de dados original.

Cada amostra terá o mesmo tamanho que o conjunto original, mas com possíveis repetições de exemplos.

Treinamento de modelos:

Treinar um modelo base (por exemplo, uma árvore de decisão) em cada amostra bootstrap.

Agregação:

Para problemas de regressão: tirar a média das previsões dos modelos.

Para problemas de classificação: usar votação majoritária (a classe mais votada entre os modelos).



## 2. Explique com suas palavras o Bagging

O Bagging é como uma votação de especialistas: em vez de confiar em apenas um modelo, ele cria vários modelos diferentes treinando cada um em subconjuntos variados dos dados. Esses subconjuntos são gerados aleatoriamente com reposição (bootstrap). Depois, cada modelo faz uma previsão e o resultado final é decidido por uma média (se for número) ou pela maioria dos votos (se for categoria). Essa técnica ajuda a reduzir o risco de overfitting e torna o modelo mais robusto.


In [3]:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn.utils import resample
import numpy as np

X, y = load_iris(return_X_y=True)

n_estimators = 10
random_state = 42
np.random.seed(random_state)

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=random_state)

models = []

for i in range(n_estimators):
    X_sample, y_sample = resample(X_train, y_train, replace=True, random_state=random_state + i)
    model = DecisionTreeClassifier(random_state=random_state + i)
    model.fit(X_sample, y_sample)
    models.append(model)

predictions = np.array([model.predict(X_test) for model in models])
predictions = predictions.T

from scipy.stats import mode
y_pred, _ = mode(predictions, axis=1)

accuracy = accuracy_score(y_test, y_pred)
print("Acurácia do Bagging:", accuracy)

Acurácia do Bagging: 1.0
