## 1. Monte um passo a passo para o Bagging

Passo 1: Coletar um conjunto de dados de treinamento.

Passo 2: Dividir o conjunto de dados de treinamento em várias amostras de bootstrap. Isso envolve amostrar aleatoriamente observações com substituição.

Passo 3: Para cada amostra de bootstrap, treinar um modelo de aprendizado de máquina separado usando o conjunto de dados correspondente.

Passo 4: Realizar a previsão usando cada modelo treinado em um conjunto de dados de teste ou validação.

Passo 5: Agregar as previsões de todos os modelos. Isso pode ser feito por votação (no caso de classificação) ou média (no caso de regressão) das previsões dos modelos individuais.

Passo 6: Avaliar o desempenho do modelo agregado usando métricas adequadas, como acurácia, precisão, recall ou erro médio quadrático.

## 2. Explique com suas palavras o Bagging

O Bagging (Bootstrap Aggregating) é uma técnica de aprendizado de máquina que envolve a combinação de vários modelos independentes para formar um modelo agregado mais robusto. Ele se baseia no princípio de bootstrap, que consiste em criar múltiplas amostras de treinamento a partir do conjunto de dados original por amostragem aleatória com substituição.

Em vez de treinar um único modelo em todo o conjunto de dados de treinamento, o Bagging treina vários modelos em diferentes amostras de bootstrap. Cada modelo é treinado independentemente, o que permite capturar diferentes nuances e variações nos dados de treinamento.

Após o treinamento, as previsões individuais de cada modelo são combinadas por meio de uma estratégia de agregação, como votação (no caso de problemas de classificação) ou média (no caso de problemas de regressão). Isso resulta em um modelo agregado final que tende a ter um desempenho melhor em relação a um único modelo.

O Bagging é especialmente eficaz quando os modelos individuais são propensos a overfitting, ou seja, têm alta variância. Ao treinar modelos independentes em amostras de bootstrap, o Bagging reduz a variância geral do modelo agregado, resultando em uma maior estabilidade e melhor generalização para dados não vistos.

## 3. Implementar em python o código do Bagging

In [3]:
import seaborn as sns
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

# Carregar a base de dados do seaborn
data = sns.load_dataset('iris')

# Separar as features e o alvo
X = data.drop('species', axis=1)
y = data['species']

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar o modelo base
base_model = DecisionTreeClassifier()

# Criar o modelo Bagging
bagging_model = BaggingClassifier(base_estimator=base_model, n_estimators=10)

# Treinar o modelo Bagging
bagging_model.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred = bagging_model.predict(X_test)

# Calcular a acurácia
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)



Accuracy: 1.0
