# Bagging

Trata-se de uma técnica de Ensemble que visa reduzir a variância e, assim, evitar o overfitting.
Um exemplo de algoritmo que faz uso da técnica de Bagging é o RandomForest, que utiliza conjuntos de árvores de decisão.

In [2]:
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

In [3]:
# Carregar os dados
data = load_digits()
X = data.data
y = data.target

In [4]:
# Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [5]:
# Criar o modelo RandomForest
model = RandomForestClassifier(n_estimators=100, random_state=42)

In [6]:
# Treinar o modelo
model.fit(X_train, y_train)

In [7]:
# Fazer previsões
predictions = model.predict(X_test)

In [8]:
# Avaliar a precisão
accuracy = accuracy_score(y_test, predictions)
print(f"Precisão do RandomForest: {accuracy:.2f}")

Precisão do RandomForest: 0.97


# Boosting

Trata-se dos modelos base que são treinados de forma sequencial, em que cada modelo se concentra em corrigir o modelo anterior.
No caso do Boosting, temos como exemplo o AdaBoost (Adaptive Boosting), que é um algoritmo que atribui pesos diferentes aos dados durante o treinamento.

In [18]:
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

In [20]:
# Carregar os dados
data = load_digits()
X = data.data
y = data.target

In [22]:
# Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [24]:
# Criar o modelo base (mais complexo)
base_model = DecisionTreeClassifier(max_depth=5, random_state=42)

In [26]:
# Criar o modelo AdaBoost com o modelo base
model = AdaBoostClassifier(base_model, n_estimators=50, random_state=42)

In [28]:
# Treinar o modelo
model.fit(X_train, y_train)

In [30]:
# Fazer previsões
predictions = model.predict(X_test)

In [32]:
# Avaliar a precisão
accuracy = accuracy_score(y_test, predictions)
print(f"Precisão do AdaBoost: {accuracy:.2f}")

Precisão do AdaBoost: 0.96


![Tabela.jpg](attachment:bb7f4109-efda-46b0-aa78-d9496c76945d.jpg)