| **Inicio** | **atrás 27** | **Siguiente 29** |
|----------- |-------------- |---------------|
| [🏠](../README.md) | [⏪](./27_Uniform_Distribution.ipynb)| [⏩](./29_%20Root_Mean_Square_Error.ipynb)|

# **28. Bagging**

Bagging es una técnica de ensemble que combina múltiples modelos para mejorar la estabilidad y la precisión del modelo final. Funciona entrenando varios modelos en conjuntos de datos de entrenamiento creados mediante bootstrap (muestreo con reemplazo), y luego agregando las predicciones de cada modelo para tomar una decisión final.

**Terminología:**

1. **Bootstrap:** Es una técnica de muestreo con reemplazo. Se crea un conjunto de datos bootstrap al seleccionar muestras del conjunto de datos de entrenamiento original de manera aleatoria y con reemplazo.

2. **Ensemble:** Es la combinación de varios modelos para formar un modelo más robusto y preciso.

**Algoritmo Bagging:**

1. **Entrenamiento:**
   - Selecciona aleatoriamente $(K)$ conjuntos de datos bootstrap del conjunto de entrenamiento original.
   - Entrena un modelo en cada conjunto de datos bootstrap.

2. **Predicción:**
   - Realiza predicciones con cada modelo.
   - Agrega las predicciones utilizando una estrategia de promedio o votación.

**Ventajas del Bagging:**

- **Reducción de la Varianza:** Al entrenar modelos en conjuntos de datos diferentes, el bagging ayuda a reducir la variabilidad y el sobreajuste.

- **Mayor Estabilidad:** La combinación de múltiples modelos hace que el modelo final sea más estable y generalizable.

**Fórmula Matemática:**

Supongamos que tenemos $(K)$ modelos base $(h_1, h_2, ..., h_K)$ y queremos predecir un nuevo ejemplo $(x)$. La predicción del ensemble mediante bagging se realiza mediante:

$\text{Predicción Final}(x) = \frac{1}{K} \sum_{i=1}^{K} h_i(x)$

donde $h_i(x)$ es la predicción del modelo base $(i)$ para el ejemplo $(x)$.

**Ejemplo con Gráfico en Python:**

In [1]:
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Generar datos de ejemplo
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear un clasificador de árbol de decisión
base_classifier = DecisionTreeClassifier(random_state=42)

# Crear el clasificador Bagging
bagging_classifier = BaggingClassifier(base_classifier, n_estimators=50, random_state=42)

# Entrenar el modelo Bagging
bagging_classifier.fit(X_train, y_train)

# Realizar predicciones
y_pred = bagging_classifier.predict(X_test)

# Calcular precisión
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisión del modelo: {accuracy:.2f}')

Precisión del modelo: 0.89


Este ejemplo utiliza bagging con un clasificador de árbol de decisión base. Puedes experimentar con diferentes parámetros, como el número de estimadores, para ver cómo afectan a la precisión del modelo.

| **Inicio** | **atrás 27** | **Siguiente 29** |
|----------- |-------------- |---------------|
| [🏠](../README.md) | [⏪](./27_Uniform_Distribution.ipynb)| [⏩](./29_%20Root_Mean_Square_Error.ipynb)|