Bagging y Boosting son dos técnicas de ensamblaje en aprendizaje automático que tienen como objetivo mejorar la precisión y la estabilidad de los modelos predictivos. A continuación, se explica cada una de estas técnicas:

### Bagging
**Bagging**, abreviatura de *Bootstrap Aggregating*, es un método de ensamblaje que busca mejorar la estabilidad y la precisión de los algoritmos de aprendizaje automático mediante la creación de múltiples versiones de un predictor y luego combinándolas para formar un modelo final. La técnica se aplica generalmente a métodos de alta varianza y baja sesgo, como árboles de decisión.

**Pasos clave**:
1. **Bootstrap**: Se generan múltiples subconjuntos de datos de entrenamiento mediante muestreo con reemplazo del conjunto original.
2. **Entrenamiento independiente**: Cada subconjunto de datos se usa para entrenar un modelo independiente.
3. **Agregación**: Los modelos individuales se combinan promediando sus predicciones (en el caso de regresión) o por votación mayoritaria (en el caso de clasificación).

**Ventajas**:
- Reduce la varianza, evitando el sobreajuste.
- Mejora la robustez del modelo al promediar múltiples estimaciones.

### Boosting
**Boosting** es un método de ensamblaje secuencial que combina múltiples modelos débiles para formar un modelo fuerte. A diferencia del Bagging, en el Boosting cada modelo nuevo se construye focalizándose en los errores cometidos por los modelos anteriores.

**Pasos**:
1. **Entrenar el modelo inicial**: Se entrena un modelo en el conjunto de datos y se evalúan los errores.
2. **Enfocar en errores**: Se asigna más peso a las instancias mal clasificadas por el modelo anterior.
3. **Iterar**: Se repite el proceso, cada nuevo modelo se concentra en los errores más significativos de los modelos anteriores.
4. **Combinación ponderada**: Los modelos se combinan usando una suma ponderada para obtener la predicción final.

**Ventajas**:
- Mejora la precisión al reducir tanto el sesgo como la varianza.
- Eficaz para reducir errores en problemas complejos.

Ambas técnicas utilizan la idea de "sabiduría de la multitud" para obtener mejores predicciones que cualquier modelo individual podría proporcionar. Sin embargo, Boosting puede ser más propenso al sobreajuste si los datos son muy ruidosos.

Claro, vamos a profundizar en los detalles matemáticos de Bagging y Boosting para ofrecer una mejor comprensión de cómo funcionan estos métodos de ensamblaje.

### Bagging (Bootstrap Aggregating)

**Fundamento matemático**:
El Bagging se basa en el muestreo aleatorio con reemplazo, conocido como *bootstrap*. Si tienes un conjunto de datos $ D $ con $ N $ muestras, el muestreo bootstrap crea subconjuntos $ D_i $ seleccionando $ N $ muestras de $ D $ al azar con reemplazo. Cada $ D_i $ es probable que tenga algunas muestras repetidas y otras no presentes.

Cada uno de estos subconjuntos se utiliza para entrenar modelos independientes $ M_i $, generalmente del mismo tipo pero entrenados en diferentes "vistas" de los datos. El resultado final de Bagging es un modelo ensamblado que promedia las predicciones de todos estos modelos $ M_i $. Matemáticamente, la predicción final $ \hat{y} $ para una instancia $ x $ se calcula como:

$
\hat{y}(x) = \frac{1}{B} \sum_{i=1}^{B} M_i(x)
$

donde $ B $ es el número de modelos en el ensamblaje.

**Reducción de varianza**:
El método de Bagging reduce la varianza porque al promediar múltiples estimaciones que tienen errores no correlacionados, el error conjunto tiende a cancelarse. Esto se debe al efecto de promediar una serie de observaciones independientes.

### Boosting

**Fundamento matemático**:
Boosting construye modelos de manera iterativa enfocándose en errores de predicciones anteriores. Suponiendo que comenzamos con un conjunto de datos $ D $ y un modelo inicial $ M_1 $, Boosting ajusta sucesivos modelos $ M_2, M_3, \ldots, M_B $ donde cada modelo intenta corregir los errores del modelo anterior.

Cada modelo $ M_i $ se entrena usando un conjunto de pesos $ w_n $ para cada muestra en el conjunto de datos, donde inicialmente todos los pesos pueden ser iguales. Después de cada modelo, los pesos se ajustan para aumentar la importancia de las muestras que fueron mal clasificadas:

$
w_n \leftarrow w_n \cdot \exp(\alpha_i \cdot I(y_n \neq M_i(x_n)))
$

donde $ \alpha_i $ es la tasa de aprendizaje y $ I $ es la función indicadora, que es 1 si $ y_n \neq M_i(x_n) $ y 0 de lo contrario.

El modelo final $ M $ es una combinación lineal de todos los modelos ponderados por su precisión respectiva:

$
M(x) = \sum_{i=1}^{B} \alpha_i M_i(x)
$

**Reducción de sesgo y varianza**:
A diferencia de Bagging, Boosting puede reducir tanto el sesgo como la varianza. Al concentrarse en los errores de los modelos anteriores, Boosting puede construir un modelo final que sea más preciso y generalizable.



### Bagging

In [1]:
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Cargar datos
wine = load_wine()
X, y = wine.data, wine.target

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Instanciar el modelo de Bagging
bagging_clf = BaggingClassifier(
    base_estimator=DecisionTreeClassifier(),
    n_estimators=50,
    random_state=42
)

# Entrenar el modelo
bagging_clf.fit(X_train, y_train)

# Evaluar el modelo
y_pred = bagging_clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy of Bagging Classifier:", accuracy)



Accuracy of Bagging Classifier: 0.9814814814814815




### Boosting

In [1]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Cargar datos
wine = load_wine()
X, y = wine.data, wine.target

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Instanciar el modelo AdaBoost
adaboost_clf = AdaBoostClassifier(
    base_estimator=DecisionTreeClassifier(max_depth=1),
    n_estimators=50,
    random_state=42
)

# Entrenar el modelo
adaboost_clf.fit(X_train, y_train)

# Evaluar el modelo
y_pred = adaboost_clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy of AdaBoost Classifier:", accuracy)



Accuracy of AdaBoost Classifier: 0.9259259259259259


