# Bagging y Boosting

## Bagging (Boostrap Aggregating)
- Entrenar muchos modelos débiles (ej. árboles de decisión) sobre muestras aleatorias con reemplazo del dataset.
- Cada modelo vota (clasificación) o promedia (regresión).
- Reduce varianza -> mejora estabilidad.
- Ejemplo: Random Forest (es un bagging + selección aleatoria de features).
- Ejemplo real: Es como preguntar la misma pregunta a un grupo de personas que vieron cosas distintas -> se reduce la posibilidad de error de unos solo.

## Boosting
- Entrenar modelos secuenciales: cada modelo aprende de los errores del anterior.
- Los errores se pesan más fuerte en el siguiente modelo.
- La predicción final es una combinación ponderada de todos los modelos.
- Reduce el sesgo -> mejora precisión.
- Ejemplo real: Es como un profesor que revisa un examen varias veces, y cada vez se concentra más en las preguntas donde el alumno falló.

## Diferencias Bagging vs Boosting
| Aspecto | Bagging | Boosting |
|---------|---------|----------|
| Entrenamiento | En paralelo (cada modelo independiente) | Secuencial ( cada modelo depende de los errores previos) |
| Objetivo | Reducir varianza | Reducir sesgo |
| ejemplo | Random Forest | AdaBoost, Gradient Boosting, XGBoost, Light GBM |
| Riesgo | Puede generar modelos muy grandes | Riesgo de overfitting si no se controla |

## Ejemplo - AdaBoost con Dataset Iris

In [6]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier
from sklearn.metrics import classification_report, confusion_matrix

# 1. Dataset
iris = load_iris()
X, y = iris.data, iris.target
target_names = iris.target_names

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, stratify=y, random_state=42
)

# 2. AdaBoost
clf = AdaBoostClassifier(
    n_estimators=50,       # número de clasificadores débiles
    learning_rate=1.0,     # peso de cada modelo secuencial
    random_state=42
)
clf.fit(X_train, y_train)

# 3. Evaluación
y_pred = clf.predict(X_test)
print("Reporte de clasificación:\n", classification_report(y_test, y_pred, target_names=target_names))
print("Matriz de confusión:\n", confusion_matrix(y_test, y_pred))


Reporte de clasificación:
               precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        15
  versicolor       0.88      0.93      0.90        15
   virginica       0.93      0.87      0.90        15

    accuracy                           0.93        45
   macro avg       0.93      0.93      0.93        45
weighted avg       0.93      0.93      0.93        45

Matriz de confusión:
 [[15  0  0]
 [ 0 14  1]
 [ 0  2 13]]




## Parámetros clave de AdaBoost
- `n_estimators`: cuántos modelos secuenciales se entrenan.
- `learning_rate`: controla cuánto peso damos a cada nuevo modelo (trade-off entre muchos modelos pequeños o pocos más fuertes).
- `base_estimator`: por defecto usa DecisionTreeClassifier(max_depth=1) (un "stump" o árbol mas pequeño).


## Explicación
- AdaBoost combina muchos árboles débiles (stumps) para formar un clasificador fuerte.
- Cada nuevo árbol se enfoca en las muestras que el anterior clasificó mal.
- La predicción final es un promedio ponderado de todos.