# AdaBoost Classified


In [None]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Generar datos de ejemplo
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)

# Dividir en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Definir el clasificador base (árbol de decisión con profundidad 1)
base_clf = DecisionTreeClassifier(max_depth=1)

# Crear y entrenar el modelo AdaBoost
ada_clf = AdaBoostClassifier(base_estimator=base_clf, n_estimators=50, learning_rate=1.0, random_state=42)
ada_clf.fit(X_train, y_train)

# Hacer predicciones
y_pred = ada_clf.predict(X_test)

# Evaluar el modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisión de AdaBoost: {accuracy:.2f}')

AdaBoost (Adaptive Boosting) es un algoritmo de aprendizaje automático supervisado que se utiliza principalmente para problemas de clasificación. Se basa en la idea de boosting, que combina múltiples clasificadores débiles para formar un clasificador fuerte.

## Conceptos Clave
Clasificadores débiles

AdaBoost utiliza clasificadores simples llamados "débilmente aprendices" (weak learners), como los árboles de decisión con una sola división (stumps).

Estos clasificadores tienen una precisión ligeramente mejor que el azar (~50%-60%).

Iteraciones y pesos

AdaBoost entrena secuencialmente múltiples clasificadores, ajustando los pesos de las instancias mal clasificadas en cada iteración.

Los ejemplos difíciles reciben mayor peso, lo que obliga al modelo a enfocarse en ellos en la siguiente iteración.

Combinación de clasificadores

Cada clasificador tiene un peso de importancia en función de su precisión.

La predicción final se obtiene mediante una votación ponderada de todos los clasificadores débiles.


## Cómo Funciona AdaBoost
Inicialización

Se asigna un peso igual a todas las instancias del conjunto de entrenamiento.

Entrenamiento Iterativo

Se entrena un clasificador débil (por ejemplo, un árbol de decisión simple).

Se evalúa su desempeño y se ajustan los pesos:

Ejemplos mal clasificados → Se les asigna más peso.

Ejemplos bien clasificados → Se les reduce el peso.

Se repite el proceso con un nuevo clasificador débil.

Predicción Final

Se combinan todos los clasificadores entrenados mediante una votación ponderada para obtener la clasificación final.


Ventajas de AdaBoost
✅ Mejora el rendimiento al combinar múltiples clasificadores débiles.
✅ Se enfoca en los errores, lo que lo hace más preciso en problemas complejos.
✅ Robusto ante sobreajuste en la mayoría de los casos, si se usa correctamente.
✅ Compatible con muchos clasificadores base (no solo árboles de decisión).

🔹 Desventajas de AdaBoost
❌ Sensible al ruido en los datos (puede dar demasiado peso a outliers).
❌ Menos eficiente en grandes conjuntos de datos, ya que el entrenamiento es secuencial.
❌ Depende de clasificadores débiles adecuados, si son demasiado débiles o demasiado fuertes, puede afectar el rendimiento.

🔹 Casos de Uso

- Detección de rostros y objetos.
- Filtrado de spam en correos electrónicos.
- Diagnóstico médico basado en datos clínicos.
- Análisis de fraudes en transacciones financieras.