# AdaBoost Classified


In [None]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Generar datos de ejemplo
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)

# Dividir en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Definir el clasificador base (√°rbol de decisi√≥n con profundidad 1)
base_clf = DecisionTreeClassifier(max_depth=1)

# Crear y entrenar el modelo AdaBoost
ada_clf = AdaBoostClassifier(base_estimator=base_clf, n_estimators=50, learning_rate=1.0, random_state=42)
ada_clf.fit(X_train, y_train)

# Hacer predicciones
y_pred = ada_clf.predict(X_test)

# Evaluar el modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisi√≥n de AdaBoost: {accuracy:.2f}')

AdaBoost (Adaptive Boosting) es un algoritmo de aprendizaje autom√°tico supervisado que se utiliza principalmente para problemas de clasificaci√≥n. Se basa en la idea de boosting, que combina m√∫ltiples clasificadores d√©biles para formar un clasificador fuerte.

## Conceptos Clave
Clasificadores d√©biles

AdaBoost utiliza clasificadores simples llamados "d√©bilmente aprendices" (weak learners), como los √°rboles de decisi√≥n con una sola divisi√≥n (stumps).

Estos clasificadores tienen una precisi√≥n ligeramente mejor que el azar (~50%-60%).

Iteraciones y pesos

AdaBoost entrena secuencialmente m√∫ltiples clasificadores, ajustando los pesos de las instancias mal clasificadas en cada iteraci√≥n.

Los ejemplos dif√≠ciles reciben mayor peso, lo que obliga al modelo a enfocarse en ellos en la siguiente iteraci√≥n.

Combinaci√≥n de clasificadores

Cada clasificador tiene un peso de importancia en funci√≥n de su precisi√≥n.

La predicci√≥n final se obtiene mediante una votaci√≥n ponderada de todos los clasificadores d√©biles.


## C√≥mo Funciona AdaBoost
Inicializaci√≥n

Se asigna un peso igual a todas las instancias del conjunto de entrenamiento.

Entrenamiento Iterativo

Se entrena un clasificador d√©bil (por ejemplo, un √°rbol de decisi√≥n simple).

Se eval√∫a su desempe√±o y se ajustan los pesos:

Ejemplos mal clasificados ‚Üí Se les asigna m√°s peso.

Ejemplos bien clasificados ‚Üí Se les reduce el peso.

Se repite el proceso con un nuevo clasificador d√©bil.

Predicci√≥n Final

Se combinan todos los clasificadores entrenados mediante una votaci√≥n ponderada para obtener la clasificaci√≥n final.


Ventajas de AdaBoost
‚úÖ Mejora el rendimiento al combinar m√∫ltiples clasificadores d√©biles.
‚úÖ Se enfoca en los errores, lo que lo hace m√°s preciso en problemas complejos.
‚úÖ Robusto ante sobreajuste en la mayor√≠a de los casos, si se usa correctamente.
‚úÖ Compatible con muchos clasificadores base (no solo √°rboles de decisi√≥n).

üîπ Desventajas de AdaBoost
‚ùå Sensible al ruido en los datos (puede dar demasiado peso a outliers).
‚ùå Menos eficiente en grandes conjuntos de datos, ya que el entrenamiento es secuencial.
‚ùå Depende de clasificadores d√©biles adecuados, si son demasiado d√©biles o demasiado fuertes, puede afectar el rendimiento.

üîπ Casos de Uso

- Detecci√≥n de rostros y objetos.
- Filtrado de spam en correos electr√≥nicos.
- Diagn√≥stico m√©dico basado en datos cl√≠nicos.
- An√°lisis de fraudes en transacciones financieras.