# ADASYN: Adaptive Synthetic Sampling

**ADASYN** significa *Muestreo Sintético Adaptativo*. Su principal diferencia con SMOTE es que no genera la misma cantidad de datos sintéticos para cada ejemplo de la clase minoritaria. En su lugar, utiliza una **distribución de densidad** para decidir dónde se necesitan más datos.

## 1. El Concepto de "Dificultad de Aprendizaje"

Imagina que eres un profesor y tienes alumnos que entienden rápido y otros que les cuesta más. 
* **SMOTE** le daría 5 minutos de tutoría extra a cada alumno por igual.
* **ADASYN** le daría 20 minutos a los que están confundidos y solo 2 minutos a los que ya entendieron.

### ¿Cómo define ADASYN quién está "confundido"?
Para cada punto de la clase minoritaria, ADASYN mira a sus vecinos más cercanos:
1. Si un punto está rodeado de otros puntos de su misma clase (minoritaria), es un caso **fácil**.
2. Si un punto está rodeado de muchos puntos de la clase opuesta (mayoritaria), es un caso **difícil**.

**ADASYN generará muchos más datos sintéticos alrededor de los puntos difíciles que de los fáciles.**

---

## 2. ¿Cómo funciona paso a paso?

1. **Calcular el desbalanceo:** Primero determina cuántos ejemplos sintéticos necesita crear en total para llegar al equilibrio.
2. **Calcular el ratio de dificultad ($r_i$):** Para cada ejemplo de la clase minoritaria, cuenta cuántos de sus vecinos pertenecen a la clase mayoritaria. 
   * Si casi todos sus vecinos son de la clase opuesta, ese punto tiene un $r_i$ alto.
3. **Distribución de pesos:** Se normalizan estos ratios para que los puntos con más "vecinos enemigos" reciban la mayor parte del presupuesto de creación de datos.
4. **Generación sintética:** Se crean los nuevos datos siguiendo una lógica similar a SMOTE (unir puntos con líneas y crear datos en medio), pero concentrándose en las zonas de alta dificultad.

## 3. Ventajas y Usos en Machine Learning

### ¿Cuándo es mejor usar ADASYN que SMOTE?
* **Cuando las clases se traslapan (Overlap):** ADASYN es excelente cuando la frontera entre las clases es difusa. Al crear más datos en el límite de colisión, obliga al modelo a prestar atención a esos detalles críticos.
* **Reducción del sesgo:** Reduce el sesgo intrínseco que tienen los modelos hacia la clase mayoritaria al "reforzar" las zonas donde la clase minoritaria suele perderse.

### El "Efecto Secundario" a tener en cuenta:
Como ADASYN se enfoca en los puntos rodeados de la clase mayoritaria, es muy sensible a los **Outliers** (valores atípicos). 
> **Peligro:** Si tienes un solo punto de la clase minoritaria que es simplemente un error de medición (ruido) metido en medio de la clase mayoritaria, ADASYN creerá que es un "caso muy difícil" y creará cientos de datos sintéticos alrededor de ese error.

## 4. Resumen Didáctico: La Analogía del Mapa

Imagina un mapa donde hay un pequeño grupo de **pueblos (clase minoritaria)** tratando de sobrevivir en un gran **desierto (clase mayoritaria)**.

* **SMOTE** construiría 3 casas nuevas en cada pueblo, sin importar si el pueblo está en un oasis seguro o en la frontera peligrosa.
* **ADASYN** diría: "Los pueblos que están en el centro del oasis están bien. Vamos a construir una ciudad entera alrededor de los pueblos que están justo en la frontera para que no sean absorbidos por el desierto".

---

### Comparativa Rápida:
* **SMOTE:** Crea datos uniformemente. Puede ignorar las zonas donde el modelo más falla.
* **ADASYN:** Crea datos adaptativamente. Se enfoca en las zonas de alta densidad de la clase mayoritaria.