 # 1. Exploración teórica de las señales ECG y variables del dataset
## Contexto del problema

La fibrilación auricular (AFib) es una de las arritmias cardíacas más comunes. Se caracteriza por latidos cardíacos irregulares y, a menudo, rápidos. Su detección oportuna es fundamental, ya que puede prevenir complicaciones graves como accidentes cerebrovasculares, insuficiencia cardíaca y otras enfermedades cardíacas.

Los ECG (electrocardiogramas) son la herramienta estándar para diagnosticar arritmias. Sin embargo, interpretar grandes volúmenes de señales ECG de forma manual es poco escalable. Aquí es donde entra el modelo de ML entrenado para detectar patrones en los datos. Estos modelos pueden ayudar a automatizar el proceso de diagnóstico, reduciendo errores humanos y permitiendo análisis a gran escala, sirviendo de apoyo para el diagnostico de los medicos especializados en el tema.

## Utilidad del modelo de Machine Learning

El modelo a desarrollar tendrá como objetivo:

- Clasificar segmentos de señal ECG usando solo información extraída de los intervalos RR.

- Distinguir entre ritmo normal y fibrilación auricular.

- Servir como base para un sistema de monitoreo automatizado que pueda alertar de forma temprana al paciente o médico tratante.

Esto se alinea con aplicaciones clínicas reales, donde dispositivos portátiles como smartwatches pueden detectar alteraciones cardíacas en tiempo real.


## Importancia de cada variable del dataset

| Variable     | Descripción técnica                                                                                   | Relevancia para la clasificación                                                                                      |
| ------------ | ----------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------- |
| **mean\_rr** | Promedio de los intervalos RR (en milisegundos). Refleja el **ritmo cardíaco promedio** del segmento. | En AFib suele haber un promedio más bajo (taquicardia) o muy variable. En ritmo normal es más constante.              |
| **std\_rr**  | Desviación estándar de los intervalos RR. Indica la **variabilidad del ritmo**.                       | En AFib hay una **alta variabilidad**; en ritmo normal, menor. Muy útil como separador.                               |
| **skew\_rr** | Asimetría de la distribución de RR. Mide si los intervalos son más frecuentes en un extremo.          | AFib puede producir distribuciones asimétricas debido a latidos muy cortos o largos intercalados.                     |
| **kurt\_rr** | Curtosis de la distribución de RR. Mide la **concentración de valores alrededor de la media**.        | En AFib, los valores pueden estar más dispersos, lo que lleva a curtosis baja; en ritmo normal, pueden agruparse más. |
| **label**    | Clase del segmento: `Normal` o `AFib`.                                                                | Etiqueta supervisada para entrenar y evaluar el modelo.                                                               |


En lugar de procesar señales crudas (que es complejo y requiere alto poder de cómputo), este enfoque reduce la dimensionalidad y complejidad al utilizar características estadísticas ya extraídas. Esto tiene varias ventajas:

- Permite entrenar modelos simples con pocos datos.

- Es interpretable: cada atributo tiene un significado clínico claro.


