# LSTM / GRU aplicados a se√±ales ECG (EKG)

## I. Teor√≠a breve del t√≥pico elegido

Las se√±ales ECG (electrocardiogr√°ficas) representan la actividad el√©ctrica del coraz√≥n como una **secuencia temporal** [3].   
Por ello, son especialmente adecuadas para modelos que pueden **recordar informaci√≥n del pasado** y relacionarla con el presente [1][2].

Las redes neuronales recurrentes (RNN tradicionales) fueron dise√±adas para este prop√≥sito, pero sufren de problemas como:

- **Vanishing gradient** (la red ‚Äúolvida‚Äù se√±ales antiguas) 
- Dificultad para aprender dependencias largas
- Poca robustez ante se√±ales ruidosas

Para resolver estos problemas surgieron **LSTM** y **GRU**, que se convirtieron en los modelos dominantes en tareas de ECG [1][2][3].

---

## üß† ¬øQu√© es LSTM?

Las **Long Short-Term Memory (LSTM)** son un tipo avanzado de RNN que incorporan un mecanismo interno de memoria [1], permitiendo:

- Recordar informaci√≥n a largo plazo  
- Controlar qu√© informaci√≥n entra y sale  
- Evitar que los gradientes se desvanezcan  

Una celda LSTM tiene:

### ‚úî Input gate  
Decide cu√°nta informaci√≥n nueva se debe incorporar [1].

### ‚úî Forget gate  
Determina cu√°nta informaci√≥n previa debe olvidarse. Esto es crucial en ECG, donde cada latido tiene estructura similar pero puede contener ruido [3].

### ‚úî Output gate  
Controla qu√© informaci√≥n se env√≠a a la siguiente capa [1].

### ‚úî Cell state (memoria a largo plazo)  
Transporta informaci√≥n clave sobre la se√±al card√≠aca [1].

---

## üîÅ ¬øQu√© es GRU?

Las **Gated Recurrent Units (GRU)** simplifican la estructura de las LSTM manteniendo un desempe√±o similar.  
Tienen solo dos puertas:

### ‚úî Update gate  
Combina input y forget; controla cu√°nta memoria pasada mantener.

### ‚úî Reset gate  
Define cu√°ndo olvidar informaci√≥n pasada, √∫til para eventos abruptos en ECG (p.ej., latidos prematuros).

Las GRU son m√°s ligeras, entrenan m√°s r√°pido y consumen menos recursos‚Äîideal para dispositivos embebidos.

---

## ‚ù§Ô∏è ¬øPor qu√© LSTM/GRU funcionan tan bien en se√±ales ECG?

El ECG tiene patrones temporales complejos [3]:

- Ritmo card√≠aco (intervalos RR)
- Morfolog√≠a P-QRS-T
- Variabilidad card√≠aca
- Anomal√≠as espec√≠ficas de arritmias
- Se√±al de identidad biom√©trica

LSTM y GRU pueden:

‚úî Capturar dependencias largas entre latidos 
‚úî Aprender la morfolog√≠a completa sin extracci√≥n manual 
‚úî Ser robustas a ruido y artefactos del ECG   
‚úî Trabajar con secuencias cortas o largas  
‚úî Entrenar modelos end-to-end 
---

# II. Papers seleccionados sobre LSTM/GRU aplicados a ECG

A continuaci√≥n, se explican **tres papers**, resaltando especialmente **c√≥mo implementan LSTM o GRU** y **por qu√© funcionan bien en su aplicaci√≥n**.

---

# üìò **PAPER 1: Kim & Pyun (2020) ‚Äî BiLSTM + Late Fusion para identificaci√≥n ECG** [4]

**Modelo:** Deep Recurrent Neural Network con **3 capas BiLSTM**  
**Problema:** Autenticaci√≥n biom√©trica de personas usando ECG  
**Por qu√© usan BiLSTM:**  
- El ECG contiene informaci√≥n que depende del pasado y ligeramente del futuro (pico T influenciado por QRS anterior)  
- Una LSTM bidireccional analiza la se√±al ‚Äúhacia adelante y hacia atr√°s‚Äù, enriqueciendo la representaci√≥n  

---

## üß© Explicaci√≥n ampliada del uso de LSTM en este paper

### 1. Preprocesamiento  
Los autores aplican:

- Filtro derivativo para resaltar QRS  
- Media m√≥vil para suavizar  
- Normalizaci√≥n min-max  
- Segmentaci√≥n por latido usando R-peaks  

Esto permite que la LSTM reciba secuencias ‚Äúlimpias‚Äù.

---

### 2. Arquitectura BiLSTM m√°s detallada

Cada capa BiLSTM procesa:

- Secuencia forward ‚Üí aprende progresi√≥n temporal normal del latido  
- Secuencia backward ‚Üí aprende simetr√≠as, fin de onda T, retorno a baseline  

La salida de ambas direcciones se combina, lo cual permite:

- Mayor discriminaci√≥n entre sujetos  
- Aprendizaje robusto ante variabilidad intra-individuo  
- No requiere extracci√≥n de caracter√≠sticas manuales  

---

### 3. Late Fusion  
El modelo produce una predicci√≥n por timestep y luego realiza un **promedio ponderado**.  
Esto:

- Suaviza variaciones inesperadas  
- Aumenta la estabilidad de la clasificaci√≥n  
- Reduce el impacto de ruido o latidos at√≠picos  

---

### 4. Resultados  
- **100% accuracy** en NSRDB  
- **99.8% accuracy** en MITDB  
- Mejores resultados que CNN, SVM y RNN tradicionales  

---

### ‚úî En este paper, el LSTM funciona porque:
- Captura *patrones personales √∫nicos* del ECG  
- Modela relaciones temporales finas entre latidos  
- Puede trabajar con secuencias cortas (muy √∫til en biometr√≠a real-time)

---

# üìò **PAPER 2: Satheeswaran et al. (2024) ‚Äî LSTM para clasificaci√≥n de arritmias** [5]

**Modelo:** LSTM cl√°sico dentro de una arquitectura RNN  
**Problema:** Clasificaci√≥n de arritmias del MIT-BIH  
**Por qu√© usan LSTM:** Las anormalidades card√≠acas se manifiestan como alteraciones en los intervalos y morfolog√≠a temporal.

---

## üß© Explicaci√≥n ampliada del uso de LSTM en este paper

### 1. Preprocesamiento  
Incluye:

- Filtros de ruido  
- Normalizaci√≥n  
- Segmentaci√≥n basada en ventana  
- Preparaci√≥n de latidos independientes  

La LSTM recibe entradas de longitudes estandarizadas.

---

### 2. La LSTM como n√∫cleo secuencial

La LSTM aprende:

- Variaci√≥n en intervalos RR (indicador clave de arritmias)  
- Cambios en duraci√≥n QRS  
- Aparici√≥n de latidos ventriculares prematuros  
- Morfolog√≠a P an√≥mala  

La capacidad de memoria permite distinguir:

- Latidos **normales**  
- Latidos **supraventriculares anormales**  
- Latidos **ventriculares**  
- Latidos peligrosos como R-on-T  

---

### 3. Resultados  
- **98‚Äì99% accuracy**  
- Excelente recall en clases minoritarias  
- LSTM > RNN simple  

---

### ‚úî En este paper, el LSTM funciona porque:
- Aprende dependencias temporales largas (comportamiento entre latidos sucesivos)  
- Reduce necesidad de feature engineering  
- Puede adaptarse a ruido y se√±ales incompletas  

---

# üìò **PAPER 3: Yun Ju et al. (2019) ‚Äî Deep Bidirectional GRU (DBGRU)** [6]

**Modelo:** 6 capas de **Bidirectional GRU**  
**Problema:** Clasificar **23 tipos** de arritmias (tarea muy dif√≠cil)  
**Por qu√© usan GRU bidireccional:**  
- GRU es m√°s ligero que LSTM ‚Üí se pueden usar m√°s capas profundas  
- Permite analizar secuencias largas sin costos computacionales excesivos  

---

## üß© Explicaci√≥n ampliada del uso de GRU en este paper

### 1. PCA como preprocesamiento  
Reduce ruido y dimensionalidad ‚Üí mejora entrada a la GRU.  
Esto es importante porque se√±ales MIT-BIH contienen artefactos.

---

### 2. Arquitectura GRU de 6 capas

- 3 capas GRU bidireccional de 256 unidades  
- 3 capas GRU bidireccional de 128 unidades  
- Dropout para evitar overfitting  
- Fully connected + Softmax  

La GRU captura:

- Dependencias temporales largas  
- Cambios en secuencia P-QRS-T  
- Anomal√≠as espec√≠ficas de las 23 clases  

---

### 3. Ventaja clave de GRU  
Al ser m√°s simples que LSTM:

- Entrenan m√°s r√°pido  
- Se pueden apilar m√°s capas  
- Previenen overfitting por exceso de par√°metros  
- Funcionan mejor en datasets grandes o con secuencias largas  

---

### 4. Resultados  
- **99.51% accuracy** (train)  
- **97.86% accuracy** (test)  
- Super√≥ a:
  - Unidirectional LSTM  
  - Unidirectional GRU  
  - CNN  
  - DNN  

---

### ‚úî En este paper, GRU funciona porque:
- Maneja mejor secuencias largas multiclase  
- Es m√°s eficiente que LSTM para modelos profundos  
- Capta patrones temporales relevantes con menos complejidad  

---

# III.ü©∫ Repositorios de GitHub que utilizan LSTM/GRU y son aplicados a ECG

# ## *1. Notebook LSTM ‚Äî Clasificaci√≥n de Se√±ales ECG*
Link github: https://github.com/AlTheMan/ECG-Classifier-LSTM
DATASET:  https://www.nature.com/articles/s41597-020-0495-6

### *üéØ Objetivo*

Entrenar un modelo basado en *LSTM* para clasificar se√±ales ECG, aprendiendo autom√°ticamente patrones temporales y morfol√≥gicos del coraz√≥n sin necesidad de extracci√≥n manual de caracter√≠sticas.

### *üìÇ Base de datos utilizada*

El notebook carga un dataset que contiene:

‚Ä¢‚Å†  ‚Å†Se√±ales ECG segmentadas en *ventanas temporales*.
‚Ä¢‚Å†  ‚Å†Cada ventana representa un *latido* o un fragmento de 1‚Äì3 latidos.
‚Ä¢‚Å†  ‚Å†Las muestras est√°n en formato:

  
‚Å†‚ÄØ  (timesteps, 1) ‚Üí se√±al ECG unidimensional
  ‚ÄØ‚Å†
‚Ä¢‚Å†  ‚Å†Las etiquetas corresponden a clases de arritmias o identificaci√≥n de individuos.

La data se divide en:

‚Ä¢‚Å†  ‚Å†*Entrenamiento (train)*
‚Ä¢‚Å†  ‚Å†*Validaci√≥n (dev)*
‚Ä¢‚Å†  ‚Å†*Prueba (test)*


### * Procesamiento de datos*

El notebook realiza:

‚Ä¢‚Å†  ‚Å†*Normalizaci√≥n* de amplitud
‚Ä¢‚Å†  ‚Å†*Segmentaci√≥n en ventanas* (fijas o basadas en picos R)
‚Ä¢‚Å†  ‚Å†Reestructuraci√≥n a formato requerido por LSTM:


(samples, timesteps, features=1)



### *üß† Arquitectura LSTM*

El modelo se basa en:

‚Ä¢‚Å†  ‚Å†1 o m√°s capas *LSTM* para capturar dependencias temporales largas
‚Ä¢‚Å†  ‚Å†Capas densas finales para la clasificaci√≥n
‚Ä¢‚Å†  ‚Å†Entrenamiento con *Adam* y funci√≥n de p√©rdida *categorical_crossentropy*

El LSTM analiza la se√±al muestra por muestra, aprendiendo patrones como:

‚Ä¢‚Å†  ‚Å†forma del complejo QRS
‚Ä¢‚Å†  ‚Å†ondas P y T
‚Ä¢‚Å†  ‚Å†intervalos temporales entre latidos (RR)


### *üìä Resultado del notebook*

‚Ä¢‚Å†  ‚Å†Entrenamiento completo con seguimiento de m√©tricas
‚Ä¢‚Å†  ‚Å†Gr√°ficas de p√©rdida y precisi√≥n
‚Ä¢‚Å†  ‚Å†Evaluaci√≥n en test
‚Ä¢‚Å†  ‚Å†Modelo final entrenado para clasificaci√≥n ECG


# ## *2. Script GRU (‚Å†‚ÄØgru.py‚ÄØ‚Å†) ‚Äî Clasificaci√≥n Multietiqueta de ECG*
link github: https://github.com/HemaxiN/DL_ECG_Classification/blob/main/cnn_gru.py
DATASET: https://physionet.org/content/ptb-xl/1.0.1/
### *üéØ Objetivo*

Entrenar un modelo *GRU* para clasificaci√≥n *multietiqueta* (4 clases) utilizando se√±ales ECG multicanal (*3 derivaciones*), incluyendo optimizaci√≥n de umbrales y m√©tricas cl√≠nicas reales (sensibilidad/especificidad).



## *üìÇ Base de datos utilizada*

Cargada mediante ‚Å†‚ÄØDataset_for_RNN‚ÄØ‚Å†:

‚Ä¢‚Å†  ‚Å†Cada muestra tiene forma:


X ‚Üí (1000 timesteps, 3 features)
y ‚Üí (4 etiquetas binarias)


‚Ä¢‚Å†  ‚Å†Dataset dividido en:

  * *Train* (batch_size=512)
  * *Validation*
  * *Validation para thresholds*
  * *Test*

Las clases est√°n desbalanceadas, por ello se calculan *pesos por clase*.


## *Procesamiento de datos*

La data ya viene preprocesada desde la carpeta ‚Å†‚ÄØdata_for_rnn‚ÄØ‚Å†, pero el script realiza:

‚Ä¢‚Å†  ‚Å†Reorganizaci√≥n de tensores para secuencias GRU
‚Ä¢‚Å†  ‚Å†Carga por batches
‚Ä¢‚Å†  ‚Å†Aplicaci√≥n de ‚Å†‚ÄØclass_weights‚ÄØ‚Å†
‚Ä¢‚Å†  ‚Å†Preparaci√≥n para clasificaci√≥n multietiqueta con BCEWithLogitsLoss


## *üß† Arquitectura GRU*

El modelo implementa:

‚Å†‚ÄØpython
nn.GRU(input_size=3,
       hidden_size=128,
       num_layers=2,
       dropout=0.3,
       batch_first=True,
       bidirectional=True/False)
‚ÄØ‚Å†

Salida final:

‚Ä¢‚Å†  ‚Å†Se usa el √∫ltimo timestep (o combinaci√≥n bidireccional)
‚Ä¢‚Å†  ‚Å†Pasa a ‚Å†‚ÄØLinear(hidden_size * d ‚Üí 4)‚ÄØ‚Å†
‚Ä¢‚Å†  ‚Å†Activaci√≥n sigmoide durante predicci√≥n

El GRU aprende relaciones temporales en las derivaciones del ECG, pero con menor complejidad que LSTM.

---

## * Entrenamiento*

Incluye:

‚Ä¢‚Å†  ‚Å†Optimizaci√≥n con Adam o SGD
‚Ä¢‚Å†  ‚Å†Early stopping
‚Ä¢‚Å†  ‚Å†Guardado del mejor modelo seg√∫n validaci√≥n
‚Ä¢‚Å†  ‚Å†C√°lculo de p√©rdida por epoch

---

## *üîé Optimizaci√≥n de umbrales*

El script calcula un umbral √≥ptimo por clase usando:

‚Ä¢‚Å†  ‚Å†Curva ROC
‚Ä¢‚Å†  ‚Å†G-Mean = ‚àö(TPR √ó (1 ‚Äì FPR))
‚Ä¢‚Å†  ‚Å†Threshold por clase para mejorar:

  * Sensibilidad
  * Especificidad

---

## *üìä Evaluaci√≥n final*

El modelo entrega:

‚Ä¢‚Å†  ‚Å†Matriz (TP, FN, FP, TN) por clase
‚Ä¢‚Å†  ‚Å†Sensibilidad por enfermedad
‚Ä¢‚Å†  ‚Å†Especificidad por enfermedad
‚Ä¢‚Å†  ‚Å†AUROC por clase
‚Ä¢‚Å†  ‚Å†Resultados guardados en archivo ‚Å†‚ÄØ.txt‚ÄØ‚Å†

---

# ## *Resumen General*

‚Ä¢‚Å†  ‚Å†*LSTM Notebook* ‚Üí Clasificaci√≥n basada en morfolog√≠a ECG, un enfoque m√°s cl√°sico, ideal para secuencias largas y dependencias complejas.
‚Ä¢‚Å†  ‚Å†*GRU Script* ‚Üí Clasificaci√≥n multietiqueta avanzada, optimizada, con umbrales personalizados y enfoque multicanal. GRU ofrece menor costo computacional con rendimiento comparable.
---

# ‚úî Conclusi√≥n general

Los tres papers demuestran:

- **LSTM ‚Üí mejor para biometr√≠a y an√°lisis fino de morfolog√≠a temporal**  
- **GRU ‚Üí mejor para modelos profundos o secuencias largas con m√∫ltiples clases**  
- Ambos modelos pueden superar 97‚Äì100% de precisi√≥n  
- Son adecuados para aplicaciones reales: biometr√≠a, diagn√≥stico y monitoreo en tiempo real  


---
# Referencias:

[1] S. Hochreiter and J. Schmidhuber, ‚ÄúLong Short-Term Memory,‚Äù Neural Computation, vol. 9, no. 8, pp. 1735‚Äì1780, 1997. Disponible en: https://www.bioinf.jku.at/publications/older/2604.pdf
[2] K. Cho et al., ‚ÄúLearning Phrase Representations using RNN Encoder‚ÄìDecoder for Statistical Machine Translation,‚Äù in Proc. EMNLP, 2014, pp. 1724‚Äì1734. Disponible en: https://arxiv.org/abs/1406.1078
[3] I. Goodfellow, Y. Bengio, and A. Courville, *Deep Learning*.MIT Press, 2016.  
Disponible en: https://www.deeplearningbook.org/
[4] B.-H. Kim and J.-Y. Pyun, ‚ÄúECG Identification for Personal Authentication Using LSTM-Based Deep Recurrent Neural Networks,‚Äù Sensors, vol. 20, no. 11, pp. 3069, May 2020. Disponible en:https://www.mdpi.com/1424-8220/20/11/3069
[5] V. Satheeswaran, A. A. Al-Shargabi, S. Alshargabi, and M. Al-Turjman, ‚ÄúDeep Learning Based Classification of ECG Signals Using RNN-LSTM Mechanism,‚Äù Journal of Electrical Engineering, Electronic Control Management and Information Technology, vol. 6, no. 2, pp. 1‚Äì12, 2024. Disponible en: https://jeeemi.org/index.php/jeeemi/article/view/496
[6] Y. Ju, M. Zhang, and H. Zhu, ‚ÄúStudy on a New Deep Bidirectional GRU Network for Electrocardiogram Signals Classification,‚Äù in Proc. 3rd Int. Conf. Comput. Eng., Inf. Sci. Appl. Technol. (ICCIA), 2019, pp. 355‚Äì359. Disponible en (PDF):https://www.researchgate.net/publication/334658737_Study_on_a_New_Deep_Bidirectional_GRU_Network_for_Electrocardiogram_Signals_Classification 

