# Extracción del canal II y etiquetas de los datos

## Paso 1: Configuración del Entorno en Google Colab
Montar Google Drive:

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## Paso 2: Procesar los Archivos para Extraer el Canal II y Guardar los Datos
Listar los Archivos Emparejados .hea y .mat

In [None]:
import os
import numpy as np
from scipy.io import loadmat

# Directorio en Google Drive donde están los archivos .hea y .mat
input_dir = "/content/drive/My Drive/training"
output_dir = "/content/drive/My Drive/processed_data"
os.makedirs(output_dir, exist_ok=True)

# Lista de archivos .hea y .mat emparejados
paired_files = [(os.path.join(input_dir, f), os.path.join(input_dir, f.replace('.hea', '.mat')))
                for f in os.listdir(input_dir) if f.endswith('.hea')]

print("Total de archivos .hea en el directorio:", len(paired_files))

Total de archivos .hea en el directorio: 750


Función para Extraer el Índice del Canal II

In [None]:
# Función para extraer el índice del canal II
def extract_channel_index(hea_content, channel_name="II"):
    for i, line in enumerate(hea_content.splitlines()):
        if channel_name in line:
            return i
    return None


Procesar los Archivos para Extraer el Canal II y Guardar los Datos

In [None]:
# Procesar los archivos para extraer el canal II y guardar los datos junto con las etiquetas
for hea_file, mat_file in paired_files:
    try:
        # Leer y procesar el archivo .hea
        with open(hea_file, 'r') as f:
            hea_content = f.read()

        # Leer el archivo .mat
        mat_content = loadmat(mat_file)

        # Extraer el índice del canal II
        ii_index = extract_channel_index(hea_content)

        if ii_index is not None:
            # Extraer los datos del canal II
            ii_signal = mat_content['val'][ii_index, :]

            # Extraer etiquetas del archivo .hea
            labels = [line.strip() for line in hea_content.splitlines() if line.startswith('#')]

            # Guardar la señal del canal II y las etiquetas en un archivo .npy
            signal_filename = os.path.join(output_dir, os.path.basename(hea_file).replace('.hea', '_II.npy'))
            np.save(signal_filename, {'signal': ii_signal, 'labels': labels})

            # Imprimir la información del archivo procesado
            print(f"Archivo de señal del canal II guardado en: {signal_filename}")
            print("Etiquetas:", labels)

    except Exception as e:
        print(f"Error procesando archivo {hea_file}: {e}")

# Verificar archivos guardados
processed_files = os.listdir(output_dir)
print("Archivos en el directorio processed_data:")
print(processed_files[:10])  # Mostrar los primeros 10 archivos


Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v368s_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#True alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v360s_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v353l_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v355l_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v354s_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v374s_II.npy
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']
Archivo de señal del canal II guardado en: /content/drive/My Drive/processed_data/v347l_II.npy


## Paso 3: Verificar la Existencia y Contenido de los Archivos .npy

In [None]:
# Verificar la existencia de los archivos .npy y su contenido
for filename in processed_files:
    if filename.endswith('_II.npy'):
        full_signal_path = os.path.join(output_dir, filename)
        data = np.load(full_signal_path, allow_pickle=True).item()
        print(f"Verificando archivo: {filename}")
        print("Señal del canal II:", data['signal'][:10])  # Mostrar los primeros 10 valores de la señal
        print("Etiquetas:", data['labels'])
        print("\n")

# Verificar el número total de archivos procesados
print(f"Total de archivos procesados: {len(processed_files) - 1}")  # Restar 1 por el archivo labels.csv


Verificando archivo: v368s_II.npy
Señal del canal II: [-443 -599 -565 -442 -404 -492 -588 -588 -545 -578]
Etiquetas: ['#Ventricular_Tachycardia', '#True alarm']


Verificando archivo: v360s_II.npy
Señal del canal II: [ 9134 11431 11625 11811 12248 11582  9549  7127  4878  2631]
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']


Verificando archivo: v353l_II.npy
Señal del canal II: [64 66 55 56 55 54 53 55 56 55]
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']


Verificando archivo: v355l_II.npy
Señal del canal II: [537 719 712 631 603 611 554 433 356 354]
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']


Verificando archivo: v354s_II.npy
Señal del canal II: [ 803 1083 1105 1021 1002 1059 1109 1110 1099 1109]
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']


Verificando archivo: v374s_II.npy
Señal del canal II: [498 544 499 532 539 534 525 523 516 499]
Etiquetas: ['#Ventricular_Tachycardia', '#False alarm']


Verificando archivo: v347l_II.npy
Señal del can

## Paso 4: Cargar los Archivos para Uso Futuro

In [None]:
import numpy as np
import os

# Directorio con los archivos procesados
output_dir = "/content/drive/My Drive/processed_data"

# Cargar todos los archivos .npy
processed_files = [f for f in os.listdir(output_dir) if f.endswith('_II.npy')]

# Cargar las señales y etiquetas
signals = []
labels = []

for filename in processed_files:
    full_signal_path = os.path.join(output_dir, filename)
    data = np.load(full_signal_path, allow_pickle=True).item()
    signals.append(data['signal'])
    labels.append(data['labels'])

# Convertir a arrays de numpy para su uso en el modelo
signals = np.array(signals, dtype=object)
labels = np.array(labels, dtype=object)

# Mostrar la información de carga
print("Señales cargadas:", signals.shape)
print("Etiquetas cargadas:", labels.shape)
print("Ejemplo de señal del canal II:")
print(signals[0][:10])  # Mostrar los primeros 10 valores de la primera señal
print("Etiquetas correspondientes:")
print(labels[0])


Señales cargadas: (740,)
Etiquetas cargadas: (740, 2)
Ejemplo de señal del canal II:
[-443 -599 -565 -442 -404 -492 -588 -588 -545 -578]
Etiquetas correspondientes:
['#Ventricular_Tachycardia' '#True alarm']


## Paso 5: Crear DataFrame con registro del Canal II

In [None]:
import os
import numpy as np
import pandas as pd

# Directorio con los archivos procesados
output_dir = "/content/drive/My Drive/processed_data"

# Cargar todos los archivos .npy
processed_files = [f for f in os.listdir(output_dir) if f.endswith('_II.npy')]

# Cargar las señales y etiquetas
signals = []
labels = []

for filename in processed_files:
    full_signal_path = os.path.join(output_dir, filename)
    data = np.load(full_signal_path, allow_pickle=True).item()
    signals.append(data['signal'])
    labels.append(data['labels'])

# Convertir a arrays de numpy para su uso en el modelo
signals = np.array(signals, dtype=object)
labels = np.array(labels, dtype=object)

# Crear DataFrame con las etiquetas
labels_df = pd.DataFrame(labels, columns=['Arrhythmia', 'Alarm'])

# Contar las señales por tipo de alarma y arritmia
label_counts = labels_df.value_counts().reset_index(name='Count')
label_counts.columns = ['Arrhythmia', 'Alarm', 'Count']

# Mostrar el DataFrame resultante
print(label_counts)


                 Arrhythmia         Alarm  Count
0  #Ventricular_Tachycardia  #False alarm    250
1              #Tachycardia   #True alarm    128
2                 #Asystole  #False alarm    100
3  #Ventricular_Tachycardia   #True alarm     88
4  #Ventricular_Flutter_Fib  #False alarm     52
5              #Bradycardia   #True alarm     45
6              #Bradycardia  #False alarm     41
7                 #Asystole   #True alarm     22
8              #Tachycardia  #False alarm      8
9  #Ventricular_Flutter_Fib   #True alarm      6
