# Dataset de las señales ECG obtenidas anteriormente en 3 categorias: Basal, Respiracion y Post-Ejercicio

In [1]:
#Importación de librerías
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

#Seleccionamos estilo de ploteo
plt.style.use("ggplot")

## Lectura de Datos

In [2]:
#Lectura de documento txt con tabulación (/t) como delimitador
array1 = np.genfromtxt("ECG_BASAL.txt", delimiter="\t")
array2 = np.genfromtxt("ECG_RESPIRACION.txt", delimiter="\t")
array3 = np.genfromtxt("ECG_POSTEJERCICIO.txt", delimiter="\t")

#Nos quedamos con el dato del sensor
basal_sensor = array1[:,-2]
resp_sensor = array2[:,-2]
ejer_sensor = array3[:,-2]

#Graficamos las señales iniciales
fig, axs = plt.subplots(3, 3, figsize=(18, 10))
fig.subplots_adjust(hspace=0.5)

axs[0, 0].plot(basal_sensor)
axs[0, 0].set_title('Basal')
axs[0, 0].grid(True)

axs[0, 1].plot(basal_sensor)
axs[0, 1].set_title('señal basal con zoom al inicio')
axs[0, 1].set_xlim(0, 2500)
axs[0, 1].grid(True)

axs[0, 2].plot(basal_sensor)
axs[0, 2].set_title('señal basal con zoom al final')
axs[0, 2].set_xlim(30000, len(basal_sensor))
axs[0, 2].grid(True)

axs[1, 0].plot(resp_sensor)
axs[1, 0].set_title('Respiracion')
axs[1, 0].grid(True)

axs[1, 1].plot(resp_sensor)
axs[1, 1].set_title('señal respiracion con zoom al inicio')
axs[1, 1].set_xlim(0, 1000)
axs[1, 1].grid(True)

axs[1, 2].plot(resp_sensor)
axs[1, 2].set_title('señal respiracion con zoom al final')
axs[1, 2].set_xlim(30400, len(resp_sensor))
axs[1, 2].grid(True)

axs[2, 0].plot(ejer_sensor)
axs[2, 0].set_title('Post-Ejercicio')
axs[2, 0].grid(True)

axs[2, 1].plot(ejer_sensor)
axs[2, 1].set_title('señal post-Ejercicio con zoom al inicio')
axs[2, 1].set_xlim(0, 800)
axs[2, 1].grid(True)

axs[2, 2].plot(ejer_sensor)
axs[2, 2].set_title('señal post-Ejercicio con zoom al final')
axs[2, 2].set_xlim(19800, len(ejer_sensor))
axs[2, 2].grid(True)

plt.tight_layout()

FileNotFoundError: ignored

## Recorte de señal

### 1. Basal
Segun lo que se ve en la graficación de los datos, la señal original que se obtiene del sensor posee ruido por lo que se procede a recortar dicha señal. El primer punto de corte se hace en 2050, que es donde se empieza los ciclos cardiacos ademas se escoge ese punto ya que es donde aproximadamente empieza la onda P, se puede observar en la gráfica de la señal original que antes del punto que escogimos hay dos ciclos cardiacos, pero no se eligieron esos como ciclos iniciales ya que todavía pueden estar afectados por el ruido. El segundo punto de corte se hace en 30457, ya que es donde aproximadamente termina la onda T del penúltimo ciclo y empieza la onda P del último ciclo.

In [None]:
# Recortamos la señal
basal_rec = basal_sensor[2050:30457]

### 2. Respiración
Segun lo que se ve en la graficación de los datos, la señal original que se obtiene del sensor no posee tanto ruido por lo que se hara pequenos recortes para tener puntos fijos de que parte del ciclo cardiaco empezara y terminara nuestra señal. El primer punto de corte se hace en 400, que es donde empieza la onda P del segundo ciclo cardiaco de nuestra señal, ya que el primer ciclo no esta tan claro. El segundo punto de corte se hace en 30829, ya que es donde aproximadamente termina la onda T del penultimo ciclo y empieza la onda P del ultimo ciclo.

In [None]:
# Recortamos la señal
resp_rec = resp_sensor[400:30829]

### 3. Post-ejercicio
Segun lo que se ve en la graficacion de los datos, la señal original que se obtiene del sensor no posee tanto ruido por lo que se hara pequenos recortes para tener puntos fijos de que parte del ciclo cardiaco empezara y terminara nuestra señal. El primer punto de corte se hace en 500, que es donde empieza la onda P del segundo ciclo cardiaco de nuestra señal, para evitar pequenos ruidos que puede haber en el primer ciclo cardiaco que aparece en nuestra señal. El segundo punto de corte se hace en 20156, ya que es donde aproximadamente termina la onda T del penultimo ciclo y empieza la onda P del ultimo ciclo.

In [None]:
# Recortamos la señal
ejer_rec = ejer_sensor[500:20156]

### Graficas de las señales recortadas

In [None]:
#Graficamos las señales iniciales
fig, axs = plt.subplots(3, 3, figsize=(16, 9))
fig.subplots_adjust(hspace=0.5)

axs[0, 0].plot(basal_rec)
axs[0, 0].set_title('Basal recortada')
axs[0, 0].grid(True)

axs[0, 1].plot(basal_rec)
axs[0, 1].set_title('señal basal con zoom al inicio')
axs[0, 1].set_xlim(0, 1500)
axs[0, 1].grid(True)

axs[0, 2].plot(basal_rec)
axs[0, 2].set_title('señal basal con zoom al final')
axs[0, 2].set_xlim(27000, len(basal_rec))
axs[0, 2].grid(True)

axs[1, 0].plot(resp_rec)
axs[1, 0].set_title('Respiracion recortada')
axs[1, 0].grid(True)

axs[1, 1].plot(resp_rec)
axs[1, 1].set_title('señal respiracion con zoom al inicio')
axs[1, 1].set_xlim(0, 1200)
axs[1, 1].grid(True)

axs[1, 2].plot(resp_rec)
axs[1, 2].set_title('señal respiracion con zoom al final')
axs[1, 2].set_xlim(29000, len(resp_rec))
axs[1, 2].grid(True)

axs[2, 0].plot(ejer_rec)
axs[2, 0].set_title('Post-Ejercicio recortada')
axs[2, 0].grid(True)

axs[2, 1].plot(ejer_rec)
axs[2, 1].set_title('señal post-Ejercicio con zoom al inicio')
axs[2, 1].set_xlim(0, 800)
axs[2, 1].grid(True)

axs[2, 2].plot(ejer_rec)
axs[2, 2].set_title('señal post-Ejercicio con zoom al final')
axs[2, 2].set_xlim(19000, len(ejer_rec))
axs[2, 2].grid(True)

plt.tight_layout()

## Especificar la Frecuencia de muestreo

In [None]:
Fs = 1000 #Frecuencia de muestreo del dispositivo de adquisición
Ts = 1/Fs

#Basal
n_basal = np.arange(0,basal_rec.shape[0])  # t = n*Ts
t_basal = n_basal*Ts

#Respiracion
n_resp = np.arange(0,resp_rec.shape[0])  # t = n*Ts
t_resp = n_resp*Ts

#Post-ejercicio
n_ejer = np.arange(0,ejer_rec.shape[0])  # t = n*Ts
t_ejer = n_ejer*Ts

#Ploteamos la señal en el tiempo
fig, axs = plt.subplots(3, 1, figsize=(16, 9))
fig.subplots_adjust(hspace=0.5)

axs[0].plot(t_basal, basal_rec)
axs[0].set_title('Basal')
axs[0].set_xlabel('t [s]')
axs[0].grid(True)

axs[1].plot(t_resp, resp_rec)
axs[1].set_title('Respiracion')
axs[1].set_xlabel('t [s]')
axs[1].grid(True)

axs[2].plot(t_ejer, ejer_rec)
axs[2].set_title('Post-ejercicio')
axs[2].set_xlabel('t [s]')
axs[2].grid(True)

plt.tight_layout()

## Pasando el array a pandas para trabajarlo como series de tiempo

In [None]:
#Pasamos las observaciones a filas correspondientes a una variable t y d_sensor
st_basal = np.concatenate((t_basal.reshape(-1,1),  basal_rec.reshape(-1,1)), axis=1) #Basal
st_resp = np.concatenate((t_resp.reshape(-1,1),  resp_rec.reshape(-1,1)), axis=1) #Respiracion
st_ejer = np.concatenate((t_ejer.reshape(-1,1),  ejer_rec.reshape(-1,1)), axis=1) #Post-ejercicio

#Creamos el data frame con las varibles t y d_sensor
df_basal = pd.DataFrame(st_basal, columns=["t","basal_rec"]) #Basal
df_resp = pd.DataFrame(st_resp, columns=["t","resp_rec"]) #Respiracion
df_ejer = pd.DataFrame(st_ejer, columns=["t","ejer_rec"]) #Post-ejercicio

#Establecemos t como index 
df_basal = df_basal.set_index("t") #Basal
df_resp = df_resp.set_index("t") #Respiracion
df_ejer = df_ejer.set_index("t") #Post-ejercicio

## Obteniendo la duracion de un ciclo cardiaco

Se grafica la señal durante el primer segundo para tener una vista amplia y calcular aproximadamente cuanto tiempo dura un ciclo cardiaco. Y como se puede observar el ciclo cardiaco para el estado basal es 0.56 segundos, para el de respiracion es 0.63 segundos y para el de post-ejercicio es 0.37.

In [None]:
#Ploteamos la señal
fig, axs = plt.subplots(3, 2, figsize=(16, 9))
fig.subplots_adjust(hspace=0.5)

axs[0, 0].plot(df_basal)
axs[0, 0].set_title('Basal durante 1 seg.')
axs[0, 0].set_xlim(0, 1)
axs[0, 0].set_xlabel('t [s]')
axs[0, 0].grid(True)

axs[0, 1].plot(df_basal)
axs[0, 1].set_title('Basal - Ciclo cardiaco (0.56s)')
axs[0, 1].set_xlim(0, 0.56)
axs[0, 1].set_xlabel('t [s]')
axs[0, 1].grid(True)

axs[1, 0].plot(df_resp)
axs[1, 0].set_title('Respiracion durante 1 seg.')
axs[1, 0].set_xlim(0, 1)
axs[1, 0].set_xlabel('t [s]')
axs[1, 0].grid(True)

axs[1, 1].plot(df_resp)
axs[1, 1].set_title('Respiracion - Ciclo cardiaco (0.63s)')
axs[1, 1].set_xlim(0, 0.63)
axs[1, 1].set_xlabel('t [s]')
axs[1, 1].grid(True)

axs[2, 0].plot(df_ejer)
axs[2, 0].set_title('Post-ejercicio durante 1 seg.')
axs[2, 0].set_xlim(0, 1)
axs[2, 0].set_xlabel('t [s]')
axs[2, 0].grid(True)

axs[2, 1].plot(df_ejer)
axs[2, 1].set_title('Post-ejercicio - Ciclo cardiaco (0.37s)')
axs[2, 1].set_xlim(0, 0.37)
axs[2, 1].set_xlabel('t [s]')
axs[2, 1].grid(True)

plt.tight_layout()

## Pasando a data tabular estilo Sklearn

In [None]:
import math

# Basal
x_basal = math.ceil(df_basal.index.max()/0.56)             #Redondeamos al numero mayor
y_basal = math.ceil(df_basal.shape[0]/x_basal)
tab_basal = df_basal[["basal_rec"]].values.reshape(x_basal,y_basal)

# Respiracion
x_resp = math.ceil(df_resp.index.max()/0.63)              #Redondeamos al numero mayor
y_resp = math.ceil(df_resp.shape[0]/x_resp)
tab_resp = df_resp[["resp_rec"]].values.reshape(x_resp,y_resp)

# Post-ejercicio
x_ejer = math.ceil(df_ejer.index.max()/0.37)              #Redondeamos al numero mayor
y_ejer = math.ceil(df_ejer.shape[0]/x_ejer)
tab_ejer = df_ejer[["ejer_rec"]].values.reshape(x_ejer,y_ejer)

In [None]:
#Graficamos
fig, axs = plt.subplots(3, 3, figsize=(18, 10))
fig.subplots_adjust(hspace=0.5)

axs[0, 0].plot(tab_basal[0])
axs[0, 0].set_title('Data basal primera fila')
axs[0, 0].grid(True)

mb = round(x_basal/2)
axs[0, 1].plot(tab_basal[mb])
axs[0, 1].set_title('Data basal fila '+ str(mb))
axs[0, 1].grid(True)

axs[0, 2].plot(tab_basal[x_basal-1])
axs[0, 2].set_title('Data basal ultima fila')
axs[0, 2].grid(True)

axs[1, 0].plot(tab_resp[0])
axs[1, 0].set_title('Data respiracion primera fila')
axs[1, 0].grid(True)

mr = round(x_resp/2)
axs[1, 1].plot(tab_resp[mr])
axs[1, 1].set_title('Data respiracion fila'+str(mr))
axs[1, 1].grid(True)

axs[1, 2].plot(tab_resp[x_resp-1])
axs[1, 2].set_title('Data respiracion ultima fila')
axs[1, 2].grid(True)

axs[2, 0].plot(tab_ejer[0])
axs[2, 0].set_title('Data post-ejercicio primera fila')
axs[2, 0].grid(True)

me = round(x_ejer/2)
axs[2, 1].plot(tab_ejer[round(x_ejer/2)])
axs[2, 1].set_title('Data post-ejercicio fila'+str(me))
axs[2, 1].grid(True)

axs[2, 2].plot(tab_ejer[x_ejer-1])
axs[2, 2].set_title('Data post-ejercicio ultima fila')
axs[2, 2].grid(True)

plt.tight_layout()

## Igualando el numero de datos por fila para las señales de las categorias

In [None]:
#Calculando el maximo numero de datos de las tres categorias
lst = [y_basal, y_resp, y_ejer]
y_max = max(lst)

#Creando una funcion para agregar el numero que queramos a señal
#n_add = Numero con el que vamos a rellenar cada fila
#n_col = Cuantas veces agregaremos ese numero por fila
def rellenar(n_add, n_col, tab_señal):
    matriz_n_add = np.repeat(n_add, tab_señal.shape[0]*n_col).reshape(-1,n_col)
    rellenado = np.concatenate((tab_señal,  matriz_n_add), axis=1)
    return rellenado

#Definiendo que numero queremos agregar
n_add = 0

#Basal
N_basal = y_max - y_basal
if N_basal == 0:
    basal_final = tab_basal
else:
    #Codigo para completar solamente con ceros
    #zeros_basal = np.zeros((tab_basal.shape[0], N_basal))
    #basal_final = np.concatenate((tab_basal,  zeros_basal), axis=1)
    basal_final = rellenar(n_add, N_basal, tab_basal)

#Respiracion
N_resp = y_max - y_resp
if N_resp == 0:
    resp_final = tab_resp
else:
    #Codigo para completar solamente con ceros
    #zeros_resp = np.zeros((tab_resp.shape[0], N_resp))
    #resp_final = np.concatenate((tab_resp,  zeros_resp), axis=1)
    resp_final = rellenar(n_add, N_resp, tab_resp)

#Post-ejercicio
N_ejer = y_max - y_ejer
if N_ejer == 0:
    ejer_final = tab_ejer
else:
    #Codigo para completar solamente con ceros
    #zeros_ejer = np.zeros((tab_ejer.shape[0], N_ejer))
    #ejer_final = np.concatenate((tab_ejer,  zeros_ejer), axis=1)
    ejer_final = rellenar(n_add, N_ejer, tab_ejer)

### Descripción de categoria de los ejercicios realizado en la clase de ECG

| Descripción | Categoria |
|----------|----------|
| Basal    | 0   |
| Respiracion   | 1   | 
| Post-Ejercicio    | 2   |

In [None]:
#Creamos una categoría
target_0 = np.repeat(0, basal_final.shape[0])    #Basal = 0
target_1 = np.repeat(1, resp_final.shape[0])     #Respiracion = 1
target_2 = np.repeat(2, ejer_final.shape[0])     #Post-ejercicio = 2

## Creando Dataset

In [None]:
ecg_data = np.vstack((basal_final, resp_final, ejer_final))
ecg_target = np.concatenate((target_0, target_1, target_2))

ecg_dataset = {"data": ecg_data, "target": ecg_target}
ecg_dataset

In [None]:
#Grafica de las 3 categorias juntas
ecg_data_array = ecg_data.flatten()
plt.figure(figsize=(18, 10))
plt.plot(ecg_data_array)
#plt.xlim(31000,32000)