# PTB Diagnostic ECG Database

EKG to skrót od Elektrokardiogramu. Jest to badanie, które mierzy elektryczną aktywność serca. Elektrokardiogram jest wykonywany przez przyklejenie elektrod do klatki piersiowej, ramion i nóg pacjenta. Te elektrody zbierają sygnały elektryczne z serca i przekazują je do aparatu EKG, który zapisuje sygnały na papierze lub w formie cyfrowej.

EKG jest jednym z najważniejszych narzędzi diagnostycznych w kardiologii, ponieważ umożliwia lekarzom zobaczenie, jak działa serce pacjenta i czy są jakieś nieprawidłowości w jego pracy. Elektrokardiogramy mogą pomóc w diagnozowaniu chorób serca, takich jak choroba wieńcowa, zawał serca, migotanie przedsionków i wiele innych.

![ekg.webp](attachment:ekg.webp)

Zbiór danych **PTB Diagnostic ECG Database** zawiera nagrania EKG. Ostatnia kolumna każdego pliku CSV zawiera etykietę, która w tym przypadku jest kategoryczna.

In [None]:
import numpy as np
import pandas as pd
import itertools
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from sklearn.metrics import f1_score, accuracy_score, classification_report, confusion_matrix, label_ranking_average_precision_score, label_ranking_loss, coverage_error
from sklearn.utils import class_weight, resample
from imblearn.over_sampling import SMOTE

from tensorflow import keras
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import BatchNormalization, Reshape, Dense, Activation, Flatten, Convolution1D, Dropout, MaxPooling1D
from tensorflow.keras.optimizers import Adam , Adadelta
from tensorflow.keras.callbacks import LearningRateScheduler, EarlyStopping, ModelCheckpoint

In [None]:
train = pd.read_csv("data/mitbih_train.csv" , header = None)
test = pd.read_csv("data/mitbih_test.csv" , header = None)

train

In [None]:
for i in range(2):
    plt.plot(train.iloc[i])

Sprawdźmy teraz czy nasze dane są zbalansowane:

In [None]:
train.rename(columns={187:"Class"}, inplace=True)
test.rename(columns={187:"Class"}, inplace=True)
mapping = {    0. : 'Normal Beat',
               1. : 'Supraventricular premature beat',
               2. : 'Premature ventricular contraction',
               3. : 'Fusion of ventricular',
               4. : 'Unclassifiable beat'}
train['label'] = train.iloc[:, -1].map(mapping)
test['label'] = test.iloc[:, -1].map(mapping)

In [None]:
train.label.value_counts()

In [None]:
test.label.value_counts()

Następnie przejdziemy do balansowania zmiennych:

In [None]:
df_1 = train[train['Class']==1]
df_2 = train[train['Class']==2]
df_3 = train[train['Class']==3]
df_4 = train[train['Class']==4]
df_0 = (train[train['Class']==0]).sample(n=20000, random_state=1234)

train = pd.concat([df_0, df_1, df_2, df_3, df_4])

In [None]:
X_train = train.iloc[:,:186].values
X_test = test.iloc[:,:186].values

In [None]:
# Uzyj algorytmu SMOTE do zbalansowania danych
oversample = ___
X_train, y_train = ___

Przekształcany dane do odpowiedniego kształtu - tensora dla tensorflow:

In [None]:
X_train = X_train.reshape(len(X_train), X_train.shape[1], 1)
X_test = X_test.reshape(len(X_test), X_test.shape[1], 1)

In [None]:
X_train.shape

In [None]:
y_train = np.array(y_train).reshape(-1, 1)
y_test = np.array(test["Class"]).reshape(-1, 1)

In [None]:
y_train.shape

In [None]:
# Zmień wektor odpowiedzi y na one-hot encoded matrix
y_train = ___
y_test = ___

Następnie możemy zbudować model:

In [None]:
# Zainicjalizuj model
model = ___

# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu, odpowiedni input shape
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę poolingu 1D: pool size 5, stride 1
___

# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę poolingu 1D: pool size 5, stride 1
___

# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę poolingu 1D: pool size 5, stride 1
___

# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę poolingu 1D: pool size 5, stride 1
___

# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę konwolucji 1D: 32 filtry, wielkość filtra 5, stride 1, padding "same", aktywację relu
___
# Dodaj warstwę poolingu 1D: pool size 5, stride 1
___

# Dodaj warstwę spłaszczającą
___

# Dodaj warstwę głęboką: 512 neuronów, aktywacja relu
___
# Dodaj normalizację batchową
___
# Dodaj warstwę głęboką: 256 neuronów, aktywacja relu
___
# Dodaj normalizację batchową
___
# Dodaj warstwę głęboką: 64 neuronów, aktywacja relu
___
# Dodaj normalizację batchową
___

# Dodaj warstwę wyjściową
___
model.summary()

In [None]:
adam = Adam(learning_rate = 0.001, beta_1 = 0.9, beta_2 = 0.999)
model.compile(optimizer=adam, loss='categorical_crossentropy', metrics=['accuracy'])

In [None]:
def exp_decay(epoch, lr):
    if epoch < 10:
        return lr
    else:
        return lr * tf.math.exp(-0.1)

lrate = LearningRateScheduler(exp_decay)
my_callbacks = [
    EarlyStopping(monitor='val_loss' , patience=8),
    ModelCheckpoint(filepath='ekg_cnn.h5' , monitor = 'val_loss' , save_best_only=True),
    lrate
]

In [None]:
history=model.fit(X_train, y_train, epochs=10,
                  callbacks=my_callbacks, batch_size=500,
                  validation_split=0.3)

In [None]:
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('model Accuracy')
plt.ylabel('Accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'val'], loc='upper left')
plt.show()

In [None]:
y_pred = model.predict(X_test, batch_size=1000)
y_pred=np.argmax(y_pred, axis=1)
yyy_test = np.argmax(y_test , axis = 1)
print("Model Accuracy is : " , accuracy_score(yyy_test, y_pred))

In [None]:
print(classification_report(yyy_test, y_pred))