In [None]:
import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, TimeDistributed
from sklearn.model_selection import train_test_split
from matplotlib import pyplot as plt
import seaborn as sns
import tensorflow as tf
import os

# Configuration

In [None]:
data_path = '/kaggle/input/file-csv/File CSV/MIT-BIH/'
window_input= 40
window_out= 40
train_size = 0.8
test_size = 1 - train_size
data_set = {
  0: "testset",
  1: "trainset"
}

# Start

## DỰ ĐOÁN TÍN HIỆU ECG

In [None]:
def get_data(istrainset):    
    missing_file = 0
    total_sample = 0
    directory = f"{data_path}{data_set[istrainset]}/"
    X, y = [], []
    for filename in os.listdir(directory):
        f = os.path.join(directory, filename)
        if os.path.isfile(f):
            df = pd.read_csv(f, header=None)
            data=df.drop(columns=187)
            data=data.values
            # Số lượng lặp qua dữ liệu
            num_samples = len(data) - window_input - window_out 
            # print("----------------------")
            # print("🍒Len data:", len(data))
            # print("🍒Num_samples:", num_samples)
            # Đối với tập train
            # Tạo dữ liệu train từ cửa sổ trượt
            if(num_samples>0):
                total_sample = total_sample + num_samples
                for i in range(num_samples):
                    X_window = data[i:i+window_input]
                    y_window = data[i+window_input+window_out:i+window_input+window_out+1]

                    X.append(X_window)
                    y.append(y_window)
            else:
                missing_file = missing_file + 1
    print(f"Num of file can not use due to its missing of length: {missing_file}")
    print(f"Number of sample: {len(y)}/{len(X)}/{total_sample}")
    return X,y

In [None]:
X_train, y_train = get_data(1)
X_test, y_test = get_data(0)

In [None]:
print(f"Len(X_train/y_train): {len(X_train)}/{len(y_train)}")
print(f"Len(X_test/y_test): {len(X_test)}/{len(y_test)}")
print(f"Test Rate: ",len(X_test)/(len(X_train)+len(X_test)))
print(f"Train Rate: ",len(X_train)/(len(X_train)+len(X_test)))

In [None]:
# X_train= np.array(X_train)
# y_train= np.concatenate(y_train)
# X_test= np.array(X_test)
# y_test= np.concatenate(y_test)

In [None]:
# print(X_train.shape)
# print(y_train.shape)
# print(X_test.shape)
# print(y_test.shape)

In [None]:
class Dataset:
    def __init__(self, data, label):
        self.data = np.array(data)
        self.label = np.concatenate(label)

    def __len__(self):
        return len(self.data)

    def __getitem__(self, i):
        # read data
        X = self.data[i]
        y = self.label[i]
        return X, y

In [None]:
class Dataloader(tf.keras.utils.Sequence):
    def __init__(self, dataset, batch_size,size):
        self.dataset = dataset
        self.batch_size = batch_size
        self.size= size

    def __getitem__(self, i):
        # collect batch data
        start = i * self.batch_size
        stop = (i + 1) * self.batch_size
        data = []
        for j in range(start, stop):
            data.append(self.dataset[j])

        batch = [np.stack(samples, axis=0) for samples in zip(*data)]
        return tuple(batch)

    def __len__(self):
        return self.size //self.batch_size

In [None]:
train_dataset = Dataset(X_train, y_train)
test_dataset = Dataset(X_test, y_test)

In [None]:
train_loader = Dataloader(train_dataset, 16,len(train_dataset))
test_loader = Dataloader(test_dataset,16,len(test_dataset))

In [None]:
# Tạo một mô hình LSTM
model = Sequential()
model.add(LSTM(64,activation='relu' ,input_shape=(40, 187)))  # Đặt input_shape phù hợp với kích thước của mảng X_train
model.add(Dense(187))# Đặt lớp Dense phù hợp với kích thước của mảng y_train
# Biên dịch mô hình
model.compile(optimizer='adam', loss='mean_squared_error')

In [None]:
model.fit_generator(train_loader, validation_data=test_loader, epochs=10, verbose=1)

In [None]:
# Dự đoán trên tập kiểm tra
y_pred = model.predict(test_dataset[:][0])

### Đánh giá độ chính xác mô hình

In [None]:
from sklearn.metrics import mean_squared_error, r2_score
# Độ đo Mean Squared Error (MSE)
mse = mean_squared_error(test_dataset[:][1], y_pred)
print(f"Mean Squared Error (MSE): {mse}")

# Độ đo R-squared (R2)
r2 = r2_score(test_dataset[:][1], y_pred)
print(f"R-squared (R2): {r2}")

Trực quan 

In [None]:
import matplotlib.pyplot as plt

# Chọn một ví dụ cụ thể để trực quan hóa
example_index = 40  # Thay đổi chỉ số ví dụ nếu cần

# Lấy giá trị dự đoán và giá trị thực tế tương ứng
y_pred_example = y_pred[example_index]
y_test_example = test_dataset[:][1][example_index]

# Vẽ biểu đồ cho giá trị dự đoán (màu xanh) và giá trị thực tế (màu đỏ)
plt.figure(figsize=(12, 6))
plt.plot(y_pred_example, label='Dự đoán', color='blue')
plt.plot(y_test_example, label='Thực tế', color='red')
plt.xlabel('Cột giá trị')
plt.ylabel('Giá trị')
plt.title('So sánh Dự đoán và Thực tế cho ví dụ cụ thể')
plt.legend()
plt.grid()
plt.show()


#### Giải phóng dữ liệu

In [None]:
# import gc
# # Giải phóng dữ liệu đào tạo và kiểm tra
# X_class_train=None
# # Sử dụng garbage collection để giải phóng bộ nhớ
# gc.collect()

## PHÂN LỚP TÍN HIỆU ECG TƯƠNG LAI

### Preprocesing

In [None]:
def get_data_class(istrainset):    
    missing_file = 0
    total_sample = 0
    directory = f"{data_path}{data_set[istrainset]}/"
    X, y = [], []
    for filename in os.listdir(directory):
        f = os.path.join(directory, filename)
        if os.path.isfile(f):
            df = pd.read_csv(f, header=None)
            data=df.values
            X_window = data[:,:-1]
            y_window = data[:,-1]
            X.append(X_window)
            y.append(y_window)
    print(f"Number of sample: {len(y)}/{len(X)}")
    return X,y

In [None]:
X_class_train, y_class_train = get_data_class(1)

In [None]:
X_class_train= np.concatenate(X_class_train,axis=0)

In [None]:
y_class_train= np.concatenate(y_class_train, axis=0)
y_class_train=y_class_train.astype(int)

In [None]:
#ECG dự đoán phân lớp X_class_test
X_class_test= y_pred
X_class_test

In [None]:
#Lây lớp của y_test
def get_data_class2(istrainset):    
    missing_file = 0
    total_sample = 0
    directory = f"{data_path}{data_set[istrainset]}/"
    X, y = [], []
    for filename in os.listdir(directory):
        f = os.path.join(directory, filename)
        if os.path.isfile(f):
            df = pd.read_csv(f, header=None)
            data=df.values
            y_window = data[window_input+window_out:,-1]
            y.append(y_window)
    print(f"Number of sample: {len(y)}")
    return y

In [None]:
y_class= get_data_class2(0)

In [None]:
#Xác định y_test_class ban đầu
y_class=np.concatenate(y_class)
y_class_test=y_class.astype(int)

In [None]:
print(X_class_train.shape)
print(y_class_train.shape)
print(X_class_test.shape)
print(y_class_test.shape)

In [None]:
# import numpy as np

# unique_values, counts = np.unique(y_class_test, return_counts=True)

# for value, count in zip(unique_values, counts):
#     print(f"{value}: {count}")

### Mô hình đơn

#### Mô hình LSTM

In [None]:
# Bước: Xây dựng mô hình LSTM
input_shape = (X_class_train.shape[1], 1)

model_lstm= Sequential()
model_lstm.add(LSTM(64, input_shape=input_shape, activation='relu', return_sequences=True))
model_lstm.add(LSTM(32, activation='relu'))
model_lstm.add(Dense(16, activation='relu'))
model_lstm.add(Dense(5, activation='softmax'))
model_lstm.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [None]:
model_lstm.fit(X_class_train.reshape(X_class_train.shape[0], X_class_train.shape[1], 1), y_class_train, epochs=10, batch_size=32)

In [None]:
predictions = model_lstm.predict(X_class_test)
y_pred_classes = np.argmax(predictions, axis=1)

##### ĐÁNH GIÁ MÔ HÌNH

In [None]:
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from sklearn.metrics import recall_score
import matplotlib.pyplot as plt

Accuracy

In [None]:
accuracy = accuracy_score(y_class_test, y_pred_classes)
accuracy

Sensitivity

In [None]:
cm = confusion_matrix(y_class_test, y_pred_classes)
cm

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, y_pred_classes == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, y_pred_classes == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, y_pred_classes == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, y_pred_classes == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, y_pred_classes == 4)

In [None]:
# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


Precision

In [None]:
from sklearn.metrics import classification_report
# Lấy báo cáo phân loại cho các lớp
report = classification_report(y_class_test, y_pred_classes)
print(report)


#### KNN

In [None]:
from sklearn.neighbors import KNeighborsClassifier

# Khởi tạo mô hình KNeighborsClassifier với số hàng xóm (neighbors) cần xem xét
knn_model = KNeighborsClassifier(n_neighbors=5)  # Tuỳ chỉnh số hàng xóm nếu cần
knn_model.fit(X_class_train, y_class_train)

In [None]:
predictions = knn_model.predict(X_class_test)

##### Đánh giá mô hình

In [None]:
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_class_test, predictions)
accuracy

In [None]:
from sklearn.metrics import classification_report
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import seaborn as sns
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()


In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

import matplotlib.pyplot as plt

# Sử dụng recall_score để tính sensitivity cho từng lớp
from sklearn.metrics import recall_score

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Random Forest

In [None]:
from sklearn.ensemble import RandomForestClassifier

# Khởi tạo mô hình KNeighborsClassifier với số hàng xóm (neighbors) cần xem xét
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)  # Tuỳ chỉnh số cây (n_estimators) nếu cần

In [None]:
rf_model.fit(X_class_train, y_class_train)

In [None]:
predictions = rf_model.predict(X_class_test)

##### Danh gia mo hinh

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()


In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Decision Tree

##### Xây dựng mô hình

In [None]:
from sklearn.tree import DecisionTreeClassifier

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

In [None]:
dt_model.fit(X_class_train, y_class_train)

In [None]:
predictions = dt_model.predict(X_class_test)

##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()


In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### LogisticRegression

##### Xay dung mo hinh

In [None]:
from sklearn.linear_model import LogisticRegression
# Khởi tạo mô hình Logistic Regression
logistic_model = LogisticRegression()
# Huấn luyện mô hình trên tập huấn luyện
logistic_model.fit(X_class_train, y_class_train)

In [None]:
predictions = logistic_model.predict(X_class_test)

##### Danh gia mo hinh

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### NaiveBayes

##### Xay dung mo hinh

In [None]:
from sklearn.naive_bayes import GaussianNB

# Khởi tạo mô hình Naive Bayes (Gaussian Naive Bayes)
nb_model = GaussianNB()
# Huấn luyện mô hình trên tập huấn luyện
nb_model.fit(X_class_train, y_class_train)

In [None]:
predictions = nb_model.predict(X_class_test)

##### Danh gia mo hinh

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### GradientBoostingClassifier

##### Xay dung mo hinh

In [None]:
from sklearn.ensemble import GradientBoostingClassifier

gb_model = GradientBoostingClassifier(random_state=42, n_estimators=100, learning_rate=0.1, max_depth=3)
# Đào tạo mô hình Gradient Boosting trên dữ liệu huấn luyện
gb_model.fit(X_class_train, y_class_train)

In [None]:
# Dự đoán với mô hình đã đào tạo
predictions = gb_model.predict(X_class_test)

##### Danh gia mo hinh

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình SVM

In [None]:
from sklearn.svm import SVC

# Khởi tạo mô hình SVM
svm_model = SVC(random_state=42)
svm_model.fit(X_class_train, y_class_train)
predictions = svm_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình Multi-layer Perceptron

In [None]:
from sklearn.neural_network import MLPClassifier

# Khởi tạo mô hình MLP
mlp_model = MLPClassifier(random_state=42)
mlp_model.fit(X_class_train, y_class_train)
predictions = mlp_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình BiLSTM

In [None]:
from tensorflow.keras.layers import Bidirectional

# Bước: Xây dựng mô hình BiLSTM
input_shape = (X_class_train.shape[1], 1)

model_bilstm = Sequential()
model_bilstm.add(Bidirectional(LSTM(64, input_shape=input_shape, activation='relu', return_sequences=True)))
model_bilstm.add(Bidirectional(LSTM(32, activation='relu')))
model_bilstm.add(Dense(16, activation='relu'))
model_bilstm.add(Dense(5, activation='softmax'))
model_bilstm.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_bilstm.fit(X_class_train.reshape(X_class_train.shape[0], X_class_train.shape[1], 1), y_class_train, epochs=10, batch_size=32)
predictions_bilstm = model_bilstm.predict(X_class_test)
y_pred_classes_bilstm = np.argmax(predictions_bilstm, axis=1)

##### Đánh giá mô hình 

In [None]:
from sklearn.metrics import classification_report

report = classification_report(y_class_test, y_pred_classes_bilstm)
print(report)

In [None]:
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import seaborn as sns
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, y_pred_classes_bilstm)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()


In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, y_pred_classes_bilstm == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, y_pred_classes_bilstm == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, y_pred_classes_bilstm == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, y_pred_classes_bilstm == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, y_pred_classes_bilstm == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình ANN

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Bước: Xây dựng mô hình ANN
input_shape = X_class_train.shape[1]  # Số lượng đặc trưng đầu vào

model_ann = Sequential()
model_ann.add(Dense(64, input_shape=(input_shape,), activation='relu'))
model_ann.add(Dense(32, activation='relu'))
model_ann.add(Dense(16, activation='relu'))
model_ann.add(Dense(5, activation='softmax'))

model_ann.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_ann.fit(X_class_train, y_class_train, epochs=10, batch_size=32)
predictions_ann = model_ann.predict(X_class_test)
predictions = np.argmax(predictions_ann, axis=1)

##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình CNN

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense, Flatten

# Bước: Xây dựng mô hình CNN từ đoạn code LSTM
input_shape = (X_class_train.shape[1], 1)

model_cnn = Sequential()
model_cnn.add(Conv1D(filters=32, kernel_size=3, activation='relu', input_shape=input_shape))
model_cnn.add(MaxPooling1D(pool_size=2))
model_cnn.add(LSTM(64, activation='relu', return_sequences=True))
model_cnn.add(LSTM(32, activation='relu'))
model_cnn.add(Dense(16, activation='relu'))
model_cnn.add(Dense(5, activation='softmax'))

model_cnn.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_cnn.fit(X_class_train.reshape(X_class_train.shape[0], X_class_train.shape[1], 1), y_class_train, epochs=10, batch_size=32)
predictions_cnn = model_cnn.predict(X_class_test.reshape(X_class_test.shape[0], X_class_test.shape[1], 1))
predictions = np.argmax(predictions_cnn, axis=1)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Mô hình RNN

In [None]:
from tensorflow.keras.layers import SimpleRNN

# Bước: Xây dựng mô hình RNN dựa trên mô hình LSTM đã có
input_shape = (X_class_train.shape[1], 1)

model_rnn = Sequential()
model_rnn.add(LSTM(64, input_shape=input_shape, activation='relu', return_sequences=True))
model_rnn.add(SimpleRNN(32, activation='relu'))
model_rnn.add(Dense(16, activation='relu'))
model_rnn.add(Dense(5, activation='softmax'))

model_rnn.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model_rnn.fit(X_class_train.reshape(X_class_train.shape[0], X_class_train.shape[1], 1), y_class_train, epochs=1, batch_size=32)
predictions_rnn = model_rnn.predict(X_class_test.reshape(X_class_test.shape[0], X_class_test.shape[1], 1))



##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### GradientBoostingClassifier

In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import GradientBoostingClassifier

gb_model = GradientBoostingClassifier(random_state=42, n_estimators=100, learning_rate=0.1, max_depth=3)
# Đào tạo mô hình Gradient Boosting trên dữ liệu huấn luyện
gb_model.fit(X_class_train, y_class_train)


In [None]:
predictions = gb_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


### Kết hợp mô hình Bagging

#### KNN

In [None]:
from sklearn.ensemble import BaggingClassifier
# Khởi tạo mô hình KNeighborsClassifier
knn_model = KNeighborsClassifier(n_neighbors=5)  # Tuỳ chỉnh số hàng xóm nếu cần
knn_model.fit(X_class_train, y_class_train)

# Bước 1: Xây dựng mô hình Bagging
n_estimators = 10  # Số lượng mô hình KNeighborsClassifier trong ensemble (có thể điều chỉnh)
bagging_model = BaggingClassifier(base_estimator=knn_model, n_estimators=n_estimators, random_state=42)

# Đào tạo mô hình Bagging trên dữ liệu huấn luyện
bagging_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình Bagging
predictions = bagging_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Decision Tree

In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import BaggingClassifier

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Khởi tạo mô hình BaggingClassifier với mô hình KNeighborsClassifier làm mô hình cơ bản
bagging_model = BaggingClassifier(estimator=dt_model, random_state=42)
bagging_model.fit(X_class_train, y_class_train)

predictions = bagging_model.predict(X_class_test)

##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Random Forest

In [None]:
from sklearn.ensemble import RandomForestClassifier, BaggingClassifier

# Khởi tạo mô hình RandomForestClassifier
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)

# Khởi tạo mô hình BaggingClassifier với mô hình RandomForestClassifier làm mô hình cơ bản
bagging_model = BaggingClassifier(base_estimator=rf_model, n_estimators=10, random_state=42)

# Đào tạo mô hình Bagging trên dữ liệu huấn luyện
bagging_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình Bagging
predictions = bagging_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Navie Bayes

In [None]:
from sklearn.naive_bayes import GaussianNB

# Khởi tạo mô hình Naive Bayes (Gaussian Naive Bayes)
nb_model = GaussianNB()

# Khởi tạo mô hình BaggingClassifier với mô hình Naive Bayes làm mô hình cơ bản
bagging_model = BaggingClassifier(estimator=nb_model, n_estimators=10, random_state=42)

# Đào tạo mô hình Bagging trên dữ liệu huấn luyện
bagging_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình Bagging
predictions = bagging_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### Logistic Regression

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import BaggingClassifier
from sklearn.metrics import accuracy_score

# Khởi tạo mô hình Logistic Regression
logistic_model = LogisticRegression()

# Khởi tạo mô hình BaggingClassifier với mô hình Logistic Regression làm mô hình cơ bản
bagging_model = BaggingClassifier(base_estimator=logistic_model, n_estimators=10, random_state=42)

# Đào tạo mô hình Bagging trên dữ liệu huấn luyện
bagging_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình Bagging
predictions = bagging_model.predict(X_class_test)


##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()

#### GradientBoostingClassifier

In [None]:
from sklearn.ensemble import GradientBoostingClassifier, BaggingClassifier
from sklearn.metrics import accuracy_score

# Khởi tạo mô hình GradientBoostingClassifier
gb_model = GradientBoostingClassifier(random_state=42, n_estimators=100, learning_rate=0.1, max_depth=3)

# Khởi tạo mô hình BaggingClassifier với mô hình GradientBoostingClassifier làm mô hình cơ bản
bagging_model = BaggingClassifier(estimator=gb_model, n_estimators=10, random_state=42)

# Đào tạo mô hình Bagging trên dữ liệu huấn luyện
bagging_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình Bagging
predictions = bagging_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


### Kết hợp mô hình Boosting

#### DT- XGboost

In [None]:
from sklearn.tree import DecisionTreeClassifier
import xgboost as xgb

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Tạo cấu hình cho mô hình XGBoost với mô hình DecisionTreeClassifier làm mô hình cơ bản
xgb_params = {
    'booster': 'gbtree',  # Sử dụng cây quyết định làm mô hình cơ bản
    'tree_method': 'hist',  # Sử dụng histogram cho tối ưu hóa tốc độ
    'grow_policy': 'lossguide',  # Sử dụng 'lossguide' cho việc tạo độ sâu cây đa dạng
    'random_state': 42
}

# Khởi tạo mô hình XGBoost với cấu hình đã định
xgb_model = xgb.XGBClassifier(**xgb_params)

# Đào tạo mô hình XGBoost trên dữ liệu huấn luyện
xgb_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình XGBoost
predictions = xgb_model.predict(X_class_test)


##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### DT-CatBoost

In [None]:
from catboost import CatBoostClassifier

# Khởi tạo mô hình CatBoostClassifier sử dụng cây quyết định làm mô hình cơ bản
catboost_model = CatBoostClassifier(boosting_type='Plain', random_seed=42)

# Đào tạo mô hình CatBoost trên dữ liệu huấn luyện
catboost_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình CatBoost
predictions = catboost_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### DT- LightGBM

In [None]:
from sklearn.tree import DecisionTreeClassifier
from lightgbm import LGBMClassifier

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Khởi tạo mô hình LGBMClassifier với mô hình DecisionTreeClassifier làm mô hình cơ bản
lgbm_model = LGBMClassifier(boosting_type='gbdt', tree_learner='voting', random_state=42)

# Đào tạo mô hình LightGBM trên dữ liệu huấn luyện
lgbm_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình LightGBM
predictions = lgbm_model.predict(X_class_test)

##### Đánh giá mô hình

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


### Kết hợp theo hướng Stacking

#### DT- KNN

In [None]:
from sklearn.ensemble import StackingClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier

# Khởi tạo mô hình KNeighborsClassifier
knn_model = KNeighborsClassifier(n_neighbors=5)

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Khởi tạo mô hình stacking bằng cách kết hợp KNN và Decision Tree
stacking_model = StackingClassifier(estimators=[('knn', knn_model), ('dt', dt_model)],
                                    final_estimator=KNeighborsClassifier(), stack_method='auto')

# Đào tạo mô hình stacking trên dữ liệu huấn luyện
stacking_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình stacking
predictions = stacking_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### DT- RF

In [None]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier

# Khởi tạo mô hình RandomForestClassifier
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Khởi tạo mô hình stacking bằng cách kết hợp RandomForest và Decision Tree
stacking_model = StackingClassifier(estimators=[('randomforest', rf_model), ('decisiontree', dt_model)],
                                    final_estimator=KNeighborsClassifier(), stack_method='auto')

# Đào tạo mô hình stacking trên dữ liệu huấn luyện
stacking_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình stacking
predictions = stacking_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()


#### DT-LR

In [None]:
from sklearn.linear_model import LogisticRegression

# Khởi tạo mô hình DecisionTreeClassifier
dt_model = DecisionTreeClassifier(random_state=42)

# Khởi tạo mô hình LogisticRegression
lr_model = LogisticRegression(max_iter=1000, random_state=42)

# Khởi tạo mô hình stacking bằng cách kết hợp Decision Tree và Logistic Regression
stacking_model = StackingClassifier(estimators=[('decisiontree', dt_model), ('logisticregression', lr_model)],
                                    final_estimator=KNeighborsClassifier(), stack_method='auto')

# Đào tạo mô hình stacking trên dữ liệu huấn luyện
stacking_model.fit(X_class_train, y_class_train)

# Dự đoán với mô hình stacking
predictions = stacking_model.predict(X_class_test)

##### Đánh giá

In [None]:
report = classification_report(y_class_test, predictions)
print(report)

In [None]:
# Tính ma trận nhầm lẫn
conf_matrix = confusion_matrix(y_class_test, predictions)
# Tạo biểu đồ dạng heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

In [None]:
sensitivity_class_0 = recall_score(y_class_test == 0, predictions == 0)
sensitivity_class_1 = recall_score(y_class_test == 1, predictions == 1)
sensitivity_class_2 = recall_score(y_class_test == 2, predictions == 2)
sensitivity_class_3 = recall_score(y_class_test == 3, predictions == 3)
sensitivity_class_4 = recall_score(y_class_test == 4, predictions == 4)

# Giả sử bạn đã tính được sensitivity cho các lớp
sensitivity_scores = [sensitivity_class_0,sensitivity_class_1, sensitivity_class_2, sensitivity_class_3, sensitivity_class_4]

# Tên của các lớp
class_names = ['Class 0','Class 1', 'Class 2', 'Class 3', 'Class 4']

# Vẽ biểu đồ cột
plt.figure(figsize=(8, 6))
plt.bar(class_names, sensitivity_scores, color='skyblue')
plt.title('Sensitivity for Each Class')
plt.xlabel('Class')
plt.ylabel('Sensitivity')
plt.ylim(0, 1)  # Đặt giới hạn trục y từ 0 đến 1 để hiển thị độ nhạy từ 0% đến 100%
plt.show()
