In [2]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout

# Load data
df = pd.read_csv('patient_survival.csv')

# Lựa chọn các đặc trưng quan trọng
selected_features = ['age', 'bmi', 'elective_surgery', 'icu_admit_source', 'apache_2_diagnosis', 'apache_3j_diagnosis',
                     'apache_post_operative', 'heart_rate_apache', 'resprate_apache', 'map_apache', 'temp_apache',
                     'd1_glucose_max', 'd1_potassium_max', 'aids', 'cirrhosis', 'diabetes_mellitus', 'hepatic_failure',
                     'immunosuppression', 'leukemia', 'lymphoma', 'solid_tumor_with_metastasis']

# Lựa chọn cột dự đoán
target_column = 'hospital_death'

# Xóa cột không mong muốn và xử lý giá trị thiếu
df.drop(columns=["Unnamed: 83"], axis=1, inplace=True)
df.dropna(inplace=True)

# Đổi các giá trị trong dataset thành số
le = LabelEncoder()
df['icu_admit_source'] = le.fit_transform(df['icu_admit_source'])

# Tách dữ liệu thành tập huấn luyện và tập kiểm tra
X_train, X_test, y_train, y_test = train_test_split(df[selected_features], df[target_column], test_size=0.2, random_state=42)

# Tiêu chuẩn hóa dữ liệu
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Xây dựng mô hình Neural Network với Dropout
model = Sequential()
model.add(Dense(64, activation='relu', input_dim=X_train_scaled.shape[1]))
model.add(Dropout(0.5))  # Tỉ lệ dropout là 0.5
model.add(Dense(1, activation='sigmoid'))

# Compile
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Train
model.fit(X_train_scaled, y_train, epochs=10, batch_size=32, validation_data=(X_test_scaled, y_test))

# Đánh giá mô hình
y_pred_proba = model.predict(X_test_scaled)
y_pred = np.round(y_pred_proba)

accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
classification_rep = classification_report(y_test, y_pred)

# In kết quả
print(f'Accuracy: {accuracy}')
print(f'Confusion Matrix:\n{conf_matrix}')
print(f'Classification Report:\n{classification_rep}')

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Accuracy: 0.9155176956178098
Confusion Matrix:
[[10351    32]
 [  930    74]]
Classification Report:
              precision    recall  f1-score   support

           0       0.92      1.00      0.96     10383
           1       0.70      0.07      0.13      1004

    accuracy                           0.92     11387
   macro avg       0.81      0.54      0.54     11387
weighted avg       0.90      0.92      0.88     11387

