In [10]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.ensemble import GradientBoostingClassifier, RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler, LabelEncoder

# Đọc dữ liệu từ file CSV hoặc nguồn dữ liệu khác
# Thay đổi 'du_lieu.csv' thành tên tệp của bạn
df = pd.read_csv('patient_survival.csv')

# Lựa chọn các đặc trưng quan trọng
selected_features = ['age', 'bmi', 'elective_surgery', 'icu_admit_source', 'apache_2_diagnosis', 'apache_3j_diagnosis',
                     'apache_post_operative', 'heart_rate_apache', 'resprate_apache', 'map_apache', 'temp_apache',
                     'd1_glucose_max', 'd1_potassium_max', 'aids', 'cirrhosis', 'diabetes_mellitus', 'hepatic_failure',
                     'immunosuppression', 'leukemia', 'lymphoma', 'solid_tumor_with_metastasis']

# Lựa chọn cột dự đoán
target_column = 'hospital_death'

# Xóa cột không mong muốn và xử lý giá trị thiếu
df.drop(columns=["Unnamed: 83"], axis=1, inplace=True)
df.dropna(inplace=True)

# Đổi các giá trị trong dataset thành số
le = LabelEncoder()
df['icu_admit_source'] = le.fit_transform(df['icu_admit_source'])

# Tách dữ liệu thành tập huấn luyện và tập kiểm tra
X_train, X_test, y_train, y_test = train_test_split(df[selected_features], df[target_column], test_size=0.2, random_state=42)

# Tiêu chuẩn hóa dữ liệu
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Initialize models
svm_model = SVC(kernel='rbf', C=1.0, gamma='scale', random_state=42)
gb_model = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
lr_model = LogisticRegression(random_state=42)

# List of models
models = [svm_model, gb_model, rf_model, lr_model]

# Evaluate each model
for model in models:
    model.fit(X_train_scaled, y_train)
    y_pred = model.predict(X_test_scaled)
    
    accuracy = accuracy_score(y_test, y_pred)
    conf_matrix = confusion_matrix(y_test, y_pred)
    classification_rep = classification_report(y_test, y_pred)
    
    print(f'Model: {type(model).__name__}')
    print(f'Accuracy: {accuracy}')
    print(f'Confusion Matrix:\n{conf_matrix}')
    print(f'Classification Report:\n{classification_rep}')
    print('\n' + '-'*50 + '\n')


Model: SVC
Accuracy: 0.913497848423641
Confusion Matrix:
[[10355    28]
 [  957    47]]
Classification Report:
              precision    recall  f1-score   support

           0       0.92      1.00      0.95     10383
           1       0.63      0.05      0.09      1004

    accuracy                           0.91     11387
   macro avg       0.77      0.52      0.52     11387
weighted avg       0.89      0.91      0.88     11387


--------------------------------------------------

Model: GradientBoostingClassifier
Accuracy: 0.9182400983577764
Confusion Matrix:
[[10297    86]
 [  845   159]]
Classification Report:
              precision    recall  f1-score   support

           0       0.92      0.99      0.96     10383
           1       0.65      0.16      0.25      1004

    accuracy                           0.92     11387
   macro avg       0.79      0.58      0.61     11387
weighted avg       0.90      0.92      0.89     11387


----------------------------------------------