# Nhập file

In [1]:
import pandas as pd
import statsmodels.api as sm

df = pd.read_csv("Death_Probability.csv")

print(df.head())

   ID  PROCALCITONIN  DEATH
0   1            0.1      0
1   2            0.2      0
2   3            0.0      0
3   4            0.4      0
4   5            0.5      0


# Xác định biến độc lập X và biến phụ thuộc Y

In [2]:

X = df[["PROCALCITONIN"]]
y = df["DEATH"]

# Thêm cột hệ số chặn

In [3]:
X = sm.add_constant(X)

# Xây dựng mô hình hồi quy logistic

In [4]:
model = sm.Logit(y, X)
result = model.fit()

print(result.summary())

Optimization terminated successfully.
         Current function value: 0.377727
         Iterations 7
                           Logit Regression Results                           
Dep. Variable:                  DEATH   No. Observations:                   20
Model:                          Logit   Df Residuals:                       18
Method:                           MLE   Df Model:                            1
Date:                Thu, 16 Oct 2025   Pseudo R-squ.:                  0.4511
Time:                        16:00:35   Log-Likelihood:                -7.5545
converged:                       True   LL-Null:                       -13.763
Covariance Type:            nonrobust   LLR p-value:                 0.0004256
                    coef    std err          z      P>|z|      [0.025      0.975]
---------------------------------------------------------------------------------
const            -3.0791      1.480     -2.080      0.038      -5.980      -0.178
PROCALCITONIN     5.

# Trích xuất hệ số để viết phương trình

In [5]:
b0 = result.params['const']
b1 = result.params['PROCALCITONIN']

# Thực hiện tính phương trình hồi quy logistic và dự đoán xác suất tử vong

In [6]:
print("\nPhương trình hồi quy logistic:")
print(f"p = 1 / (1 + e^(-({b0:.4f} + {b1:.4f} * PROCALCITONIN)))")

df['Predicted_Prob'] = result.predict(X)
print("\nDự đoán xác suất tử vong:")
print(df[['ID', 'PROCALCITONIN', 'Predicted_Prob']].head())


Phương trình hồi quy logistic:
p = 1 / (1 + e^(-(-3.0791 + 5.0369 * PROCALCITONIN)))

Dự đoán xác suất tử vong:
   ID  PROCALCITONIN  Predicted_Prob
0   1            0.1        0.070736
1   2            0.2        0.111872
2   3            0.0        0.043976
3   4            0.4        0.256473
4   5            0.5        0.363387


In [7]:
import numpy as np

b0 = result.params['const']
b1 = result.params['PROCALCITONIN']

# Tính odds cho PROCALCITIONIN = 0 VÀ 1

In [8]:
odds_0 = np.exp(b0 + b1 * 0)
odds_1 = np.exp(b0 + b1 * 1)

# Tỷ lệ so sánh

In [9]:
odds_ratio = odds_1 / odds_0

print(f"Odds khi PROCALCITONIN = 0: {odds_0:.4f}")
print(f"Odds khi PROCALCITONIN = 1: {odds_1:.4f}")
print(f"Tỷ lệ odds tăng khi PROCALCITONIN tăng 1 ng/ml: e^(b1) = {odds_ratio:.4f}")

Odds khi PROCALCITONIN = 0: 0.0460
Odds khi PROCALCITONIN = 1: 7.0833
Tỷ lệ odds tăng khi PROCALCITONIN tăng 1 ng/ml: e^(b1) = 153.9884


# Diễn giải

In [10]:
if odds_ratio > 1:
    print(f"Khi PROCALCITONIN tăng 1 ng/ml, khả năng tử vong tăng {odds_ratio:.2f} lần.")
else:
    print(f"Khi PROCALCITONIN tăng 1 ng/ml, khả năng tử vong giảm {(1/odds_ratio):.2f} lần.")

Khi PROCALCITONIN tăng 1 ng/ml, khả năng tử vong tăng 153.99 lần.
