# ベイズの定理と疾患検査

# 要旨

個人的に作成したサンプルコードをフリーウェアとして公開する。

# ライブラリバージョン

本サンプル作成時のpythonおよびモジュールのバージョンは次のとおり。

* python 3.13.1 (tags/v3.13.1:0671451, Dec  3 2024, 19:06:28) [MSC v.1942 64 bit (AMD64)]
* numpy 2.2.0

# ベイズの定理

In [1]:
def disease_test(P_H1, P_A_H1, P_Ac_H2):
    """ベイズの定理により疾患検査の事後確率を計算する  
    (H1: 疾患あり, H2: 疾患なし, A: 検査陽性, Ac: 検査陰性)

    Args:
        P_H1    (float): 事前確率(疾患率) P(疾患あり) 
        P_A_H1  (float): 検査精度(感度)   P(陽性|疾患あり)
        P_Ac_H2 (float): 検査精度(特異度) P(陰性|疾患なし)

    Returns:
        (P_H1_A, P_H2_A, P_H2_Ac, P_H1_Ac) (float):  事後確率のタプル
            真陽性率 P(疾患あり|陽性),
            偽陽性率 P(疾患なし|陽性),
            真陰性率 P(疾患なし|陰性),
            偽陰性率 P(疾患あり|陰性))
    """
    P_H2 = 1 - P_H1       # 事前確率(非疾患率)
    P_A_H2 = 1 - P_Ac_H2  # 検査精度(偽陽性)
    P_Ac_H1 = 1 - P_A_H1  # 検査精度(偽陰性)

    # 検査前 各領域の確率
    P_A_and_H1 = P_H1 * P_A_H1
    P_A_and_H2 = P_H2 * P_A_H2
    P_Ac_and_H2 = P_H2 * P_Ac_H2
    P_Ac_and_H1 = P_H1 * P_Ac_H1
    P_all = P_A_and_H1 + P_A_and_H2 + P_Ac_and_H2 + P_Ac_and_H1
    print('検査前 各領域の確率')
    print('P(A ∩ H1) =', P_A_and_H1)
    print('P(A ∩ H2) =', P_A_and_H2)
    print('P(Ac ∩ H2) =', P_Ac_and_H2)
    print('P(Ac ∩ H1) =', P_Ac_and_H1)
    print('P(全検査対象) =', P_all)

    # 事後確率
    P_H1_A = (P_H1 * P_A_H1) / ((P_H1 * P_A_H1) + (P_H2 * P_A_H2))  # P(疾患あり|陽性)
    P_H2_A = (P_H2 * P_A_H2) / ((P_H1 * P_A_H1) + (P_H2 * P_A_H2))  # P(疾患なし|陽性)
    P_H2_Ac = (P_H2 * P_Ac_H2) / ((P_H1 * P_Ac_H1) + (P_H2 * P_Ac_H2))  # P(疾患なし|陰性)
    P_H1_Ac = (P_H1 * P_Ac_H1) / ((P_H1 * P_Ac_H1) + (P_H2 * P_Ac_H2))  # P(疾患あり|陰性)

    print('')
    print('事後確率')
    print('真陽性率P(H1|A) =', P_H1_A)
    print('偽陽性率P(H2|A) =', P_H2_A)
    print('真陰性率P(H2|Ac) =', P_H2_Ac)
    print('偽陽性率P(H1|Ac) =', P_H1_Ac)

    return (P_H1_A, P_H2_A, P_H2_Ac, P_H1_Ac)

# 疾患検査 (1回目)

In [2]:
P_H1 = 0.001   # 全人口における疾患率 0.1%
P_A_H1 = 0.7   # 検査精度 (感度)   P(陽性|疾患あり)
P_Ac_H2 = 0.99 # 検査精度 (特異度) P(陰性|疾患なし)

P_H1_A, P_H2_A, P_H2_Ac, P_H1_Ac = disease_test(P_H1, P_A_H1, P_Ac_H2)

検査前 各領域の確率
P(A ∩ H1) = 0.0007
P(A ∩ H2) = 0.00999000000000001
P(Ac ∩ H2) = 0.98901
P(Ac ∩ H1) = 0.00030000000000000003
P(全検査対象) = 0.9999999999999999

事後確率
真陽性率P(H1|A) = 0.06548175865294663
偽陽性率P(H2|A) = 0.9345182413470534
真陰性率P(H2|Ac) = 0.9996967583467266
偽陽性率P(H1|Ac) = 0.0003032416532734937


# 疾患検査 (2回目)

In [3]:
P_H1 = P_H1_A  # 前回検査の真陽性率
P_A_H1 = 0.7   # 検査精度 (感度)   P(陽性|疾患あり)
P_Ac_H2 = 0.99 # 検査精度 (特異度) P(陰性|疾患なし)

P_H1_A, P_H2_A, P_H2_Ac, P_H1_Ac = disease_test(P_H1, P_A_H1, P_Ac_H2)

検査前 各領域の確率
P(A ∩ H1) = 0.04583723105706264
P(A ∩ H2) = 0.009345182413470543
P(Ac ∩ H2) = 0.9251730589335829
P(Ac ∩ H1) = 0.01964452759588399
P(全検査対象) = 1.0000000000000002

事後確率
真陽性率P(H1|A) = 0.8306492625868789
偽陽性率P(H2|A) = 0.16935073741312112
真陰性率P(H2|Ac) = 0.9792081266522114
偽陽性率P(H1|Ac) = 0.02079187334778862


# 疾患検査 (3回目)

In [4]:
P_H1 = P_H1_A  # 前回検査の真陽性率
P_A_H1 = 0.7   # 検査精度 (感度)   P(陽性|疾患あり)
P_Ac_H2 = 0.99 # 検査精度 (特異度) P(陰性|疾患なし)

P_H1_A, P_H2_A, P_H2_Ac, P_H1_Ac = disease_test(P_H1, P_A_H1, P_Ac_H2)

検査前 各領域の確率
P(A ∩ H1) = 0.5814544838108152
P(A ∩ H2) = 0.0016935073741312127
P(Ac ∩ H2) = 0.1676572300389899
P(Ac ∩ H1) = 0.2491947787760637
P(全検査対象) = 1.0

事後確率
真陽性率P(H1|A) = 0.9970959217904704
偽陽性率P(H2|A) = 0.0029040782095296866
真陰性率P(H2|Ac) = 0.4021984457159593
偽陽性率P(H1|Ac) = 0.5978015542840408


In [5]:
# バージョン情報
import sys
import numpy as np
print(sys.version)
print(np.__version__)

3.13.1 (tags/v3.13.1:0671451, Dec  3 2024, 19:06:28) [MSC v.1942 64 bit (AMD64)]
2.2.0
