**조건부 확률**
* P(A|B): B가 일어났을 때 A가 일어날 확률
* 공식: P(A|B) = P(A ∩ B) / P(B)

**독립 사건**
* 두 사건이 서로 영향을 주지 않을 때
* P(A|B) = P(A)이면 A와 B는 독립
* 독립이면: P(A ∩ B) = P(A) × P(B)

**베이즈 정리**
P(A|B) = P(B|A) x P(A) / P(B)
- P(A): 사전 확률 (prior) - 처음에 A라고 생각한 확률
- P(A|B): 사후 확률 (posterior) - 증거 B를 본 후 A일 확률
- 새로운 정보(증거)를 보고 믿음을 업데이트하는 것

In [3]:
import numpy as np

In [274]:
# 1. 조건부 확률 - 질병 검사 예제
# 질병 유병률: 1%
# 검사 민감도(질병 있을 때 양성): 99%
# 검사 특이도(질병 없을 때 음성): 95%

In [24]:
def simulate_mdeical_test(n_people=100000):
    #실제 질병 여부 (1% 유병률)
    has_disease = np.random.random(n_people) < 0.01

    #검사 결과
    test_result = np.zeros(n_people, dtype=bool)

    #has_disease.sum(): True의 개수
    #질병이 있는 사람: 99% 양성
    test_result[has_disease] = np.random.random(has_disease.sum()) < 0.99

    #~has_disease.sum(): False의 개수
    #질병이 없는 사람: 5% 양성(위양성)
    test_result[~has_disease] = np.random.random((~has_disease).sum()) < 0.05

    # 양성이 나왔을 때 실제로 질병이 있을 확률
    positive_tests = test_result
    # positive_tests에는 진양성, 위양성이 모두 포함
    true_positive_rate = has_disease[positive_tests].sum() / positive_tests.sum()

    print(f"양성 판정 받은 사람 중 실제 질병 보유 비율: {true_positive_rate:.3f}")
    print(f"전체 인구 중 질병 보유율: {has_disease.mean():.3f}")
    print(f"양성 판정 비율: {positive_tests.mean():.3f}")

    return has_disease, test_result

* np.random.random: 0 이상 1 미만의 범위에서 균등 분포(uniform distribution)를 따르는 난수를 생성하는 NumPy 함수입니다.
* np.zeros: zero값을 채운 NumPy 함수
* test_result[has_disease]: has_disease의 True 지점을 test_result에서 선택
* 해당 지점을 확률에 따라 True 혹은 False로 둠

In [25]:
has_disease, test_result = simulate_mdeical_test()

양성 판정 받은 사람 중 실제 질병 보유 비율: 0.162
전체 인구 중 질병 보유율: 0.010
양성 판정 비율: 0.061


In [277]:
# 2. 베이즈 정리로 계산
# P(A|B) = P(B|A) x P(A) / P(B)
# P(A|B) = P(A∩B) / P(B)

In [278]:
def bayes_medical_test():
    p_disease = 0.01 #P(질병): 질병이란 사건이 발생할 확률
    p_positive_given_disease=0.99 #P(양성|질병)
    p_positive_given_no_disease=0.05 #P(양성\질병없음)

    #P(양성) = P(양성|질병) x P(질병) + P(양성|질병없음) x P(질병없음)
    p_positive = p_positive_given_disease * p_disease + p_positive_given_no_disease * (1 - p_disease)

    # P(질병|양성) = P(양성|질병) × P(질병) / P(양성)
    p_disease_given_positive = (p_positive_given_disease * p_disease) / p_positive

    print(f"\n베이즈 정리로 계산한 P(질병|양성): {p_disease_given_positive:.3f}")

bayes_medical_test()


베이즈 정리로 계산한 P(질병|양성): 0.167
