# Lösungen Aufgaben Bayes-Theorem

Die Formel des Bayes-Theorems lautet:

$$P(Y|X) = \frac{P(Y \cap X)}{P(X)} = \frac{P(X \cap Y)}{P(X)} = \frac{ P(X|Y) \cdot P(Y)}{P(X)}$$

$$= \frac{ P(X|Y) \cdot P(Y)}{P(X | Y) \cdot P(Y) + P(X | Y^C) \cdot P(Y^C)}$$

In [11]:
# Definition einer Funktion zur Berechnung des Bayes-Theorems
def bayes_rule(p_xy, p_y, p_x):
  return ((p_xy * p_y) / p_x)

# Definition einer Funktion zur Berechung der vier Felder einer Vier-Felder-Tafel
def contingency_matrix(prior, prior_c, sensitivity, specificity, n):
  # Erkrankt und positives Testergebnis (richtig positiv)
  tp = int(round(sensitivity * prior * n, 0))
  print("TP: ", tp)

  # Gesund und negatives Testergebnis (richtig negativ)
  tn = int(round(specificity * prior_c * n, 0))
  print("TN: ", tn)

  # Gesund und positives Testergebnis (falsch positiv)
  fp = int(round(prior_c * n - tn, 0))
  print("FP: ", fp)

  # Erkrankung und negatives Testergebnis (falsch negativ)
  fn = int(round(prior * n - tp, 0))
  print("FN: ", fn)

  return tp, tn, fp, fn

## Regentag in Köln

In [8]:
# Prior P(Y)
prior = 206 / 365

# P(X)
p_x = 9 / 10

# P(X | Y)
p_x_given_y = 4 / 5

# Anwendung der Funktion
bayes_rule(
    p_xy=p_x_given_y,
  	p_y=prior,
  	p_x=p_x
)

0.5016742770167428

## Hautkrebsscreening

In [12]:
# Grundgesamtheit
n = 1000000

# Prior P(Y)
prior = 170 / n

# Prior Gegenereignis P(Y^C)
prior_c = 1 - prior

# Sensitivität
sensitivity = 0.9

# Spezifität
specificity = 0.9

# Berechung der vier Felder einer Vier-Felder-Tafel
tp, tn, fp, fn = contingency_matrix(prior, prior_c, sensitivity, specificity, n)

# Aufgabe: P(Y^C | X^C)

# P(X^C)
p_xc = (fn + tn) / n

# P(X^C | Y^C)
p_xcyc = tn / (tn + fp)


# Anwendung der Funktion
bayes_rule(
    p_xy=p_xcyc,
  	p_y=prior_c,
  	p_x=p_xc
)

TP:  153
TN:  899847
FP:  99983
FN:  17


0.9999811082563588

## Blasenentzündung

In [13]:
# Grundgesamtheit
n = 100000

# Prior P(Y)
prior = 63000 / n

# Prior Gegenereignis P(Y^C)
prior_c = 1 - prior

# Sensitivität
sensitivity = 0.84

# Spezifität
specificity = 0.45

# Berechung der vier Felder einer Vier-Felder-Tafel
tp, tn, fp, fn = contingency_matrix(prior, prior_c, sensitivity, specificity, n)

# Aufgabe: P(Y^C | X)

# P(X)
p_x = (tp + fp) / n

# P(X | Y^C)
p_xyc = fp / (fp + tn)


# Anwendung der Funktion
bayes_rule(
    p_xy=p_xyc,
  	p_y=prior_c,
  	p_x=p_x
)

TP:  52920
TN:  16650
FP:  20350
FN:  10080


0.2777398662481234

In [14]:
# P(X|Y)
p_x_given_y = tp / (tp + fn)

# P(Cystits | T+)
bayes_rule(
    p_xy=p_x_given_y,
    p_y=prior,
    p_x=p_x
)

0.7222601337518766

In [15]:
# P(Cystitis^C | T-)
p_xc_given_yc = tn / (tn + fp)
p_xc = (tn + fn) / n
bayes_rule(
    p_xy=p_xc_given_yc,
    p_y=prior_c,
    p_x=p_xc
)

0.622895622895623

## Lungenembolie

In [21]:
# Grundgesamtheit
n = 1000000

# Prior P(Y)
prior = 2000 / n

# Prior Gegenereignis P(Y^C)
prior_c = 1 - prior

# Sensitivität
sensitivity = 0.98

# Spezifität
specificity = 0.63

# Berechung der vier Felder einer Vier-Felder-Tafel
tp, tn, fp, fn = contingency_matrix(prior, prior_c, sensitivity, specificity, n)

# Aufgabe: P(Y | X)

# P(X)
p_x = (tp + fp) / n

# P(X | Y)
p_xy = tp / (tp + fn)


# Anwendung der Funktion
bayes_rule(
    p_xy=p_xy,
  	p_y=prior,
  	p_x=p_x
)

TP:  1960
TN:  628740
FP:  369260
FN:  40


0.005279887937072356

## Lungenembolie (Setting 2)

In [24]:
# Grundgesamtheit
n = 10000

# Prävalenz
prevalence = 0.35

# Prior P(Y)
prior = prevalence

# Prior Gegenereignis P(Y^C)
prior_c = 1 - prior

# Sensitivität
sensitivity = 0.98

# Spezifität
specificity = 0.63

# Berechung der vier Felder einer Vier-Felder-Tafel
tp, tn, fp, fn = contingency_matrix(prior, prior_c, sensitivity, specificity, n)

# Aufgabe: P(Y | X)

# P(X)
p_x = (tp + fp) / n

# P(X | Y)
p_xy = tp / (tp + fn)


# Anwendung der Funktion
bayes_rule(
    p_xy=p_xy,
  	p_y=prior,
  	p_x=p_x
)

TP:  3430
TN:  4095
FP:  2405
FN:  70


0.5878320479862895

## Brustkrebsvorsorge

In [26]:
# Grundgesamtheit
n = 1000

# Prävalenz
prevalence = 0.05

# Prior P(Y)
prior = prevalence

# Prior Gegenereignis P(Y^C)
prior_c = 1 - prior

# Sensitivität
sensitivity = 0.60

# Spezifität
specificity = 1 - 0.1

# Berechung der vier Felder einer Vier-Felder-Tafel
tp, tn, fp, fn = contingency_matrix(prior, prior_c, sensitivity, specificity, n)

# Aufgabe: P(Y | X)

# P(X)
p_x = (tp + fp) / n

# P(X | Y)
p_xy = tp / (tp + fn)


# Anwendung der Funktion
bayes_rule(
    p_xy=p_xy,
  	p_y=prior,
  	p_x=p_x
)

TP:  30
TN:  855
FP:  95
FN:  20


0.24

## Spamfilter

In [27]:
# Definition einer Funktion zur Berechnung des Bayes-Theorems ohne Vorliegen der
# totalen Wahrscheinlichkeit für P(X)
def bayes_rule2(p_xy, p_y):
  return ((p_xy * p_y) / ((p_xy * p_y) + ((1 - p_xy) * (1 - p_y))))

In [28]:
# Prior P(Y)
prior = 0.5

# Wahrscheinlichkeitsverhältnis (likelihood-ratio = LR)
lr = 5.1

# P(X | Y)
p_xy = (lr / (1 + lr))


# Anwendung der Funktion
bayes_rule2(
    p_xy=p_xy,
  	p_y=prior
)

0.8360655737704918

In [29]:
# Prior P(Y)
prior = 0.7

# Wahrscheinlichkeitsverhältnis (likelihood-ratio = LR)
lr = 5.1 * 0.8 * 53.2 * 0.3

# P(X | Y)
p_xy = (lr / (1 + lr))


# Anwendung der Funktion
bayes_rule2(
    p_xy=p_xy,
  	p_y=prior
)

0.993461453963405