<a href="https://colab.research.google.com/github/condor68mihon/InformationTheory/blob/master/02_Formula.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
np.set_printoptions(legacy='1.25')

# Формула Байеса

### Вероятность заболевания при положительном тесте

In [None]:
# поместим значения априорной вероятности и правдоподобия в массивы Numpy
prior = np.array([0.05, 0.95])
likelihood = np.array([0.9, 0.2])

In [None]:
# найдем вероятность быть больным при положительном тесте,
P_sick_positive = prior[0] * likelihood[0] / np.dot(prior, likelihood)
P_sick_positive

0.19148936170212766

In [None]:
# а также вероятность быть здоровым при положительном тесте
P_not_sick_positive = prior[1] * likelihood[1] / np.dot(prior, likelihood)
P_not_sick_positive

0.8085106382978723

### Изменение априорной вероятности и правдоподобия

Изменение априорной вероятности

In [None]:
# уменьшим распространенность заболевания до 0,01
prior = np.array([0.01, 0.99])
likelihood = np.array([0.9, 0.2])

P_sick_positive = prior[0] * likelihood[0] / np.dot(prior, likelihood)
P_sick_positive

0.043478260869565216

Изменение правдоподобия

In [None]:
# вернемся к изначальной распространенности
prior = np.array([0.05, 0.95])
# повысим чувствительность до 0,95, а специфичность - до 0,90
likelihood = np.array([0.95, 0.1])

P_sick_positive = prior[0] * likelihood[0] / np.dot(prior, likelihood)
P_sick_positive

0.3333333333333333

### Обновление априорной вероятности

In [None]:
prior = np.array([0.05, 0.95])
likelihood = np.array([0.9, 0.2])

# найдем вероятность быть больным после первого положительного теста
posterior = prior[0] * likelihood[0] / np.dot(prior, likelihood)
posterior

0.19148936170212766

In [None]:
# сделаем апостериорную вероятность новой априорной
new_prior = np.array([posterior, 1 - posterior])
new_prior

array([0.19148936, 0.80851064])

In [None]:
# (1 - posterior) - это то же самое, что
# вероятность не быть больным при положительном тесте
prior[1] * likelihood[1] / np.dot(prior, likelihood)

0.8085106382978723

In [None]:
new_posterior = new_prior[0] * likelihood[0] / np.dot(new_prior, likelihood)
new_posterior

0.5159235668789809

### Обновление как степень правдоподобия

In [None]:
prior = np.array([0.05, 0.95])
likelihood = np.array([0.9, 0.2])

for i in range(3):
  posterior = prior * likelihood / np.dot(prior, likelihood)
  print(posterior)
  prior = posterior

print()
print(posterior[0])

[0.19148936 0.80851064]
[0.51592357 0.48407643]
[0.82746879 0.17253121]

0.8274687854710556


In [None]:
# вернемся к исходной априорной вероятности и правдоподобию
prior = np.array([0.05, 0.95])
likelihood = np.array([0.9, 0.2])

# посчитаем повторные тесты как степень правдоподобия
new_posterior = prior[0] * likelihood[0] ** 2 / (prior[0] * likelihood[0] ** 2 + prior[1] * likelihood[1] ** 2)
new_posterior

0.5159235668789809

In [None]:
# если считать через скалярное произведение
prior[0] * likelihood[0] ** 2 / np.dot(prior, likelihood ** 2)

0.5159235668789809

In [None]:
# посмотрим на вероятность заболеть после пяти положительных тестов
prior[0] * likelihood[0] ** 5 / np.dot(prior, likelihood ** 5)

0.9898084047136129

### Биномиальное распределение

In [None]:
# импортируем функцию binom из scipy.stats
from scipy.stats import binom

In [None]:
# смоделируем два испытания Бернулли (однократный тест)
binom.pmf(k = 1, n = 1, p = 0.9), binom.pmf(k = 1, n = 1, p = 0.2)

(0.9, 0.2)

In [None]:
# и два биномиальных распределения (результаты после двух тестов)
prior = np.array([0.05, 0.95])
likelihood = binom.pmf(k = 2, n = 2, p = 0.9), binom.pmf(k = 2, n = 2, p = 0.2)

prior[0] * likelihood[0] / np.dot(prior, likelihood)

0.5159235668789809

### Влияние правдоподобия на априорную вероятность

In [None]:
# предположим, что заболевание очень редкое
prior = np.array([0.000001, 1 - 0.000001])

# посмотрим на вероятность быть больным при получении
# от 1 до 10 положительных результатов
for i in range(1, 11):
  likelihood = binom.pmf(k = i, n = i, p = 0.9), binom.pmf(k = i, n = i, p = 0.2)
  print(prior[0] * likelihood[0] / np.dot(prior, likelihood))

4.4999842500551244e-06
2.0249610195003743e-05
9.111678809947254e-05
0.00040989482739716776
0.0018418842973257723
0.008235389119311678
0.036020987079196466
0.14394659706142984
0.4307448121090599
0.7729886606345894
