# Теория вероятностей и математическая статистика

## Урок 1

## Случайные события. Вероятность события. Условная вероятность. Формула Байеса

### Разбор домашнего задания

In [25]:
import numpy as np

In [26]:
def combinations(n: int, k: int) -> int:
    """Число сочетаний.
    """
    
    return np.math.factorial(n) // (np.math.factorial(k) * np.math.factorial(n - k))

__Задачи 1 и 2__

Из 60 вопросов, входящих в экзаменационные билеты, студент знает 50. Случайным образом студент вытягивает 3 вопроса. Какова вероятность, что все выбранные вопросы знакомы студенту? Какова вероятность что два из трёх вопросов знакомы студенту?

__Решение__

Общее число исходов при вытягивании $3$ билетов из $60$ равно 
$C_{60}^3 = \dfrac{60!}{3! \cdot 57!} = \dfrac{60 \cdot 59 \cdot 58}{6}$.

Число исходов, благоприятных для события «все билеты знакомые», равно 
$C_{50}^3 = \dfrac{50 \cdot 49 \cdot 48}{6}$. Итак, вероятность первого события:

In [27]:
combinations(50, 3) / combinations(60, 3)

0.5727644652250146

Чтобы посчитить число благоприятных исходов для второго события, надо посчитать число возможностей выбрать $2$ знакомых билета (из $50$) и $1$ незнакомый билет (из $10$). Число таких исходов: 
$C_{50}^2 \cdot C_{10}^1 = \dfrac{50 \cdot 49}{2} \cdot 10$. Итак, вероятность второго события:

In [28]:
combinations(50, 2) * combinations(10, 1) / combinations(60, 3)

0.35797779076563413

__Задача 3__

Подбрасываются три игральных кубика. Оцените вероятность того, что сумма значений этих кубиков не будет превышать 6.

_Подсказка_: оценкой вероятности может служить, например, относительная частота при большом числе опытов. Попробуйте реализовать наибольшее число опытов, которое позволяют ваш компьютер и/или ваше терпение.

_Замечание_: вообще в этом курсе мы не используем такие численные методы оценки вероятностей, и в будущем мы не будем их применять. Но тут сделаем исключение один раз.

__Решение__

Результаты бросков трёх игральных кубиков можно моделировать с помощью функции `randint` из модуля `random` библиотеки `numpy`. Ранее мы подавали туда аргумент `size`, отвечающий за число возвращаемых реализаций. В этот аргумент можно подать не число, а кортеж чисел, тогда вернётся не одномерный массив, а многомерный.

In [33]:
n_samples = 10 ** 8

dice_values = np.random.randint(1, 7, size=(n_samples, 3))
dice_values

array([[6, 4, 2],
       [3, 3, 3],
       [5, 2, 4],
       ...,
       [1, 3, 4],
       [6, 4, 3],
       [5, 2, 2]])

Чтобы посчитать сумму значений кубиков при каждой реализации, можно воспользоваться методом `.sum()`, при этом передать туда аргумент `axis=1`. Тогда суммирование будет производиться вдоль второй (начиная с нуля) оси, т.е. суммироваться будут только отдельные строчки.

In [35]:
samples = dice_values.sum(axis=1)
samples

array([12,  9, 11, ...,  8, 13,  9])

Итак, нас интересует событие $A$, заключающееся в том, что сумма трёх кубиков оказалась не больше $6$. Посчитаем, сколько раз такое событие наступило.

In [36]:
n_successes = (samples <= 6).sum()
n_successes

9260401

Чтобы получить относительную частоту, разделим это число на общее число опытов:

In [37]:
frequency = n_successes / n_samples
frequency

0.09260401

А давайте попробуем найти ту же вероятность аналитически. (Этого не требовалось в задаче, но любопытства ради давайте найдём.) Есть классный элегантный способ это сделать.

Сперва найдём вероятность того, что сумма трёх кубиков будет в точности равна $6$. Другими словами, нужно найти число способов составить число $6$ из трёх кусков. Представим себе ленту из $6$ ячеек. Разбиение её на 3 части равнозначно выбору $2$ позиций, в которых эту ленту нужно разрезать. Все таких позиций $5$. Итак, получается, что число исходов для числа $6$ равно $C_5^2 = 10$:

In [38]:
combinations(5, 2)

10

А сколько всего исходов? Поскольку мы бросаем $3$ кубика, каждый из которых имеет $6$ разных сторон, число исходов будет равно $6^3 = 216$. Итак, вероятность получить в сумме ровно $6$:

In [39]:
combinations(5, 2) / 6 ** 3

0.046296296296296294

Продолжим аналогично. Чтобы получить $5$, нужно разбить ленту с пятью ячейками на $3$ части:

In [40]:
combinations(4, 2) / 6 ** 3

0.027777777777777776

Чтобы получить $4$:

In [41]:
combinations(3, 2) / 6 ** 3

0.013888888888888888

Чтобы получить $3$:

In [42]:
combinations(2, 2) / 6 ** 3

0.004629629629629629

Ну а меньше трёх число быть не может, поскольку оно составлено из трёх значений кубиков. Итак, искомая вероятность:

In [43]:
sum(combinations(k, 2) for k in range(2, 6)) / 6 ** 3

0.09259259259259259