## Урок 2
### Дискретные случайные величины. Закон распределения вероятностей. 

### Биномиальный закон распределения. Распределение Пуассона

**Случайная величина** — та, которая в результате испытания принимает только одно возможное значение. 

Оно заранее не известно и может зависеть от множества случайных факторов. Случайные величины могут быть дискретными и непрерывными.

**Дискретная случайная величина** принимает отделенные друг от друга значения. Например, в результате стократного подбрасывания монетки орел может выпасть 50 или 51 раз (целое число в диапазоне от 0 до 100 включительно), но не 50 с половиной. В данном случае число выпаданий орла — пример дискретной случайной величины.

In [None]:
import numpy as np

**Пример 1**

Смоделируем стократное подбрасывание монетки с помощью модуля **random** из библиотеки **numpy**. Результат будет дискретной случайной величиной — число выпаданий орла:

In [None]:
# n - число испытаний
# p - вероятность появления события
np.random.binomial(n=100, p=0.5)

52

Клетку можно запускать несколько раз, число выпадений орла будет меняться.

**Пример 2**

Еще один пример дискретной случайной величины — число дождливых дней летом.

Летних дней всего 92, так что здесь мы можем получить случайное целое число из отрезка [0, 92]:

In [None]:
np.random.randint(0, 93)

42

**Пример 3**

Есть также примеры дискретных величин без верхней границы. Например, число метеоритов, упавших на Землю за год, может принимать счетное множество значений от 0 до плюс бесконечности.

**Закон распределения вероятностей** дискретной случайной величины — это соответствие между возможными значениями этой величины и вероятностями, которые этим значениям соответствуют.

Закон распределения вероятностей можно представить в виде таблицы. Составим ее для количества выпаданий орла при трехкратном подбрасывании монеты:

<table border="3">
<tr><th>**X**</th><td>0</td><td>1</td><td>2</td><td>3</td></tr>
<tr><th>**p**</th><td>0.125</td><td>0.375</td><td>0.375</td><td>0.125</td></tr>
</table>

Из таблицы видно, что вероятность того, что при трехкратном подбрасывании монетки орел выпадет, к примеру, два раза, равна 0.375.

**Биномиальное распределение** — один из примеров дискретного распределения.

Биномиальный закон распределения — это закон распределения числа $X=k$ наступлений события $A$ в $n$ независимых испытаниях, в каждом из которых оно может произойти с вероятностью $p$.

Число наступления события — это дискретная величина из отрезка [0, $n$]. Вероятности возможных значений этой величины определяются по формуле Бернулли:

$$P_n(X=k) = C_n^k p^k q^{n-k}$$

где $p$ — это вероятность наступления события $A$ в $n$ независимых испытаниях, a $q = 1 - p$.

Математическое ожидание для биномиально распределенной дискретной величины можно вычислить по формуле:

$$M(X) = np$$

Дисперсия для биномиально распределенной дискретной величины вычисляется так:

$$D(X) = npq$$

**Пример 4**

Еще раз приведем таблицу вероятностей выпадания орла при трехкратном подбрасывании монеты. С помощью формулы Бернулли покажем, как вычисляются эти вероятности:

<table border="3">
<tr><th>**X**</th><td>0</td><td>1</td><td>2</td><td>3</td></tr>
<tr><th>**p**</th><td>0.125</td><td>0.375</td><td>0.375</td><td>0.125</td></tr>
</table>

$$p(k=0) = C_n^kp^kq^{n-k} = C_3^0p^0q^3 = \frac{3!}{0!(3-0)!} \cdot 0.5^0 \cdot 0.5^3 = 1 \cdot 1 \cdot 0.125 = 0.125$$

$$p(k=1) = C_n^kp^kq^{n-k} = C_3^1p^1q^2 = \frac{3!}{1!(3-1)!} \cdot 0.5^1 \cdot 0.5^2 = 3 \cdot 0.5 \cdot 0.25 = 0.375$$

$$p(k=2) = C_n^kp^kq^{n-k} = C_3^2p^2q^1 = \frac{3!}{2!(3-2)!} \cdot 0.5^2 \cdot 0.5^1 = 3 \cdot 0.25 \cdot 0.5 = 0.375$$

$$p(k=3) = C_n^kp^kq^{n-k} = C_3^3p^3q^0 = \frac{3!}{3!(3-3)!} \cdot 0.5^3 \cdot 0.5^0 = 1 \cdot 0.125 \cdot 1 = 0.125$$

**Пример 5**

Будем находить математическое ожидание для биномиального распределения из предыдущего примера.

Параметр $n$ равняется 3, так как монету побрасывают три раза, а вероятность выпадания орла $p$ равняется 0.5.

Посчитаем математическое ожидание:

$$M(X) = np = 3 \cdot 0.5 = 1.5$$

Результат можно понимать так: в среднем при трехкратном подбрасывании монеты орел выпадает 1.5 раза.

Теперь посчитаем дисперсию, зная, что величина $q$ (вероятность невыпадания орла, то есть выпадания решки) равна также 0.5:

$$D(X) = npq = 3 \cdot 0.5 \cdot 0.5 = 0.75$$

**Распределение Пуассона**

Если проводится большое количество испытаний $n$ и при этом вероятность $p$ появления события $A$ в отдельном испытании мала, применяют формулу Пуассона для вычисления вероятности того, что событие произойдет $m$ раз в $n$ испытаниях:

$$P_m \approx \frac{\lambda^m}{m!}e^{-\lambda}$$

где $λ = np$.

Распределение Пуассона и формула Пуассона часто применяются в теории массового обслуживания (ТМО).

ТМО — это раздел теории вероятностей, в котором исследуется рациональный выбор структуры системы обслуживания и его процесса. В основе теории — изучение потоков требований на обслуживание, поступающих в систему и выходящих из нее, длительности ожидания и длины очередей.

**Пример 6**

Вероятность того, что среди писем, поступающих на определенный почтовый ящик, встретится письмо со спамом, составляет 0.01.

Найдите вероятность того, что среди 1000 писем, поступивших на него за месяц, будет 11 со спамом.

Применим формулу Пуассона, зная, что $m = 11$ и $λ = np = 1000 \cdot 0.01 = 10$:

$$P_{11} \approx \frac{\lambda^m}{m!}e^{-\lambda} \approx \frac{10^{11}}{11!}e^{-10} \approx  0.1137$$

Если использовать Python для расчетов, можно вычислить вероятность:

In [None]:
n = 1000
m = 11
p = 0.01
lambda_ = n * p

(lambda_**m / np.math.factorial(m)) * np.exp(-lambda_)

0.11373639611012119