# Урок 2. Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона

## Практическое задание

In [1]:
from math import factorial, exp
from scipy.stats import binom, poisson

In [2]:
def my_combinations(n, k):
    return factorial(n) / factorial(k) / factorial(n - k)


def my_binom(k, n, p):
    return my_combinations(n, k) * p**k * (1 - p)**(n - k)


def my_poisson(k, mu):
    return exp(-mu) * mu**k / factorial(k)

#### Задача 1

Вероятность того, что стрелок попадет в мишень, выстрелив один раз, равна 0.8.
Стрелок выстрелил 100 раз.
Найдите вероятность того, что стрелок попадет в цель ровно 85 раз.

Решение:

Последовательность выстрелов $\left\{x_i\right\}_{i=1}^n$,
каждый из которых может быть либо успешным $x_i = 1$, либо нет $x_i = 0$,  
образует пространство $\Omega$
элементарных исходов $\omega = (x_1, x_2, \cdots, x_n)$.

$
{n \in \mathbb{Z}}
\wedge
{0 \leq n}
\newline
\Omega = \left\{
    (x_1, x_2, \cdots, x_n)
    \mid
    i = \overline{1, n}
    \:
    x_i \in \left\{1, 0\right\}
\right\}
$

Вероятность успеха в каждом из выстрелов $p_{x_i}$ постоянна и равна $p$.

$
{p \in \mathbb{R}}
\wedge
{0 \leq p \leq 1}
\newline
p_{x_i}(1) = p 
$

Таким образом, случайная величина $y$, соответствующая событию,
при котором в серии испытаний реализуется определённое количество успехов,
имеет биномиальное распределение с параметрами $n$ и $p$.

$
y = \sum_{i = 1}^n x_i
\newline
y \sim B(n, p)
$

При этом вероятность $p_y$ события,
в котором случится $k$ успешных испытаний,
может быть рассчитана по формуле:

$
{k \in \mathbb{Z}}
\wedge
{0 \leq k \leq n}
\newline
q = 1 - p
\newline
p_y(k) = C_n^k p^k q^{n - k}
$

По условию задачи:
$
n = 100
\newline
p = 0.8
\newline
k = 85
$

Из чего следует:
$
q = 1 - p = 0.2
\newline
p_y(85) = C_{100}^{85} {0.8}^{85} {0.2}^{15}
$

In [3]:
# Set parameters.
# Binomial distribution
# support and parameters: k, n, p.
parameters = 85, 100, .8
# Solution precision in decimal digits.
ndigits = 6

# Find probability in alternative ways.
probability = [
    my_binom(*parameters),
    binom.pmf(*parameters)
]

# Round and check alternative solutions to be equal.
probability = [round(_, ndigits=ndigits) for _ in probability]
check = probability[0] == probability[1]

print(
    f'number of trials (n): {parameters[1]}',
    f'success probability (p): {parameters[2]}',
    f'number of successes (k): {parameters[0]}',
    f'probability: {probability[0]}',
    f'check: {check}',
    sep='\n'    
)

number of trials (n): 100
success probability (p): 0.8
number of successes (k): 85
probability: 0.048062
check: True


In [4]:
%%timeit
my_binom(*parameters)

5.47 µs ± 48.6 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [5]:
%%timeit
binom.pmf(*parameters)

312 µs ± 6.17 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### Задача 2

Вероятность того, что лампочка перегорит в течение первого дня эксплуатации, равна 0.0004.
В жилом комплексе после ремонта в один день включили 5000 новых лампочек.
1. Какова вероятность, что ни одна из них не перегорит в первый день? 
2. Какова вероятность, что перегорят ровно две?

1.
Решение

1.1

$
q = 1 - p
\newline
p_y(0) =
\prod_{i=1}^n q = 
q^n
$

1.2

$
q = 1 - p
\newline
p_y(k) =
f(k, n, p) =
C_n^k p^k q^{n - k}
$

$
k = 0
$

$
p_y(0) =
f(0, n, p) =
C_n^0 p^0 q^n =
q^n
$

2.

$
n = 5000
\newline
p = 0.0004
$

$
q = 1 - p = 0.9996
\newline
p_y(0) =
q^n =
{0.9996}^{5000}
$

3.

$
\mu = n p
\newline
p_y(k) =
f(k, \mu) =
e^{-\mu}{\mu^k\over{k!}}
$

$
k = 0
$

$
p_y(0) =
f(0, \mu) =
e^{-\mu}{\mu^0\over{0!}} =
e^{-\mu}
$



$
n = 5000
\newline
p = 0.0004
$

$
\mu = n p
= 2
$


$
p_y(0) = e^{-2}
$

In [6]:
# Set parameters.
# Binomial distribution support and parameters.
n, p = 5000, .0004
# Solution precision in decimal digits.
ndigits = 6

# Binomial distribution failure probability.
q = 1 - p
# Poisson distribution parameter.
mu = n * p

# Find probability in alternative ways.
probability = [
    q ** n,
    exp(-mu)
]

# Round solutions and find absolute difference.
probability = [round(_, ndigits=ndigits) for _ in probability]
difference = abs(probability[0] - probability[1])

print(
    f'number of trials (n): {n}',
    f'success probability (p): {p}',
    f'failure probability (q): {q}',
    f'rate (mu): {mu}',
    f'Binomial probability: {probability[0]}',
    f'Poisson probability: {probability[1]}',
    f'Absolute difference: {difference}',
    sep='\n'
)

number of trials (n): 5000
success probability (p): 0.0004
failure probability (q): 0.9996
rate (mu): 2.0
Binomial probability: 0.135281
Poisson probability: 0.135335
Absolute difference: 5.3999999999998494e-05


In [7]:
# Set parameters.
# Binomial distribution support and parameters.
k, n, p = 0, 5000, .0004
# Solution precision in decimal digits.
ndigits = 6

# Poisson distribution parameter.
mu = n * p

# Find probability in alternative ways.
probability = [
    exp(-mu),
    my_poisson(k, mu),
    poisson.pmf(k, mu)
]

# Round and check alternative solutions to be equal.
probability = [round(_, ndigits=ndigits) for _ in probability]
check = all([_ == probability[0] for _ in probability[1:]])

print(
    f'number of trials (n): {n}',
    f'success probability (p): {p}',
    f'number of successes (k): {k}',
    f'rate (mu): {mu}',
    f'probability: {probability[0]}',
    f'check: {check}',
    sep='\n'    
)

number of trials (n): 5000
success probability (p): 0.0004
number of successes (k): 0
rate (mu): 2.0
probability: 0.135335
check: True


In [8]:
%%timeit
my_poisson(k, mu)

497 ns ± 5.47 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [9]:
%%timeit
poisson.pmf(k, mu)

255 µs ± 5.02 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### Задача 3

Монету подбросили 144 раза.
Какова вероятность, что орел выпадет ровно 70 раз? 

Решение:

1.1

$
p_y(k) =
{C_n^k\over\bar{A_2^n}} =
{C_n^k\over2^n}
$


1.2

$
q = 1 - p
\newline
p_y(k) =
f(k, n, p) =
C_n^k p^k q^{n - k}
$

$
p = 0.5
\newline
q = 1 - p = 0.5 = p
$

$
p_y(k) =
f(k, n, 0.5) =
C_n^k p^k p^{n - k} =
C_n^k p^n =
{C_n^k \over 2^n}
$

2.

$
k = 70
\newline
n = 144
$

$
p_y(k) =
{C_{144}^{70} \over 2^{144}}
$

In [10]:
# Set parameters. 
# Binomial distribution support and parameters.
k, n, p = 70, 144, .5
# Solution precision in decimal digits. 
ndigits = 6

# Find probability in alternative ways.
probability = [
    my_combinations(n, k) * p**n,
    my_binom(k, n, p),
    binom.pmf(k, n, p)
]

# Round and check alternative solutions to be equal.
probability = [round(_, ndigits=ndigits) for _ in probability]
check = all([_ == probability[0] for _ in probability[1:]])

print(
    f'number of trials (n): {n}',
    f'success probability (p): {p}',
    f'number of successes (k): {k}',
    f'probability: {probability[0]}',
    f'check: {check}',
    sep='\n'    
)

number of trials (n): 144
success probability (p): 0.5
number of successes (k): 70
probability: 0.062812
check: True


In [11]:
%%timeit
my_binom(k, n, p)

6.98 µs ± 203 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [12]:
%%timeit
binom.pmf(k, n, p)

348 µs ± 18.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### Задача 4

В первом ящике находится 10 мячей, из которых 7 - белые.
Во втором ящике - 11 мячей, из которых 9 белых.
Из каждого ящика вытаскивают случайным образом по два мяча.
1. Какова вероятность того, что все мячи белые?
2. Какова вероятность того, что ровно два мяча белые?
3. Какова вероятность того, что хотя бы один мяч белый?