In [1]:
import numpy as np
from math import factorial

# Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных

Формула для вычисления количества сочетаний из $k$ элементов, выбранных из $n$ элементов.

$$C_n^k = \frac{n!}{k! (n - k)!}.$$

In [2]:
def combinations(n, k):
    """ Вычисляет число сочетаний k элементов, выбранных из n элементов """
    return int(factorial(n) / (factorial(k) * factorial(n - k)))

Формула Байеса для вычисления вероятности события $B$ при условии, что событие $A$ уже произошло

$$P(B | A) = \frac{P(B) \; P(A | B)}{P(A)}.$$

In [3]:
def bayes(p_B, p_A_B, p_A):
    """
    Формула Байеса - вычисляет апостериорную вероятность события B при условии, что событие A уже произошло.
    p_B - априорная вероятность наступления события B, определенная до испытания,
    p_A_B - вероятность наступления события A при условии, что произошло событие B,
    p_A - вероятность наступления события A.
    """
    return p_B * p_A_B / p_A

Формула полной вероятности для вычисления события $A$, которое может наступить только при появлении событий $B_1, B_2, \dots, B_n$, образующих полную группу несовместных событий

$$P(A) = \sum_{i = 1}^n P(B_i) \; P(A | B_i).$$

### Задание 1

*Даны значения зарплат из выборки выпускников: 100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 24, 57, 55, 70, 75, 65, 84, 90, 150.*

*Посчитать (желательно без использования статистических методов наподобие std, var, mean) среднее арифметическое, среднее квадратичное отклонение, смещенную и несмещенную оценки дисперсий для данной выборки.*

**Ответ:**

Среднее арифметическое = 65.3,

Смещенная оценка дисперсии = 950.11,

Несмещенная оценка дисперсии $\approx$ 1000.116,

Смещенная оценка СКО $\approx$ 30.824,

Несмещенная оценка СКО $\approx$ 31.625.

In [4]:
a = np.array([100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 24, 57, 55, 70, 75, 65, 84, 90, 150])

# Среднее арифметическое
mean = np.sum(a) / a.size
print(f'mean = {mean}')
print(f'mean = {np.mean(a)}')

# Смещенная оценка дисперсии
var = np.sum(np.power(a - mean, 2)) / a.size
print(f'var = {var}')
print(f'var = {np.var(a)}')

# Несмещенная оценка дисперсии
var_ddof = np.sum(np.power(a - mean, 2)) / (a.size - 1)
print(f'var_ddof = {var_ddof}')
print(f'var_ddof = {np.var(a, ddof=1)}')

# Смещенная оценка среднего квадратичного отклонения
std = np.sqrt(var)
print(f'std = {std}')
print(f'std = {np.std(a)}')

# Несмещенная оценка среднего квадратичного отклонения
std_ddof = np.sqrt(var_ddof)
print(f'var_ddof = {std_ddof}')
print(f'var_ddof = {np.std(a, ddof=1)}')

mean = 65.3
mean = 65.3
var = 950.11
var = 950.11
var_ddof = 1000.1157894736842
var_ddof = 1000.1157894736842
std = 30.823854398825596
std = 30.823854398825596
var_ddof = 31.624607341019814
var_ddof = 31.624607341019814


### Задание 2

*В первом ящике находится 8 мячей, из которых 5 - белые. Во втором ящике - 12 мячей, из которых 5 белых. Из первого ящика вытаскивают случайным образом два мяча, из второго - 4.*

*Какова вероятность того, что 3 мяча белые?*

Три мяча белые - возможны три отдельных несовместных события:

1) Из первой корзины извлекли 2 белых мяча, из второй - 1 белый и 3 черных мяча.

2) Из первой корзины извлекли 1 белый и 1 черный мяч, из второй - 2 белых и 2 черных мяча.

3) Из первой корзины извлекли 2 черных мяча, из второй - 3 белых и 1 черный мяч.

Тогда искомая вероятность равна сумме вероятностей отдельных событий:

$$P = P_1 + P_2 + P_3.$$

Найдем вероятности отдельных событий.

1) Из первой корзины извлекли 2 белых мяча - событие $A$, из второй извлекли 1 белый и 3 черных мяча - событие $B$.

Вероятность того, что из первой корзины извлекли 2 белых мяча: 

$$P(A) = \frac{C_5^2}{C_8^2}.$$

Во второй корзине 7 черных мяча. Вероятность того, что из второй корзины извлекли 1 белый и 3 черных мяча: 

$$P(B) = \frac{C_5^1 \; C_7^3}{C_{12}^4}.$$

Тогда вероятность для первого случая:

$$P_1 = P(AB) = P(A)P(B) = \frac{C_5^2}{C_8^2} \; \frac{C_5^1 \; C_7^3}{C_{12}^4}.$$

2) Из первой корзины извлекли 1 белый и 1 черный мяч - событие $A$, из второй извлекли 2 белых и 2 черных мяча - событие $B$.

В первой корзине 3 черных мяча. Вероятность того, что из первой корзины извлекли 1 белый и 1 черный мяч: 

$$P(A) = \frac{C_5^1 \; C_3^1}{C_8^2}.$$

Во второй корзине 7 черных мяча. Вероятность того, что из второй корзины извлекли 2 белых и 2 черных мяча: 

$$P(B) = \frac{C_5^2 \; C_7^2}{C_{12}^4}.$$

Тогда вероятность для второго случая:

$$P_2 = P(AB) = P(A)P(B) = \frac{C_5^1 \; C_3^1}{C_8^2} \; \frac{C_5^2 \; C_7^2}{C_{12}^4}.$$

3) Из первой корзины извлекли 2 черных мяча - событие $A$, из второй извлекли 3 белых и 1 черный мяч - событие $B$.

В первой корзине 3 черных мяча. Вероятность того, что из первой корзины извлекли 2 черных мяча: 

$$P(A) = \frac{C_3^2}{C_8^2}.$$

Во второй корзине 7 черных мяча. Вероятность того, что из второй корзины извлекли 3 белых и 1 черный мяч: 

$$P(B) = \frac{C_5^3 \; C_7^1}{C_{12}^4}.$$

Тогда вероятность для третьего случая:

$$P_3 = P(AB) = P(A)P(B) = \frac{C_3^2}{C_8^2} \; \frac{C_5^3 \; C_7^1}{C_{12}^4}.$$

Таким образом, вероятность того, что ровно два мяча белые, равна

$$P = P_1 + P_2 + P_3 \approx 0.369.$$

**Ответ:** $P \approx 0.369$.

In [5]:
P1_A = combinations(5, 2) / combinations(8, 2)
P1_B = combinations(5, 1) * combinations(7, 3) / combinations(12, 4)
P_1 = P1_A * P1_B
print(f'P_1 = {P_1}')

P2_A = combinations(5, 1) * combinations(3, 1) / combinations(8, 2)
P2_B = combinations(5, 2) * combinations(7, 2) / combinations(12, 4)
P_2 = P2_A * P2_B
print(f'P_2 = {P_2}')

P3_A = combinations(3, 2) / combinations(8, 2)
P3_B = combinations(5, 3) * combinations(7, 1) / combinations(12, 4)
P_3 = P3_A * P3_B
print(f'P_3 = {P_3}')

print(f'P = {P_1 + P_2 + P_3}')

P_1 = 0.12626262626262627
P_2 = 0.22727272727272727
P_3 = 0.01515151515151515
P = 0.3686868686868687


### Задание 3

*На соревновании по биатлону один из трех спортсменов стреляет и попадает в мишень. Вероятность попадания для первого спортсмена равна 0.9, для второго — 0.8, для третьего — 0.6.*

*Найти вероятность того, что выстрел произведен:*

*a) первым спортсменом,* 

*б) вторым спортсменом,*

*в) третьим спортсменом.*

Событие $A$ - попадание в мишень.

Событие $B_1$ - выстрелил первый спортсмен, $B_2$ - выстрелил второй спортсмен, $B_3$ - выстрелил третий спортсмен.

События $B_1$, $B_2$, $B_3$ образуют полную группу несовместных событий.

Для определения $P(B_i | A)$ - вероятности события $B_i$ (выстрелил i-ый спортсмен) при условии, что событие $A$ (попадание в мишень) уже произошло используем фоормулу Байеса:

$$P(B_i | A) = \frac{P(B_i) \; P(A | B_i)}{P(A)}.$$

По условию задачи вероятности попадания при условии, что выстрелил определенный спортсмен, равны $P(A | B_1) = 0.9$, $P(A | B_2) = 0.8$, $P(A | B_3) = 0.6$. 

Очевидно, что вероятность того, что выстрелит i-ый спортсмен равна:

$$P(B_i) = \frac{1}{3}.$$

Вычислим $P(A)$ - вероятность попадания в мишень:

$$P(A) = P(B_1) \; P(A | B_1) + P(B_2) \; P(A | B_2) + P(B_3) \; P(A | B_3) = \frac{1}{3} (0.9 + 0.8 + 0.6) = \frac{23}{30}.$$

1) Вероятность того, что выстрел произведен первым спортсменом:

$$P(B_1 | A) = \frac{P(B_1) \; P(A | B_1)}{P(A)} = 0.9 \frac{1}{3} \frac{30}{23} \approx 0.391.$$

2) Вероятность того, что выстрел произведен втором спортсменом:

$$P(B_2 | A) = \frac{P(B_2) \; P(A | B_2)}{P(A)} = 0.8 \frac{1}{3} \frac{30}{23} \approx 0.348.$$

3) Вероятность того, что выстрел произведен третим спортсменом:

$$P(B_3 | A) = \frac{P(B_3) \; P(A | B_3)}{P(A)} = 0.6 \frac{1}{3} \frac{30}{23} \approx 0.261.$$

**Ответ:** $P(B_1 | A) \approx 0.391$, $P(B_2 | A) \approx 0.348$, $P(B_3 | A) \approx 0.261$.

In [6]:
P_B = 1 / 3
P_A_B1 = 0.9
P_A_B2 = 0.8
P_A_B3 = 0.6

P_A = P_B * (P_A_B1 + P_A_B2 + P_A_B3)

print(f'P_B1_A = {bayes(P_B, P_A_B1, P_A)}')
print(f'P_B2_A = {bayes(P_B, P_A_B2, P_A)}')
print(f'P_B3_A = {bayes(P_B, P_A_B3, P_A)}')

P_B1_A = 0.3913043478260869
P_B2_A = 0.34782608695652173
P_B3_A = 0.26086956521739124


### Задание 4

*В университет на факультеты A и B поступило равное количество студентов, а на факультет C студентов поступило столько же, сколько на A и B вместе. Вероятность того, что студент факультета A сдаст первую сессию, равна 0.8. Для студента факультета B эта вероятность равна 0.7, а для студента факультета C - 0.9. Студент сдал первую сессию.*

*Какова вероятность, что он учится:*

*a) на факультете A*

*б) на факультете B*

*в) на факультете C?*

Событие $A$ - студент сдал сессию.

Событие $B_1$ - студент учится на факультете A, $B_2$ - студент учится на факультете B, $B_3$ - студент учится на факультете C.

События $B_1$, $B_2$, $B_3$ образуют полную группу несовместных событий.

Для определения $P(B_i | A)$ - вероятности события $B_i$ (студент учится на i-ом факультете) при условии, что событие $A$ (студент сдал сессию) уже произошло используем формулу Байеса:

$$P(B_i | A) = \frac{P(B_i) \; P(A | B_i)}{P(A)}.$$

По условию задачи вероятности сдачи сессии при условии, что студент из определенного факультета, равны $P(A | B_1) = 0.8$, $P(A | B_2) = 0.7$, $P(A | B_3) = 0.9$. 

Найдем вероятности того, что студент учится на определенном факультете. На факультетах A и B учится равное количество студентов, пусть это $x$. На факультете C студентов столько же, сколько на A и B вместе - это $2x$. Тогда всего студентов $4x$.

Тогда вероятность того, что студент учится на факультете A (или B), равна:

$$P(B_1) = P(B_2) = \frac{1}{4}.$$

А вероятность того, что студент учится на факультете C, равна:

$$P(B_3) = \frac{1}{2}.$$

Вычислим $P(A)$ - вероятность сдачи сессии:

$$P(A) = P(B_1) \; P(A | B_1) + P(B_2) \; P(A | B_2) + P(B_3) \; P(A | B_3) = 0.8 \frac{1}{4} + 0.7 \frac{1}{4} + 0.9 \frac{1}{2} = 0.825.$$

1) Вероятность того, что сдавший студент учится на факультете A:

$$P(B_1 | A) = \frac{P(B_1) \; P(A | B_1)}{P(A)} = \frac{0.8}{4 \cdot 0.825} \approx 0.242.$$

2) Вероятность того, что сдавший студент учится на факультете B:

$$P(B_2 | A) = \frac{P(B_2) \; P(A | B_2)}{P(A)} = \frac{0.7}{4 \cdot 0.825} \approx 0.212.$$

3) Вероятность того, что сдавший студент учится на факультете C:

$$P(B_3 | A) = \frac{P(B_3) \; P(A | B_3)}{P(A)} = \frac{0.9}{2 \cdot 0.825} \approx 0.545.$$

**Ответ:** $P(B_1 | A) \approx 0.242$, $P(B_2 | A) \approx 0.212$, $P(B_3 | A) \approx 0.545$.

In [7]:
P_B1 = 1 / 4
P_A_B1 = 0.8

P_B2 = 1 / 4
P_A_B2 = 0.7

P_B3 = 1 / 2
P_A_B3 = 0.9

P_A = P_B1 * P_A_B1 + P_B2 * P_A_B2 + P_B3 * P_A_B3

print(f'P_B1_A = {bayes(P_B1, P_A_B1, P_A)}')
print(f'P_B2_A = {bayes(P_B2, P_A_B2, P_A)}')
print(f'P_B3_A = {bayes(P_B3, P_A_B3, P_A)}')

P_B1_A = 0.24242424242424246
P_B2_A = 0.21212121212121213
P_B3_A = 0.5454545454545455


### Задание 5

*Устройство состоит из трех деталей. Для первой детали вероятность выйти из строя в первый месяц равна 0.1, для второй - 0.2, для третьей - 0.25.*

*Какова вероятность того, что в первый месяц выйдут из строя:*

*а) все детали,*

*б) только две детали,*

*в) хотя бы одна деталь,*

*г) от одной до двух деталей?*

#### Пример 1

*Какова вероятность того, что в первый месяц выйдут из строя все детали?*

Все детали вышли из строя - значит одновременно произошли три совместных события: событие $A$ - первая деталь вышла из строя, $B$ - вторая деталь вышла из строя, $C$ - третья деталь вышла из строя.

По условию $P(A) = 0.1, P(B) = 0.2, P(C) = 0.25$.

Тогда вероятность того, что в первый месяц выйдут из строя все детали, равна:

$$P = P(ABC) = P(A)P(B)P(C) = 0.1 \cdot 0.2 \cdot 0.25 = 0.005.$$

**Ответ:** $P \approx 0.005$.

#### Пример 2

*Какова вероятность того, что в первый месяц выйдут из строя только две детали?*

Две детали вышли из строя - возможный три отдельных несовместных события:

1) Первая и вторая деталь вышли из строя, третья работала исправно.

2) Первая и третья деталь вышли из строя, вторая работала исправно.

3) Вторая и третья деталь вышли из строя, первая работала исправно.

Тогда искомая вероятность равна сумме вероятностей отдельных событий:

$$P = P_1 + P_2 + P_3.$$

1) Первая деталь вышла из строя - событие $A$, вторая деталь вышла из строя - событие $B$, третья деталь работала исправно - событие $C$.

Вероятность для первого случая:

$$P_1 = P(ABC) = P(A)P(B)P(C) = 0.1 \cdot 0.2 \cdot 0.75 = 0.015.$$

2) Первая деталь вышла из строя - событие $A$, вторая деталь работала исправно - событие $B$, третья деталь вышла из строя - событие $C$.

Вероятность для второго случая:

$$P_2 = P(ABC) = P(A)P(B)P(C) = 0.1 \cdot 0.8 \cdot 0.25 = 0.02.$$

3) Первая деталь работала исправно - событие $A$, вторая деталь вышла из строя - событие $B$, третья деталь вышла из строя - событие $C$.

Вероятность для третьего случая:

$$P_3 = P(ABC) = P(A)P(B)P(C) = 0.9 \cdot 0.2 \cdot 0.25 = 0.045.$$

Таким образом, вероятность того, что в первый месяц выйдут из строя только две детали, равна

$$P = P_1 + P_2 + P_3 \approx 0.08.$$

**Ответ:** $P \approx 0.08$.

In [8]:
P1 = 0.1 * 0.2 * 0.75
P2 = 0.1 * 0.8 * 0.25
P3 = 0.9 * 0.2 * 0.25
print(f'P1 = {P1}')
print(f'P2 = {P2}')
print(f'P3 = {P3}')

print(f'P = {P1 + P2 + P3}')

P1 = 0.015000000000000003
P2 = 0.020000000000000004
P3 = 0.045000000000000005
P = 0.08000000000000002


#### Пример 3

*Какова вероятность того, что в первый месяц выйдет из строя хотя бы одна деталь?*

Хотя бы одна деталь вышла из строя - значит вышли из строя 1, 2 или 3 детали. Обратный случай - все детали работали исправно. Найдем вероятность обратного случая и вычтем полученное значение из 1. 

Обратный случай - одновременно произошло три совместных события: событие $A$ - первая деталь работала исправно, $B$ - вторая деталь работала исправно, $C$ - третья деталь работала исправно.

По условию $P(A) = 1 - 0.1 = 0.9, P(B) = 1 - 0.2 = 0.8, P(C) = 1 - 0.25 = 0.75$.

Тогда вероятность того, что в первый месяц выйдет из строя хотя бы одна деталь, равна:

$$P = 1 - P(ABC) = 1 - P(A)P(B)P(C) = 1 - 0.9 \cdot 0.8 \cdot 0.75 = 0.46.$$

**Ответ:** $P \approx 0.46$.

In [9]:
print(f'P = {1 - 0.9 * 0.8 * 0.75}')

P = 0.45999999999999996


#### Пример 4

*Какова вероятность того, что в первый месяц выйдут из строя от одной до двух деталей?*

Одна или две детали вышли из строя - это два несовместных события: вышла из строя 1 деталь и вышла из строя 2 детали. Тогда искомая вероятность равна сумме вероятностей отдельных событий:

$$P = P_1 + P_2.$$

Одна деталь вышла из строя - это сумма трех несовместных событий: первая деталь вышла из строя, а остальные работали исправно, вторая деталь вышла из строя, а остальные работали исправно и третья деталь вышла из строя, а остальные работали исправно. Вероятность равна сумме:

$$P_1 = 0.1 \cdot 0.8 \cdot 0.75 + 0.9 \cdot 0.2 \cdot 0.75 + 0.9 \cdot 0.8 \cdot 0.25 = 0.375.$$

Вероятность того, что выйдут из строя только 2 детали определили в предыдущем примере, она равна

$$P_2 = 0.08.$$

Тогда вероятность того, что в первый месяц выйдут из строя от одной до двух деталей, равна:

$$P = P_1 + P_2 = 0.55 + 0.08 = 0.455.$$

**Ответ:** $P \approx 0.455$.

In [10]:
P1 = 0.1 * 0.8 * 0.75 + 0.9 * 0.2 * 0.75 + 0.9 * 0.8 * 0.25
P2 = 0.08
print(f'P1 = {P1}')
print(f'P2 = {P2}')

print(f'P = {P1 + P2}')

P1 = 0.375
P2 = 0.08
P = 0.455
