### Урок 4. Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема

#### Задача 1

О непрерывной равномерно распределенной случайной величине B известно, что ее дисперсия равна 0.2. Можно ли найти правую границу величины B и ее среднее значение зная, что левая граница равна 0.5? Если да, найдите ее.

In [1]:
import pandas as pd
import numpy as np

In [23]:
from scipy.stats import norm
from scipy import stats

In [3]:
a = 0.5
Dx = 0.2

Математическое ожидание и дисперсия равномерного распределения:

$$M(X) = \dfrac{a + b}{2}, \text{ } D(X) = \dfrac{(b - a)^2}{12}.$$



Отсюда: 
$$b = \sqrt{D(X) \cdot 12} + a$$


In [5]:
b = (12*Dx)**0.5 + a
b

2.049193338482967

Cреднее значение будет соответствовать математическому ожиданию:

In [6]:
Mx = (a+b)/2
Mx

1.2745966692414834

Проверим:

In [7]:
samples = np.random.uniform(a, b, size=1000)
samples

array([1.66863114, 1.45718175, 1.76924638, 1.87374845, 1.75522183,
       0.74171539, 1.24752591, 1.92892727, 1.65566863, 0.91679943,
       1.10546132, 0.51189947, 1.11725455, 0.58281161, 1.53592356,
       0.68837816, 1.1863635 , 1.46835247, 1.26468256, 1.03312515,
       1.23402128, 0.74168772, 1.07995401, 0.5513398 , 1.56965035,
       1.93536168, 1.15074433, 1.20377182, 0.90977919, 1.19580928,
       0.52697354, 0.6681692 , 0.9673084 , 1.58518737, 0.53187156,
       2.01713168, 1.26362699, 1.67194063, 0.89092146, 1.25297545,
       1.62803486, 0.70555986, 0.59554071, 1.05103599, 0.84161484,
       1.93195465, 1.76763584, 1.80667975, 1.1097157 , 0.58289806,
       1.18021427, 1.78612257, 1.57930527, 1.10061766, 1.1710198 ,
       1.46951244, 1.22934013, 1.49187309, 1.12109274, 0.76622302,
       1.8996215 , 0.76274963, 1.07073634, 1.6930785 , 0.86994238,
       1.3368396 , 1.43141718, 1.57281736, 0.88116639, 1.01039476,
       1.56104138, 0.99929727, 1.07256995, 1.2737564 , 1.87386

Математическое ожидание:

In [8]:
samples.mean()

1.281401567815057

Выборочная дисперсия (несмещённая):

In [12]:
samples.var(ddof=1)

0.1950333835741427

#### Задача 2

Рост взрослого населения города X имеет нормальное распределение, причем, средний рост равен 174 см, а среднее квадратическое отклонение равно 8 см. посчитайте, какова вероятность того, что случайным образом выбранный взрослый человек имеет рост:
1. больше 182 см?
2. больше 190 см?
3. от 166 см до 190 см?
4. от 166 см до 182 см?
5. от 158 см до 190 см?
6. не выше 150 см или не ниже 190 см?
7. не выше 150 см или не ниже 198 см?
8. ниже 166 см?

Задачу можно решить двумя способами: без использования сторонних библиотек (numpy, scipy, pandas и пр.), а затем проверить себя с помощью встроенных функций

Поскольку Х - нормально распределенная случайная величина используем формулу для нахождения вероятности попадания НСВ в интервал:

$$P(\alpha < X < \beta) = \Phi\left(\dfrac{\beta - а}{\sigma}\right) - \Phi\left(\dfrac{\alpha - а}{\sigma}\right)$$

Где $\Phi(х)$ - функция Лапласа (значения табулированы)

a = 174, \
$\sigma = 8$

P(Х > 182) = 1 - P(Х<182) = 1 - Ф(182-174/8) = 1 - Ф(1) = 1 - 0,8413 = 0,1587

In [19]:
1 - norm(loc = 174 , scale = 8).cdf(182)

0.15865525393145707

P(Х > 190) = 1 - P(Х<190) = 1 - Ф(190-174/8) = 1 - Ф(2) = 1 - 0,9772 = 0,0028

In [76]:
p = 1 - stats.norm.cdf(x=190, loc=174, scale=8)
p

0.02275013194817921

P(166 < Х < 190) = Ф(190-174/8) - Ф(166-174/8) = 0,8185

In [28]:
p = (stats.norm.cdf(x=190, loc=174, scale=8) - stats.norm.cdf(x=166, loc=174, scale=8))
p

0.8185946141203637

P(166 < Х < 182) = Ф(182-174/8) - Ф(166-174/8) = 0,6826

In [29]:
p = (stats.norm.cdf(x=182, loc=174, scale=8) - stats.norm.cdf(x=166, loc=174, scale=8))
p

0.6826894921370859

P(158 < Х < 190) = Ф(190-174/8) - Ф(158-174/8) = 0,9544

In [30]:
p = (stats.norm.cdf(x=190, loc=174, scale=8) - stats.norm.cdf(x=158, loc=174, scale=8))
p

0.9544997361036416

P(Х < 150 | Х > 190) = Ф(150-174/8) + (1-Ф(190-174/8) = 0,0228

In [73]:
p = stats.norm.cdf(x=150, loc=174, scale=8) + (1 - stats.norm.cdf(x=190, loc=174, scale=8))
p

0.0241000299798093

P(Х < 150 | Х > 198) = Ф(150-174/8) + (1-Ф(198-174/8) = 0,0026

In [74]:
p = stats.norm.cdf(x=150, loc=174, scale=8) + (1 - stats.norm.cdf(x=198, loc=174, scale=8))
p

0.0026997960632601965

P(Х < 166) = Ф(166-174/8) = 0,1587

In [75]:
p = stats.norm.cdf(x=166, loc=174, scale=8)
p

0.15865525393145707

#### Задача 3 (Дополнительно)

Коробки с шоколадом упаковываются автоматически. Их средняя масса равна 1.06 кг. Известно, что 5% коробок имеют массу, меньшую 1 кг. Найдите: а) среднее квадратическое отклонение массы коробки, б) процент коробок, имеющих массу больше 1.1 кг.

Подсказка. 1. Можно считать, что распределение массы коробки нормальное. 2. Найдите такое значение scale, для которого значение cdf(x=1, loc=1.06, scale=scale) близко к 0.05. Точности 0.0001 будет достаточно.

Х - нормально распределенная случайная величина, равная массе коробки с конфетами а=1.06, $\sigma = 8$. Тогда, используя формулу нахождения вероятности попадания нормальной случайной величины в интервал:

$$P(\alpha < X < \beta) = \Phi\left(\dfrac{\beta - а}{\sigma}\right) - \Phi\left(\dfrac{\alpha - а}{\sigma}\right)$$

и используя условие, что 5% коробок имеют массу меньшую 1 кг получаем:

$$P(-\infty < X < 1) = \Phi\left(\dfrac{1 - 1,06}{\sigma}\right) - \Phi\left(\dfrac{-\infty - 1,06}{\sigma}\right) = 0.05$$

$$\Phi\left(\dfrac{-0,06}{\sigma}\right) - \Phi\left(-\infty\right) = 0.05$$

$$-\Phi\left(\dfrac{-0,06}{\sigma}\right) +0,5 = 0.05$$

$$\Phi\left(\dfrac{0,06}{\sigma}\right) = 0.45$$

$$\dfrac{0,06}{\sigma} = 1.645$$

$${\sigma} = 0.0365$$

In [25]:
for scale in np.linspace(0.00001, 1, 99999):
    s = stats.norm.cdf(x=1, loc=1.06, scale=scale)
    if s > 0.0499 and s < 0.0501:
        print(f'Среднее квадратическое отклонение массы коробки: {scale}')
        break

Среднее квадратическое отклонение массы коробки: 0.03646036450729015


 Вычислим процент коробок, масса которых превышает 1,1 кг

$$P(1,1 < X < \infty) = \Phi\left(\dfrac{\infty - 1,06}{0,0365}\right) - \Phi\left(\dfrac{1,1 - 1,06}{0,0365}\right) = \Phi\left(\infty\right) - \Phi\left(\dfrac{0,04}{0,0365}\right) = \Phi\left(\infty\right) - \Phi\left(1,095\right)= 1 - 0,8621 = 0,1379$$

или 13,79%

In [61]:
p = (stats.norm.cdf(x=float('inf'), loc=1.06, scale=scale) - stats.norm.cdf(x=1.1, loc=1.06, scale=scale))
print(f'Процент коробок, имеющих массу больше 1.1 кг: {round(p*100,3)} %')

Процент коробок, имеющих массу больше 1.1 кг: 13.63 %
