# Урок 4
## Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема

In [1]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from scipy.stats import norm

%config InlineBackend.figure_formats = ['svg']

plt.style.use('seaborn-whitegrid')
plt.rcParams['figure.facecolor'] = 'white'

### Задача 1

О непрерывной равномерно распределённой случайной величине $B$ известно, что её дисперсия равна $0,2$. Можно ли найти правую границу величины $B$ и её среднее значение зная, что левая граница равна $0,5$? Если да, найдите их.

Да, найти можно, так как распределение равномерное

$$f(x) = \begin{cases} 0, если \; x \le a; \\ \frac{1}{b - a}, если \; a < x \le b; \\ 0, \; если \; x > b. \end{cases}$$

Для равномерного распределения из дисперсии

$$D(X) = \frac{(b - a)^2}{12}$$

найдем правую границу

$$b = a + \sqrt{12 \cdot D(X)} = 0,5 + \sqrt{12 \cdot 0,2} = 0,5 + \sqrt{2,4} = 0,5 + 1,5492 = 2,0492$$

Найдем среднее значение

$$M(X) = \frac{a + b}{2} = \frac{0,5 + 2,0492}{2} = 1,2746$$

### Задача 2

Коробки с шоколадом упаковываются автоматически. Их средняя масса равна $1,06$ кг. Известно, что $5$% коробок имеют массу, меньшую $1$ кг. Найдите: а) среднее квадратическое отклонение массы коробки, б) процент коробок, имеющих массу больше $1,1$ кг.

Подсказка. Найдите такое значение __scale__, для которого значение __cdf(x=1, loc=1.06, scale=scale)__ близко к $0,05$. Точности $0,0001$ будет достаточно.

Масса шоколада нормально распределена

$$f(x) = \dfrac{1}{\sqrt{2 \pi \sigma^2}} \cdot \exp \left(- \frac{(x - a)^2}{2 \sigma^2} \right)$$

возле среднего

$$M(X) = a = 1,06$$

__norm.cdf(x, loc, scale)__ - функция распределения нормального распределения.
- __x__ - некоторая переменная распределения, в нашем случае 1
- __loc__ - среднее значение в нашем случае 1,06
- __scale__ - стандартное отклонение (среднеквадратичное отклонение), неизвестно, надо подобрать

Надо подобрать __scale__ таким образом, чтобы $norm.cdf(x=1, loc=1,06, scale=?) - 0,05 < 0,0001$

Подбираем вручную

In [2]:
scl = .03647740991470618

In [3]:
norm.cdf(x=1,loc=1.06,scale=scl)

0.050000000000000044

In [4]:
print(norm.cdf(x=1,loc=1.06,scale=scl) - 0.05 < 0.0001)

True


Среднеквадратическое отклонение

$$D(X) = \sigma^2 = 0,03647745$$

Чтобы найти процент коробок, имеющих массу больше $1,1$ кг надо сначала найти процент коробок, имеющих массу меньшую $1,1$ кг и затем найденный процент вычесть из $100$%.

In [5]:
1 - norm.cdf(x=1.1,loc=1.06,scale=scl)

0.1364149040409519

### Задача 3

Коробка содержит $30$ конфет. Известно, что масса каждой конфеты распределена равномерно в промежутке от $12$ до $14$ граммов. Используя центральную предельную теорему, найти вероятность, что масса всей коробки будет: а) меньше $390$ граммов, б) больше $395$ граммов, в) от $380$ до $400$ граммов.

Массой самой коробки можно пренебречь.

Масса каждой конфеты распределена равномерно, следовательно наше распределение равномерное

$$f(x) = \begin{cases} 0, если \; x \le a; \\ \frac{1}{b - a}, если \; a < x \le b; \\ 0, \; если \; x > b. \end{cases}$$

в диапазоне от $a = 12$ до $b = 14$

Среднее получается

$$M(X) = \frac{a + b}{2} = \frac{12 + 14}{2} = 13$$

А среднеквадратическое отклонение

$$D(X) = \frac{(14 - 12)^2}{12} = \frac{4}{12} = \frac{1}{3}$$

Согласно центральной предельной теореме

$$n = 30, \:\: a = n \cdot M(X), \:\: \sigma^2 = n \cdot D(X)$$

$$a = 30 \cdot 13 = 390$$

$$\sigma^2 = 30 \cdot \frac{1}{3} = 10$$

Отсюда

$$scale = \sqrt{\sigma^2} = \sqrt{10} = 3,16227766017$$

а) меньше  $390$  граммов

In [6]:
norm.cdf(x=390,loc=390,scale=3.16227766017)

0.5

б) больше  $395$  граммов

In [7]:
1 - norm.cdf(x=395,loc=390,scale=3.16227766017)

0.05692314900342166

в) от $380$ до $400$ граммов

In [8]:
norm.cdf(x=400,loc=390,scale=3.16227766017) - norm.cdf(x=380,loc=390,scale=3.16227766017)

0.9984345977419888