## Урок 4
### Непрерывные случайные величины. 
### Функция распределения и плотность распределения вероятностей. 
### Равномерное и нормальное распределение. Центральная предельная теорема.

In [1]:
import numpy as np
import pandas as pd
from scipy import stats

#### Задача 1
О непрерывной равномерно распределенной случайной величине `B` известно, что ее дисперсия равна 0.2. Можно ли найти правую границу величины `B` и ее среднее значение зная, что левая граница равна 0.5? Если да, найдите ее.

##### Решение

Math expected value formula:
$$M(X) = \dfrac{a + b}{2}.$$

Dispersion of uniform distribution formula:
$$D(X) = \dfrac{(b - a)^2}{12}.$$

Quadratic equation:
$$b^2 - 2*a*b + a^2 - 12*D = 0.$$

In [2]:
disp = 0.2
a = 0.5

$$b^2 - b - 2.15 = 0.$$

$$D = (-1)^2 - 4*1*(- 2.15).$$

In [3]:
# Discriminant
D = (-1)**2 - 4 * 1 * (-2.15)
D

9.6

$$b1 = \frac{-(-1) + \sqrt{D}}{2*1}.$$
$$b2 = \frac{-(-1) - \sqrt{D}}{2*1}.$$

In [4]:
b1 = (1 + np.sqrt(D))/2
b1

2.049193338482967

In [5]:
b2 = (1 - np.sqrt(D))/2
b2

-1.0491933384829668

In [6]:
b = b1

# Expected value
M = (a + b)/2
M

1.2745966692414834

#### Задача 2
На сколько сигм (средних квадратических отклонений) отклоняется рост человека, равный 190 см, от математического ожидания роста в популяции, в которой `M(X) = 178` и `D(X) = 25`?

##### Решение

In [7]:
height = 190
m_exp_val = 178
disp = 25

In [8]:
# Calculate sigma
sigma = np.sqrt(disp)
sigma

5.0

In [9]:
# Find how many sigmas
(height - m_exp_val) / sigma

2.4

#### Задача 3
Рост взрослого населения города `X` имеет нормальное распределение, причем, средний рост равен 174 см, а среднее квадратическое отклонение равно 8 см. С помощью правил одной, двух и трёх сигм посчитайте, какова вероятность того, что случайным образом выбранный взрослый человек имеет рост:

1. больше 182 см?
2. больше 190 см?
3. от 166 см до 190 см?
4. от 166 см до 182 см?
5. от 158 см до 190 см?
6. не выше 150 см или не ниже 190 см?
7. не выше 150 см или не ниже 198 см?
8. ниже 166 см?

##### Решение

In [10]:
height_mean = 174
sigma = 8

In [11]:
# Get sigma-based threshold values
minus_three_sigmas = height_mean - sigma * 3
minus_two_sigmas = height_mean - sigma * 2
minus_one_sigma = height_mean - sigma
plus_one_sigma = height_mean + sigma
plus_two_sigmas = height_mean + sigma * 2
plus_three_sigmas = height_mean + sigma * 3

In [12]:
# Define intervals based on threshold values
print("Values less than (height_mean - 3*sigma): ({}, {})".format(0, minus_three_sigmas))
print("Values between (height_mean - 3*sigma) and (height_mean - 2*sigma): ({}, {})".format(minus_three_sigmas, minus_two_sigmas))
print("Values between (height_mean - 2*sigma) and (height_mean - sigma): ({}, {})".format(minus_two_sigmas, minus_one_sigma))
print("Values between (height_mean - sigma) and (height_mean + sigma): ({}, {})".format(minus_one_sigma, plus_one_sigma))
print("Values between (height_mean + sigma) and (height_mean + 2*sigma): ({}, {})".format(plus_one_sigma, plus_two_sigmas))
print("Values between (height_mean + 2*sigma) and (height_mean + 3*sigma): ({}, {})".format(plus_two_sigmas, plus_three_sigmas))
print("Values greater than (height_mean + 3*sigma): ({}, {})".format(plus_three_sigmas, 250))

Values less than (height_mean - 3*sigma): (0, 150)
Values between (height_mean - 3*sigma) and (height_mean - 2*sigma): (150, 158)
Values between (height_mean - 2*sigma) and (height_mean - sigma): (158, 166)
Values between (height_mean - sigma) and (height_mean + sigma): (166, 182)
Values between (height_mean + sigma) and (height_mean + 2*sigma): (182, 190)
Values between (height_mean + 2*sigma) and (height_mean + 3*sigma): (190, 198)
Values greater than (height_mean + 3*sigma): (198, 250)


In [13]:
# Values between (a - sigma) and (a + sigma)
one_sigma_deviation = stats.norm.cdf(1) - stats.norm.cdf(-1)
# Values between (a - 2*sigma) and (a + 2*sigma)
two_sigmas_deviation = stats.norm.cdf(2) - stats.norm.cdf(-2)
# Values between (a - 3*sigma) and (a + 3*sigma)
three_sigmas_deviation = stats.norm.cdf(3) - stats.norm.cdf(-3)

one_sigma_deviation, two_sigmas_deviation, three_sigmas_deviation

(0.6826894921370859, 0.9544997361036416, 0.9973002039367398)

In [14]:
# Height greater than 182
P1 = (1 - one_sigma_deviation) * 0.5
P1

0.15865525393145707

In [15]:
# Height greater than 190
P2 = (1 - two_sigmas_deviation) * 0.5
P2

0.02275013194817921

In [16]:
# Height between 166 and 190
P3 = one_sigma_deviation + ((two_sigmas_deviation - one_sigma_deviation) * 0.5)
P3

0.8185946141203637

In [17]:
# Height between 166 and 182
P4 = one_sigma_deviation
P4

0.6826894921370859

In [18]:
# Height between 158 and 190
P5 = two_sigmas_deviation
P5

0.9544997361036416

In [19]:
# Height less than 150 or greater than 190
P6 = ((1 - three_sigmas_deviation) * 0.5) + ((1 - two_sigmas_deviation) * 0.5)
P6

0.024100029979809312

In [20]:
# Height less than 150 or greater than 198
P7 = 1 - three_sigmas_deviation
P7

0.002699796063260207

In [21]:
# Height less than 166
P8 = (1 - one_sigma_deviation) * 0.5
P8

0.15865525393145707

#### Задача 4
Каким образом связаны между собой понятие квантиля и правила двух и трёх сигм? 
Данное задание - на подумать, оформлять его не обязательно. Этот вопрос мы обсудим в начале следующего занятия.