## Урок 4. Непрерывная случайная величина

In [1]:
import numpy as np
from scipy.stats import norm

### Задача 1.

Случайная непрерывная величина A имеет равномерное распределение на промежутке (200, 800].

Найдите ее среднее значение и дисперсию.

Чтобы найти среднее значение равномерного распределения, нужно найти сумму между концами промежутка и разделить пополам:

$\displaystyle M(x) = \frac{b + a}{2} = \frac{800 + 200}{2} = 500$

Чтобы найти дисперсию, нужно квадрат разности концов отрезка разделить на 12:

$\displaystyle D(x) = \frac{(b - a)^2}{12} = \frac{(800 - 200)^2}{12} = 30 000$

In [2]:
(800 - 200) ** 2 / 12

30000.0

### Задача 2.

О случайной непрерывной равномерно распределенной величине B известно, что ее дисперсия равна 0.2.

Можно ли найти правую границу величины B и ее среднее значение зная, что левая граница равна 0.5?

Если да, найдите ее.

Если дисперсия равна 0.2, а левая граница равна 0.5, то искать следует по формуле:

$\displaystyle b = a + \sqrt{12D(x)}$

In [3]:
a = 0.5
Dx = 0.2

b = a + np.sqrt(12 * Dx)
b

2.049193338482967

Соответственно, среднее значение будет:

In [4]:
(a + b) / 2

1.2745966692414834

### Задача 3.

Непрерывная случайная величина X распределена нормально и задана плотностью распределения

$\displaystyle f(x) = \frac{1}{4 * \sqrt{2\pi}} \cdot e^{-\frac{(x+2)^2}{32})}$


Найдите:
1. M(X)
2. D(X)
3. std(X) (среднее квадратичное отклонение)

В принципе - все читается из самой записи:

$\displaystyle f(x) = \frac{1}{std(x) * \sqrt{2\pi}} \cdot e^{-\frac{(x + M(x))^2}{2 \cdot D(x)})}$

1. M(x) = 2
1. D(x) = 16
1. std(x) = 4

### Задача 4. 

Рост взрослого населения города X имеет нормальное распределение, причем, средний рост равен 174 см, а среднее квадратическое отклонение равно 8 см. посчитайте, какова вероятность того, что случайным образом выбранный взрослый человек имеет рост:

1. больше 182 см?
2. больше 190 см?
3. от 166 см до 190 см?
4. от 166 см до 182 см?
5. от 158 см до 190 см?
6. не выше 150 см или не ниже 190 см?
7. не выше 150 см или не ниже 198 см?
8. ниже 166 см?

Задачу можно решить двумя способами: без использования сторонних библиотек (numpy, scipy, pandas и пр.), а затем проверить себя с помощью встроенных функций

К сожалению у меня нет таблиц z-распределения, поэтому - поясню ход решения на примере пункта 1, и буду пользоваться инструментами от scipy

Первое, что нужно сделать - получить z-значение для нужного роста, для этого вычтем из значения роста (x = 182) средний рост (M(x) = 174) жителей и разделим на среднее квадратичное отклонение ($\sigma$ = 8):

здесь:

$\displaystyle z = \frac{182 - 174}{8} = 1$

z-значение показывает, что вероятность втретить человек выше 182 см лежит за одной сигмой вправо от среднего. Берем табличку и считаем нужное значение (в зависимости от таблички, возможно, его нужно будет вычесть из 1)

Я же, как говорил, частично воспользуюсь scipy

In [5]:
def standart_scaler(x_val, mean_val=174, SD=8):
    return (x_val - mean_val) / SD

1. больше 182 см?

In [6]:
z = standart_scaler(182)
1 - norm.cdf(z)

0.15865525393145707

2. больше 190 см?

In [7]:
z = standart_scaler(190)
1 - norm.cdf(z)

0.02275013194817921

3. от 166 см до 190 см?

In [8]:
z_1 = standart_scaler(166)
z_2 = standart_scaler(190)

norm.cdf(z_2) - norm.cdf(z_1)

0.8185946141203637

4. от 166 см до 182 см?

In [9]:
z_1 = standart_scaler(166)
z_2 = standart_scaler(182)

norm.cdf(z_2) - norm.cdf(z_1)

0.6826894921370859

5. от 158 см до 190 см?

In [10]:
z_1 = standart_scaler(158)
z_2 = standart_scaler(190)

norm.cdf(z_2) - norm.cdf(z_1)

0.9544997361036416

6. не выше 150 см или не ниже 190 см?

In [11]:
z_1 = standart_scaler(158)
z_2 = standart_scaler(190)

1 - norm.cdf(z_2) + norm.cdf(z_1)

0.0455002638963584

7. не выше 150 см или не ниже 198 см?

In [12]:
z_1 = standart_scaler(150)
z_2 = standart_scaler(198)

1 - norm.cdf(z_2) + norm.cdf(z_1)

0.0026997960632601965

8. ниже 166 см?

In [13]:
z = standart_scaler(168)
norm.cdf(z)

0.2266273523768682

### Задача 5.

На сколько сигм (средних квадратичных отклонений) отклоняется рост человека, равный 190 см, от математического ожидания роста в популяции, в которой M(X) = 178 см и D(X) = 25 кв.см?

Здесь сначала стоит перевести дисперсию в среднее квадратическое отклонение (вычислить корень):

In [14]:
Dx = 25
Mx = 178
x = 190

In [15]:
stdx = np.sqrt(Dx)

И теперь вычислить z-значение, которое и будет ответом:

In [16]:
standart_scaler(x, Mx, stdx)

2.4