## **Урок 5. Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование**

#### Задача 1. Известно, что генеральная совокупность распределена нормально 
#### со средним квадратическим отклонением, равным 16.
#### Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95,
#### если выборочная средняя M = 80, а объем выборки n = 256.

In [23]:
import math
import numpy as np

Так как известна $\sigma$ генеральной совокупности, воспользуемся формулой нахождения доверительного интервала:

$$\bar X \pm Z_{\alpha/2} * \frac{\sigma}{\sqrt{n}}$$

In [24]:
Z = 1.96
sigma = 16
n = 256
X = 80

a1 = X + Z * sigma / math.sqrt(n)
a1

81.96

In [25]:
a2 = X - Z * sigma / math.sqrt(n)
a2

78.04

#### Ответ: [78.04; 81.96].

#### Задача 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью,
#### получены опытные данные:
#### 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1
#### Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей,
#### оценить истинное значение величины X при помощи доверительного интервала, покрывающего это
#### значение с доверительной вероятностью 0,95.

In [26]:
n = 10
v = n - 1
t = 2.262

Так как неизвестна $\sigma$ генеральной совокупности, воспользуемся формулой нахождения доверительного интервала (по критерию Стьюдента):

$$\bar X \pm t_{\alpha/2} * \frac{\sigma_n}{\sqrt{n}}$$

In [27]:
data = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

In [28]:
X_mean = np.mean(data)
X_mean

6.590000000000001

In [29]:
sigma_data = np.std(data, ddof=1)
sigma_data 

0.4508017549014448

In [30]:
a1 = X_mean + t * sigma_data / np.sqrt(n)
a1

6.912461744087575

In [31]:
a2 = X_mean - t * sigma_data / np.sqrt(n)
a2

6.267538255912426

#### Ответ: [6.267538255912426; 6.912461744087575].

#### Задача 3. Проведите тест гипотезы. Утверждается, что шарики для подшипников, изготовленные автоматическим
####  станком, имеют средний диаметр 17 мм.
####  Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр
####  оказался равным 17.5 мм, а дисперсия известна и равна 4 кв. мм.

In [32]:
m_0  = 17
m = 17.5
variarion = 4
alpha = 0.05
n = 100

$$H_0: \mu = \mu_0$$
$$H_1: \mu > \mu_0$$

Так как дисперсия нам известна, будем решать по формуле:
![image.png](attachment:image.png)

In [33]:
Z_n = (m - m_0) / (np.sqrt(variarion ) * np.sqrt(n))
Z_n

0.025

In [34]:
Z = 1.65

In [35]:
Z > Z_n

True

#### Ответ:  шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Гипотеза верна при α=0,05.

#### Задача 4. Проведите тест гипотезы. Продавец утверждает, что средний вес пачки печенья составляет 200 г.
#### Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
#### 202, 203, 199, 197, 195, 201, 200, 204, 194, 190.
#### Известно, что их веса распределены нормально.
#### Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%? (Провести двусторонний тест.)

In [36]:
m_0  = 200
cookies = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
alpha = 0.01
n = 10
m = np.mean(cookies)
sigma_cookies= np.std(cookies, ddof=1)
m, sigma_cookies

(198.5, 4.453463071962462)

Так как дисперсия и среднее квадратичное отклонение неизветсны, будем решать по формуле:
![image.png](attachment:image.png)

$$H_0: \mu = \mu_0$$
$$H_1: \mu \neq \mu_0$$

In [37]:
#Найдем t_n
t_n = (m - m_0) / (sigma_cookies / np.sqrt(n))
t_n 

-1.0651074037450896

Найдем $t_{\alpha/2}:$

$\frac{\alpha}{2} = 0.005$ 

$df = 10 - 1 = 9$

In [38]:
t_a_2 = 3.250

In [39]:
abs(t_n) < t_a_2 

True

#### Ответ:  средний вес пачки печенья составляет 200 г. Гипотеза верна при α=0,01.