# Урок 5. Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование
## Домашнее задание

### Задача 1

Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр $17$ мм. Используя уровень значимости $0.025$ и правостороннюю критическую область, проверить данную гипотезу при условии, что в выборке из $100$ шариков средний диаметр оказался равным $17.5$ мм, а дисперсия известна и равна $4$ мм.

**Решение**

Подготовим выборку

In [2]:
import numpy as np
from scipy import stats

In [3]:
n = 100
samples = np.random.normal(17, 4, size=n)

Чтобы проверить гипотизу зададим функцию от выборки $T$:
$$T(X) = \frac{\overline{X} - a}{\sigma\sqrt{n}} = \frac{\overline{X} - 17.5}{1/10} = 10 \cdot (\overline{X} - 17.5)$$

Уровень значимости $\alpha=0.025$. По правилу трёх сигм определим критическую область:
$$\Omega_\alpha = (-\infty, -3) \cup (3, +\infty)$$


In [8]:
mean = samples.mean()
print('X_avg = ', mean)

X_avg =  17.00529861166573


In [9]:
T = 10 * (mean - 17.5)
print('T(X) =', T)

T(X) = -4.947013883342706


In [11]:
alpha = 0.025
ppf = stats.norm.ppf(1 - alpha / 2)
print('ppf:', ppf)

ppf: 2.241402727604947


In [12]:
ppf < 3

True

Значение не превышает пределы критической области, следовательно гипотезу $H_0$ принимаем.

### Задача 2

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением $16$. Найти доверительный интервал для оценки математического ожидания a с надёжностью $0.95$, если выборочное среднее равно $80$, а объём равен $256$.

In [15]:
sigma = 16
alpha = 0.1
mean = 80
n = 256

T = (mean - sigma) / (1/np.sqrt(n))
print('T(X) =', T)

ppf = stats.norm.ppf(1 - alpha / 2)
print('ppf:', ppf)

T(X) = 1024.0
ppf: 1.6448536269514722


### Задача 3

Продавец утверждает, что средний вес пачки печенья составляет $200$ г. Из партии извлечена выборка из $10$ пачек. Вес каждой пачки составляет:

`202, 203, 199, 197, 195, 201, 200, 204, 194, 190`

Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен $1%$?

In [13]:
samples = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = len(samples)

mean = samples.mean()
print('X_avg = ', mean)

T = np.sqrt(10) * (mean - 200)
print('T(X) =', T)

alpha = 0.1
ppf = stats.norm.ppf(1 - alpha / 2)
print('ppf =', ppf)

ppf < 1

X_avg =  198.5
T(X) = -4.743416490252569
ppf = 1.6448536269514722


False

Значение превышает пределы критической области, следовательно гипотезу $H_0$ отвергаем.