# Проверка статистических гипотез. Доверительные интервалы. A/B-тестирование
### Задача 1

Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя уровень значимости 0.025 и правостороннюю критическую область, проверить данную гипотезу при условии, что в выборке из 100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 мм.

#### Решение
$H_0$ — нулевая гипотеза. Предположение того, что средний размер шариков равен a = 17 мм

Используем статистику $T(X) = \dfrac{\overline{X} - a}{\sigma \left/ \sqrt{n}\right.} = \dfrac{\overline{X} - 17}{\sqrt{4} / 10} = 5(\overline{X} - 17)$

$\alpha = 0.025$

Правосторонняя область: $\Omega_\alpha = (t_{1 - \alpha}, +\infty) \approx (2, +\infty)$, так как для стандартного нормального распределения попасть в область $(-\infty, -2) \cup (2, \infty)$ равна $0.05$.

В нашем эксперименте $\overline{X} = 17.5$

Значит $T(X) = 5\cdot(17.5 - 17) = 2.5$
Получается, что мы попали в критическую область, значит отвергаем гипотезу.

### Задача 2

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти доверительный интервал для оценки математического ожидания a с надёжностью 0.95, если выборочное среднее равно 80, а объём равен 256.

#### Решение
$\dfrac{\sigma}{\sqrt{n}} = 1$

$\overline{X} = 80$

Для нормального распределени используем статистику $T(X) = \dfrac{\overline{X} - a}{\sigma \left/ \sqrt{n}\right.}$.

$T$ имеет стандартное нормальное распределение.

$0.95 \approx P(-2 \leqslant T \leqslant 2) = P \left(\overline{X} - 2 \cdot \dfrac{\sigma}{\sqrt{n}} \leqslant a \leqslant \overline{X} + 2 \cdot \dfrac{\sigma}{\sqrt{n}}\right) = P \left(\overline{X} - 2  \leqslant a \leqslant \overline{X} + 2 \right) = P(78  \leqslant a \leqslant 82)$

Доверительный интервал примерно $(78, 82)$

### Задача 3

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:

`202, 203, 199, 197, 195, 201, 200, 204, 194, 190`

Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?

#### Решение

$\alpha = 0.01$

In [1]:
import numpy as np
from scipy.stats import norm, t

alpha = 0.01
samples = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = len(samples)
mean = samples.mean()
std = samples.std(ddof=1)

n, mean, std

(10, 198.5, 4.453463071962462)

In [2]:
t_ = t.ppf(1 - alpha / 2, n - 1)

In [3]:
(mean - t_ * std / np.sqrt(n), mean + t_ * std / np.sqrt(n))

(193.92322840036354, 203.07677159963646)

200 попадает в этот интервал, значит можно считать утверждение продавца верным