# Урок 5. Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование

## 1. Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

Так как известно среднее квадратическое отклонение генеральной совокупности, то используем Z-критерий. Нижняя и верхняя границы доверительного интервала:

## $$T_{1,2} = \overline{X} \pm Z_{\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}$$

По условию задачи:

### $$\sigma = 16$$
### $$M = 80$$
### $$n = 256$$

### $$p = 1-\alpha = 0,95 \Rightarrow \alpha = 0,05 $$

Согласно Z-таблице:

### $$Z_{\frac{\alpha}{2}} = Z_{0,025} = -1,96$$

Подставив значения в формулу имеем:

### $$T_{1,2} = 80 \pm 1,96 \cdot \frac{16}{\sqrt{256}} = 80 \pm 1,96 $$

### __Ответ__: [78,04; 81,96]

## 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1. Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

In [1]:
import numpy as np

In [2]:
X = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])
X

array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

Так как неизвестно среднее квадратическое отклонение генеральной совокупности, то используем t-критерий. Нижняя и верхняя границы доверительного интервала:

## $$T_{1,2} = \overline{X} \pm t_{\frac{\alpha}{2}} \cdot \frac{s_0}{\sqrt{n}}$$

По условию задачи:

### $$n = 10$$
### $$p = 1-\alpha = 0,95 \Rightarrow \alpha = 0,05 $$
### 

Выборочное среднее арифметическое $\overline{X}$:

In [3]:
X.mean()

6.590000000000001

Среднее квадратичное отклонение по выборке (несмещенное) $s_0$:

In [4]:
np.std(X, ddof=1)

0.4508017549014448

Согласно t-таблице, для $\alpha = 0,025$ и числа степеней свободы равному $n-1 = 9$ значение $t = 2,262$

Подставив значения в формулу имеем:

In [5]:
X.mean() - 2.262*np.std(X, ddof=1)/np.sqrt(10)

6.267538255912426

In [6]:
X.mean() + 2.262*np.std(X, ddof=1)/np.sqrt(10)

6.912461744087575

### __Ответ__: [6,26754; 6,91246]

## 3.  Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв.мм.

Так как известна дисперсия генеральной совокупности, то для сравнения используем Z-критерий.

По условию задачи:

### $$\mu_0 = 17$$
### $$\mu = 17,5$$
### $$\alpha = 0,05$$
### $$D = 4$$

Сформулируем гипотезы:

### $$H_0: \, \mu = \mu_0$$
### $$H_1: \, \mu > \mu_0$$

Вычислим расчетное значение критерия:

## $$Z_р = \frac{\mu - \mu_0}{\frac{\sigma}{\sqrt{n}}}=\frac{17,5 - 17}{\frac{\sqrt{4}}{\sqrt{100}}} = 2,5$$

Согласно Z-таблице:

### $$Z_T = Z_{0,95} = 1,65$$

Так как $Z_р > Z_T$ то отвергаем гипотезу $H_0$

### __Ответ__: утверждение, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм неверно при $\alpha=0,05$

## 4. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

Так как неизвестна дисперсия генеральной совокупности, то для сравнения используем t-критерий.

По условию задачи:

### $$\mu_0 = 200$$
### $$\alpha = 1 - 0,99 = 0,01$$
### $$n = 10$$

In [7]:
X = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
X.mean()

198.5

### $$\mu = 198,5$$

Среднее квадратичное отклонение по выборке (несмещенное) $s_0$:

In [8]:
np.std(X, ddof=1)

4.453463071962462

Сформулируем гипотезы:

### $$H_0: \, \mu = \mu_0$$
### $$H_1: \, \mu \neq \mu_0$$

Вычислим расчетное значение критерия:

## $$t_р = \frac{\mu - \mu_0}{\frac{s_0}{\sqrt{n}}}$$

In [9]:
(X.mean() - 200)/(np.std(X, ddof=1)/np.sqrt(10))

-1.0651074037450896

Согласно t-таблице, для $\frac{\alpha}{2} = 0,005$ и числа степеней свободы равному $n-1 = 9$ значение $t_T = 3,25$

Так как $t_р$ лежит от $-t_T$ до $t_T$, то принимаем гипотезу $H_0$

### __Ответ__: утверждение продавца верно, при доверительной вероятности 99%