In [1]:
from math import sqrt
import numpy as np

## Урок 5. Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование

### 1. Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

### Решение:
$ T_{1, 2}= \bar{X}\pm z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}$

$ \bar{X}=80, z_{\frac{\alpha}{2}}=1.96, \sigma=16, n=256 $

In [2]:
X = 80
z=1.96
s=16
n=256

T_1 = X - z * s / sqrt(n)
T_2 = X + z * s / sqrt(n)

print(f'Доверительный интервал с надежностью 95 %: [{T_1}; {T_2}]')

Доверительный интервал с надежностью 95 %: [78.04; 81.96]


### 2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные: 6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95. 3,4

### Решение:
$ T_{1, 2}= \bar{X}\pm t_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}$

$ \bar{X}=80, t_{\frac{\alpha}{2}}=2.262, \sigma=0.4508, n=256 $

In [3]:
sample = np.array([6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1])

X = np.mean(sample)
t = 2.262
s = np.std(sample, ddof=1)
n = sample.shape[0]

T_1 = X - t * s / sqrt(n)
T_2 = X + t * s / sqrt(n)

print(f'Доверительный интервал с доверительной вероятностью 0.95: [{T_1:0.3}; {T_2:0.3}]')

Доверительный интервал с доверительной вероятностью 0.95: [6.27; 6.91]


### 3. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв.мм.

### Решение:

Гипотеза H0: диаметр 17 мм, $ \mu=\mu_0 $  
Гипотеза H1: диаметр 17.5 мм, $ \mu>\mu_0 $

Сравниваем $ Z_{табл} $ и $ Z_{набл} $

$ Z_{набл}=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} $

$ \bar{X}=17.5 мм,  \mu_0=17 мм, \sigma=\sqrt{4} мм, n=100, Z_{табл}=1.645 $

In [4]:
Z_1 = 1.645
a = 0.05

X = 17.5
M = 17
s = 2
n = 100

Z_2 = abs(X - M) / (s / sqrt(n))

print(f'(Z_1={Z_1}) >= (Z_2={Z_2})')
print(f'Гипотеза H0 {"верна" if Z_1 >= Z_2 else "неверна"} для a={a}')

(Z_1=1.645) >= (Z_2=2.5)
Гипотеза H0 неверна для a=0.05


### 4. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

### Решение:

Гипотеза H0: вес пачки составляет 200 г, $ \mu=\mu_0 $  
Гипотеза H1: вес пачки не равен 200 г, $ \mu\ne\mu_0 $

Сравниваем $ t_{табл} $ и $ t_{набл} $

$ t_{набл}=\frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} $

$ \bar{X}=198.5 г,  \mu_0=200 г, \sigma=\sqrt{4.45} мм, n=10, t_{табл}=3.25 $

In [5]:
t_1 = 3.25
a = 0.01
M = 200

sample = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = sample.shape[0]
X = sample.mean()
s = np.std(sample, ddof=1)

t_2 = abs(X - M) / (s / sqrt(n))

print(f'(t_1={t_1}) >= (t_2={t_2})')
print(f'Гипотеза H0 {"верна" if t_1 >= t_2 else "неверна"} для a={a}')

(t_1=3.25) >= (t_2=1.0651074037450896)
Гипотеза H0 верна для a=0.01
