#  Проверка статистических гипотез. P-значения. Доверительные интервалы

In [89]:
import scipy.stats as st
from math import sqrt 
import numpy as np

1) Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти ширину доверительного интервала для оценки математического ожидания `mu` с надёжностью 0.95, если выборочное среднее равно 80, а объём выборки равен 256.

In [90]:
def get_confidence_interval(p, std, x, n):
    a = (1 - p) / 2
    z = st.norm.ppf(a)
    
    return [x + z * (std / sqrt(n)), x - z * (std / sqrt(n))]

In [91]:
std = 16
p = 0.95
x = 80
n = 256

interval = get_confidence_interval(p, std, m, n)
width = interval[1] - interval[0]
width

3.9199279690801063

2) Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
```
202, 203, 199, 197, 195, 201, 200, 204, 194, 190
```
Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%? Найдите P-значение для данного теста и укажите его в качестве ответа.

In [92]:
m_0 = 200
X = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
alpha = 0.01
n = len(X)
mean = X.mean()
std = X.std(ddof=1)

t_t = 3.250
print(f"t-табличное: {t_t}")

t-табличное: 3.25


In [93]:
t = (mean - m_0) / (std / sqrt(n))
print(f"t-расчетное: {t}")

t-расчетное: -1.0651074037450896


Находим критическую область

In [94]:
t1 = st.t.ppf(alpha / 2, df=n - 1)
t2 = st.t.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(-3.2498355440153697, 3.2498355440153697)

Принимаем нулевую гипотезу, т.к наше t-расчетное не попадает в критическую область область.

In [95]:
p_1 = st.t.cdf(t, df=n - 1)
p_2 = 1 - st.t.cdf(t, df=n - 1)
p_value = 2 * min(p_1, p_2)

print(f'Р-значение: {p_value}')

Р-значение: 0.3145666035247285


3) Дана выборка диаметров подшипников из примера 1 с занятия 5:
```
samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02  ]
```
Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна `0.0625` при уровне значимости `alpha = 0.05`. Что для этого нужно знать:
1. Альтернативная гипотеза двухсторонняя.
2. Статистика для теста: `H = (n - 1) * sample_variance / variance`, где `n` - число элементов в выборке, `sample_variance` - несмещённая оценка дисперсии, `variance` - утверждаемая нулевой гипотезой дисперсия.
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром `df = n - 1`. Её квантили можно найти с помощью функции `scipy.stats.chi2.ppf`.

В качестве ответа запишите 1, если нулевая гипотеза верна, и 0 иначе.

ПОка что не разобрался =(