__Задача 1__

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти ширину доверительного интервала для оценки математического ожидания `mu` с надёжностью 0.95, если выборочное среднее равно 80, а объём выборки равен 256.
http://www.mathprofi.ru/statisticheskie_ocenki_parametrov_generalnoy_sovokupnosti.html

Так как известно среднее квадратичное отклонение генеральной совокупности, то используем Z-статистику.  
Границы доверительного интервала: 
$
\overline{X} \pm t_{\alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}}, \overline{X} = 80, \sigma = 16, n = 256, t_{\alpha / 2} = 
$


In [1]:
av_x = 80; sigma = 16; t_a = 1.96; n = 256
left = av_x - t_a*sigma/n**(1/2)
right = av_x + t_a*sigma/n**(1/2)
print([left, right])
print(right - left)

[78.04, 81.96]
3.9199999999999875



Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
```
202, 203, 199, 197, 195, 201, 200, 204, 194, 190
```
Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%? Найдите P-значение для данного теста и укажите его в качестве ответа.


In [2]:
import numpy as np
from scipy import stats
def statistic(samples: np.ndarray) -> float:
    return (samples.mean() - 200) / (samples.std(ddof=1) / np.sqrt(samples.shape[0]))

In [3]:
n = 10
arr = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
alpha = 0.01

In [4]:
S = statistic(arr)

In [5]:
t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)

print(t1 <= S <= t2)

True


In [6]:
p_left = stats.t.cdf(S, df=n - 1)
p_right = 1 - stats.t.cdf(S, df=n - 1)

pvalue = 2 * min(p_left, p_right)

print('P-value: ', pvalue)

P-value:  0.31456660352472854


__Задача 3__

Дана выборка диаметров подшипников из примера 1 с занятия 5:
```
samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02  ]
```
Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна `0.0625` при уровне значимости `alpha = 0.05`. Что для этого нужно знать:
1. Альтернативная гипотеза двухсторонняя.
2. Статистика для теста: `H = (n - 1) * sample_variance / variance`, где `n` - число элементов в выборке, `sample_variance` - несмещённая оценка дисперсии, `variance` - утверждаемая нулевой гипотезой дисперсия.
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром `df = n - 1`. Её квантили можно найти с помощью функции `scipy.stats.chi2.ppf`.

В качестве ответа запишите 1, если нулевая гипотеза верна, и 0 иначе.

In [7]:
samples = np.array([0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
                   1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
                   0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02])
alpha = 0.05

1) $H_0: \sigma = 0.0625, H_1: \sigma \in (-\infty, 0.0625) \cup (0.0625, +\infty)$  
2) Статистика для теста: `H = (n - 1) * sample_variance / variance`, где `n` - число элементов в выборке, `sample_variance` - несмещённая оценка дисперсии, `variance` - утверждаемая нулевой гипотезой дисперсия.  
3) `alpha = 0.05`  
4) Критическая область:

In [12]:
t1 = stats.chi2.ppf(alpha / 2, df=len(samples) - 1)
t2 = stats.chi2.ppf(1 - alpha / 2, df=len(samples) - 1)
[t1, t2]

[11.688551922452438, 38.0756272503558]

5) Статистический тест:

In [15]:
H = (len(samples) - 1) * samples.std(ddof=1) / np.sqrt(samples.shape[0]) / 0.0625
print(t1 <= H <= t2)

True
