__Задача 1__

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти ширину доверительного интервала для оценки математического ожидания $\mu$ с надёжностью 0.95, если выборочное среднее равно 80, а объём выборки равен 256.

In [37]:
import pandas as pd
import numpy as np
from math import sqrt
from scipy import stats
from scipy.stats import norm, t

$\delta = \frac{t_\lambda * \sigma}{\sqrt{n}}$

In [38]:
sigma, lambda_, M, n = 16, 0.95, 80, 256
t_lambda_ = norm.ppf(lambda_/2 + 0.5)
delta = t_lambda_ * sigma / sqrt(n)
print(f'Доверительный интервал: [{round(M-delta, 4)}, {round(M+delta, 4)}]')
print(f'Ширина доверительного интервала:',(round(M+delta, 4) - round(M-delta, 4)))

Доверительный интервал: [78.04, 81.96]
Ширина доверительного интервала: 3.9199999999999875


__Задача 2__

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
```202, 203, 199, 197, 195, 201, 200, 204, 194, 190```\
Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%? Найдите P-значение для данного теста и укажите его в качестве ответа.


__Решение:__\
Нулевая гипотеза - продавец прав, $\mu=\mu_{0}$\
Альтернативная гипотеза - продавец не прав, $\mu \neq \mu_{0}$

In [39]:
data = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
mu0=200; n=10; t = 3.25
mu = data.mean()
s = np.sqrt(data.var(ddof=1))
v = ((mu - mu0)*np.sqrt(n))/s
print('Гипотеза H_0 верна - средний вес пачки составляет 200г' if -t < v < t else 'Гипотеза H_0 не верна.')
p = 2 * min(stats.t.cdf(v, df=data.shape[0] - 1), 1 - stats.t.cdf(v, df=data.shape[0] - 1))
print(f'P-значение: ',p)

Гипотеза H_0 верна - средний вес пачки составляет 200г
P-значение:  0.31456660352472854


In [40]:
# Проверка
stats.ttest_1samp(sample, popmean=200)

Ttest_1sampResult(statistic=-1.0651074037450896, pvalue=0.31456660352472854)

__Задача 3__

Дана выборка диаметров подшипников из примера 1 с занятия 5:
```
samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02  ]
```
Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна `0.0625` при уровне значимости `alpha = 0.05`. Что для этого нужно знать:
1. Альтернативная гипотеза двухсторонняя.
2. Статистика для теста: `H = (n - 1) * sample_variance / variance`, где `n` - число элементов в выборке, `sample_variance` - несмещённая оценка дисперсии, `variance` - утверждаемая нулевой гипотезой дисперсия.
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром `df = n - 1`. Её квантили можно найти с помощью функции `scipy.stats.chi2.ppf`.

В качестве ответа запишите 1, если нулевая гипотеза верна, и 0 иначе.

In [61]:
samples = np.array([0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02 ])
var = 0.0625
n = samples.shape[0]
sample_variance = samples.var(ddof=1)

Cтатистика $H$ для нашей выборки:

In [62]:
H = (n - 1) * sample_variance / var
H

28.720541753333343

Границы критической области $\Omega_\alpha$ согласно уровню значимости $\alpha = 0.05$:

In [64]:
alpha = 0.05

t1 = stats.chi2.ppf(alpha / 2, df=n-1)
t2 = stats.chi2.ppf(1 - alpha / 2, df=n-1)

t1, t2

(11.688551922452438, 38.0756272503558)

Т.к. t1 <= H <= t2 , то гипотеза верна!

Ответ: 1. 