__Задача 1__

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти ширину доверительного интервала для оценки математического ожидания `mu` с надёжностью 0.95, если выборочное среднее равно 80, а объём выборки равен 256.


In [165]:
from scipy import stats
import numpy as np

In [166]:
sigma = 16
p = 0.95
X_ = 80
n = 256

alpha = 1 - p

Доверительный интервал с известной дисперсией
$$P \left( \overline{X} + t_{\alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \leq \mu \leq \overline{X} + t_{1 - \alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \right) = p$$

In [167]:
t1 = stats.norm.ppf(alpha / 2)
t2 = stats.norm.ppf(1 - alpha / 2)

t1, t2

(-1.959963984540054, 1.959963984540054)

In [168]:
left = X_ + t1 * sigma / np.sqrt(n)
right = X_ + t2 * sigma / np.sqrt(n)
left, right

(78.04003601545995, 81.95996398454005)

In [169]:
print(f'Ширина мат ожидания mu = {(right-left):.8f}')

Ширина мат ожидания mu = 3.91992797


__Задача 2__

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
```
202, 203, 199, 197, 195, 201, 200, 204, 194, 190
```
Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%? Найдите P-значение для данного теста и укажите его в качестве ответа.

In [170]:
X_test = 200
wieght_list = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = len(wieght_list)
mean = wieght_list.mean()
std = wieght_list.std()
alpha = 0.01
n, mean, std

(10, 198.5, 4.224926034855522)

In [171]:
def statistic(samples: np.ndarray, test_value: float) -> float:
    return (samples.mean() - test_value) / (samples.std(ddof=1) / np.sqrt(samples.shape[0]))

In [172]:
S = statistic(wieght_list, X_test)
S

-1.0651074037450896

In [173]:
t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(-3.24983554401537, 3.2498355440153697)

In [174]:
if S < t1 or S > t2:
    print("Утверждение кондитера не верно.")
else:
    print("Утверждение кондитера верно. Средний вес пачки печенья = 200гр.")

Утверждение кондитера верно. Средний вес пачки печенья = 200гр.


In [175]:
p_left = stats.t.cdf(S, df=n - 1)
p_right = 1 - stats.t.cdf(S, df=n - 1)

pvalue = 2 * min(p_left, p_right)
pvalue

0.31456660352472854

__Задача 3__

Дана выборка диаметров подшипников из примера 1 с занятия 5:
```
samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02  ]
```
Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна `0.0625` при уровне значимости `alpha = 0.05`. Что для этого нужно знать:
1. Альтернативная гипотеза двухсторонняя.
2. Статистика для теста: `H = (n - 1) * sample_variance / variance`, где `n` - число элементов в выборке, `sample_variance` - несмещённая оценка дисперсии, `variance` - утверждаемая нулевой гипотезой дисперсия.
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром `df = n - 1`. Её квантили можно найти с помощью функции `scipy.stats.chi2.ppf`.

В качестве ответа запишите 1, если нулевая гипотеза верна, и 0 иначе.

In [176]:
samples = np.array([0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
           1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
           0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02  ])

alpha = 0.05

# H0 -> D_x = 0.0625

variance = 0.0625

n = samples.shape[0]
n

24

Формула несмещенной оценки дисперсии
$$ \hat{S}^2 = \frac{\sum_{i=1}^{n}(Xi - \overline{X})^2}{n-1} $$

In [177]:
sample_variance = np.sum((samples - samples.mean())**2)/(n-1)
sample_variance

0.07804495041666669

In [178]:
H = (n - 1) * sample_variance / variance
H

28.720541753333343

In [179]:
t1 = stats.chi2.ppf(alpha / 2, df=n-1)
t2 = stats.chi2.ppf(1 - alpha / 2, df=n-1)

t1, t2

(11.688551922452438, 38.0756272503558)

In [180]:
if H < t1 or H > t2:
    print("0")
else:
    print("1")

1
