In [97]:
import numpy as np
from scipy import stats

### Задача 1

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти доверительный интервал для оценки математического ожидания mu с надёжностью 0.95, если выборочное среднее равно 80, а объём равен 256

In [98]:
std = 16
mean = 80
n = 256
p = 0.95
alpha = 1 - p

$$Z = \dfrac{\overline{X} - \mu}{\sigma / \sqrt{n}}$$

 $$P \left( \overline{X} + t_{\alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \leq \mu \leq \overline{X} + t_{1 - \alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}} \right) = p$$

In [99]:
t1 = stats.norm.ppf(alpha / 2)
t2 = stats.norm.ppf(1 - alpha / 2)

t1, t2

(-1.959963984540054, 1.959963984540054)

In [100]:
(mean + t1 * std / np.sqrt(n), mean + t2 * std / np.sqrt(n))

(78.04003601545995, 81.95996398454005)

### Задача 2

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:

202, 203, 199, 197, 195, 201, 200, 204, 194, 190

Известно, что их веса распределены нормально.
1. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?
2. Найдите P-значение для данного теста.

In [101]:
# H0: mu = 200
# H1: mu != 200
mu = 200
samples = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = samples.shape[0]
mean = samples.mean()
sigma = np.sqrt(((samples - mean)**2).sum()/(n-1))
sigma

4.453463071962462

#### 1. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?

In [102]:
def statistic(samples):
    return (samples.mean() - mu) / (samples.std(ddof=1) / np.sqrt(samples.shape[0]))

In [103]:
# по условию задачи
alpha = 0.01

t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(-3.24983554401537, 3.2498355440153697)

In [104]:
t = statistic(samples)
t

-1.0651074037450896

#### Значение статистики не попадает в критическую область, нулевую гипотезу можно принять

#### 2. Найдите P-значение для данного теста.

In [105]:
p_left = stats.t.cdf(t, df=n -1)
p_right = 1 - stats.t.cdf(t, df=n - 1)
pvalue = 2 * min(p_left, p_right)
pvalue

0.31456660352472854

In [106]:
alpha < pvalue

True

### Задача 3

Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя уровень значимости 0.025 и правостороннюю критическую область, проверить данную гипотезу при условии, что в выборке из 100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 мм.

In [154]:
# H0: mu = 17 при alpha = 0.025
# H1: mu > 17 alpha = 0.025

In [152]:
mu = 17
alpha = 0.025
n = 100
mean = 17.5
D = 4
#sigma = np.sqrt(D/n)
sigma = np.sqrt(D)

$$Z = \dfrac{\overline{X} - \mu}{\sigma / \sqrt{n}},$$

 $$P \left( \mu \leq \overline{X} + t_{1 - \alpha} \cdot \dfrac{\sigma}{\sqrt{n}} \right) = p$$

Правосторонняя критическая область лежит правее точки: $\Omega_\alpha = (t_{1 - \alpha}, \infty)$.

In [163]:
t2 = stats.norm.ppf(1 - alpha)

t2

1.959963984540054

In [161]:
mean + t2 * sigma / np.sqrt(n)

17.89199279690801

In [162]:
mu <= mean + t2 * sigma / np.sqrt(n)

True

#### Нулевая гипотеза верна

### Задача 4 (Дополнительно)

Дана выборка диаметров подшипников из примера 1 с занятия 5:

samples = [0.6603, 0.9466, 0.5968, 1.3792, 1.5481, 0.7515, 1.0681, 1.1134,
1.2088, 1.701 , 1.0282, 1.3579, 1.0191, 1.1784, 1.1168, 1.1372,
0.7273, 1.3958, 0.8665, 1.5112, 1.161 , 1.0232, 1.0865, 1.02 ]

Предполагая, что диаметры подшипников распределены нормально, проверьте гипотезу о том, что дисперсия случайной величины равна 0.0625 при уровне значимости alpha = 0.05. Что для этого нужно знать:
1. Альтернативная гипотеза двухсторонняя.
2. Статистика для теста: H = (n - 1) * sample_variance / variance, где n - число элементов в выборке, sample_variance - несмещённая оценка дисперсии, variance - утверждаемая нулевой гипотезой дисперсия.
3. Эта статистика в предположении верности нулевой гипотезы имеет распределение хи-квадрат с параметром df = n - 1. Её квантили можно найти с помощью функции scipy.stats.chi2.ppf.

