#### Задача 1
Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя уровень значимости 0.025 и правостороннюю критическую область, проверить данную гипотезу при условии, что в выборке из 100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 мм.
#### Решение

In [28]:
import numpy as np
from scipy import stats

In [29]:
n = 100
Dx = 4 #дисперсия -- это квадрат среднего квадратического отклонения (d)
d = 4**0.5
samples = np.random.normal(17.5, d, size=n)

print(samples)

[15.23610451 17.27584122 14.15167873 17.83541993 17.27441985 17.23061775
 15.08083874 16.62599466 20.56833783 13.63450877 17.12448243 18.24480355
 15.89465416 16.59685703 19.54195388 18.10431284 14.78752026 15.39213839
 15.66939466 19.60879329 17.64216988 17.00469835 16.89633172 16.94706889
 19.25375138 16.43917074 20.60692861 15.65448388 15.98578514 18.01493652
 18.02825363 18.15913624 19.5700472  15.75676572 17.00999008 21.57555745
 13.60990938 17.99075717 16.8249635  19.3471415  16.51192455 17.59572662
 18.52944304 18.21253867 15.74567506 18.75202035 22.33815336 17.31064319
 17.0583757  18.63365579 19.95593257 16.31993299 16.58126381 17.09143801
 18.31092456 17.51694125 15.63761918 18.57347352 18.09795445 19.6363511
 21.82898028 13.08920464 17.66344776 17.62055921 18.68710278 18.68616351
 20.02320032 18.16510968 14.13077363 17.1979866  19.10905642 14.98636506
 12.44197611 18.22901315 17.03251512 18.23039743 18.3096329  19.47236016
 18.05961499 15.82940065 19.8495435  18.90514738 20.

Поскольку мы проверяем гипотезу относительно математического ожидания нормально распределённой случайной величины с известной дисперсией, будем использовать статистику
$$T(X) = \dfrac{\overline{X} - a}{\sigma / \sqrt{n}}$$
При условии верности гипотезы $H_0$, статистика $T$ имеет стандартное нормальное распределение.

В нашем случае статистика имеет вид:
$$T(X) = \dfrac{\overline{X} - 17}{2 / 10} = \dfrac{10 \cdot (\overline{X} - 17)}{2}.$$

Теперь нужно задать уровень значимости $\alpha$. Возьмём $\alpha = 0.025$.

* Правосторонняя область: $\Omega_\alpha = (t_{1 - \alpha}, \infty)$.

In [30]:
alpha = 0.025

t = stats.norm.ppf(1 - alpha)

print(f"({t}, +inf)")

(1.959963984540054, +inf)


Проводим статистический тест: берём нашу выборку `samples` и вычисляем от неё значение статистики $T$.

Если это значение попало в критическую область, то гипотеза $H_0$ отвергается в пользу гипотезы $H_1$. Если же это значение не попадает в критическую область, то гипотеза $H_0$ остаётся в силе.

In [31]:
#на самом деле здесь можно было не считать mean по сгенерированной нами выборке, а взять значение из условия = 17.5
mean = samples.mean()
mean

17.435754118199263

__комментарий преподавателя к утверждению выше:__ Всё отлично) Разве что не совсем корректно использовать в первой задаче выборочное среднее по сгенерированной выборке) Как вы написали, этого как бы делать "не обязательно", потому что нам уже дано выборочное среднее) Тут не совсем так, его не то чтобы "не обязательно" использовать, его нельзя использовать) У вас уже есть вся информация об исходе эксперимента) Так что генерировать новый не надо, это будет уже другой эксперимент) Вполне можно сгенерировать, например, выборку из нормального распределения с мат. ожиданием 17.5, тк , что выборочное среднее по выборке будет 17)

In [32]:
T = 10 * (mean - 17)/2
T

2.178770590996315

Значение статистики T попало в критическую область, поэтому гипотезу, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм, отвергаем.

#### Задача 2
Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти доверительный интервал для оценки математического ожидания a с надёжностью 0.95, если выборочное среднее равно 80, а объём равен 256.
#### Решение

Если рассматриваемая случайная величина имеет нормальное распределение, то доверительный интервал для математического ожидания можно построить с помощью квантилей стандартного распределения (если дисперсия известна)

$$T(X) = \dfrac{\overline{X} - a}{\sigma / \sqrt{n}},$$
где $\sigma$ — известный параметр среднего квадратического отклонения. Статистика $T$ имеет стандартное распределение. Допустим, нас интересует симметричный доверительный интервал с уровнем доверия $p = 1 - \alpha$. Тогда доверительный интервал для $T$ можно получить с помощью соответствующих квантилей:
$$P(- t_{1 - \alpha / 2} \leq T \leq t_{1 - \alpha / 2}) = p.$$

Преобразуем выражения в скобках и получим доверительный интервал для параметра $a$:
$$
P \left(
    \overline{X} - t_{1 - \alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}}
    \leq a \leq 
    \overline{X} + t_{1 - \alpha / 2} \cdot \dfrac{\sigma}{\sqrt{n}}
\right) = p.
$$

In [33]:
mean = 80
n = 256
p = 0.95
scale = 16
alpha = 1 - p

t = stats.norm.ppf(1 - alpha/2)
t

1.959963984540054

In [34]:
# Итак, доверительный интервал:
(mean - t * scale / np.sqrt(n), mean + t * scale / np.sqrt(n))

(78.04003601545995, 81.95996398454005)

#### Задача 3
Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:
202, 203, 199, 197, 195, 201, 200, 204, 194, 190

Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?
#### Решение

In [35]:
weights = np.array([202, 203, 199, 197, 195, 201, 200, 204, 194, 190])
n = 10

mean = weights.mean()
std = weights.std(ddof=1)

mean, std

(198.5, 4.453463071962462)

Поскольку мы проверяем гипотезу относительно математического ожидания нормально распределённой случайной величины
с неизвестной дисперсией, будем использовать статистику:
    $$T(X) = \dfrac{\overline{X} - a}{\sigma_X / \sqrt{n}},$$

где $\sigma_X$ --  несмещённая оценка среднего квадратического отклонения.

В предположении вероности гипотезы $H_0$ такая статистика имеет __распределение Стьюдента__ или __t-распределение__ с параметром $df = n - 1$.

При условии верности гипотезы $H_0$, статистика $T$ имеет стандартное нормальное распределение.

В нашем случае статистика имеет вид:
$$T(X) = \dfrac{\overline{X} - 200}{std / \sqrt{10}} = \dfrac{\sqrt{10} \cdot (\overline{X} - 200)}{std}.$$

In [36]:
T = (mean-200)/(std/np.sqrt(n))
T

-1.0651074037450896

In [37]:
#найдем критическую область
alpha = 0.01

t1 = stats.t.ppf(alpha / 2, df=n - 1)
t2 = stats.t.ppf(1 - alpha / 2, df=n - 1)

t1, t2

(-3.24983554401537, 3.2498355440153697)

$$\Omega_\alpha = (-\infty, -3.249835) \cup (3.249835, \infty).$$

Значение T не попадает в критическую область, таким образом, утверждение продавца остается в силе.