## Задание 1
Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением, равным 16.
Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

Для доверительной вероятности $\beta=0.95$ вычислим $\alpha =1-\beta=1-0.95=0.05$

[В таблице нормального распределения](https://www.medcalc.org/manual/values-of-the-normal-distribution.php) находим квантиль уровня $1-\frac{\alpha }{2}=0.975, z_{\alpha } = 1.96$

Теперь можем найти точность $\triangle =\frac{\sigma  z_{\alpha }}{\sqrt{n}}=\frac{16}{16}\cdot 1.96=1.96$

Доверительный интервал для среднего с известной дисперсией имеет вид $\left(\bar{X}-\frac{\sigma  z_{\alpha }}{\sqrt{n}};\bar{X}+\frac{\sigma  z_{\alpha }}{\sqrt{n}}\right)$

Искомый 95%-доверительный интервал имеет вид
$(80 - 1.96; 80 + 1.96)$

Ответ: $(78.04; 81.96)$

In [13]:
from numpy import sqrt
from scipy import stats

p = 0.95
mean = 80
std = 16
n = 256

se = std / sqrt(n)
alpha = (1 - p) / 2
z_alpha = stats.norm().isf(alpha)
c_i = mean - z_alpha * se, mean + z_alpha * se
print('[%.2f; %.2f]' % c_i)

[78.04; 81.96]


## Задание 2
В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные:
6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1
Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

In [76]:
import numpy as np

data = [6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1]

n = len(data)
mean = np.array(data).mean()
s = np.var(data, ddof=1)
sd = np.std(data, ddof=1)

print('Исходная выборка:', data)
print('Объем выборки:', n)
print('Среднее:', mean)
print('Дисперсия выборки:', s)
print('Среднеквадратическое отклонение выборки', sd)

Исходная выборка: [6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1]
Объем выборки: 10
Среднее: 6.590000000000001
Дисперсия выборки: 0.2032222222222223
Среднеквадратическое отклонение выборки 0.4508017549014448


Среднее значение равно $\bar{X}=6.59$, а выборочная дисперсия $D = 0.203(2)$

Так как неизвестна дисперсия генеральной совокупности и $n < 30$, поэтому
точность интервальной оценки $\triangle =\frac{D t_{\alpha }}{\sqrt{n}}$

По таблице распределения Стьюдента находим $1-\frac{\alpha }{2}=0.975$ и, так как у нас $n − 1 = 10 − 1 = 9$ степеней свободы, определяем квантиль $t_{\alpha } = 2.262$

Теперь можем найти точность $\triangle =\frac{\sqrt{D} t_{\alpha }}{\sqrt{n}} = \frac{\sqrt{0.20322} \cdot 2.262}{\sqrt{10}} \approx 0.3225$

Искомый 95%-доверительный интервал имеет вид $(6.59−0.3225; 6.59+0.3225) = (6.2675; 6.9125)$

Ответ: $(6.2675; 6.9125)$

In [54]:
print(stats.t.ppf(0.025, n - 1))
print(stats.t.ppf(0.975, n - 1))

-2.262157162740992
2.2621571627409915


In [55]:
df = n - 1
p = 0.95
alpha = 1 - p
# стандартная ошибка
se = sd / n ** 0.5

# функция считает один конец, а нам нужно два, поэтому делим на два
t_value = stats.t(df).ppf(1 - alpha / 2)

# доверительный интервал
c_i = (mean - t_value * se, mean + t_value * se)
print('[%.4f; %.4f]' % c_i)

[6.2675; 6.9125]


## Задание 3
Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм.
Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр
оказался равным 17.5 мм, а дисперсия известна и равна 4 кв. мм.

Использование доверительных интервалов часто считается альтернативным способом проверки гипотез. В нашем случае, если оценочное среднее значение генеральной совокупности 17 не попадает в 95% доверительный интервал, рассчитанный на основе выборочных данных, у нас будет достаточно оснований отклонить нулевую гипотезу.

In [74]:
mean = 17.5
df = n - 1
alpha = 0.05
se = sd / n ** 0.5

t_value = stats.t.ppf(1 - alpha / 2, df)

c_i = (mean - t_value * se, mean + t_value * se)
print('[%.4f; %.4f]' % c_i)

[17.1032; 17.8968]


Ответ: 17 мм находится за пределами доверительного интервала, мы отвергаем нулевую гипотезу.

## Задание 4
Продавец утверждает, что средний вес пачки печенья составляет 200 г.
Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190.
Известно, что их веса распределены нормально.
Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%?

In [78]:
data = [202, 203, 199, 197, 195, 201, 200, 204, 194, 190]

n = len(data)
mean = np.array(data).mean()
s = np.var(data, ddof=1)
sd = np.std(data, ddof=1)

df = n - 1
p = 0.99
alpha = 1 - p
se = sd / n ** 0.5

t_value = stats.t.ppf(1 - alpha / 2, df)

c_i = (mean - t_value * se, mean + t_value * se)
print('[%.4f; %.4f]' % c_i)

[193.9232; 203.0768]


Ответ: Эксперимент показал, что значение заявленного среднего веса в 200 г находится в пределах доверительного интервала, поэтому можно сделать вывод, что нулевая гипотеза верна.