In [1]:
import numpy as np
from scipy import stats

**Задача 1**

Известно, что генеральная совокупность распределена нормально с известным средним квадратическим отклонением 16. Найти доверительный интервал для оценки математического ожидания mu с надёжностью 0.95, если выборочное среднее равно 80, а объём равен 256.

In [2]:
# Найдем необходимые квантили для вычисления доверительного интервала.

alpha = 0.05
stats.norm.ppf(1-alpha/2)

1.959963984540054

In [3]:
# Тогда доверительный интервал:

left = 80 - 1.96 * (16 / pow(256, 0.5))
right = 80 + 1.96 * (16 / pow(256, 0.5))

left, right

(78.04, 81.96)

**Задача 2**

Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет:

202, 203, 199, 197, 195, 201, 200, 204, 194, 190

Известно, что их веса распределены нормально.
1. Верно ли утверждение продавца, если учитывать, что уровень значимости равен 1%?
2. Найдите P-значение для данного теста.

In [4]:
def t_statistic(x, M, n, sigma_x):
    return (x - M) / (sigma_x / np.math.sqrt(n))

In [5]:
M = 200
n = 10
alpha = 0.01
sample = np.array((202, 203, 199, 197, 195, 201, 200, 204, 194, 190))
x = sample.mean()
sigma_x = sample.std(ddof=1)

In [6]:
# Вычислим t-статистику

S_t = t_statistic(x, M, n, sigma_x)

S_t

-1.0651074037450896

In [7]:
# Вычислим критическую область

t1 = stats.t.ppf(alpha / 2, df=n-1)
t2 = stats.t.ppf(1 - alpha / 2, df=n-1)

print(f"(-inf;{t1}),({t2};+inf)")

(-inf;-3.24983554401537),(3.2498355440153697;+inf)


In [8]:
# Вычисляемая статистика не попала в критическую область,
# значит наша нулевая гипотеза верна при нашем уровне значимости 0.001

In [9]:
# Вычислим P-значение, для двусторнней области:

p_left = stats.t.cdf(S_t, df=n - 1)
p_right = 1 - stats.t.cdf(S_t, df=n - 1)
pvalue = 2 * min(p_left, p_right)

pvalue

0.31456660352472854

**Задача 3**

Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя уровень значимости 0.025 и правостороннюю критическую область, проверить данную гипотезу при условии, что в выборке из 100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 мм.

В качестве нулевой гипотезы $H_0$ берётся гипотеза о том, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм.

$$Z = \dfrac{\overline{X} - \mu}{\sigma / \sqrt{n}}$$

In [10]:
alpha = 0.025
t = stats.norm.ppf(1 - alpha / 2)

t

2.241402727604947

Критическая область:$$\Omega_\alpha = (2.24, \infty)$$

In [11]:
Z = (17.5 - 17) / (np.sqrt(4) / np.sqrt(100))
Z

2.5

In [12]:
# Значение попало в критическую область, следовательно,
# нулевая гипотеза отвергается