# Задача


---

С помощью критерия Пирсона (хи-квадрат), проверить гипотезу, что случайная выборка, имеет экспоненциальное распределение с параметром $\lambda = 2.17$. Взять равномерную сетку из $10$ интервалов и уровень значимости $\epsilon = 0.05$.



---

# Теоретические положения



---

Гипотеза $H_0$ - выборка распределена по экспоненциальному закону. Гипотеза $H_1$ - выборка распределена не по экспоненциальному закону, а по какому-то иному закону:
$$
\begin{gathered}
H_0 \sim Exp(\lambda) \\
H_1 \neq  Exp(\lambda)
\end{gathered}
$$
Пусть $n_i$ - это частота попадания элемента из выборки в интервал $\Delta_i$. Пусть далее $p_i$ - это вероятность попадания элемента в интервал.

In [None]:
import math

In [None]:
'''
            Установка параметров
'''
lambda1 = 2.17
epsilon = 0.05
x = [0.17, 0.29, 0.86, 0.12, 3.06, 0.12, 0.41, 0.11, 0.71, 0.72, 1.01, 0.27, 0.11, 2.65, 0.16,
        0.64, 0.26, 0.77, 0.01, 0.62, 0.13, 0.45, 1.11, 1.28, 0.63, 0.11, 0.45, 0.26, 1.45, 0.04,
        0.08, 0.61, 0.52, 0.25, 0.02, 1.14, 1.38, 0.48, 0.3, 0.02, 0.1, 0.65, 0.3, 0.27, 0.03, 0.01,
        0.25, 0.46, 0.77, 0.62, 0.19, 1.36, 1.96, 0.03, 0.04, 0.49, 0.42, 0.5, 0.11, 0.09, 0.1, 0.75,
        0.09, 0.68, 0.45, 0.12, 0.09, 1.58, 0.27, 0.27, 0.62, 0.65, 0.75, 1.23, 0.36, 0.08, 0.24, 1.02,
        0.08, 0.59, 0.29, 0.54, 0.51, 0.47, 0.36, 0.54, 0.57, 0.01, 0.06, 0.0, 0.28, 0.1, 0.56, 0.23,0.45,
        0.17, 0.92, 0.29, 0.68, 2.21]

**1 шаг**: Найдем максимум и минимум в данной выборке

In [None]:
max_x = max(x)
min_x = min(x)
print(f"Максимум: {max_x}\nМинимум: {min_x}")

Максимум: 3.06
Минимум: 0.0


**2 шаг**: разобьём выборку на 10 непересекающихся частей

In [None]:
delta = (max_x - min_x) / 10
intervals_borders = [0]
border = 0
for i in range(10):
  border = border + delta
  intervals_borders.append(round(border,3))
print(f"Границы интервалов:\n{intervals_borders}")
x.sort()
j, border_counter = 0, 1
intervals = [[] for i in range (10)]
while (True):
  if (j == 100):
    break
  if (x[j] < intervals_borders[border_counter]):
    intervals[border_counter-1].append(x[j])
    j += 1
  elif (x[j] > intervals_borders[border_counter]):
    intervals[border_counter].append(x[j])
    j += 1
    border_counter +=  1

Границы интервалов:
[0, 0.306, 0.612, 0.918, 1.224, 1.53, 1.836, 2.142, 2.448, 2.754, 3.06]


In [None]:
print("Полученные интервалы:")
for i in range (len(intervals)):
  print(intervals[i])

Полученные интервалы:
[0.0, 0.01, 0.01, 0.01, 0.02, 0.02, 0.03, 0.03, 0.04, 0.04, 0.06, 0.08, 0.08, 0.08, 0.09, 0.09, 0.09, 0.1, 0.1, 0.1, 0.11, 0.11, 0.11, 0.11, 0.12, 0.12, 0.12, 0.13, 0.16, 0.17, 0.17, 0.19, 0.23, 0.24, 0.25, 0.25, 0.26, 0.26, 0.27, 0.27, 0.27, 0.27, 0.28, 0.29, 0.29, 0.29, 0.3, 0.3]
[0.36, 0.36, 0.41, 0.42, 0.45, 0.45, 0.45, 0.45, 0.46, 0.47, 0.48, 0.49, 0.5, 0.51, 0.52, 0.54, 0.54, 0.56, 0.57, 0.59, 0.61]
[0.62, 0.62, 0.62, 0.63, 0.64, 0.65, 0.65, 0.68, 0.68, 0.71, 0.72, 0.75, 0.75, 0.77, 0.77, 0.86]
[0.92, 1.01, 1.02, 1.11, 1.14]
[1.23, 1.28, 1.36, 1.38, 1.45]
[1.58]
[1.96]
[2.21]
[2.65]
[3.06]


**3 шаг**: Подсчитаем частоты $n_i$ и вероятности $p_i$.

Будем считать вероятности $p_i$ по следующему принципу:
$$
p_i = F(b) - F(a)
$$
где $b$ - верхняя граница интервала, $a$ - нижняя граница интервала, $F(a), F(b)$ - значения функции распределения экспоненциального закона. Перепишем формулу:
$$
p_i = F(b) - F(a) = (1-e^{-\lambda b}) - (1 - e^{-\lambda a}) = e^{-\lambda a} - e^{-\lambda b}
$$

In [None]:
freq = []
probabilty = []
for i in range (len(intervals)):
  temp_count = 0
  for j in range (len(intervals[i])):
    temp_count += 1
  freq.append(temp_count)
print(f"Частоты n_i:\n{freq}")
for i in range (len(intervals_borders)-1):
  temp_p = math.exp(-lambda1 * intervals_borders[i]) - math.exp(-lambda1 * intervals_borders[i+1])
  probabilty.append(round(temp_p,4))
print(f"Вероятности p_i:\n{probabilty}")

Частоты n_i:
[48, 21, 16, 5, 5, 1, 1, 1, 1, 1]
Вероятности p_i:
[0.4852, 0.2498, 0.1286, 0.0662, 0.0341, 0.0175, 0.009, 0.0046, 0.0024, 0.0012]


**4 шаг**: Посчитаем критерий $\chi^{2}$ по формуле:
$$
\chi^{2} = \sum_{i=1}^{10} \frac{(n_i-Np_i)^{2}}{Np_i}
$$
где N - объём выборки (в случае моей выборки 100), $n_i$ - частоты, $p_i$ - вероятности

In [None]:
chi_square = 0
for i in range (10):
  temp_frac1 = (freq[i] - 100 * probabilty[i])**2
  temp_frac2 = 100 * probabilty[i]
  chi_square = chi_square + ((temp_frac1) / (temp_frac2))
print(f"Посчитанный Хи-квадрат: {chi_square}")

Посчитанный Хи-квадрат: 12.370649731497975


Далее, вернемся к теории. Мы получили $\chi^{2}$ с $k-1$ степенями свободы и уровнем значимости $\varepsilon = 0.05$. Найдём по таблице хи-квадрат критическое значение:
$$
\chi^{2}_{0.05}(9) \approx 16.92
$$
Иными словами, наша исходная выборка будет распределена по экспоненциальному закону (принимается гипотеза $H_0$), если $\chi^{2}$ будет меньше критического значения.

In [None]:
if (chi_square < 16.92):
  print(f"Гипотеза H_0 принимается")
else:
  print("Гипотеза H_0 отклоняется")

Гипотеза H_0 принимается
