# Критерий Колмогорова

Критерий Колмогорова для простой гипотезы является наиболее простым критерием проверки гипотезы о виде закона распределения.
Он связывает эмперическую функцию распределения $F^{\ast}_{n}(x)$ с функцией распределения $F(x)$ непрерывной случайной величины *X*.

Выдвигается простая нулевая гипотеза: $F(x) = F_{0}(x), x \in \mathbb{R}$

Альнернативная гипотеза: $F(x) \neq F_{0}(x), x \in \mathbb{R}$

Сущность критерия Колмогорова состоит в том, что вводят в рассмотрение функцию:

$D_{n} = max_{-\infty < x < \infty} |F^{\ast}_{n}(x) - F_{0}(x)|$

называемой **статистикой Колмагорова**, представляющей собой максимальное отклонение эмперической ф-и распределения от гипотетической ф-и распределения.

Колмогоров доказал, что при $n \rightarrow \infty$ закон распределения случайной величины $\sqrt{n} \cdot D_{n}$ независимо от вида распределения случайной величины *X* стремится к *закону распределения Колмагорова*:

$P \{\sqrt{n} \cdot D_{n} < x\} \rightarrow K(x)$,

где $K(x)$ - ф-я распределения Колмагорова, для которой составлена таблица, ее можно использовать для расчетов уже при $n \geq 20$

Таблица:

In [1]:
import pandas as pd

K_x = pd.DataFrame({"alpha":[0.1, 0.05, 0.02, 0.01, 0.001], "x_0":[1.224, 1.358, 1.520, 1.627, 1.950]})

K_x

Unnamed: 0,alpha,x_0
0,0.1,1.224
1,0.05,1.358
2,0.02,1.52
3,0.01,1.627
4,0.001,1.95


Найдем $D_{0}$ такое, что $P(D_{n} > D_{0}) = \alpha$.

Рассмотрим уравнение $K(x) = 1 - \alpha$. С помощью ф-и Колмагорова найдем корень $x_{0}$ этого ур-я. Тогда по теореме Колмагорова, 

$P \{\sqrt{n} \cdot D_{n} < x_{0}\} = 1 - \alpha, P \{\sqrt{n} \cdot D_{n} > x_{0}\} = \alpha$, откуда $D_{0} = \dfrac{x_{0}}{\sqrt{n}}$

Если $D_{n} < D_{0}$, то нулевую гипотезу нет оснований отвергать, в противном случае ее отвергают.

## Задание

Монету бросали 4040 раз (Бюффон). Получили $n_{1} = 2048$ выпадение герба и $n_{2} = 1992$ выпадений решки. Проверить согласуются ли эти данные с нулевой гипотезой о симметричности монеты ($\alpha = 0.05$).

In [2]:
n = 4040
n_1 = 2048
n_2 = 1992
alpha = 0.05

## Решение

Случайная величина *X* принимает два значения:

- $x_{1} = -1$ (решка)
- $x_{2} = 1$ (герб)

Нулевая гипотеза: $P \{ x = -1 \} = P \{ x = 1 \} = \dfrac{1}{2}$

По таблице Колмагорова находим корень ур-я $K(x) = 1 - \alpha$

In [14]:
x_0 = K_x.x_0[K_x.alpha == alpha][1]
x_0

1.358

In [15]:
import math

D_0 = x_0 / math.sqrt(n) 
D_0

0.02136530452916041

Для нахождения по выборке $D_{n}$ строим ф-и $F_{0}(x)$ и $F^{\ast}_{n}(x)$ и вычисляем величину $D_{n} = max_{x} |F^{\ast}_{n}(x) - F_{0}(x)|$

In [19]:
F_0 = pd.DataFrame({"x_i":[1, -1], "p_i":[0.5, 0.5]})
F_0


Unnamed: 0,x_i,p_i
0,1,0.5
1,-1,0.5


In [20]:
F_n = pd.DataFrame({"x_i":[1, -1],"n_i":[n_1, n_2]})
F_n["p_*_i"] = F_n.n_i / n
F_n

Unnamed: 0,x_i,n_i,p_*_i
0,1,2048,0.506931
1,-1,1992,0.493069


In [31]:
D_n = abs(F_0.p_i - F_n['p_*_i']).max().round(3)
D_n

0.007

In [32]:
D_n < D_0

True

## Вывод:

Нет оснований отвергать нулевую гипотезу