In [6]:
# Предположим, мы хотим проверить нулевую гипотезу о том, что выборка распределена в соответствии со стандартной нормой. 
# Мы выбираем уровень достоверности 95%; то есть мы отклоним нулевую гипотезу в пользу альтернативы, если p-значение меньше 0,05.
# При проверке равномерно распределенных данных мы ожидаем, что нулевая гипотеза будет отвергнута.

import numpy as np
from scipy import stats
rng = np.random.default_rng()
stats.kstest(stats.uniform.rvs(size=100, random_state=rng),stats.norm.cdf)

KstestResult(statistic=0.5012229900953932, pvalue=9.172156938247408e-24, statistic_location=0.0030655863543372908, statistic_sign=-1)

In [8]:
# Если, p-value ниже  порога 0.05, то мы отклоняем нулевую гипотезу в пользу альтернативы по умолчанию: 
# данные не распределяются в соответствии со стандартной нормой.
# При тестировании случайных отклонений от стандартного нормального распределения мы ожидаем, что данные в большинстве случаев 
# будут соответствовать нулевой гипотезе.
x = stats.norm.rvs(size=100, random_state=rng)
stats.kstest(x, stats.norm.cdf)

KstestResult(statistic=0.058152605651525524, pvalue=0.8680334869758003, statistic_location=-0.49062063536384304, statistic_sign=1)

In [10]:
# Как и ожидалось, p-value не ниже нашего порога 0.05, поэтому мы не можем отвергнуть нулевую гипотезу.
# Предположим, однако, что случайные величины распределены в соответствии с нормальным распределением, 
# сдвинутым в сторону больших значений. В этом случае кумулятивная функция плотности (CDF) базового распределения 
# имеет тенденцию быть меньше, чем CDF стандартного нормального распределения. 
# Следовательно, мы ожидаем, что нулевая гипотеза будет отклонена
x = stats.norm.rvs(size=100, loc=0.5, random_state=rng)
stats.kstest(x, stats.norm.cdf, alternative='less')

KstestResult(statistic=0.2971246854128803, pvalue=1.2690020512986598e-08, statistic_location=0.7625184611059994, statistic_sign=-1)

In [11]:
stats.kstest(x, "norm", alternative='less')

KstestResult(statistic=0.2971246854128803, pvalue=1.2690020512986598e-08, statistic_location=0.7625184611059994, statistic_sign=-1)

In [12]:
sample1 = stats.laplace.rvs(size=105, random_state=rng)
sample2 = stats.laplace.rvs(size=95, random_state=rng)
stats.kstest(sample1, sample2)

KstestResult(statistic=0.11979949874686717, pvalue=0.4284604237891626, statistic_location=-0.5347645799650641, statistic_sign=1)