1. Normality Tests
  1. Shapiro-Wilk Test
  2. D’Agostino’s K^2 Test
  3. Anderson-Darling Test
2. Correlation Tests
  1. Pearson’s Correlation Coefficient
  2. Spearman’s Rank Correlation
  3. Kendall’s Rank Correlation
  4. Chi-Squared Test
3. Stationary Tests
  1. Augmented Dickey-Fuller
  2. Kwiatkowski-Phillips-Schmidt-Shin
4. Parametric Statistical Hypothesis Tests
  1. Student’s t-test
  2. Paired Student’s t-test
  3. Analysis of Variance Test (ANOVA)
  4. Repeated Measures ANOVA Test
5. Nonparametric Statistical Hypothesis Tests
  1. Mann-Whitney U Test
  2. Wilcoxon Signed-Rank Test
  3. Kruskal-Wallis H Test
  4. Friedman Test


## 1. Normality Tests

This section lists statistical tests that you can use to check if your data has a Gaussian distribution. _(В этом разделе перечислены статистические тесты, которые вы можете использовать, чтобы проверить, имеют ли ваши данные распределение Гаусса.)_

### Shapiro-Wilk Test
Tests whether a data sample has a Gaussian distribution. _(Проверяет, имеет ли выборка данных распределение Гаусса.)_

Assumptions _(Предположения)_
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_

Interpretation _(Интерпретация)_
- H0: the sample has a Gaussian distribution. _(образец имеет гауссово распределение.)_
- H1: the sample does not have a Gaussian distribution. _(образец не имеет гауссовского распределения.)_

In [1]:
# Example of the Shapiro-Wilk Normality Test
from scipy.stats import shapiro

data = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
stat, p = shapiro(data)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably Gaussian') # Вероятно гауссов
else:
	print('Probably not Gaussian') # Вероятно, не гауссов

stat=0.895, p=0.193
Probably Gaussian


More Information

- [A Gentle Introduction to Normality Tests in Python](https://machinelearningmastery.com/a-gentle-introduction-to-normality-tests-in-python/)
- [scipy.stats.shapiro](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html)
- [Shapiro-Wilk test on Wikipedia](https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test)

### D’Agostino’s K^2 Test
Tests whether a data sample has a Gaussian distribution. _(Проверяет, имеет ли выборка данных распределение Гаусса.)_

Assumptions _(Предположения)_
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_

Interpretation _(Интерпретация)_
- H0: the sample has a Gaussian distribution. _(образец имеет гауссово распределение.)_
- H1: the sample does not have a Gaussian distribution. _(образец не имеет гауссовского распределения.)_

In [4]:
# Example of the D'Agostino's K^2 Normality Test
from scipy.stats import normaltest

data = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
stat, p = normaltest(data)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably Gaussian')
else:
	print('Probably not Gaussian')

stat=3.392, p=0.183
Probably Gaussian


  "anyway, n=%i" % int(n))


More Information
- [A Gentle Introduction to Normality Tests in Python](https://machinelearningmastery.com/a-gentle-introduction-to-normality-tests-in-python/)
- [scipy.stats.normaltest](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html)
- [D’Agostino’s K-squared test on Wikipedia](https://en.wikipedia.org/wiki/D%27Agostino%27s_K-squared_test)

### Anderson-Darling Test
Tests whether a data sample has a Gaussian distribution. _(Проверяет, имеет ли выборка данных распределение Гаусса.)_

Assumptions _(Предположения)_
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_

Interpretation _(Интерпретация)_
- H0: the sample has a Gaussian distribution. _(образец имеет гауссово распределение.)_
- H1: the sample does not have a Gaussian distribution. _(образец не имеет гауссовского распределения.)_

In [5]:
# Example of the Anderson-Darling Normality Test
from scipy.stats import anderson

data = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
result = anderson(data)
print('stat=%.3f' % (result.statistic))

for i in range(len(result.critical_values)):
	sl, cv = result.significance_level[i], result.critical_values[i]
	if result.statistic < cv:
		print('Probably Gaussian at the %.1f%% level' % (sl)) # Вероятно, гауссовский на уровне n%
	else:
		print('Probably not Gaussian at the %.1f%% level' % (sl)) # Вероятно, не гауссовский на уровне n%

stat=0.424
Probably Gaussian at the 15.0% level
Probably Gaussian at the 10.0% level
Probably Gaussian at the 5.0% level
Probably Gaussian at the 2.5% level
Probably Gaussian at the 1.0% level


More Information
- [A Gentle Introduction to Normality Tests in Python](https://machinelearningmastery.com/a-gentle-introduction-to-normality-tests-in-python/)
- [scipy.stats.anderson](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.anderson.html)
- [Anderson-Darling test on Wikipedia](https://en.wikipedia.org/wiki/Anderson%E2%80%93Darling_test)

## 2. Correlation Tests
This section lists statistical tests that you can use to check if two samples are related. _(В этом разделе перечислены статистические тесты, которые вы можете использовать, чтобы проверить, связаны ли две выборки.)_

### Pearson’s Correlation Coefficient
Tests whether two samples have a linear relationship. _(Проверяет, имеют ли два образца линейную зависимость.)_

Assumptions _(Предположения)_
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample are normally distributed. _(Наблюдения в каждом образце обычно распределяются.)_
- Observations in each sample have the same variance. _(Наблюдения в каждом образце имеют одинаковую дисперсию.)_

Interpretation
- H0: the two samples are independent. _(Два образца независимы.)_
- H1: there is a dependency between the samples. _(Существует зависимость между образцами.)_

In [6]:
# Example of the Pearson's Correlation test
from scipy.stats import pearsonr

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [0.353, 3.517, 0.125, -7.545, -0.555, -1.536, 3.350, -1.578, -3.537, -1.579]
stat, p = pearsonr(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably independent') # Возможно независимый
else:
	print('Probably dependent') # Возможно зависимый

stat=0.688, p=0.028
Probably dependent


More Information
- [How to Calculate Correlation Between Variables in Python](https://machinelearningmastery.com/how-to-use-correlation-to-understand-the-relationship-between-variables/)
- [scipy.stats.pearsonr](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html)
- [Pearson’s correlation coefficient on Wikipedia](https://en.wikipedia.org/wiki/Pearson_correlation_coefficient)

### Spearman’s Rank Correlation
Tests whether two samples have a monotonic relationship. _(Проверяет, имеют ли два образца монотонное отношение.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.)_

Interpretation
- H0: the two samples are independent. _(два образца независимы.)_
- H1: there is a dependency between the samples. _(Существует зависимость между образцами.)_

In [7]:
# Example of the Spearman's Rank Correlation Test
from scipy.stats import spearmanr

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [0.353, 3.517, 0.125, -7.545, -0.555, -1.536, 3.350, -1.578, -3.537, -1.579]
stat, p = spearmanr(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably independent') # Возможно независимый
else:
	print('Probably dependent') # Возможно зависимый

stat=0.855, p=0.002
Probably dependent


More Information
- [How to Calculate Nonparametric Rank Correlation in Python](https://machinelearningmastery.com/how-to-calculate-nonparametric-rank-correlation-in-python/)
- [scipy.stats.spearmanr](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.spearmanr.html)
- [Spearman’s rank correlation coefficient on Wikipedia](https://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coefficient)

### Kendall’s Rank Correlation
Tests whether two samples have a monotonic relationship. _(Проверяет, имеют ли два образца монотонное отношение.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.)_

Interpretation
- H0: the two samples are independent. _(два образца независимы.)_
- H1: there is a dependency between the samples. _(Существует зависимость между образцами.)_

In [8]:
# Example of the Kendall's Rank Correlation Test
from scipy.stats import kendalltau

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [0.353, 3.517, 0.125, -7.545, -0.555, -1.536, 3.350, -1.578, -3.537, -1.579]
stat, p = kendalltau(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably independent') # Возможно независимый
else:
	print('Probably dependent') # Возможно зависимый

stat=0.733, p=0.002
Probably dependent


More Information
- [How to Calculate Nonparametric Rank Correlation in Python](https://machinelearningmastery.com/how-to-calculate-nonparametric-rank-correlation-in-python/)
- [scipy.stats.kendalltau](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kendalltau.html)
- [Kendall rank correlation coefficient on Wikipedia](https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient)

### Chi-Squared Test
Tests whether two categorical variables are related or independent. _(Проверяет, являются ли две категориальные переменные связанными или независимыми.)_

Assumptions
- Observations used in the calculation of the contingency table are independent. _(Наблюдения, использованные при расчете таблицы сопряженности, являются независимыми.)_
- 25 or more examples in each cell of the contingency table. _(25 или более примеров в каждой ячейке таблицы сопряженности.)_

Interpretation
- H0: the two samples are independent. _(два образца независимы.)_
- H1: there is a dependency between the samples. _(существует зависимость между образцами.)_

In [9]:
# Example of the Chi-Squared Test
from scipy.stats import chi2_contingency

table = [[10, 20, 30],[6,  9,  17]]
stat, p, dof, expected = chi2_contingency(table)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably independent') # Возможно независимый
else:
	print('Probably dependent') # Возможно зависимый

stat=0.272, p=0.873
Probably independent


More Information
- [A Gentle Introduction to the Chi-Squared Test for Machine Learning](https://machinelearningmastery.com/chi-squared-test-for-machine-learning/)
- [scipy.stats.chi2_contingency](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2_contingency.html)
- [Chi-Squared test on Wikipedia](https://en.wikipedia.org/wiki/Chi-squared_test)

## 3. Stationary Tests
This section lists statistical tests that you can use to check if a time series is stationary or not. _(В этом разделе перечислены статистические тесты, которые вы можете использовать, чтобы проверить, является ли временной ряд стационарным или нет.)_

### Augmented Dickey-Fuller Unit Root Test
Tests whether a time series has a unit root, e.g. has a trend or more generally is autoregressive. _(Проверяет, есть ли у временного ряда единичный корень, например, имеет тенденцию или, в более общем смысле, является авторегрессией.)_

Assumptions
- Observations in are temporally ordered. _(Наблюдения во временном порядке.)_

Interpretation
- H0: a unit root is present (series is non-stationary). _(присутствует единичный корень (серия нестационарна).)_
- H1: a unit root is not present (series is stationary). _(единичного корня нет (серия стационарная).)_

In [11]:
# Example of the Augmented Dickey-Fuller unit root test
from statsmodels.tsa.stattools import adfuller

data = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
stat, p, lags, obs, crit, t = adfuller(data)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably not Stationary') # Вероятно, не стационарный
else:
	print('Probably Stationary') # Вероятно, стационарный

stat=0.517, p=0.985
Probably not Stationary


More Information
- [How to Check if Time Series Data is Stationary with Python](https://machinelearningmastery.com/time-series-data-stationary-python/)
- [statsmodels.tsa.stattools.adfuller API.](https://www.statsmodels.org/dev/generated/statsmodels.tsa.stattools.adfuller.html)
- [Augmented Dickey–Fuller test, Wikipedia.](https://en.wikipedia.org/wiki/Augmented_Dickey%E2%80%93Fuller_test)

### Kwiatkowski-Phillips-Schmidt-Shin
Tests whether a time series is trend stationary or not. _(Проверяет, является ли временной ряд стационарным по тренду или нет.)_

Assumptions
- Observations in are temporally ordered. _(Наблюдения во временном порядке.
интерпретация)_

Interpretation
- H0: the time series is not trend-stationary. _(временной ряд не является трендовым.)_
- H1: the time series is trend-stationary. _(временной ряд является стационарным по тренду.)_

In [13]:
# Example of the Kwiatkowski-Phillips-Schmidt-Shin test
from statsmodels.tsa.stattools import kpss

data = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
stat, p, lags, crit = kpss(data)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably not Stationary') # Вероятно, не стационарный
else:
	print('Probably Stationary') # Вероятно, стационарный

stat=0.410, p=0.073
Probably not Stationary




More Information
- [statsmodels.tsa.stattools.kpss API.](https://www.statsmodels.org/stable/generated/statsmodels.tsa.stattools.kpss.html#statsmodels.tsa.stattools.kpss)
- [KPSS test, Wikipedia.](https://en.wikipedia.org/wiki/KPSS_test)

## 4. Parametric Statistical Hypothesis Tests
This section lists statistical tests that you can use to compare data samples.

### Student’s t-test
Tests whether the means of two independent samples are significantly different. _(Проверяет, значительно ли отличаются два независимых образца.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample are normally distributed. _(Наблюдения в каждом образце обычно распределяются.)_
- Observations in each sample have the same variance. _(Наблюдения в каждом образце имеют одинаковую дисперсию.)_

Interpretation
- H0: the means of the samples are equal. _(среднии образцов равны.)_
- H1: the means of the samples are unequal. _(среднии образцов неравны.)_

In [14]:
# Example of the Student's t-test
from scipy.stats import ttest_ind

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = ttest_ind(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=-0.326, p=0.748
Probably the same distribution


More Information
- [How to Calculate Parametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/)
- [scipy.stats.ttest_ind](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)
- [Student’s t-test on Wikipedia](https://en.wikipedia.org/wiki/Student%27s_t-test)

### Paired Student’s t-test
Tests whether the means of two paired samples are significantly different. _(Проверяет, значительно ли отличаются два парных образца.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample are normally distributed. _(Наблюдения в каждом образце обычно распределяются.)_
- Observations in each sample have the same variance. _(Наблюдения в каждом образце имеют одинаковую дисперсию.)_
- Observations across each sample are paired. _(Наблюдения по каждому образцу являются парными.)_

Interpretation
- H0: the means of the samples are equal. _(среднии образцов равны.)_
- H1: the means of the samples are unequal. _(среднии образцов неравны.)_

In [15]:
# Example of the Paired Student's t-test
from scipy.stats import ttest_rel

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = ttest_rel(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=-0.334, p=0.746
Probably the same distribution


More Information
- [How to Calculate Parametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/)
- [scipy.stats.ttest_rel](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_rel.html)
- [Student’s t-test on Wikipedia](https://en.wikipedia.org/wiki/Student%27s_t-test)

### Analysis of Variance Test (ANOVA)
Tests whether the means of two or more independent samples are significantly different. _(Проверяет, значительно ли отличаются два или более независимых образца.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample are normally distributed. _(Наблюдения в каждом образце обычно распределяются.)_
- Observations in each sample have the same variance. _(Наблюдения в каждом образце имеют одинаковую дисперсию.)_

Interpretation
- H0: the means of the samples are equal. _(средства образцов равны.)_
- H1: one or more of the means of the samples are unequal. _(одно или несколько средств отсчетов неравны.)_

In [16]:
# Example of the Analysis of Variance Test
from scipy.stats import f_oneway

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
data3 = [-0.208, 0.696, 0.928, -1.148, -0.213, 0.229, 0.137, 0.269, -0.870, -1.204]
stat, p = f_oneway(data1, data2, data3)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=0.096, p=0.908
Probably the same distribution


More Information
- [How to Calculate Parametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/)
- [scipy.stats.f_oneway](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.f_oneway.html)
- [Analysis of variance on Wikipedia](https://en.wikipedia.org/wiki/Analysis_of_variance)

### Repeated Measures ANOVA Test
Tests whether the means of two or more paired samples are significantly different. _(Проверяет, значительно ли отличаются два или более парных образца.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и распределяются одинаково (iid).)_
- Observations in each sample are normally distributed. _(Наблюдения в каждой выборке обычно распределяются.)_
- Observations in each sample have the same variance. _(Наблюдения в каждом образце имеют одинаковую дисперсию.)_
- Observations across each sample are paired. _(Наблюдения по каждому образцу сопряжены.)_

Interpretation
- H0: the means of the samples are equal. _(средние значения образцов равны.)_
- H1: one or more of the means of the samples are unequal. _(одно или несколько средств отсчетов неравны.)_

In [None]:
# Currently not supported in Python.

More Information
- [How to Calculate Parametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/)
- [Analysis of variance on Wikipedia](https://en.wikipedia.org/wiki/Analysis_of_variance)

## 5. Nonparametric Statistical Hypothesis Tests

### Mann-Whitney U Test
Tests whether the distributions of two independent samples are equal or not. _(Проверяет, равны ли распределения двух независимых выборок или нет.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и распределяются одинаково (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.)_

Interpretation
- H0: the distributions of both samples are equal. _(распределения обоих образцов одинаковы.)_
- H1: the distributions of both samples are not equal. _(распределения обоих образцов не равны.)_

In [17]:
# Example of the Mann-Whitney U Test
from scipy.stats import mannwhitneyu

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = mannwhitneyu(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=40.000, p=0.236
Probably the same distribution


More Information
- [How to Calculate Nonparametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/nonparametric-statistical-significance-tests-in-python/)
- [scipy.stats.mannwhitneyu](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html)
- [Mann-Whitney U test on Wikipedia](https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test)

### Wilcoxon Signed-Rank Test
Tests whether the distributions of two paired samples are equal or not. _(Проверяет, равны ли распределения двух парных выборок или нет.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.)_
- Observations across each sample are paired. _(Наблюдения по каждому образцу являются парными.
интерпретация)_

Interpretation
- H0: the distributions of both samples are equal. _(распределения обоих образцов равны.)_
- H1: the distributions of both samples are not equal. _(распределения обоих образцов не равны.)_

In [18]:
# Example of the Wilcoxon Signed-Rank Test
from scipy.stats import wilcoxon

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = wilcoxon(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=21.000, p=0.508
Probably the same distribution


More Information
- [How to Calculate Nonparametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/nonparametric-statistical-significance-tests-in-python/)
- [scipy.stats.wilcoxon](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.wilcoxon.html)
- [Wilcoxon signed-rank test on Wikipedia](https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test)

### Kruskal-Wallis H Test
Tests whether the distributions of two or more independent samples are equal or not. _(Проверяет, являются ли распределения двух или более независимых выборок равными или нет.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.
интерпретация)_

Interpretation
- H0: the distributions of all samples are equal. _(распределения всех образцов равны.)_
- H1: the distributions of one or more samples are not equal. _(распределения одной или нескольких выборок не равны.)_

In [19]:
# Example of the Kruskal-Wallis H Test
from scipy.stats import kruskal

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
stat, p = kruskal(data1, data2)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
	print('Probably the same distribution') # Вероятно, такое же распределение
else:
	print('Probably different distributions') # Возможно разные распределения

stat=0.571, p=0.450
Probably the same distribution


More Information
- [How to Calculate Nonparametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/nonparametric-statistical-significance-tests-in-python/)
- [scipy.stats.kruskal](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html)
- [Kruskal-Wallis one-way analysis of variance on Wikipedia](https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance)

### Friedman Test
Tests whether the distributions of two or more paired samples are equal or not. _(Проверяет, являются ли распределения двух или более парных выборок равными или нет.)_

Assumptions
- Observations in each sample are independent and identically distributed (iid). _(Наблюдения в каждой выборке независимы и одинаково распределены (iid).)_
- Observations in each sample can be ranked. _(Наблюдения в каждом образце могут быть ранжированы.)_
- Observations across each sample are paired. _(Наблюдения по каждому образцу являются парными.
интерпретация)_

Interpretation
- H0: the distributions of all samples are equal. _(распределения всех образцов равны.)_
- H1: the distributions of one or more samples are not equal. _(распределения одной или нескольких выборок не равны.)_

In [21]:
	# Example of the Friedman Test
from scipy.stats import friedmanchisquare

data1 = [0.873, 2.817, 0.121, -0.945, -0.055, -1.436, 0.360, -1.478, -1.637, -1.869]
data2 = [1.142, -0.432, -0.938, -0.729, -0.846, -0.157, 0.500, 1.183, -1.075, -0.169]
data3 = [-0.208, 0.696, 0.928, -1.148, -0.213, 0.229, 0.137, 0.269, -0.870, -1.204]
stat, p = friedmanchisquare(data1, data2, data3)
print('stat=%.3f, p=%.3f' % (stat, p))

if p > 0.05:
  print('Probably the same distribution') # Вероятно, такое же распределение
else:
  print('Probably different distributions') # Возможно разные распределения

stat=0.800, p=0.670
Probably the same distribution


More Information
- [How to Calculate Nonparametric Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/nonparametric-statistical-significance-tests-in-python/)
- [scipy.stats.friedmanchisquare](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html)
- [Friedman test on Wikipedia](https://en.wikipedia.org/wiki/Friedman_test)

## Further Reading
This section provides more resources on the topic if you are looking to go deeper.

- [A Gentle Introduction to Normality Tests in Python](https://machinelearningmastery.com/a-gentle-introduction-to-normality-tests-in-python/)
- [How to Use Correlation to Understand the Relationship Between Variables](https://machinelearningmastery.com/how-to-use-correlation-to-understand-the-relationship-between-variables/)
- [How to Use Parametric Statistical Significance Tests in Python](https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/)
- [A Gentle Introduction to Statistical Hypothesis Tests](https://machinelearningmastery.com/statistical-hypothesis-tests/)
- https://machinelearningmastery.com/statistical-hypothesis-tests/
- https://machinelearningmastery.com/parametric-statistical-significance-tests-in-python/

In [None]:
pass