## 18. 
* ## Непараметрические критерии независимости. 
* ## Ранговый критерий независимости Спирмена. 
* ## Работа с критерием в пакете R.

`FYI:`

Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики. 

Дело в том, что когда выборки становятся очень большими, то выборочные средние подчиняются нормальному закону, даже если исходная переменная не является нормальной или измерена с погрешностью. 

Непараметрические тесты имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты, и если важно обнаружить даже слабые отклонения, следует особенно внимательно выбирать статистику критерия.

-----
Для проверки независимости качественных признаков A и B, то есть,
признаков, измеряемых в номинальных шкалах, применяются таблицы
сопряженности.

1. ### Критерий Пирсона

При условии, что случайные велиины `X, Y` принадлежат нормальному распределению, то

они независимы тогда и только тогда, когда не коррелируют, то есть
`corr(X, Y) = 0`

In [3]:
X <- rnorm(100)
Y <- rnorm(100)

cor.test(X, Y, method="pearson")


	Pearson's product-moment correlation

data:  X and Y
t = 1.4866, df = 98, p-value = 0.1403
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.0493547  0.3351454
sample estimates:
     cor 
0.148503 


2. ### Ранговая корреляция Спирмена

Обе случайные величины должны подчиняться нормальному распределению.

$x_i  \longrightarrow r_l=rank(x_i)$ среди X

$y_i  \longrightarrow s_l=rank(y_i)$ среди Y

Ранги X и Y - это две случайные перестановки первых n чисел

И эти две перестановки должны быть независимы.

In [10]:
X <- c(1,2,4,6,3)
Y <- c(1,3,4,6,5)

cor.test(X, Y, method="spearman")


	Spearman's rank correlation rho

data:  X and Y
S = 2, p-value = 0.08333
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho 
0.9 


3. ### Корреляция Кенделла

Для вычисления статистики Кенделла достаточно посчитать количество инверсий (число несогласованных пар), которое надо сделать для того, чтобы одно упорядочение объектов превратилось в другое.

Если X, Y - независимы, то случайно равновозможны => число беспорядков ~ половина от общего числа пар.

In [13]:
X <- c(1,2,4,6,3)
Y <- c(1,3,4,6,5)

cor.test(X, Y, method="kendall")


	Kendall's rank correlation tau

data:  X and Y
T = 9, p-value = 0.08333
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau 
0.8 
