# Непараметрични критерии

В много емпирични изследвания не рядко се налага използването на номинална и/или рангова скала за наблюденията. Това не позволява използването на стат. методи за проверка на хипотези, свързани с определени параметри. Тогава може да използваме непараметрични критерии за установяване на някои свойства на извадките, които не зависят от разпр. на набл. величини. Понякога тези критерии се наричат и методи, свободни от разпределение.

## Процедура за провеждане на тестове

1. Подреждане на получените стойности по съответния за теста начин.
2. Формулиране на хипитези, които ще се проверяват.
3. Изчисляване стойността на проверяващата величина.
4. Определяне на критичната област според броя на изследваните лица, степените на свобода и прието ниво на грешка.
5. Сравняване на критичната ст-ст с получената ст-ст на проверяващата величина.
6. Формулиране на извод - приемане на едната и отхвърляне на другата статистическа хипотеза.

Хипотезите ще формулираме по следния начин:

$H_0$ - не съществува стат. значима разлика между получените резултатите за изследваните х-ки
$H_1$ - между изследваните х-ки се наблюдава стат. значима разлика и тя се дължи на проверявания фактор

## Критерий на знаците

Нека са дадени две независими редици с еднакъв брой наблюдения:

$$(\xi): \xi_1, \ldots, \xi_n \\
(\eta): \eta_1, \ldots, \eta_n$$

над сл.в. $\xi$ и $\eta$. Искаме да отговорим дали различията между наблюденията в редиците са значими. Нека разликите между редиците са:

$$d_i = \xi_i - \eta_i$$

$W$ - критична област за хипотезата $H_0$. Ако статистиката попадне в нея, отхвърляме хипотезата.

Законите на разпределение $F_i(x)$ могат да бъдат различни в различните опити $(i = 1, \ldots, n)$, тъй като отклоненията към положителния и отрицателния знак са равновероятни:

$$P\{d_i \leq 0\} = P\{d_i \geq 0\} = \frac{1}{2}.$$

Нека $\nu_n$ е броят на +1 в редицата със знаци. Проверката на $H_0$ се свежда до проверката на еквивалентната хипотеза:

$H_0'$ - разпределението на $\nu_n$ е биномно с параметри $n$ и $p = \frac{1}{2}$ срещу алтернативата

$H_1'$ - $p \neq \frac{1}{2}$

Критичната област при зададено ниво на съгласие $\alpha$ е двустранна и се определея с число $C_{\alpha}$, което може да се определи с използване на нормалното приближение на бином. разпределение:

$$\phi\Bigg(\frac{2C_{\alpha}}{\sqrt{n}}\Bigg) = 1 - \frac{\alpha}{2}.$$

## Критерий на Уилкоксън

Когато броят на наблюденията в двете извадки е различен, критерият на знаците е неприложим. Тогава използваме критерия на Уилкоксън.

Нека са дадени две извадки от случайни величини с непрекъснати функции на разпределение $F(x)$ и $G(x)$:

$$(\xi): \xi_1, \ldots, \xi_n \\
(\eta): \eta_1, \ldots, \eta_m$$

Образуваме общ вариационен ред:

$$\eta_{i1} < \xi_{j1} < \ldots < \eta_{im} < \xi_{jn}$$

Критичната област $W$ с ниво на съгласие $\alpha$ се дефинира с неравенство от вида:

$$\Big|\frac{U_{m, n} - \alpha}{\sigma}\Big| > K_{\alpha}$$

където константата $K_{\alpha}$ се определя от условието :

$$\alpha = 2[1 - \Phi(K_{\alpha})]$$

$U_{m, n}$ е сл. в. съответно със средно и дисперсия:

$$\alpha = EU_{m, n} = \frac{mn}{2}, \quad \sigma^2 = DU_{m, n} = \frac{mn}{12}(m + n + 1).$$

Когато $U_{m,n} \in W$, $H_0$ се отхвърля, в противен случай $H_0$ не противоричи на наблюденията.

## $\chi^2$-критерий за еднородност

Когато проверяваме хипотезата за еднаква разпределеност на сл.в. $\xi$ и $\eta$, може да използваме $\chi^2$ критерият. Проверяваме $H_0$ като допускаме разпределенията да не са непрекъснати:

$$H_0 : P\{\xi < x\} = P\{\eta < x\}, \quad x \in (-\infty, \infty)$$

Процедурата за проверка на хипотезата се свежда до разделяне на интервала $[a, b]$, който съдържа извадките на $r$ подинтервала с поне по 5 наблюдения във всеки. Нека това делението е:

$$\alpha = z_0 < \ldots < z_r = b$$

Да означим с $n_i$ и $m_i$ броя на наблюденията от извадките $\xi$ и $\eta$, попаднали в интервала $[z_{i - 1}, z_i]$. При вярна $H_0$ величината 

$$\chi^2 = nm\sum_{i = 1}^r\frac{(\frac{n_i}{n} - \frac{m_i}{m})^2}{n_i + m_i}$$

има асимптотично $chi^2$ разпределение с $r - 1$ степени на свобода.

Ако $\chi^2 \geq \chi^2_{\alpha}(r - 1)$ отхвърляме $H_0$, в противен случай я приемаме.

## $\chi^2$-критерий за независимост и еднородност на дисперсиите

Често в практиката е дали два вида измервания на един и същи индивид на ГС са зависими величини помежду си или не. Тогава, решаваме следната задача: Нека $\xi$ и $\eta$ са две сл.в., които наблюдават един и същ експеримент и образуват сл.вектор $(\xi, \eta)$. Да се построи критерий за проверка на основната хипотеза:

$$H_0: P\{\xi < x, \eta < y\} = P\{\xi < x\}P\{\eta < y\}$$

Правим извадка от едновременни наблюдения $(\xi_1, \eta_1), \ldots, (\xi_n, \eta_n)$. Нека ст-тите $\xi_1, \ldots, \xi_n$ се съдържат в интервала $[a, b]$, а $\eta_1, \ldots, \eta_n$ в интервала $[c, d]$. Да разделим $[a, b]$ и $[c, d]$ съответно на $r$ и $s$ подинтервала:

$$a = z_0 < \ldots < z_r =b \quad c = t_o < \ldots < t_s = d.$$

Нека $n_{ij}$ е бр. на двойките наблюдения $(\xi_k, \eta_k)$, за които $\xi_k \in [z_{i - 1}, z_i]$ и $\eta_k \in (t_{j - 1}, t_j)$. Да положим:

$$n_{*j} = \sum_{i=1}^rn_{ij}, \quad n_{i*} = \sum_{j=1}^sn_{ij}$$

При вярна $H_0$ величината:

$$\chi^2 = n \sum_{i, j}\Big(\frac{n_{ij}}{n_{i*}n_{*j}} - \frac{1}{n}\Big)^2n_{i*}n_{*j}$$

има асимптотично $\chi^2$- разпределение с $(r - 1)(s - 1)$ степени на свобода.

За да приемем или отхвърлим $H_0$ при избрано ниво на съгласие $\alpha$ се определя квантилът $\chi^2_{\alpha}((r - 1)(s - 1))$ и се сравнява с пресметната от наблюденията ст-ст на $\chi^2$. При $\chi^2 \geq \chi^2_{\alpha}$ $H_0$ се отхвърля, в противен случай се приема като непротиворечаща на наблюденията.