# Testiranje domnev
Postopek za testiranje domnev:
 1. Postavimo ničelno in alternativno domnevo $H_0$ in $H_a$
 2. Zberemo podatke in izračunamo testno statistiko (TS)
 3. Določimo kritično območje za testno statistiko
 4. Sklepamo
Vsak od teh korakov je opisan podrobneje v nadaljevanju.

## Naloga: povprečna višina
Preveriti želimo, ali je povprečna telesna višina moškega študenta enaka $180$cm. Postavimo dve domnevi
 * ničelno domnevo: $H_0: \mu=180$cm
 * alternativno domnevo: $H_a: \mu \not=180$cm
 
s testom bomo preverili, kako se ničelna domneva ujema z zbranimi podatki.

In [1]:
x = [180, 183, 173, 171, 180, 183, 172, 178, 188, 175, 183, 179, 185, 195, 169]

In [2]:
from statistics import mean, stdev

In [3]:
xp = mean(x)
xp

179.6

In [4]:
s = stdev(x)
s

6.987744373442078

### Testna statistika
Če testiramo $H_0: \mu = \mu_0$, potem je testna statistika ena od naslednjih možnosti:
 * če $\sigma$ ne poznamo $$TS = \frac{\bar{x}-\mu_0}{s}\sqrt{n}\sim Student(n-1)$$
 * če $\sigma$ poznamo $$TS = \frac{\bar{x}-\mu_0}{\sigma}\sqrt{n}\sim N(0,1)$$

In [6]:
from math import sqrt
mu_0 = 180
n = len(x)
TS = (xp - mu_0)/s*sqrt(n)
TS

-0.22170148987861085

#### Kritično območje
Kritično območje je interval „nenavadnih vrednosti“ za dano porazdelitev. Kritično območje je odvisno od stopnje značilnosti $\alpha$.
 * dvostranski test $H_a: \mu\not=\mu_0$ je kritično območje $(-\infty, -w_k] \cup [w_k, \infty)$
 * za enostranski test $Ha: \mu>\mu_0$ je kritično območje $[w_k, \infty)$
 
Rob kritičnega območja $w_k$ določimo kot kvantil za
 * dvostranski test: kvatnil za $1-\frac{\alpha}{2}$ se pravi $w_k = t_{1-\frac{\alpha}{2}}(n-1)$
 * enostranski test: kvantil za $1-\alpha$ se pravi $w_k = t_{1-\alpha}(n-1)$

In [7]:
# Studentova porazdelitev
from scipy.stats import t

In [9]:
alfa = 0.1 # 10 procentov
wk = t.ppf(1-alfa/2, n-1)
print("Kritično območje: (-neskončno, {}] U [{}, neskončno)".format(-wk,wk))

Kritično območje: (-neskončno, -1.7613101357748562] U [1.7613101357748562, neskončno)


### Sklep

 * Če je testna statistika v kritičnem območju $TS\in W_k$, potem $H_0$ zavrnemo v prid $H_a$
 * Če testna statistika ni v kritičnem območju, potem $H_0$ ne moremo zavrniti (podatki so skladni s $H_0$)

Torej: podatki so skladni z domnevo, da je $\mu=180$cm

## Testiranje $\sigma$

V tovarni proizvajajo cevi izbrane dolžine.  Trdijo, da je standardna napaka izdelane
cevi  manjša  od  1.2cm.   Na  25  ceveh  dobimo  vzorčni  odklon  1.5cm.   Ali  lahko  na
podlagi vzorca pri 

α = 0.05 

zavrnemo trditev tovarne?  Kaj pa na vzorcu 101 cevi?

In [10]:
sigma_0 = 1.2
s = 1.5
n = 25
alfa = 0.05

### 1. Postavimo domneve

 * ničelna domneva: $H_0: \sigma=1.2$
 * alternativna domneva $H_a: \sigma > 1.2$

### 2. Vzorčenje in testna statistika TS
$TS = (n-1)\frac{s^2}{\sigma_0^2}\sim \chi^2(n-1)$ 

In [11]:
TS = s**2/sigma_0**2*(n-1)
print("Vrednost testne statistike je {}".format(TS))

Vrednost testne statistike je 37.5


### 3. Kritično območje
Ali je $TS$ normalna? Primerjamo jo s kvantili za $\chi^2(n-1)$

Kritično območje je interval $[\chi^2_{1-\alpha}(n-1), \infty)$

In [12]:
from scipy.stats import chi2

In [13]:
wk = chi2.ppf(1-alfa, n-1)

In [14]:
print("Kritično območje je [{}, neskončno)".format(wk))

Kritično območje je [36.4150285018073, neskončno)


### 4. Sklep
Testna statistika **leži** v kritičnem območju, to pomeni, da $H_0$ zavrnemo v prid $H_a$.

### Volitve 2018
Ali lahko na podlagi [ankete](http://www.delo.si/assets/media/other/20180311//politbarometer_marec2018copy.pdf) sklepamo, da se bo Desus prebil v parlament.

In [21]:
p_desus = 0.032
p_levica = 0.049
p_sls = 0.025
n = 1010
p_neodloceni = 0.25

In [18]:
p0 = 0.04*0.75/1
p0

0.03

### 1. postavimo domneve
 * $H_0: p_{sls} = 0.03$
 * $H_a: p_{sls} < 0.03$

### 2. Testna statistika
Za delež je TS

$$TS = (p-p_0)\sqrt{\frac{n}{p_0(1-p_0)}}\sim N(0,1)$$

In [27]:
TS_sls = (p_sls - p0)*sqrt(n/(p0*(1 - p0)))
TS_sls
TS_levica = (p_levica - p0)*sqrt(n/(p0*(1 - p0)))
TS_levica
TS_desus = (p_desus - p0)*sqrt(n/(p0*(1 - p0)))
print("SLS: {}, Desus: {}, Levica: {}".format(TS_sls, TS_desus, TS_levica))

SLS: -0.9315028687565687, Desus: 0.372601147502628, Levica: 3.5397109012749635


### 3. Kritično območje

In [28]:
alfa = 0.01
from scipy.stats import norm
wk = norm.ppf(1 - alfa)
print("Kritično območje: (-neskončno, {})".format(-wk))

Kritično območje: (-neskončno, -2.3263478740408408)


### 4. Sklep
Testna statistika ni v kritičnem območju, $H_0$ zavrnemo in ne moremo s stopnjo značilnosti $\alpha$ trditi, da se SLS ne bo uvrstila v parlament.