# ELSŐ HÉT

In [3]:
from scipy import stats
import numpy


## t-próba és változatai
### 1. Egymintás t-próba

Feltételek:
- a minta normális eloszlásból származik
- az elméleti szórás nem ismert
- a nullhipotézis az ismeretlen várható értékre vonatkozik
- dokumentáció: [ttest_1samp](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_1samp.html)

In [None]:
data = np.array([0.8, 2.8, 0.1, -0.9, -0.6, -1.3, 0.5, -1.6, -1.1, -1.8])

In [None]:
len(data), data.mean(), data.std()

In [None]:
stats.ttest_1samp(data,2)

In [None]:
stats.ttest_1samp(data,2, alternative='greater')


### 2. Páros t-próba

- Párosított adatokra vonatkozó t-próba
- dokumentáció: [ttest_rel](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mstats.ttest_rel.html)

In [None]:
data1 = np.array([0.8, 2.8, 0.1, -0.9, -0.6, -1.4, 0.5, -1.6, -1.1, -1.8])
data2 = np.array([1.1, -0.4, -0.9, -0.7, -0.8, -0.2, 0.5, 1.2, -1.2, -0.2])

In [None]:
print( len(data1), data1.mean(), data1.std() )
print( len(data2), data2.mean(), data2.std() )

In [None]:
stats.ttest_rel(data1,data2)

In [None]:
stats.ttest_rel(data1,data2, alternative='greater')


### 3. Kétmintás t-próba

- Két független minta összehasonlítására vonatkozó t-próba
- dokumentáció: [ttest_ind](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)

In [None]:
stats.ttest_ind(data1, data2)

In [None]:
stats.ttest_ind(data1, data2, equal_var=False)


## Normalitás vizsgálatok
### 4. Shapiro-Wilk próba

- leírás: [Shapiro-Wilk test](https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test)
- dokumentáció: [shapiro](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html)

In [None]:
stats.shapiro(data)

In [None]:
stats.shapiro(data1)

In [None]:
stats.shapiro(data2)

### 5. D’Agostino - féle $K^2$ próba

- leírás: [D’Agostino's K-squared test](https://en.wikipedia.org/wiki/D%27Agostino%27s_K-squared_test)
- dokumentáció: [normaltest](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html)

In [None]:
stats.normaltest(data)

In [None]:
stats.normaltest(data1)

In [None]:
stats.normaltest(data2)

### 6. További normalitás tesztek:

- Anderson-Darling
    - leírás: [Anderson-Darling test](https://en.wikipedia.org/wiki/Anderson%E2%80%93Darling_test)
    - dokumentáció: [anderson](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.anderson.html)
- Jarque-Bera
    - leírás: [Jarque-Bera test](https://en.wikipedia.org/wiki/Jarque%E2%80%93Bera_test)
    - dokumentáció: [jarque_bera](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.jarque_bera.html)
- Cramér- von Mises
    - leírás: [Cramér - von Mises test](https://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion)
    - dokumentáció: [cramervonmises](https://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion)


## Chí-négyzet próbák

- leírás: https://en.wikipedia.org/wiki/Chi-squared_test

### 7. Chí-négyzet próba illeszkedés vizsgálatra

- dokumentáció: [chisquare](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chisquare.html)

In [None]:
megfigyelt = np.array([30, 35, 20, 10, 5])
elvart = np.array([25, 40, 25, 5, 5])

In [None]:
stats.chisquare(megfigyelt, elvart)

### 8. Chí-négyzet próba függtelenség vizsgálatra

- dokumentáció: [chi2_contingency](https://docs.scipy.org/doc/scipy/tutorial/stats/hypothesis_chi2_contingency.html)

In [None]:
table = np.array([ [ 20, 30], [40, 15]])

In [None]:
stats.chi2_contingency(table)

## Gyakorláshoz feladatok

- t-próba: http://www.sze.hu/~harmati/valszam/Gyakorlat/gyakorlat_12_a_BSC.pdf
- Chi-négyzet próba: http://www.sze.hu/~harmati/valszam/Gyakorlat/gyakorlat_14_BSC.pdf