# Zadanie

Rozważmy zbiór danych:

$[ 5260.,  5470.,  5640.,  6180.,  6390.,  6515.,  6805.,  7515., 7515.,  8230.,  8770.]$

oraz hipotezę, że średnia jest równa $7725$.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import seaborn as sns
import pandas as pd
# additional packages
from statsmodels.stats.diagnostic import lillifors

In [2]:
data=np.array([5260.,  5470.,  5640.,  6180.,  6390.,  6515.,  6805.,  7515., 7515.,  8230.,  8770.])

# Najpierw sprawdzamy założenie o tym, że próbka pochodzi z rozkładu normalnego.

In [3]:
pVals = pd.Series()
pFewVals = pd.Series()
# The scipy normaltest is based on D-Agostino and Pearsons test that
# combines skew and kurtosis to produce an omnibus test of normality.
_, pVals['Omnibus']    = stats.normaltest(data)

# Shapiro-Wilk test
_, pVals['Shapiro-Wilk']    = stats.shapiro(data)

# Or you can check for normality with Lilliefors-test
_, pVals['Lilliefors']    = lillifors(data)

# Alternatively with original Kolmogorov-Smirnov test
_, pVals['Kolmogorov-Smirnov']    = stats.kstest((data-np.mean(data))/np.std(data,ddof=1), 'norm')

print('p-values for all {0} data points: ----------------'.format(len(data)))
print(pVals)


p-values for all 11 data points: ----------------
Omnibus               0.681313
Shapiro-Wilk          0.674299
Lilliefors            1.175721
Kolmogorov-Smirnov    0.993585
dtype: float64


  "anyway, n=%i" % int(n))


# Możemy wykonać test t-studenta al
Naszym celem jest sprawdzenie czy średnia z danych różni się istotnie od wartości $110$

In [4]:
tval = (7725-np.mean(data))/stats.sem(data)
td = stats.t(len(data)-1) # "frozen" t-distribution
p = 2*td.sf(tval)
print(p)
if p < 0.05:
    print("Odrzucamy hipotezę H_0")
else:
    print("Nie ma podstaw aby odrzucić hipotezę H_0")

0.0181372351761
Odrzucamy hipotezę H_0


# Zadanie
Wykonaj test t-studenta z pomocą funkcji <tt>stats.ttest_1samp</tt>.

In [7]:
checkValue = 7725
t, prob = stats.ttest_1samp(data, checkValue)
print( (t, prob))
if prob < 0.05:
    print("Odrzucamy hipotezę H_0")
else:
    print("Nie ma podstaw aby odrzucić hipotezę H_0")

(-2.8207540608310198, 0.018137235176105812)
Odrzucamy hipotezę H_0


# Możemy wykonać test rang Wilcoxon-a

In [8]:
(rank, pVal) = stats.wilcoxon(data-checkValue)
print(pVal)
if pVal < 0.05:
    print("Odrzucamy hipotezę H_0")
else:
    print("Nie ma podstaw aby odrzucić hipotezę H_0")    

0.0261571823293
Odrzucamy hipotezę H_0
