# Zadanie

Załóżmy, że prowadzisz prywatną instytucję edukacyjną. Twoja umowa mówi, że jeśli twoi uczniowie uzyskają $110$ punktów w ostatnim egzaminie, gdzie średnia krajowa wynosi $100$, to otrzymasz bonus. Jeśli wyniki są znacznie niższe to tracisz bonus (bo uczniowie nie są wystarczająco dobrzy) i musisz zatrudnić więcej nauczycieli. Jeśli wyniki są znacznie wyższe, tracisz także bonus (ponieważ spędziłeś za dużo pieniędzy na nauczycielach) i musisz zredukować liczbę nauczycieli.\newline

Wyniki końcowy egzamin dla dziesięciu uczniów to
$[109.4, 76.2, 128.7, 93.7, 85.6, 117.7, 117.2, 87.3, 100.3, 55.1].$\newline

Pytanie, na które chcemy odpowiedzieć: Czy średnia wartość wyników $97.1$ różni się znacząco od wartości $110$?


In [2]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import seaborn as sns
import pandas as pd
# additional packages
from statsmodels.stats.diagnostic import lillifors

In [3]:
data=np.array([109.4, 76.2, 128.7, 93.7, 85.6, 117.7, 117.2, 87.3, 100.3, 55.1])

# Najpierw sprawdzamy założenie o tym, że próbka pochodzi z rozkładu normalnego.

In [4]:
pVals = pd.Series()
pFewVals = pd.Series()
# The scipy normaltest is based on D-Agostino and Pearsons test that
# combines skew and kurtosis to produce an omnibus test of normality.
_, pVals['Omnibus']    = stats.normaltest(data)

# Shapiro-Wilk test
_, pVals['Shapiro-Wilk']    = stats.shapiro(data)

# Or you can check for normality with Lilliefors-test
_, pVals['Lilliefors']    = lillifors(data)

# Alternatively with original Kolmogorov-Smirnov test
_, pVals['Kolmogorov-Smirnov']    = stats.kstest((data-np.mean(data))/np.std(data,ddof=1), 'norm')

print('p-values for all {0} data points: ----------------'.format(len(data)))
print(pVals)


p-values for all 10 data points: ----------------
Omnibus               0.787921
Shapiro-Wilk          0.912810
Lilliefors            1.458084
Kolmogorov-Smirnov    0.999136
dtype: float64


  "anyway, n=%i" % int(n))


# Możemy wykonać test t-studenta
Naszym celem jest sprawdzenie czy średnia z danych różni się istotnie od wartości $110$

In [5]:
tval = (110-np.mean(data))/stats.sem(data)
td = stats.t(len(data)-1) # "frozen" t-distribution
p = 2*td.sf(tval)
print(p)
if p < 0.05:
    print("Odrzucamy hipotezę H_0")
else:
    print("Nie ma podstaw aby odrzucić hipotezę H_0")

0.0995384365279
Nie ma podstaw aby odrzucić hipotezę H_0


# Zadanie
Wykonaj test t-studenta z pomocą funkcji <tt>stats.ttest_1samp</tt>.

In [6]:
checkValue = 110
t, prob = stats.ttest_1samp(data, checkValue)
print( (t, prob))
if prob < 0.05:
    print("Odrzucamy hipotezę H_0")
else:
    print("Nie ma podstaw aby odrzucić hipotezę H_0")

(-1.8360249997815428, 0.099538436527906296)
Nie ma podstaw aby odrzucić hipotezę H_0


# Wniosek
Średnia nie różni się w sposób istotny od wartości $110$ a premia powinna być wypłacona.