In [13]:
import scipy.stats as sp
import numpy as np 
import pandas as pd

misto = ["Praha", "Brno", "Znojmo", "Tišnov", "Rokytnice nad Jizerou", "Jablunkov", "Dolní Věstonice", "Moje okolí"]
odpoved = ["Zimní čas", "Letní čas", "Střídání časů", "Nemá názor"]

zimni_cas = np.array([510, 324, 302, 257, 147, 66, 87, 1])
letni_cas = np.array([352, 284, 185, 178, 87, 58, 65, 6])
stridani = np.array([257, 178, 124, 78, 44, 33, 31, 8])
nema_nazor = np.array([208, 129, 70, 74, 6, 19, 32, 5])

data =  np.array([zimni_cas, letni_cas, stridani, nema_nazor])

df = pd.DataFrame(data, columns=misto, index=odpoved)

display(df)

# Celkovy pocet respondentu
n = df.sum().sum()
print('Počet respondentů: ', end='')
print(n)


# Sumy řádků
row_sums = df.sum(axis=1)
print('\nSumy řádků: ')
print(row_sums)

# Sumy sloupců
column_sum = df.sum(axis=0)
print('\nSumy sloupců: ')
print(column_sum)


Unnamed: 0,Praha,Brno,Znojmo,Tišnov,Rokytnice nad Jizerou,Jablunkov,Dolní Věstonice,Moje okolí
Zimní čas,510,324,302,257,147,66,87,1
Letní čas,352,284,185,178,87,58,65,6
Střídání časů,257,178,124,78,44,33,31,8
Nemá názor,208,129,70,74,6,19,32,5


Počet respondentů: 4205

Sumy řádků: 
Zimní čas        1694
Letní čas        1215
Střídání časů     753
Nemá názor        543
dtype: int64

Sumy sloupců: 
Praha                    1327
Brno                      915
Znojmo                    681
Tišnov                    587
Rokytnice nad Jizerou     284
Jablunkov                 176
Dolní Věstonice           215
Moje okolí                 20
dtype: int64


In [14]:
# Úkol 1
# Část a)

# Teoreticka cetnost
zimni_cas_teor = (row_sums['Zimní čas']/n) * column_sum

# Testovaci kriterium
test = np.sum((zimni_cas - zimni_cas_teor) **2/zimni_cas_teor)
print('Testovací kritérium:', test)

k = len(zimni_cas)
chi = sp.chi2.ppf(0.95, k - 1 - 1)

print('Doplněk kritického oboru = (0, ' , chi , ')')
print('\nTestovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme')

Testovací kritérium: 26.90430881205663
Doplněk kritického oboru = (0,  12.591587243743977 )

Testovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme


In [15]:
# Úkol 1
# Část b)

# Teoreticka cetnost
letni_cas_teor = (row_sums['Letní čas']/n) * column_sum

# Testovaci kriterium
test = np.sum((letni_cas - letni_cas_teor) **2/letni_cas_teor)
print('Testovací kritérium:', test)

k = len(letni_cas)
chi = sp.chi2.ppf(0.95, k - 1 - 1)

print('Doplněk kritického oboru = (0, ' , chi , ')')
print('\nTestovací kritérium ∈ doplňku kritického oboru => Hypotézu nezamítáme')

Testovací kritérium: 6.593965560899951
Doplněk kritického oboru = (0,  12.591587243743977 )

Testovací kritérium ∈ doplňku kritického oboru => Hypotézu nezamítáme


In [16]:
# Úkol 1
# Část c)

# Teoreticka cetnost
stridani_teor = (row_sums['Střídání časů']/n) * column_sum

# Testovaci kriterium
test = np.sum((stridani - stridani_teor) **2/stridani_teor)
print('Testovací kritérium:', test)

k = len(stridani)
chi = sp.chi2.ppf(0.95, k - 1 - 1)


print('Doplněk kritického oboru = (0, ' , chi , ')')
print('\nTestovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme')

Testovací kritérium: 17.736797383550027
Doplněk kritického oboru = (0,  12.591587243743977 )

Testovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme


In [17]:
# Úkol 1
# Část d)

misto = ["Praha", "Brno", "Znojmo", "Tišnov", "Rokytnice nad Jizerou", "Jablunkov", "Dolní Věstonice", "Moje okolí"]
odpoved = ["Zimní čas", "Letní čas", "Střídání časů", "Nemá názor"]

vetsi_mesta = df['Praha'] + df['Brno']
mensi_mesta = df['Znojmo'] + df['Tišnov']
obce = df['Rokytnice nad Jizerou'] + df['Jablunkov'] + df['Dolní Věstonice']

data_merged =  np.array([vetsi_mesta, mensi_mesta, obce]).T

df_merged = pd.DataFrame(data_merged, columns=['Větší města', 'Menší města', 'Obce'], index=odpoved)

display(df_merged)

# Celkovy pocet respondentu
n_merged = df_merged.sum().sum()
print('Počet respondentů: ', end='')
print(n_merged)


# Sumy řádků
row_sums_merged = df_merged.sum(axis=1)
print('\nSumy řádků: ')
print(row_sums_merged)

# Sumy sloupců
column_sum_merged = df_merged.sum(axis=0)
print('\nSumy sloupců: ')
print(column_sum_merged)

# Teoreticka cetnost
zimni_cas_teor = (row_sums_merged['Zimní čas']/n_merged) * column_sum_merged

# Testovaci kriterium
test = np.sum((df_merged.loc['Zimní čas'] - zimni_cas_teor) **2/zimni_cas_teor)
print('\nTestovací kritérium:', test)

k = len(df_merged.loc['Zimní čas'])
chi = sp.chi2.ppf(0.95, k - 1 - 1)

print('Doplněk kritického oboru = (0, ' , chi , ')')
print('\nTestovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme')

Unnamed: 0,Větší města,Menší města,Obce
Zimní čas,834,559,300
Letní čas,636,363,210
Střídání časů,435,202,108
Nemá názor,337,144,57


Počet respondentů: 4185

Sumy řádků: 
Zimní čas        1693
Letní čas        1209
Střídání časů     745
Nemá názor        538
dtype: int64

Sumy sloupců: 
Větší města    2242
Menší města    1268
Obce            675
dtype: int64

Testovací kritérium: 12.661948651569508
Doplněk kritického oboru = (0,  3.841458820694124 )

Testovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme


In [19]:
# Teoreticka cetnost
nerozhodni_teor = (row_sums_merged['Nemá názor']/n_merged) * column_sum_merged

# Testovaci kriterium
test = np.sum((df_merged.loc['Nemá názor'] - nerozhodni_teor) **2/nerozhodni_teor)
print('\nTestovací kritérium:', test)

k = len(df_merged.loc['Nemá názor'])
chi = sp.chi2.ppf(0.95, k - 1 - 1)

print('Doplněk kritického oboru = (0, ' , chi , ')')
print('\nTestovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme')

sp.chisquare(f_obs = df_merged.loc['Nemá názor'], f_exp = nerozhodni_teor)



Testovací kritérium: 20.688664757394136
Doplněk kritického oboru = (0,  3.841458820694124 )

Testovací kritérium ∉ doplňku kritického oboru => Hypotézu zamítáme


Power_divergenceResult(statistic=20.688664757394136, pvalue=3.217462760178799e-05)