# Temat testów
### Czy istnieje istotna statystycznie różnica w poprawności odpowiedzi w zależności od odpowiedzi na pytania dotyczące preferowanego typu grafiki i formy graficznej?

In [1]:
import pandas as pd

from functions.set_preparations import prepare_set_changes_questions, prepare_row
from functions.tests import conduct_chi2test

In [2]:
df_answers = pd.read_csv(
    '/Users/martasolarz/Studies/Thesis/data/correctness.csv',
    usecols=['ID', 'Quest1_before', 'Quest2_before', '1a_corr', '1b_corr', '2a_corr', '2b_corr', '3a_corr', '3b_corr']
)

df_quest = pd.read_csv(
    '/Users/martasolarz/Studies/Thesis/data/survey.csv',
    usecols=['ID', 'Quest1_after', 'Quest2_after']
)

df_merge = df_answers.merge(df_quest, on='ID')
df_merge.head()

Unnamed: 0,ID,Quest1_before,Quest2_before,1a_corr,1b_corr,2a_corr,2b_corr,3a_corr,3b_corr,Quest1_after,Quest2_after
0,1,B,wykres,1,1,0,0,1,1,B,wykres
1,2,B,wykres,1,1,1,1,0,1,B,wykres
2,3,B,mapa,1,1,1,1,0,0,B,mapa
3,4,B,mapa,1,1,1,1,1,0,B,wykres
4,5,B,tabela,1,1,1,1,1,1,B,tabela


### TESTY

**H0:** Nie ma istotnej statystycznie zależności między poprawnością odpowiedzi a wybraną preferowaną formą (mapa vs mapa + inne elementy; mapa vs tabela vs wykres vs tekst).

**H1:** Istnieje istotna statystycznie zależność między poprawnością odpowiedzi a wybraną preferowaną formą (mapa vs mapa + inne elementy; mapa vs tabela vs wykres vs tekst).

**Poziom istotności:** $\alpha=0.05$

In [3]:
ALPHA = 0.05

#### Wszystkie grafiki - zagregowane do jednej kolumny

In [5]:
quest1_before = [df_merge['Quest1_before'] for i in range(6)]
quest2_before = [df_merge['Quest2_before'] for i in range(6)]
quest1_after = [df_merge['Quest1_after'] for i in range(6)]
quest2_after = [df_merge['Quest2_after'] for i in range(6)]

popr = []
for col in df_answers.columns.tolist():
    if col.endswith('corr'):
        popr.append(df_answers[col])

popr_row = prepare_row(popr)
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before   A    B
poprawnosc            
0               5   67
1              19  155
Wartość statystyki chi-kwadrat: 0.5182647626074353
P-value: 0.4715828248989259
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                41      12      3      16
1                85      30     15      44
Wartość statystyki chi-kwadrat: 2.238131727786901
P-value: 0.5244767141553461
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A    B
poprawnosc           
0             27   45
1             39  135
Wartość statystyki chi-kwadrat: 5.160716721815859
P-value: 0.023103361396515018
Istnieją podstawy do odrzucenia H0, przyjmujemy hipotezę H1.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0               41       6      3      22
1               73      30      3

#### Grafiki A - zagregowane do jednej kolumny

In [6]:
quest1_before = [df_merge['Quest1_before'] for i in range(3)]
quest2_before = [df_merge['Quest2_before'] for i in range(3)]
quest1_after = [df_merge['Quest1_after'] for i in range(3)]
quest2_after = [df_merge['Quest2_after'] for i in range(3)]

popr = [df_answers['1a_corr'], df_answers['2a_corr'], df_answers['3a_corr']]
        
popr_row = prepare_row(popr)
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before   A   B
poprawnosc           
0               2  34
1              10  77
Wartość statystyki chi-kwadrat: 0.4570017215491356
P-value: 0.49902856634830706
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                20       6      1       9
1                43      15      8      21
Wartość statystyki chi-kwadrat: 1.632781426746944
P-value: 0.6519799035839045
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A   B
poprawnosc          
0             12  24
1             21  66
Wartość statystyki chi-kwadrat: 0.6783648264251712
P-value: 0.41015035950447143
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0               21       3      2      10
1               36      15      1      35
Wartość statystyki chi-kwadr

#### Grafiki B - zagregowane do jednej kolumny

In [7]:
quest1_before = [df_merge['Quest1_before'] for i in range(3)]
quest2_before = [df_merge['Quest2_before'] for i in range(3)]
quest1_after = [df_merge['Quest1_after'] for i in range(3)]
quest2_after = [df_merge['Quest2_after'] for i in range(3)]

popr = [df_answers['1b_corr'], df_answers['2b_corr'], df_answers['3b_corr']]
        
popr_row = prepare_row(popr)
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before  A   B
poprawnosc          
0              3  33
1              9  78
Wartość statystyki chi-kwadrat: 6.633788961375382e-05
P-value: 0.9935014556753952
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                21       6      2       7
1                42      15      7      23
Wartość statystyki chi-kwadrat: 1.2340768108009497
P-value: 0.7448434185037259
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A   B
poprawnosc          
0             15  21
1             18  69
Wartość statystyki chi-kwadrat: 4.689110211308487
P-value: 0.03035436213327259
Istnieją podstawy do odrzucenia H0, przyjmujemy hipotezę H1.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0               20       3      1      12
1               37      15      2      33


#### Grafiki 1,2,3 - zagregowane do jednej kolumny

-> 1

In [10]:
popr = []
for col in df_merge.columns.tolist():
    if col.startswith('1') and col.endswith('_corr'):
        popr.append(df_merge[col])
        
quest1_before = [df_merge['Quest1_before'] for i in range(2)]
quest2_before = [df_merge['Quest2_before'] for i in range(2)]
quest1_after = [df_merge['Quest1_after'] for i in range(2)]
quest2_after = [df_merge['Quest2_after'] for i in range(2)]
        
popr_row = prepare_row(popr)   
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before  A   B
poprawnosc          
0              1   7
1              7  67
Wartość statystyki chi-kwadrat: 0.0
P-value: 1.0
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                 4       2      0       2
1                38      12      6      18
Wartość statystyki chi-kwadrat: 0.9788288288288286
P-value: 0.8063745671387934
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A   B
poprawnosc          
0              6   2
1             16  58
Wartość statystyki chi-kwadrat: 7.935670045045044
P-value: 0.004846967594060261
Istnieją podstawy do odrzucenia H0, przyjmujemy hipotezę H1.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0                7       0      0       1
1               31      12      2      29
Wartość statystyki chi-kwadrat: 

-> 2

In [11]:
popr = []
for col in df_merge.columns.tolist():
    if col.startswith('2') and col.endswith('_corr'):
        popr.append(df_merge[col])
        
quest1_before = [df_merge['Quest1_before'] for i in range(2)]
quest2_before = [df_merge['Quest2_before'] for i in range(2)]
quest1_after = [df_merge['Quest1_after'] for i in range(2)]
quest2_after = [df_merge['Quest2_after'] for i in range(2)]
        
popr_row = prepare_row(popr)   
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before  A   B
poprawnosc          
0              1  22
1              7  52
Wartość statystyki chi-kwadrat: 0.37981487382740153
P-value: 0.5377023293868424
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                12       5      1       5
1                30       9      5      15
Wartość statystyki chi-kwadrat: 0.8905849738568967
P-value: 0.8276992569297563
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A   B
poprawnosc          
0              7  16
1             15  44
Wartość statystyki chi-kwadrat: 0.033372412407047594
P-value: 0.8550481858414848
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0                9       4      1       9
1               29       8      1      21
Wartość statystyki chi-kwadrat

-> 3

In [12]:
popr = []
for col in df_merge.columns.tolist():
    if col.startswith('3') and col.endswith('_corr'):
        popr.append(df_merge[col])
        
quest1_before = [df_merge['Quest1_before'] for i in range(2)]
quest2_before = [df_merge['Quest2_before'] for i in range(2)]
quest1_after = [df_merge['Quest1_after'] for i in range(2)]
quest2_after = [df_merge['Quest2_after'] for i in range(2)]
        
popr_row = prepare_row(popr)   
q1_b = prepare_row(quest1_before)
q1_a = prepare_row(quest1_after)
q2_b = prepare_row(quest2_before)
q2_a = prepare_row(quest2_after)

df = pd.DataFrame({'poprawnosc': popr_row, 'quest1_before': q1_b, 
                         'quest2_before': q2_b, 'quest1_after': q1_a,
                         'quest2_after': q2_a})

conduct_chi2test(df, 'poprawnosc', 'quest1_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_before', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest1_after', ALPHA)
print('------------------------------------------')
conduct_chi2test(df, 'poprawnosc', 'quest2_after', ALPHA)

quest1_before  A   B
poprawnosc          
0              3  38
1              5  36
Wartość statystyki chi-kwadrat: 0.1385135135135135
P-value: 0.7097632756475021
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                25       5      2       9
1                17       9      4      11
Wartość statystyki chi-kwadrat: 3.533333333333333
P-value: 0.31646456315918847
Brak podstaw do odrzucenia H0.
------------------------------------------
quest1_after   A   B
poprawnosc          
0             14  27
1              8  33
Wartość statystyki chi-kwadrat: 1.553030303030303
P-value: 0.21268864307211574
Brak podstaw do odrzucenia H0.
------------------------------------------
quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0               25       2      2      12
1               13      10      0      18
Wartość statystyki chi-kwadrat: 1

#### Zadania 1a, 1b, 2a, 2b, 3a, 3b

In [13]:
df1a = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '1a_corr']].rename(columns={'1a_corr':'poprawnosc'})
df2a = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '2a_corr']].rename(columns={'2a_corr':'poprawnosc'})
df3a = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '3a_corr']].rename(columns={'3a_corr':'poprawnosc'})

df1b = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '1b_corr']].rename(columns={'1b_corr':'poprawnosc'})
df2b = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '2b_corr']].rename(columns={'2b_corr':'poprawnosc'})
df3b = df_merge[['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after', '3b_corr']].rename(columns={'3b_corr':'poprawnosc'})

dfs = [df1a, df1b, df2a, df2b, df3a, df3b]
names = {
    1: '1a:',
    2: '1b:',
    3: '2a:',
    4: '2b:',
    5: '3a:',
    6: '3b:',
}

In [17]:
for nr, df in enumerate(dfs):
    print('---------------------------------------------')
    print(names[nr+1])
    for i in ['Quest1_before', 'Quest1_after', 'Quest2_before', 'Quest2_after']:
        print('----------------')
        print(i)
        conduct_chi2test(df, 'poprawnosc', i, ALPHA)

---------------------------------------------
1a:
----------------
Quest1_before
Quest1_before  A   B
poprawnosc          
0              1   4
1              3  33
Wartość statystyki chi-kwadrat: 0.00038475975975976035
P-value: 0.9843502633116243
Brak podstaw do odrzucenia H0.
----------------
Quest1_after
Quest1_after  A   B
poprawnosc         
0             4   1
1             7  29
Wartość statystyki chi-kwadrat: 5.406098484848484
P-value: 0.020066516230538914
Istnieją podstawy do odrzucenia H0, przyjmujemy hipotezę H1.
----------------
Quest2_before
Quest2_before  mapa  tabela  tekst  wykres
poprawnosc                                
0                 3       1      0       1
1                18       6      3       9
Wartość statystyki chi-kwadrat: 0.5759523809523808
P-value: 0.9019147738707174
Brak podstaw do odrzucenia H0.
----------------
Quest2_after
Quest2_after  mapa  tabela  tekst  wykres
poprawnosc                               
0                5       0      0       0
1

### Podsumowanie:
Istnieje istotna statystycznie zależność między poprawnością odpowiedzi a odpowiedzią na pytanie dotyczące preferowanej formy graficznej na poziomie istotności $\alpha=0.05$ dla:
- wszystkie grafiki, quest1_after
- grafiki B, quest1_after
- grafiki 1, quest1_after
- grafiki 3, quest2_after
- grafika 1a, quest1_after
- grafika 3b, quest2_after



### Analiza ossoby które zmieniły zdanie vs osoby które pozostały przy swojej opinii
**H0:** Nie ma istotnej statystycznie zależności między poprawnością odpowiedzi a zmianą zdania w pytaniu 1/2.

**H1:** Istnieje istotna statystycznie zależność między poprawnością odpowiedzi a zmianą zdania w pytaniu 1/2.

**Poziom istotności:** $\alpha=0.05$


In [18]:
df_merge['is_change_1'] = df_merge.apply(lambda row: row['Quest1_before'] != row['Quest1_after'], axis=1)
df_merge['is_change_2'] = df_merge.apply(lambda row: row['Quest2_before'] != row['Quest2_after'], axis=1)

df_merge

Unnamed: 0,ID,Quest1_before,Quest2_before,1a_corr,1b_corr,2a_corr,2b_corr,3a_corr,3b_corr,Quest1_after,Quest2_after,is_change_1,is_change_2
0,1,B,wykres,1,1,0,0,1,1,B,wykres,False,False
1,2,B,wykres,1,1,1,1,0,1,B,wykres,False,False
2,3,B,mapa,1,1,1,1,0,0,B,mapa,False,False
3,4,B,mapa,1,1,1,1,1,0,B,wykres,False,True
4,5,B,tabela,1,1,1,1,1,1,B,tabela,False,False
5,6,B,wykres,1,1,1,1,0,1,B,mapa,False,True
6,7,B,tekst,1,1,1,1,1,1,B,wykres,False,True
7,11,B,mapa,1,0,0,0,0,1,B,wykres,False,True
8,12,B,mapa,1,1,0,0,0,0,B,mapa,False,False
9,13,A,mapa,1,1,1,1,1,0,A,mapa,False,False


#### Grafiki:

In [21]:
# wszystkie
popr = []
for col in df_answers.columns.tolist():
    if col.endswith('corr'):
        popr.append(df_answers[col])
        
changes1 = [df_merge['is_change_1'] for i in range(6)]
changes2 = [df_merge['is_change_2'] for i in range(6)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

----------------
quest1
quest1      False  True
poprawnosc             
0              50    22
1             142    32
Wartość statystyki chi-kwadrat: 3.717360196493188
P-value: 0.05384944288623782
Brak podstaw do odrzucenia H0.
----------------
quest2
quest2      False  True
poprawnosc             
0              26    46
1              70   104
Wartość statystyki chi-kwadrat: 0.21060853687739414
P-value: 0.6462908566505332
Brak podstaw do odrzucenia H0.


In [22]:
# grafiki A
popr = []
for col in df_answers.columns.tolist():
    if col.endswith('a_corr'):
        popr.append(df_answers[col])
        
changes1 = [df_merge['is_change_1'] for i in range(3)]
changes2 = [df_merge['is_change_2'] for i in range(3)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

----------------
quest1
quest1      False  True
poprawnosc             
0              26    10
1              70    17
Wartość statystyki chi-kwadrat: 0.5850237135483183
P-value: 0.4443498952350563
Brak podstaw do odrzucenia H0.
----------------
quest2
quest2      False  True
poprawnosc             
0              14    22
1              34    53
Wartość statystyki chi-kwadrat: 0.0
P-value: 1.0
Brak podstaw do odrzucenia H0.


In [23]:
# grafiki B
popr = []
for col in df_answers.columns.tolist():
    if col.endswith('b_corr'):
        popr.append(df_answers[col])
        
changes1 = [df_merge['is_change_1'] for i in range(3)]
changes2 = [df_merge['is_change_2'] for i in range(3)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

----------------
quest1
quest1      False  True
poprawnosc             
0              24    12
1              72    15
Wartość statystyki chi-kwadrat: 2.966708739091102
P-value: 0.08499461498099148
Brak podstaw do odrzucenia H0.
----------------
quest2
quest2      False  True
poprawnosc             
0              12    24
1              36    51
Wartość statystyki chi-kwadrat: 0.3958866139846738
P-value: 0.5292212634953144
Brak podstaw do odrzucenia H0.


In [25]:
# grafiki 1,2,3
popr = []
for col in df_merge.columns.tolist():
    if col.startswith('1') and col.endswith('_corr'):
        popr.append(df_merge[col])

changes1 = [df_merge['is_change_1'] for i in range(2)]
changes2 = [df_merge['is_change_2'] for i in range(2)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

print('1:')
for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

popr = []
for col in df_merge.columns.tolist():
    if col.startswith('2') and col.endswith('_corr'):
        popr.append(df_merge[col])

changes1 = [df_merge['is_change_1'] for i in range(2)]
changes2 = [df_merge['is_change_2'] for i in range(2)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

print('--------------------------------------------')
print('2:')
for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

popr = []
for col in df_merge.columns.tolist():
    if col.startswith('3') and col.endswith('_corr'):
        popr.append(df_merge[col])

changes1 = [df_merge['is_change_1'] for i in range(2)]
changes2 = [df_merge['is_change_2'] for i in range(2)]
df = prepare_set_changes_questions(popr, changes1, changes2, 'poprawnosc')

print('--------------------------------------------')
print('3:')
for i in ['quest1', 'quest2']:
    print('----------------')
    print(i)
    conduct_chi2test(df, 'poprawnosc', i, ALPHA)

1:
----------------
quest1
quest1      False  True
poprawnosc             
0               3     5
1              61    13
Wartość statystyki chi-kwadrat: 6.087019636824325
P-value: 0.013617860689217585
Istnieją podstawy do odrzucenia H0, przyjmujemy hipotezę H1.
----------------
quest2
quest2      False  True
poprawnosc             
0               3     5
1              29    45
Wartość statystyki chi-kwadrat: 0.0
P-value: 1.0
Brak podstaw do odrzucenia H0.
--------------------------------------------
2:
----------------
quest1
quest1      False  True
poprawnosc             
0              17     6
1              47    12
Wartość statystyki chi-kwadrat: 0.07181000777859668
P-value: 0.7887194137435113
Brak podstaw do odrzucenia H0.
----------------
quest2
quest2      False  True
poprawnosc             
0               5    18
1              27    32
Wartość statystyki chi-kwadrat: 3.0676354089904216
P-value: 0.07986556189878524
Brak podstaw do odrzucenia H0.
--------------------------

In [27]:
# dla garfik 1 wyszło H1: sprawdzamy dla 1a i 1b
df1a = df_merge[['is_change_1', '1a_corr']].rename(columns={'1a_corr':'poprawnosc', 'is_change_1': 'quest1'})
df1b = df_merge[['is_change_1', '1b_corr']].rename(columns={'1b_corr':'poprawnosc', 'is_change_1': 'quest1'})

for i in [df1a, df1b]:
    print('----------------')
    conduct_chi2test(i, 'poprawnosc', 'quest1', ALPHA)

----------------
quest1      False  True
poprawnosc             
0               2     3
1              30     6
Wartość statystyki chi-kwadrat: 2.6148967978395055
P-value: 0.10586441215755699
Brak podstaw do odrzucenia H0.
----------------
quest1      False  True
poprawnosc             
0               1     2
1              31     7
Wartość statystyki chi-kwadrat: 1.486362390350877
P-value: 0.22278171435089766
Brak podstaw do odrzucenia H0.


Podsumowanie:
Zmiana zdania nie wpłynęła na poprawność odpowiedzi w sposób istotny statystycznie poza grafikami typu 1.