# 사후 분석 (post hoc)

## #01. 사후분석 개요

ANOVA 검증 결과 유의미하다는 결론을 얻었을 때, 구체적으로 어떤 수준(들)에서 평균 차이가 나는지를 검증하는 방법

연구자의 사전 가설(아이디어)없이 ANOVA를 시행한 경우, 탐색적으로 평균 차이가 나는 수준(집단)을 살펴보기 위해 시행하는 방법

조합 가능한 모든 쌍에 대해 비교를 하므로 과잉검증으로 인한 **FWER** 증가




### FRWR (가족오류율, Familywise Error Rate)

가설 검정에서 여러 개의 가설을 동시에 비교하는 경우, 각 가설을 독립적으로 검정할 때 발생하는 오류 확률이 존재한다.

FWER는 이러한 가설 중 어느 하나라도 잘못 기각되는 전체적인 오류율을 의미

즉, FWER은 적어도 하나의 거짓 양성(잘못된 기각)이 발생할 확률 -> 가설검정을 많이 할 수록 FWER은 증가




### 대표적인 사후분석 방법 

유의수준을 보정하여 FWER을 0.05로 고정시킴 (가족오류율)
  
- 봉페로니 교정 (일반적으로 널리 사용됨) - 전체에서 유의수준 알파를 설정했을 때 검정 반복 횟수를 k라고 하고 , 매 검정에서 알파를 검정횟수로 나눈 값 a/k를 기준으로 가설검정을 하는 방법 
- 투키의 HSD (일반적으로 널리 사용됨)
- 피셔의 LSD : 실제로 보정을 하지 않는 방법이므로 사용하지 않음.
- 셰페의 방법 : 지나치게 보수적이어서 사용하지 않음


In [33]:
from pandas import read_excel

# 분산분석을 위한 라이브러리
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

# 사후분석을 위한 라이브러리
from statsmodels.sandbox.stats.multicomp import MultiComparison
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.stats import ttest_ind

# helper 참조
import sys
import os
sys.path.append(os.path.dirname(os.path.dirname(os.getcwd())))
from helper import normality_test, equal_variance_test, independence_test, all_test

## #03. 예제 (1)

품종별 나무 무게 조사 데이터

### 데이터 가져오기

In [34]:
df = read_excel("https://data.hossam.kr/E02/tree_weight.xlsx")
df

Unnamed: 0,weight,group
0,4.17,A
1,5.58,A
2,5.18,A
3,6.11,A
4,4.5,A
5,4.61,A
6,5.17,A
7,4.53,A
8,5.33,A
9,5.14,A


### 데이터 전처리


항상 카테고리를 확인해서 돌릴 수 있도록 숫자로 변환해야 함

In [35]:
df2 = df.copy()
df2['group'] = df2['group'].map({'A': 0, 'B': 1, 'C': 2})
df2

Unnamed: 0,weight,group
0,4.17,0
1,5.58,0
2,5.18,0
3,6.11,0
4,4.5,0
5,4.61,0
6,5.17,0
7,4.53,0
8,5.33,0
9,5.14,0


### 일원분산분석

#### 정규성, 등분산성, 독립성 검사

In [36]:
all_test(df2['group'], df2['weight'])

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,statistic,p-value,result
condition,test,field,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
정규성,shapiro,group,0.795503,5.434527e-05,False
정규성,shapiro,weight,0.982683,0.8915055,True
정규성,normaltest,group,17.211505,0.0001830498,False
정규성,normaltest,weight,0.568335,0.7526404,True
정규성,ks_2samp,group vs weight,1.0,1.691123e-17,False
정규성,ks_2samp,weight vs group,1.0,1.691123e-17,False
등분산성,Bartlett,group vs weight,0.812217,0.3674655,True
등분산성,Fligner,group vs weight,1.419281,0.2335219,True
등분산성,Levene,group vs weight,0.849158,0.360608,True
독립성,Chi2,group vs weight,15.905074,0.9765907,True


#### 분산분석 수행

In [37]:
model = ols('weight ~ C(group)', data=df2).fit()
anova_lm(model)

Unnamed: 0,df,sum_sq,mean_sq,F,PR(>F)
C(group),2.0,3.76634,1.88317,4.846088,0.01591
Residual,27.0,10.49209,0.388596,,


분산분석이 끝나면 사후분석을 수행할 수 있다. 

### 사후분석

#### 봉페로니 교정

- Bonferroni correction
- 모든 집단을 짝지어 t-test
- FWER이 중간 정도

In [38]:
comp = MultiComparison(df['weight'], df['group'])
result = comp.allpairtest(ttest_ind, method='bonf') #P벨류에 의해 보정을 마친 값 pvale ->  보정된 값은 "pval-corr" pval-corr를 보면 된다.  
result[0]

group1,group2,stat,pval,pval_corr,reject
A,B,1.1913,0.249,0.7471,False
A,C,-2.134,0.0469,0.1406,False
B,C,-3.0101,0.0075,0.0226,True


### 투키의 HSD

`Tuckey's Honestly Significant Difference` = "진정으로 유의미한 차이"
본페로니 교정보다 검증력이 우수하다. 

FWER이 중간 정도

In [39]:
hsd = pairwise_tukeyhsd(df['weight'], df['group'], alpha=0.05)
hsd.summary()

group1,group2,meandiff,p-adj,lower,upper,reject
A,B,-0.371,0.3909,-1.0622,0.3202,False
A,C,0.494,0.198,-0.1972,1.1852,False
B,C,0.865,0.012,0.1738,1.5562,True


### 결과보고

1. 전체 모형에 대한 분석결과 보고
2. 사용한 사후분석 방법에 대한 보고
3. 유의미한 사후분석 결과들에 대한 보고

> group에 따른 weight의 평균 차이는 유의미하였다


($F(2, 27) = 4.846, p < 0.05$)


F(2,27) 27개의 데이터와 자유도 2 (조건이 3개니까)

Tukey의 HSD를 이용하여 사후분석을 실시한 결과, B 조건과 C 조건에서 유의미한 평균 차이가 있었다($p < 0.05$).

## 예제 (2)

독극물 실험 데이터

| 필드 | 설명 |
|--|--|
| Time | 동물의 생존시간 |
| poison | 사용된 독극물 종류 |
| treat | 사용되는 치료 유형 |

### 데이터 가져오기

In [40]:
df = read_excel("https://data.hossam.kr/E02/poisons.xlsx")
df.head(5)

Unnamed: 0,time,poison,treat
0,0.31,1,A
1,0.45,1,A
2,0.46,1,A
3,0.43,1,A
4,0.36,2,A


In [41]:
df2 = df.copy()
df2['treat'] = df2['treat'].map({'A': 0, 'B': 1, 'C': 2,'D':3})
df2

Unnamed: 0,time,poison,treat
0,0.31,1,0
1,0.45,1,0
2,0.46,1,0
3,0.43,1,0
4,0.36,2,0
5,0.29,2,0
6,0.4,2,0
7,0.23,2,0
8,0.22,3,0
9,0.21,3,0


In [42]:
all_test(df2['time'], df2['poison'],df2['treat'])

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,statistic,p-value,result
condition,test,field,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
정규성,shapiro,time,0.877399,0.0001265919,False
정규성,shapiro,poison,0.793623,9.351824e-07,False
정규성,shapiro,treat,0.856681,3.28712e-05,False
정규성,normaltest,time,12.270059,0.002165661,False
정규성,normaltest,poison,39.942604,2.121162e-09,False
정규성,normaltest,treat,22.049881,1.62903e-05,False
정규성,ks_2samp,time vs poison,0.9375,4.4406690000000003e-23,False
정규성,ks_2samp,poison vs treat,0.25,0.09956397,True
정규성,ks_2samp,treat vs time,0.6875,4.065699e-11,False
등분산성,Bartlett,time vs poison vs treat,79.410822,5.703731e-18,False


이원분산분석

In [46]:
model = ols('time ~ C(poison) * C(treat)', data=df).fit() 
# 'time ~ C(poison) + C(treat) + C(poison):C(treat)' 를 *로 바꿀 수 있다. 
anova_lm(model)

Unnamed: 0,df,sum_sq,mean_sq,F,PR(>F)
C(poison),2.0,1.033012,0.516506,23.221737,3.33144e-07
C(treat),3.0,0.921206,0.307069,13.805582,3.777331e-06
C(poison):C(treat),6.0,0.250138,0.04169,1.874333,0.1122506
Residual,36.0,0.800725,0.022242,,


결과해석

| 요인 | 분석모델 | 결과 |
|--|--|--|
| poison | $F(2, 36) = 23.222, p < 0.05$ | poison의 수준에 따라 평균에 차이가 난다고 볼 수 있음 |
| treat | $F(3, 36) = 13.806, p < 0.05$ | treat의 수준에 따라 평균에 차이가 난다고 볼 수 있음 |
| poison:treat | $F(6, 36) = 1.874, p > 0.05$ | 유의미하지 않음. 상호작용 효과는 발견하지 못함 |

In [None]:
comp = MultiComparison(df['weight'], df['group'])
result = comp.allpairtest(ttest_ind, method='bonf') #P벨류에 의해 보정을 마친 값 pvale ->  보정된 값은 "pval-corr" pval-corr를 보면 된다.  
result[0]

## 사후분석

### poison에 대한 봉페로니

일반적으로 결과가 다를 때는 일반적으로는 투키 방식을 선택한다. 

In [47]:
comp = MultiComparison(data=df2['time'], groups=df2['poison'])
result = comp.allpairtest(ttest_ind,method='bonf')
result[0]

group1,group2,stat,pval,pval_corr,reject
1,2,0.8189,0.4193,1.0,False
1,3,6.2474,0.0,0.0,True
2,3,3.6234,0.0011,0.0032,True


In [48]:
hsd = pairwise_tukeyhsd(df2['time'], df2['poison'], alpha=0.05)
hsd.summary()

group1,group2,meandiff,p-adj,lower,upper,reject
1,2,-0.0731,0.5882,-0.2525,0.1063,False
1,3,-0.3412,0.0001,-0.5206,-0.1619,True
2,3,-0.2681,0.0021,-0.4475,-0.0887,True


In [49]:
hsd = pairwise_tukeyhsd(df2['time'], df2['treat'], alpha=0.05)
hsd.summary()

group1,group2,meandiff,p-adj,lower,upper,reject
0,1,0.3625,0.001,0.1253,0.5997,True
0,2,0.0783,0.8143,-0.1589,0.3156,False
0,3,0.22,0.0778,-0.0172,0.4572,False
1,2,-0.2842,0.0132,-0.5214,-0.0469,True
1,3,-0.1425,0.387,-0.3797,0.0947,False
2,3,0.1417,0.3922,-0.0956,0.3789,False
