#### 윌콕는 부호 순위 다중 검정

1. 하나의 데이터 집합에서 여러 개의 가설 검정을 수행할 때 발생하는 문제를 다룸. (검정을 하는 만큼 오류가 발생한다.)
2. 여러 개의 검정을 수행할 때 적절한 보정을 해야한다.

##### 오류 타입

1. 제 1종 오류 타입 (False Positive)
    - 귀무가설이 참이지만, 대립가설이 참.
    - 효과 없는 약에 대해 효과가 있다.
    - 적절한 실험 계획 및 검정 방법 선택 / 검정력 분석등을 최소화 가능

2. 제 2종 오류 타입  (False Nenative)
    - 귀무가설을 기각할 근거가 충분하지 않아, 귀무가설이 거짓임에도 불구하고 기각하지 못하는 오류
    - 검정 결과로는 차이나 관계가 없는 것으로 반대의 오류가 생김.
    - 약이 효과가 있음에도 효과가 없는 것으로 보여짐.
    - 검정력을 적설하게 설정하는 것이 중요하다.

- 보정 방법
    - Bonferroni 보정 : 유의수준/가설의 개수로 설정함.
    - Benajamini-Hochberg(BH) 보정 : 각각의 가설 검정에서 p-value를 큰 것부터 정렬하고, 사용자 지정 수준에 맞는 것을 선택

In [1]:
import pandas as pd
from scipy.stats import wilcoxon
from statsmodels.stats.multitest import multipletests

In [36]:
# 데이터 불러오기
data = pd.read_csv('../00_DataEx/99_Output/treatment_data_multi.csv')
p_values = []

for i in range(10) :
    sample = data.sample(frac=0.5)
    st, p = wilcoxon(sample['pre_treatment'], sample['post_treatment'])
    print("sample", i+1, ':')
    print('statistic : ', st)
    print('p-value', p)
    p_values.append(p)
   
    if p > 0.05 :
        print("fail to reject HO")
    else :
        print("reject HO")
    print("-----------------")

sample 1 :
statistic :  18.0
p-value 1.0
fail to reject HO
-----------------
sample 2 :
statistic :  13.5
p-value 0.9319149601232763
fail to reject HO
-----------------
sample 3 :
statistic :  8.5
p-value 0.34732353285574014
fail to reject HO
-----------------
sample 4 :
statistic :  14.0
p-value 0.30353286929141443
fail to reject HO
-----------------
sample 5 :
statistic :  14.0
p-value 0.5574801348628696
fail to reject HO
-----------------
sample 6 :
statistic :  7.5
p-value 0.5236085643722508
fail to reject HO
-----------------
sample 7 :
statistic :  9.5
p-value 0.8316408424990329
fail to reject HO
-----------------
sample 8 :
statistic :  8.5
p-value 0.17692900573221848
fail to reject HO
-----------------
sample 9 :
statistic :  7.5
p-value 0.25963977138128647
fail to reject HO
-----------------
sample 10 :
statistic :  9.5
p-value 0.4351560724455289
fail to reject HO
-----------------




#### Boneferroni 보정

In [37]:
alpha = 0.05
rejects_bonf, corrected_p_bonf, _, _ = multipletests(p_values, alpha=alpha, method='bonferroni')
print("Bonferroni")
for i in range(len(rejects_bonf)) :
    if rejects_bonf[i] :
        print(f"sample : {i+1} : reject HO" )
    else :
        print(f"sample : {i+1} : fail to reject HO")

Bonferroni
sample : 1 : fail to reject HO
sample : 2 : fail to reject HO
sample : 3 : fail to reject HO
sample : 4 : fail to reject HO
sample : 5 : fail to reject HO
sample : 6 : fail to reject HO
sample : 7 : fail to reject HO
sample : 8 : fail to reject HO
sample : 9 : fail to reject HO
sample : 10 : fail to reject HO


- rejects_bonf: 각 가설에 대한 기각 여부를 나타내는 불리언 배열입니다. 
- rejects_bonf[i]는 i번째 가설이 기각되었는지 여부를 나타냅니다.
- corrected_p_bonf: 보정된 p-값들의 배열입니다. 
- corrected_p_bonf[i]는 i번째 가설의 보정된 p-값을 나타냅니다.