# 다중 검정 실습
* 1종 오류 타입
귀무가설이 참이지만 대립가설이 참이라는 잘못된 결론을 내리는 것.<br>
일반적으로 유의수준(alpha)을 0.05로 사용하는 경우, 100번 중 5번은 우연히 귀무가설을 기각하게 된다. 이 때 귀무가설이 참인데도 대립가설을 참으로 잘못 판단하는 것이 제 1종 오류이다.
이러한 오류가 발생하면, 적절한 실험 계획 및 검정 방법 선택, 검정력 분석 등을 통해 최소화 할 수 있다.
* 2종 오류 타입
귀무가설을 기각할 근거가 충분하지 않아 귀무가설이 거짓임에도 불구하고 기각하지 못하는 오류. 우리가 찾고자 하는 차이나 관계가 존재하는데도 불구하고, 검정 결과로는 차이나 관계가 없는 것으로 나타나는 경우이다.<br>


## 보정 방법
다중 비교 문제는 유의수준을 조정해 주어야 한다. 이는 가설 검정에서 유의수준을 설정하면서 생기는 문제로, 가설 수가 증가할수록 제 1종 오류가 발생할 가능성이 높아지는 문제이다. 보정 방법은 유의수준을 보정해야 한다.
대표적인 보정 방법은 Bonferroni 보정과 Benjamini-Hochberg(BH) 보정

- Bonferroni 보정
간단하면서 보수적인 방법으로, 각각의 가설 검정에서 유의수준을 1/m(m은 가설의 개수)로 나누어 준다. 이렇게 보정된 유의수준보다 작은 p-value를 가지는 가서를만을 유의미하다고 판단한다. 이 방법은 가설의 개수가 작을 때에는 유용하지만, 가설 수가 많아질수록 유의수준이 극도로 작아져, 결국 유의미한 가설을 찾는 것이 어려워진다.

- Benjamini-Hochberg(BH) 보정
위 보정의 단점을 보완한 방법. 각각의 가설 검정에서 p-value를 작은 것부터 큰 것 순서대로 정렬한다. 그리고 정렬된 p-value에 고유한 인덱스를 붙인다. 이 때, 인텍스 i에 해당하는 가설의 p-vlaue가 (i/m)*alpha(사용자가 지정한 유의수준) 보다 작을 때까지만 유의미하다고 판단.

## 윌콕슨 부호 순위 다중 검정 실습
### Bonferroni 보정
검정을 여러번 수행하면서 다중 검정 오류가 발생하는 문제 보정 예시 실습

In [1]:
import pandas as pd
from scipy.stats import wilcoxon
from statsmodels.stats.multitest import multipletests

data = pd.read_csv("./data/treatment_data.csv")

p_values = []

# 여러 개의 가설 검정 수행
for i in range(10):
    # 랜덤으로 데이터를 선택해서 윌콕슨 부호 순위 검정 수행
    sample = data.sample(frac=0.5)
    st, p = wilcoxon(sample['pre_treatment'], sample['post_treatment'])
    print("sample", i+1, ':')
    print('statis : ', st)
    print('p-values : ', p)
    p_values.append(p)
    
    if p > 0.5:
        print('fail to reject HO')
    else:
        print("reject HO")
        
        
alpha = 0.05
rejects_bonf, corrected_p_bonf, _, _ = multipletests(p_values, alpha=alpha, method='bonferroni')   # bonferroni이나 fdr-bh 둘 중 해당하는 알고리즘 사용
print("Bonferroni")
for i in range(len(rejects_bonf)) :
    if rejects_bonf[i] :
        print(f"sample : {i+1} : reject HO" )
    else :
        print(f"sample : {i+1} : fail to reject HO")


sample 1 :
statis :  3.0
p-values :  0.03546586462402558
reject HO
sample 2 :
statis :  1.0
p-values :  0.017153601700200603
reject HO
sample 3 :
statis :  1.5
p-values :  0.020706216472488822
reject HO
sample 4 :
statis :  3.0
p-values :  0.03546586462402558
reject HO
sample 5 :
statis :  3.0
p-values :  0.06203917662384968
reject HO
sample 6 :
statis :  0.0
p-values :  0.001953125
reject HO
sample 7 :
statis :  3.0
p-values :  0.03456570267773128
reject HO
sample 8 :
statis :  3.0
p-values :  0.009765625
reject HO
sample 9 :
statis :  1.0
p-values :  0.010723552816128436
reject HO
sample 10 :
statis :  3.0
p-values :  0.009765625
reject HO
Bonferroni
sample : 1 : fail to reject HO
sample : 2 : fail to reject HO
sample : 3 : fail to reject HO
sample : 4 : fail to reject HO
sample : 5 : fail to reject HO
sample : 6 : reject HO
sample : 7 : fail to reject HO
sample : 8 : fail to reject HO
sample : 9 : fail to reject HO
sample : 10 : fail to reject HO




In [5]:
import pandas as pd
from scipy.stats import wilcoxon
from statsmodels.stats.multitest import multipletests

data = pd.read_csv("./data/treatment_data.csv")

# 여러 개의 가설 검정 수행
for i in range(10):
    # 랜덤으로 데이터를 선택해서 윌콕슨 부호 순위 검정 수행
    sample = data.sample(frac=0.5)
    st, p = wilcoxon(sample['pre_treatment'], sample['post_treatment'])
    print("sample", i+1, ':')
    print('statis : ', st)
    print('p-values : ', p)
    p_values.append(p)
    
    if p > 0.5:
        print('fail to reject HO')
    else:
        print("reject HO")
        
        
alpha = 0.05
p_values = []
rejects_bh, corrected_p_bh, _, = multipletests(p_values, alpha=alpha, method = 'fdr_bh')
print('Benjamini-Hochberg(BH) correction')
for i in range(len(rejects_bh)):
    if rejects_bh[i]:
        print(f'Sample {i+1}: Different distribution (reject H0)')
    else:
        print(f'Sample {i+1}: Same distribution (fail to reject H0)')


ZeroDivisionError: float division by zero