In [5]:
import numpy as np
import pandas as pd
from scipy import stats

before_medicine = np.random.randint(1, 10, size=20)
after_medicine = before_medicine + np.random.randint(-3, 4, size=20)

data = pd.DataFrame({
    "before_medicine": before_medicine,
    "after_medicine": after_medicine
})

p_vals_list = []
for i in range(10):
    # data에서 랜덤으로 데이터를 선정해서 윌콕슨 부호 순위 검정 진행
    sample = data.sample(frac=0.5)

    _, p_value = stats.wilcoxon(sample['before_medicine'], sample['after_medicine'])
    p_vals_list.append(p_value)
    print(f'Sample {i + 1}, 귀무가설 기각 여부 : {p_value < 0.05}')


Sample 1, 귀무가설 기각 여부 : False
Sample 2, 귀무가설 기각 여부 : False
Sample 3, 귀무가설 기각 여부 : False
Sample 4, 귀무가설 기각 여부 : False
Sample 5, 귀무가설 기각 여부 : False
Sample 6, 귀무가설 기각 여부 : False
Sample 7, 귀무가설 기각 여부 : False
Sample 8, 귀무가설 기각 여부 : True
Sample 9, 귀무가설 기각 여부 : False
Sample 10, 귀무가설 기각 여부 : False




In [12]:
from statsmodels.stats.multitest import multipletests

# multipletests : 다중 검정으로 얻은 P-Value 집합을 넣어 보정을 진행
# alpha 인자는 기본적으로 0.05 (유의수준 5%)로 설정되어 있음) 
rejected_bool, corrected_p, _, bonferroni_alpha = multipletests(p_vals_list, method='bonferroni')

print(f'Bonferroni 보정에 사용될 유의수준 : {bonferroni_alpha}')
for i, item in enumerate(rejected_bool):
    if item:
        print(f"{i + 1} : P_Value {corrected_p[i]}, 귀무가설 기각됨")
    else:
        print(f"{i + 1} : P_Value {corrected_p[i]},귀무가설 채택됨")
    

Bonferroni 보정에 사용될 유의수준 : 0.005
1 : P_Value 1.0,귀무가설 채택됨
2 : P_Value 1.0,귀무가설 채택됨
3 : P_Value 1.0,귀무가설 채택됨
4 : P_Value 1.0,귀무가설 채택됨
5 : P_Value 1.0,귀무가설 채택됨
6 : P_Value 1.0,귀무가설 채택됨
7 : P_Value 1.0,귀무가설 채택됨
8 : P_Value 0.474368928248654,귀무가설 채택됨
9 : P_Value 1.0,귀무가설 채택됨
10 : P_Value 1.0,귀무가설 채택됨


In [14]:
# Bonfeffoni 보정에서는 모든 검정에 대해 똑같이 n배 엄격한 유의수준을 일괄적으로 적용
# 그러나 Benjamoni-Hochberg 보정에서는 P-Value 크기 순으로 유예를 주기 때문에 단일 유의수준을 반환하지 않음
# 따라서 Bonferroni 보정의 유의수준에 해당하는 4번째 인자까지 생략
rejectes_bool, corrected_p, _, _ = multipletests(p_vals_list, method='fdr_bh')

for i, item in enumerate(rejected_bool):
    if item:
        print(f"{i + 1} : P_Value {corrected_p[i]}, 귀무가설 기각됨")
    else:
        print(f"{i + 1} : P_Value {corrected_p[i]},귀무가설 채택됨")
    


1 : P_Value 0.6310566191660882,귀무가설 채택됨
2 : P_Value 0.6310566191660882,귀무가설 채택됨
3 : P_Value 0.6310566191660882,귀무가설 채택됨
4 : P_Value 0.6310566191660882,귀무가설 채택됨
5 : P_Value 0.6310566191660882,귀무가설 채택됨
6 : P_Value 0.5107288041009415,귀무가설 채택됨
7 : P_Value 0.6310566191660882,귀무가설 채택됨
8 : P_Value 0.47436892824865395,귀무가설 채택됨
9 : P_Value 0.6310566191660882,귀무가설 채택됨
10 : P_Value 0.6310566191660882,귀무가설 채택됨
