비모수검정 中 모중위수 검정

## 윌콕슨의 부호 순위 검정
## 윌콕슨의 순위합 검정
## 만 위트니 U 검정

- 비모수 검정은 정규성을 충족하지 못할 경우 사용
- 평균이 아닌 중위수를 기준으로 검정을 수행함

In [3]:
# 단일표본 T 검정 대신 단일 표본 부호순위 검정 수행
# 몸무게 데이터를 임의로 생성하고
# 모집단의 중위수가 70이라고 할 수 있는지

import numpy as np
kg = np.array([75.5, 83.9, 75.7, 56.2, 73.4, 67.7, 79.0, 50.7, 58.4, 74.1, 65.1, 77.8, 48.1, 46.3])

from scipy.stats import wilcoxon

wilcoxon(kg-70)

# 결과: WilcoxonResult(statistic=42.0, pvalue=0.5416259765625)
# p-value 크다 -> 귀무가설 채택 -> 동일함

# 결론: 유의수준 5%에서 모집단의 중위수가 70과 같다!

WilcoxonResult(statistic=42.0, pvalue=0.5416259765625)

In [6]:
# 대응 표본 T 검정 대신 이표본 부호순위 검정 수행
# 남녀 몸무게 데이터를 임의로 생성하고
# 두 데이터가 서로 짝지어져 있다고 가정하고
# 두 데이터에 대한 모중위수가 서로 다르다고 할 수 있는지

import numpy as np
female = np.array([50.7, 58.4, 74.1, 65.1, 77.8, 48.1, 46.3])
male = np.array([75.5, 83.9, 75.7, 56.2, 73.4, 67.7, 79.0])

from scipy.stats import wilcoxon

wilcoxon(female - male)

# 결과: WilcoxonResult(statistic=5.0, pvalue=0.15625)
# p-value 크다 -> 귀무가설 채택 -> 차이 없음

# 결론: 유의수준 5%에서 두 표본의 중앙값에 유의한 차이가 없음

WilcoxonResult(statistic=5.0, pvalue=0.15625)

In [12]:
# 독립표본 T 검정 대신 순위합 검정 수행
# 남녀 몸무게 데이터를 임의로 생성하고
# 두 데이터가 서로 독립이라고 가정하고
# 두 데이터에 대한 모중위수가 서로 다르다고 할 수 있는지

import numpy as np
female = np.array([50.7, 58.4, 74.1, 65.1, 77.8, 48.1, 46.3])
male = np.array([75.5, 83.9, 75.7, 56.2, 73.4, 67.7, 79.0])

from scipy.stats import ranksums
ranksums(female, male)

# 결과: RanksumsResult(statistic=-1.8527420384998257, pvalue=0.06391934147515746)
# p-value 크다 -> 귀무가설 채택 -> 두 데이터 모중위수 같음

# 결론: 유의수준 5%에서 성별에 따른 두 모집단의 중위수에 유의한 차이가 없음


RanksumsResult(statistic=-1.8527420384998257, pvalue=0.06391934147515746)

In [17]:
# 독립표본 T 검정 대신 만-위트니 검정 수행행
# 남녀 몸무게 데이터를 임의로 생성하고
# 두 데이터가 서로 독립이라고 가정하고
# 두 데이터에 대한 모중위수가 서로 다르다고 할 수 있는지

import numpy as np
female = np.array([50.7, 58.4, 74.1, 65.1, 77.8, 48.1, 46.3])
male = np.array([75.5, 83.9, 75.7, 56.2, 73.4, 67.7, 79.0])

from scipy.stats import mannwhitneyu
mannwhitneyu(female, male)

# 결과: MannwhitneyuResult(statistic=10.0, pvalue=0.07284382284382285)
# p-value 크다 -> 귀무가설 채택 -> 차이 없음

# 결론: 유의수준 5%에서 성별에 따른 두 모집단의 중위수에 유의한 차이가 없음


MannwhitneyuResult(statistic=10.0, pvalue=0.07284382284382285)