In [1]:
# 다른 그룹에 대한 평균 비교
# 각 관측치는 서로 독립이어야 한다.
# 각 관측치의 모분산이 동일할 필요는 없다.

# 정규성을 만족하고 등분산성도 만족한다면? 독립 표본 t-검정
# scipy.stats.ttest_ind(data1, data2)

# 정규성을 만족하고 등분산성은 만족하지 않는다면? Welch's t-검정
# scipy.stats.ttest_ind(data1, data2, equal_var=False)

# 정규성, 등분산성 모두 만족하지 않는다면? Mann-Whitney U 검정 (어떠한 가정도 불필요한 비모수 검정)
# scipy.stats.mannwhitneyu(data1, data2)

In [86]:
import numpy as np

groupA = [70, 68, 75, 80, 72, 78, 74] # 대조군
groupB = [75, 70, 78, 82, 74, 80, 76, 70, 79, 75] # 실험군

np.mean(groupA), np.mean(groupB), np.median(groupA), np.median(groupB)

(73.85714285714286, 75.9, 74.0, 75.5)

In [87]:
from scipy.stats import shapiro

# 귀무가설 : 데이터가 정규 분포를 따른다.
# 대립가설 : 데이터가 정규 분포를 따르지 않는다.

# 샤피로-윌크 정규성 검정
shapiro_stat1, shapiro_p1 = shapiro(groupA)
shapiro_stat2, shapiro_p2 = shapiro(groupA)

print(f"Shapiro-Wilk p-value: {shapiro_p1:.4f}, {shapiro_p2:.4f}")

# 유의수준 0.05 기준 해석
alpha = 0.05
if shapiro_p1 > alpha and shapiro_p2 > alpha :
    print("정규성 만족")
else:
    print("정규성 불만족 → Mann-Whitney U 검정")

Shapiro-Wilk p-value: 0.9560, 0.9560
정규성 만족


In [88]:
from scipy.stats import levene

# 귀무가설 : 집단의 분산이 같다. (등분산성)
# 대립가설 : 집단의 분산이 다르다. (이분산성)

shapiro_stat, levene_p = levene(groupA, groupB)

print(f"Levene p-value: {levene_p:.4f}")

# 유의수준 0.05 기준 해석
alpha = 0.05
if levene_p > alpha:
    print("등분산 만족 → 독립 표본 t-검정 수행")
else:
    print("등분산 불만족 → Welch's t-검정 수행")

Levene p-value: 0.8740
등분산 만족 → 독립 표본 t-검정 수행


In [89]:
from scipy.stats import ttest_ind

print("등분산성 만족 → 독립 표본 t-검정 수행")
t_stat, p_value = ttest_ind(groupA, groupB, equal_var=True)
print(f"t-statistic: {t_stat:.3f}")
print(f"p-value: {p_value:.4f}")

print()

print("등분산성 불만족 → Welch’s t-검정 수행")
t_stat, p_value = ttest_ind(groupA, groupB, equal_var=False)
print(f"t-statistic: {t_stat:.3f}")
print(f"p-value: {p_value:.4f}")

print()

# 유의수준 0.05 기준 해석
if p_value < alpha:
    print("귀무가설 기각: 두 그룹 평균은 유의하게 다릅니다.")
else:
    print("귀무가설 채택: 두 그룹 평균은 유의하게 다르지 않습니다.")

등분산성 만족 → 독립 표본 t-검정 수행
t-statistic: -1.012
p-value: 0.3277

등분산성 불만족 → Welch’s t-검정 수행
t-statistic: -0.999
p-value: 0.3367

귀무가설 채택: 두 그룹 평균은 유의하게 다르지 않습니다.


In [90]:
from scipy.stats import mannwhitneyu

u_stat, p_value = mannwhitneyu(groupA, groupB, alternative='two-sided')

print(f"U-statistic: {u_stat:.3f}")
print(f"p-value: {p_value:.4f}")

# 유의수준 0.05 기준 해석
alpha = 0.05
if p_value < alpha:
    print("귀무가설 기각: 두 그룹 중앙값은 유의하게 다릅니다.")
else:
    print("귀무가설 채택: 두 그룹 중앙값은 유의하게 다르지 않습니다.")

U-statistic: 24.500
p-value: 0.3258
귀무가설 채택: 두 그룹 중앙값은 유의하게 다르지 않습니다.
