In [11]:
import numpy as np
from scipy import stats

In [12]:
# 단일집단 분산 검정
# 어떤 공장에서 생산한 부품의 내구성을 조사하기 위해 무작위로 10개의 부품을 뽑아 측정한 결과, 분산은 36이었다.
# 이 공장의 부품 내구성의 모분산이 25라고 주장할 수 있는지 유의수준 5%에서 검정하라.

In [13]:
n = 10
sample_var = 36
pop_var = 25
alpha = 0.05

# 귀무가설: 모분산이 25이다.
# 대립가설: 모분산이 25가 아니다.

# 검정통계량
statistic = (n - 1) * sample_var / pop_var

# 양측 임계값
lower_critical = stats.chi2.ppf(alpha / 2, n - 1)
upper_critical = stats.chi2.ppf(1 - alpha / 2, n - 1)

# p-value
p_value = 2 * min(
    stats.chi2.cdf(statistic, n - 1),
    1 - stats.chi2.cdf(statistic, n - 1)
)

print('검정통계량: {:.2f}'.format(statistic))
print('임계값: [{:.2f}, {:.2f}]'.format(lower_critical, upper_critical))
print('p-value: {:.4f}'.format(p_value))

if statistic < lower_critical or statistic > upper_critical:
    print('귀무가설 기각: 모분산이 25가 아니다.')
else:
    print('귀무가설 채택: 모분산이 25이다.')

검정통계량: 12.96
임계값: [2.70, 19.02]
p-value: 0.3288
귀무가설 채택: 모분산이 25이다.


In [8]:
# 귀무가설: 모분산이 25보다 작거나 같다.
# 대립가설: 모분산이 25보다 크다.

# 검정통계량
statistic = (n - 1) * sample_var / pop_var

# 임계값
critical_value = stats.chi2.ppf(1 - alpha, n - 1)

# p-value
p_value = 1 - stats.chi2.cdf(statistic, n - 1)

print('검정통계량: {:.2f}'.format(statistic))
print('임계값: {:.2f}'.format(critical_value))
print('p-value: {:.4f}'.format(p_value))

if statistic > critical_value:
    print('대립가설: 모분산이 25보다 크다.')
else:
    print('귀무가설: 모분산이 25이다.')

검정통계량: 12.96
임계값: 16.92
p-value: 0.1644
귀무가설: 모분산이 25이다.


In [9]:
# 귀무가설: 모분산이 25보다 크거나 같다.
# 대립가설: 모분산이 25보다 작다.

# 검정통계량
statistic = (n - 1) * sample_var / pop_var

# 임계값
critical_value = stats.chi2.ppf(alpha, n - 1)

# p-value
p_value = stats.chi2.cdf(statistic, n - 1)

print('검정통계량: {:.2f}'.format(statistic))
print('임계값: {:.2f}'.format(critical_value))
print('p-value: {:.4f}'.format(p_value))

if statistic > critical_value:
    print('대립가설: 모분산이 25보다 작다.')
else:
    print('귀무가설: 모분산이 25이다.')

검정통계량: 12.96
임계값: 3.33
p-value: 0.8356
대립가설: 모분산이 25보다 작다.
