# 가설검정 문제

어느 회사에서 제품의 평균 수명은 100시간이라고 알려져 있습니다.
새 공정을 적용한 뒤 임의로 표본을 12개 측정한 결과가 아래와 같습니다.

98, 102, 95, 97, 100, 96, 94, 99, 101, 97, 95, 96

이 자료를 이용하여, 제품의 평균 수명이 변했는지를 유의 수준 α=0.05 으로 검정해주세요.

In [2]:
import numpy as np
from scipy import stats

x = np.array([98, 102, 95, 97, 100, 96, 94, 99, 101, 97, 95, 96])

mu0 = 100
alpha = 0.05

n = len(x) # 표본 크기
xbar = x.mean() # 표본 평균
s = x.std(ddof=1)

# t 통계량 계산

t_stat = (xbar - mu0) / (s / np.sqrt(n))

# p-value (양측 검정)
p_value = 2 * (1 - stats.t.cdf(abs(t_stat), df=n-1))

# 출력
print("=== 가설검정 결과 ===")
print(f"표본 크기 n = {n}")
print(f"표본평균 x̄ = {xbar:.3f}")
print(f"표본표준편차 s = {s:.3f}")
print(f"t 통계량 = {t_stat:.4f}")
print(f"p-value = {p_value:.6f}")
print(f"유의수준 α = {alpha}")

if p_value <= alpha:
    print("결론: 귀무가설을 기각한다 (평균이 변했다고 볼 근거 있음)")
else:
    print("결론: 귀무가설을 기각하지 않는다 (변했다고 볼 근거 부족)")

=== 가설검정 결과 ===
표본 크기 n = 12
표본평균 x̄ = 97.500
표본표준편차 s = 2.541
t 통계량 = -3.4088
p-value = 0.005838
유의수준 α = 0.05
결론: 귀무가설을 기각한다 (평균이 변했다고 볼 근거 있음)


다음은 한 강사의 강의 만족도 점수 5개 표본이다.

72, 75, 78, 80, 85

이 표본을 이용해 표본분산을 계산하려 한다.   
다음 설명 중 표본분산 계산에서 분모로 n이 아니라 n−1을 사용하는 이유로 가장 적절한 것은 무엇인가?

보기   
A. 표본의 개수가 적을수록 계산을 단순하게 하기 위해   
B. 표본평균이 이미 데이터에서 계산되어 변동성이 줄어들기 때문에 이를 보정하기 위해   
C. 모집단 분산은 항상 표본분산보다 크기 때문에   
D. 표본의 개수에서 1을 빼는 것이 관례이기 때


표본분산은 표본평균을 기준으로 계산,표본평균은 데이터로부터 추정된 값이기 때문에 변동성을 줄이는 효과가있음,    
이로인해 표본분산은 모집단 분산을 과소추정하는 경향이있으며 이를 보정하기 위해 분모룰 n이아닌 n-1을 사용한다

A: 계산 편의성과 무관
C: 항상 크다x
D: 관례가 아니라 통계적 이유