In [7]:
# 빅데이터분석기사 실기 유형3 - Z검정 문제

"""
문제 1: 모비율 검정 (Z검정)

어느 온라인 쇼핑몰에서 고객 만족도를 조사한 결과, 
과거 데이터에 따르면 전체 고객의 75%가 만족한다고 알려져 있다.
최근 200명의 고객을 대상으로 조사한 결과 160명이 만족한다고 응답했다.
유의수준 0.05에서 고객 만족도가 과거와 다른지 검정하시오.

H0: p = 0.75 (고객 만족도가 75%이다)
H1: p ≠ 0.75 (고객 만족도가 75%가 아니다)
"""

import numpy as np
from scipy.stats import norm
from statsmodels.stats.proportion import proportions_ztest

# 주어진 데이터
n = 200        # 표본 크기
x = 160        # 만족한 고객 수
p0 = 0.75      # 귀무가설 하의 모비율
alpha = 0.05   # 유의수준

# 표본비율
p_hat = x / n
print(f"표본비율: {p_hat}")

# Z검정 수행 (statsmodels 사용)
z_stat, p_value = proportions_ztest(x, n, p0, alternative='two-sided')

print(f"Z 통계량: {z_stat:.4f}")
print(f"p-value: {p_value:.4f}")

# 임계값
z_critical = norm.ppf(1 - alpha/2)
print(f"임계값: ±{z_critical:.4f}")

# 결론
if p_value < alpha:
    print(f"p-value({p_value:.4f}) < α({alpha}) 이므로 귀무가설을 기각한다.")
    print("고객 만족도가 75%와 다르다고 할 수 있다.")
else:
    print(f"p-value({p_value:.4f}) >= α({alpha}) 이므로 귀무가설을 채택한다.")
    print("고객 만족도가 75%와 다르다고 할 수 없다.")

표본비율: 0.8
Z 통계량: 1.7678
p-value: 0.0771
임계값: ±1.9600
p-value(0.0771) >= α(0.05) 이므로 귀무가설을 채택한다.
고객 만족도가 75%와 다르다고 할 수 없다.


In [8]:
"""
문제 2: 모평균 검정 (Z검정) - 모표준편차를 아는 경우

한 제조업체에서 생산하는 제품의 무게는 평균 500g, 표준편차 15g인 정규분포를 따른다고 알려져 있다.
새로운 생산 공정을 도입한 후 36개의 제품을 무작위로 선택하여 무게를 측정한 결과 평균이 505g이었다.
유의수준 0.01에서 새로운 공정으로 제품의 평균 무게가 변했는지 검정하시오.

H0: μ = 500 (평균 무게가 500g이다)
H1: μ ≠ 500 (평균 무게가 500g이 아니다)
"""

from scipy.stats import norm
import numpy as np

# 주어진 값
mu_0 = 500       # 귀무가설 하 모집단 평균
sigma = 15       # 모집단 표준편차 (알려진 값)
n = 36           # 표본 크기
x_bar = 505      # 표본 평균
alpha = 0.01     # 유의수준

print(f"표본 평균: {x_bar}g")
print(f"모집단 평균(H0): {mu_0}g")
print(f"모집단 표준편차: {sigma}g")
print(f"표본 크기: {n}")

# 표준오차 계산
se = sigma / np.sqrt(n)
print(f"표준오차: {se:.4f}")

# Z 통계량 계산
z_stat = (x_bar - mu_0) / se
print(f"Z 통계량: {z_stat:.4f}")

# p-value 계산 (양측검정)
p_value = 2 * norm.sf(abs(z_stat))
print(f"p-value: {p_value:.6f}")

# 임계값 계산
z_critical = norm.ppf(1 - alpha/2)
print(f"임계값: ±{z_critical:.4f}")

# 결론
print("\n=== 검정 결과 ===")
if p_value < alpha:
    print(f"p-value({p_value:.6f}) < α({alpha}) 이므로 귀무가설을 기각한다.")
    print("새로운 공정으로 제품의 평균 무게가 변했다고 할 수 있다.")
else:
    print(f"p-value({p_value:.6f}) >= α({alpha}) 이므로 귀무가설을 채택한다.")
    print("새로운 공정으로 제품의 평균 무게가 변했다고 할 수 없다.")

if abs(z_stat) > z_critical:
    print(f"|Z|({abs(z_stat):.4f}) > 임계값({z_critical:.4f}) 이므로 귀무가설 기각")
else:
    print(f"|Z|({abs(z_stat):.4f}) <= 임계값({z_critical:.4f}) 이므로 귀무가설 채택")

표본 평균: 505g
모집단 평균(H0): 500g
모집단 표준편차: 15g
표본 크기: 36
표준오차: 2.5000
Z 통계량: 2.0000
p-value: 0.045500
임계값: ±2.5758

=== 검정 결과 ===
p-value(0.045500) >= α(0.01) 이므로 귀무가설을 채택한다.
새로운 공정으로 제품의 평균 무게가 변했다고 할 수 없다.
|Z|(2.0000) <= 임계값(2.5758) 이므로 귀무가설 채택
