In [31]:
import numpy as np
from scipy.stats import t, norm

%precision 3

'%.3f'

In [34]:
def t_criterion_two_side(p, df):
    """
    t-분포 임계값 계산 함수
    
    Args:
        p (float): 신뢰수준 (예: 0.90, 0.95 등)
        df (int): 자유도 (degree of freedom)
    Returns:
        float: t-분포 임계값
    """
    alpha = 1 - p  # 유의수준
    return t.ppf(1 - alpha / 2, df)


def t_criterion_one_side(p, df):
    """
    t-분포 원측 임계값 계산 함수
    
    Args:
        p (float): 신뢰수준 (예: 0.90, 0.95 등)
        df (int): 자유도 (degree of freedom)
    Returns:
        float: t-분포 원측 임계값
    """
    alpha = 1 - p  # 유의수준
    return t.ppf(1 - alpha, df)


def z_criterion_two_side(p):
    """
    Z-분포 임계값 계산 함수  
    
    Args:
        p (float): 신뢰수준 (예: 0.90, 0.95 등)
    Returns:
        float: Z-분포 임계값
    """
    alpha = 1 - p  # 유의수준
    return norm.ppf(1 - alpha / 2)


def z_criterion_one_side(p):
    """
    Z-분포 원측 임계값 계산 함수
    
    Args:
        p (float): 신뢰수준 (예: 0.90, 0.95 등)
    Returns:
        float: Z-분포 원측 임계값
    """
    alpha = 1 - p  # 유의수준
    return norm.ppf(1 - alpha)

In [35]:
def standard_error(variance, n):
    return np.sqrt(variance / n)

In [37]:
# **문제 1: 평균의 신뢰구간 (모분산이 알려진 경우)**
# 한 회사의 직원 40명의 주간 근무 시간을 조사했더니, 표본 평균이 42시간, 모집단의 표준편차가 5시간으로 나타났습니다.
# 모집단 평균에 대한 95% 신뢰구간을 구하세요.

interval = z_criterion_two_side(.95) * standard_error(5**2, 40)
(42 - interval, 42 + interval)

(40.451, 43.549)

In [39]:
# **문제 2: 평균의 신뢰구간 (모분산이 알려지지 않은 경우)**
# 대학생 25명을 대상으로 하루 평균 공부 시간을 조사한 결과, 표본 평균이 6시간, 표본 표준편차가 1.2시간이었습니다.
# 모집단 평균에 대한 99% 신뢰구간을 구하세요.

interval = t_criterion_two_side(.99, 24) * standard_error(1.2**2, 25)
(6 - interval, 6 + interval)

(5.329, 6.671)

In [41]:
# **문제 3: 비율의 신뢰구간**
# 한 설문조사에서 200명 중 120명이 특정 브랜드의 제품에 만족한다고 답했습니다.
# 이 설문조사 결과를 기반으로 모집단 만족 비율에 대한 90% 신뢰구간을 구하세요.
s_mean = 120 / 200
s_var = 120 / 200 * (1 - (120 / 200))

interval = z_criterion_two_side(.90) * standard_error(s_var, 200)
(s_mean - interval, s_mean + interval)

(0.543, 0.657)

In [46]:
# **문제 4: 차이의 신뢰구간 (평균의 차이)**
# 다이어트 프로그램의 효과를 확인하기 위해 10명의 참가자를 대상으로 프로그램 전후의 체중을 측정했습니다.
# - 프로그램 전 체중: 80, 85, 78, 90, 88, 82, 76, 84, 83, 81
# - 프로그램 후 체중: 78, 82, 75, 87, 85, 80, 74, 81, 80, 78
# 참가자들의 평균 체중 감소에 대한 95% 신뢰구간을 구하세요.
s_before = [80, 85, 78, 90, 88, 82, 76, 84, 83, 81]
s_after = [78, 82, 75, 87, 85, 80, 74, 81, 80, 78]

s_diff = np.array(s_after) - np.array(s_before)
diff_mean = np.mean(s_diff)
diff_var = np.var(s_diff)

interval = t_criterion_two_side(.95, 9) * standard_error(diff_var, 10)
(diff_mean - interval, diff_mean + interval)

(-3.028, -2.372)

In [47]:
# **문제 5: 모분산의 신뢰구간**
# 한 공장에서 생산되는 제품의 무게를 20개 샘플로 측정한 결과, 표본 분산이 2.5로 나타났습니다.
# 모집단 분산에 대한 95% 신뢰구간을 구하세요.
s_mean = 20

interval = t_criterion_two_side(.95, 19) * standard_error(2.5**2, 20)
(20 - interval, 20 + interval)

(18.830, 21.170)