In [None]:
import numpy as np
from scipy import stats

## 🔹 1. **작아졌는지 검정 (좌측 단측 Z검정)**

**문제:**  
한 제약회사는 기존 약의 평균 효과 지속 시간이 **12시간**이라 주장한다.  
하지만 경쟁사는 실제보다 짧을 수 있다고 주장하며 50명을 대상으로 실험했다.

- 모집단 표준편차: **σ = 2시간**
- 표본 평균: **11.4시간**
- 표본 크기: **n = 50**

이 약의 효과 지속 시간이 **실제로 더 짧은지**  
**유의수준 0.05에서 검정**하시오.

In [None]:
pop_mean = 12
pop_std = 2
pop_var = np.square(pop_std)

sample_n = 50
sample_mean = 11.4

H0 = '약의 평균 지속시간이 12시간보다 짧지 않다.'
H1 = '약의 평균 지속시간이 12시간보다 짧다.'

In [6]:
# 통계량으로 검정
z_statistics = (sample_mean - pop_mean) / np.sqrt((pop_var / sample_n))
z_critical = stats.norm.ppf(0.05)

print('z_statistics', z_statistics)
print('z_critical', z_critical)
print('=' * 10)
if z_statistics < z_critical:
    print(H1)
else:
    print(H0)

z_statistics -2.1213203435596415
z_critical -1.6448536269514729
약의 평균 지속시간이 12시간보다 짧다.


In [7]:
# p_value로 검정
z_statistics = (sample_mean - pop_mean) / np.sqrt((pop_var / sample_n))
p_value = stats.norm.cdf(z_statistics)

print('p_value', p_value)
print('=' * 10)
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value 0.01694742676234467
약의 평균 지속시간이 12시간보다 짧다.


In [8]:
# 신뢰구간으로 검정
z_critical = stats.norm.ppf(1 - 0.05)

margin_of_error = z_critical * (pop_std / np.sqrt(sample_n))
ci_upper = sample_mean + margin_of_error
ci_lower = float('-inf')

print('comfidence_interval_upper', ci_upper)
print('pop_mean', pop_mean)
print('=' * 10)

if ci_upper < pop_mean:
    print(H1)
else:
    print(H0)

comfidence_interval_upper 11.86523486147067
pop_mean 12
약의 평균 지속시간이 12시간보다 짧다.


## 🔹 2. **커졌는지 검정 (우측 단측 Z검정)**

**문제:**  
한 운동 프로그램은 성인의 평균 체력 점수를 **65점**까지 올려준다고 한다.  
이를 검증하기 위해 40명을 대상으로 실험했더니 **평균 67점**이 나왔다.

- 모집단 표준편차: **σ = 6점**
- 표본 평균: **67점**
- 표본 크기: **n = 40**

이 프로그램이 **실제로 체력 점수를 향상시키는지**  
**유의수준 0.05에서 검정**하시오.

In [9]:
pop_mean = 65
pop_std = 6
pop_var = np.square(pop_std)

sample_n = 40
sample_mean = 67

H0 = '운동 프로그램이 체력점수를 65점 까지 올려주지 않는다.'
H1 = '운동 프로그램이 체력점수를 65점 까지 올려준다.'

In [10]:
# 통계량으로 검정
z_statistics = (sample_mean - pop_mean) / np.sqrt((pop_var / sample_n))
z_critical = stats.norm.ppf(1 - 0.05)

print('z_statistics', z_statistics)
print('z_critical', z_critical)
print('=' * 10)
if z_critical < z_statistics:
    print(H1)
else:
    print(H0)

z_statistics 2.1081851067789197
z_critical 1.644853626951472
운동 프로그램이 체력점수를 65점 까지 올려준다.


In [11]:
# p_value로 검정
z_statistics = (sample_mean - pop_mean) / np.sqrt((pop_var / sample_n))
p_value = 1 - stats.norm.cdf(z_statistics)

print('p_value', p_value)
print('=' * 10)
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value 0.017507490509831247
운동 프로그램이 체력점수를 65점 까지 올려준다.


In [12]:
# 신뢰구간으로 검정
z_critical = stats.norm.ppf(1 - 0.05)

margin_of_error = z_critical * (pop_std / np.sqrt(sample_n))
ci_upper = float('inf')
ci_lower = sample_mean - margin_of_error

print('comfidence_interval_lower', ci_lower)
print('pop_mean', pop_mean)
print('=' * 10)

if pop_mean < ci_lower:
    print(H1)
else:
    print(H0)

comfidence_interval_lower 65.43955483637333
pop_mean 65
운동 프로그램이 체력점수를 65점 까지 올려준다.


## 🔹 3. **같은지 검정 (양측 Z검정)**

**문제:**  
한 커피 브랜드는 자사 커피의 평균 카페인 함량이 **150mg**이라고 주장한다.  
소비자단체가 조사한 결과, 36개 샘플의 평균이 **153mg**이었다.

- 모집단 표준편차: **σ = 10mg**
- 표본 평균: **153mg**
- 표본 크기: **n = 36**

이 커피의 카페인 함량이 **정말 150mg과 같은지**  
**유의수준 0.05에서 검정**하시오.


In [13]:
pop_mean = 150
pop_std = 10
pop_var = np.square(pop_std)

sample_n = 36
sample_mean = 153

H0 = '카페인 합량이 150이다.'
H1 = '카페인 합량이 150이 아니다.'

In [14]:
# 통계량으로 검정
z_statistics = abs((sample_mean - pop_mean) / np.sqrt((pop_var / sample_n)))
z_critical = stats.norm.ppf(1 - 0.025)

print('z_statistics', z_statistics)
print('z_critical', z_critical)
print('=' * 10)
if z_critical < z_statistics:
    print(H1)
else:
    print(H0)

z_statistics 1.7999999999999998
z_critical 1.959963984540054
카페인 합량이 150이다.


In [15]:
# p_value로 검정
z_statistics = abs((sample_mean - pop_mean) / np.sqrt((pop_var / sample_n)))
p_value = (1 - stats.norm.cdf(z_statistics)) * 2

print('p_value', p_value)
print('=' * 10)
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value 0.07186063822585154
카페인 합량이 150이다.


In [16]:
# 신뢰구간으로 검정
z_critical = stats.norm.ppf(1 - 0.025)

margin_of_error = z_critical * (pop_std / np.sqrt(sample_n))
ci_upper = sample_mean + margin_of_error
ci_lower = sample_mean - margin_of_error

print('comfidence_interval_upper', ci_upper)
print('comfidence_interval_lower', ci_lower)
print('pop_mean', pop_mean)
print('=' * 10)

if pop_mean < ci_lower or ci_upper < pop_mean:
    print(H1)
else:
    print(H0)

comfidence_interval_upper 156.26660664090008
comfidence_interval_lower 149.73339335909992
pop_mean 150
카페인 합량이 150이다.
