In [2]:
import numpy as np
from scipy import stats

### 🔹 1. **작아졌는지 검정 (좌측 단측 t-검정)**

**문제:**

어느 도시의 성인 평균 수면시간은 **7.5시간**으로 알려져 있다.  
하지만 재택근무가 늘어난 이후로 **수면시간이 줄었는지** 조사하려 한다.

10명을 조사한 결과 수면시간은 다음과 같았다:

```
[7.2, 6.8, 7.1, 6.5, 7.0, 6.9, 6.4, 6.7, 7.3, 6.6]
```

- 유의수준: 0.05  
- 모집단 분산: **모름**

→ 재택근무 이후 **수면시간이 줄었는지 검정하시오.**

In [3]:
pop_mean = 7.5

samples = [7.2, 6.8, 7.1, 6.5, 7.0, 6.9, 6.4, 6.7, 7.3, 6.6]

sample_n = len(samples)
sample_var = np.var(samples, ddof=1)
sample_std = np.sqrt(sample_var)
sample_mean = np.mean(samples)

H0 = '재택근무 이후 수면시간이 줄지 않았다.'
H1 = '재택근무 이후 수면시간이 줄었다.'

In [4]:
t_statistics, p_value = stats.ttest_1samp(a=samples, popmean=pop_mean, alternative='less')

In [5]:
# 통계량으로 검정
t_critical = stats.t.ppf(0.05, df=sample_n - 1)

print(f't_statistics : {t_statistics}')
print(f't_critical : {t_critical}')
if t_statistics < t_critical:
    print(H1)
else:
    print(H0)

t_statistics : -6.789028582272221
t_critical : -1.8331129326536337
재택근무 이후 수면시간이 줄었다.


In [6]:
# p_value로 검정

print(f'p_value : {round(p_value, 4)}')
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value : 0.0
재택근무 이후 수면시간이 줄었다.


In [7]:
# 신뢰구간으로 검정
margin_of_error = abs(t_critical) * (sample_std / np.sqrt(sample_n))
ci_upper = sample_mean + margin_of_error
ci_lower = float('-inf')

print('comfidence_interval_upper', ci_upper)
print('pop_mean', pop_mean)
print('=' * 10)

if ci_upper < pop_mean:
    print(H1)
else:
    print(H0)

comfidence_interval_upper 7.0255072013301305
pop_mean 7.5
재택근무 이후 수면시간이 줄었다.


In [8]:
stats.t.interval(0.95, sample_n - 1, sample_mean, sample_std / np.sqrt(sample_n))

(6.633414941027832, 7.0665850589721675)

### 🔹 2. **커졌는지 검정 (우측 단측 t-검정)**

**문제:**

한 어플은 사용자의 집중력을 향상시킨다고 주장한다.  
기존 집중력 평균은 **70점**이었고, 15명 사용자에게 실험한 결과 다음 점수가 나왔다:

```
[72, 75, 69, 74, 73, 76, 71, 77, 70, 78, 75, 74, 73, 72, 76]
```

- 유의수준: 0.05  
- 모집단 분산: **모름**

→ 어플 사용 후 집중력이 **향상되었는지 검정하시오.**

In [9]:
pop_mean = 70

samples = [72, 75, 69, 74, 73, 76, 71, 77, 70, 78, 75, 74, 73, 72, 76]

sample_n = len(samples)
sample_var = np.var(samples, ddof=1)
sample_std = np.sqrt(sample_var)
sample_mean = np.mean(samples)

H0 = '어플 사용 후 집중력이 향상되지 않았다.'
H1 = '어플 사용 후 집중력이 향상되었다.'

In [10]:
t_statistics, p_value = stats.ttest_1samp(a=samples, popmean=pop_mean, alternative='greater')

In [11]:
# 통계량으로 검정
t_critical = stats.t.ppf(1 - 0.05, df=sample_n - 1)

print(f't_statistics : {t_statistics}')
print(f't_critical : {t_critical}')
if t_critical < t_statistics:
    print(H1)
else:
    print(H0)

t_statistics : 5.500000000000005
t_critical : 1.7613101357748562
어플 사용 후 집중력이 향상되었다.


In [12]:
# p_value로 검정

print(f'p_value : {round(p_value, 4)}')
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value : 0.0
어플 사용 후 집중력이 향상되었다.


In [13]:
# 신뢰구간으로 검정
margin_of_error = t_critical * (sample_std / np.sqrt(sample_n))

ci_upper = float('inf')
ci_lower = sample_mean - margin_of_error

print('comfidence_interval_upper', ci_lower)
print('pop_mean', pop_mean)
print('=' * 10)

if pop_mean < ci_lower:
    print(H1)
else:
    print(H0)

comfidence_interval_upper 72.49245990948343
pop_mean 70
어플 사용 후 집중력이 향상되었다.


In [14]:
stats.t.interval(0.95, sample_n - 1, sample_mean, sample_std / np.sqrt(sample_n))

(72.23680887472206, 75.09652445861128)


### 🔹 3. **같은지 검정 (양측 t-검정)**

**문제:**

어느 커피 브랜드는 자사 커피의 평균 카페인 함량이 **160mg**이라고 주장한다.  
소비자 단체에서 12개 커피를 샘플링한 결과 다음과 같았다:

```
[159, 163, 161, 158, 162, 157, 159, 160, 164, 161, 158, 162]
```

- 유의수준: 0.05  
- 모집단 분산: **모름**

→ 이 커피의 **카페인 함량이 160mg과 다른지 검정하시오.**


In [15]:
pop_mean = 160

samples = [159, 163, 161, 158, 162, 157, 159, 160, 164, 161, 158, 162]

sample_n = len(samples)
sample_var = np.var(samples, ddof=1)
sample_std = np.sqrt(sample_var)
sample_mean = np.mean(samples)

H0 = '카페인 함량이 160이다.'
H1 = '카페인 함량이 160이 아니다.'

In [16]:
t_statistics, p_value = stats.ttest_1samp(a=samples, popmean=pop_mean, alternative='two-sided')

In [17]:
# 통계량으로 검정
t_critical = stats.t.ppf(1 - (0.05 / 2), df=sample_n - 1)

print(f't_statistics : {t_statistics}')
print(f't_critical : {t_critical}')
if t_critical < abs(t_statistics):
    print(H1)
else:
    print(H0)

t_statistics : 0.5277130021690234
t_critical : 2.200985160082949
카페인 함량이 160이다.


In [18]:
# p_value로 검정

print(f'p_value : {round(p_value, 4)}')
if p_value < 0.05:
    print(H1)
else:
    print(H0)

p_value : 0.6082
카페인 함량이 160이다.


In [19]:
# 신뢰구간 검정
t_critical = stats.t.ppf(1 - (0.05/2), df=sample_n - 1)

margin_of_error = t_critical * (sample_std / np.sqrt(sample_n))
ci_upper = sample_mean + margin_of_error
ci_lower = sample_mean - margin_of_error

print('comfidence_interval_upper', ci_upper)
print('comfidence_interval_lower', ci_lower)
print('pop_mean', pop_mean)
print('=' * 10)

if pop_mean < ci_lower or ci_upper < pop_mean:
    print(H1)
else:
    print(H0)

comfidence_interval_upper 161.72359985512105
comfidence_interval_lower 158.94306681154563
pop_mean 160
카페인 함량이 160이다.


In [20]:
stats.t.interval(0.975, sample_n - 1, sample_mean, sample_std / np.sqrt(sample_n))

(158.69538955715092, 161.97127710951577)