# 단일표본검정

나커피 유튜버는 최근 판매되는 "합격 원두(dark)" 상품의 실제 무게를 조사하였다. 제조사는 "합격 원두(dark)"의 무게를 120g라고 표기하였다. 나커피 유튜버는 이 주장이 사실인지 확인하기 위해 상품의 무게를 측정하였다. 다음은 30개의 상품 샘플의 무게 측정 결과다. 이 측정 결과를 바탕으로 제조사의 주장인 상품의 무게(120g)가 사실인지 검정해보시오. (데이터는 정규분포를 따른다고 가정한다.)
- 귀무가설: μ = μ0, "합격 원두(dark)" 상품의 평균 무게는 120g이다.
- 대립가설: μ ≠ μ0, "합격 원두(dark)" 상품의 평균 무게는 120g 아니다.

- μ(뮤): 현재 조사하려는 상품의 실제 평균 무게
-
μ0(뮤 제로): 제조사가 주장하는 상품의 평균 무게(120g)

## 1. 기초

In [None]:
import pandas as pd
df = pd.DataFrame({
    '무게':[119, 121, 121, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           123, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

### 단일표본검정

In [None]:
# 단일표본검정
from scipy import stats
print(stats.ttest_1samp(df['무게'], 120)) # pvalue가 0.05보다 낮기때문에 대립가설 채택

TtestResult(statistic=2.153709967150663, pvalue=0.03970987897788578, df=29)


In [None]:
# 대립가설: 합격 원두(dark) 상품의 평균 무게는 120g이 아니다.

print(stats.ttest_1samp(df['무게'], 120, alternative='two-sided')) # 귀무가설 기각

TtestResult(statistic=2.153709967150663, pvalue=0.03970987897788578, df=29)


In [None]:
# 대립가설: 합격 원두(dark) 상품의 평균 무게는 120g보다 크다.

print(stats.ttest_1samp(df['무게'], 120, alternative='greater')) # 귀무가설 기각

TtestResult(statistic=2.153709967150663, pvalue=0.01985493948894289, df=29)


In [None]:
# 대립가설: 합격 원두(dark) 상품의 평균 무게는 120g보다 작다.

print(stats.ttest_1samp(df['무게'], 120, alternative='less')) # 귀무가설 채택

TtestResult(statistic=2.153709967150663, pvalue=0.9801450605110571, df=29)


### 심화

In [None]:
# 데이터 (정규성에 만족하지 않게 일부 변경)
import pandas as pd
df = pd.DataFrame({
    '무게':[219, 121, 121, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           123, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

### Shapiro-Wilk 검정
- 귀무가설 (H0): 주어진 데이터 샘플은 정규 분포를 따른다.
- 대립가설(H1): 주어진 데이터 샘플은 정규 분포를 따르지 않는다.

In [None]:
# Shapiro-Wilk(샤피로-윌크) 정규성 검정
from scipy import stats
stats.shapiro(df['무게']) # pvalue가 0.05보다 작으므로 대립가설 채택 -> 정규분포를 따르지 않음.

ShapiroResult(statistic=0.35728970196526855, pvalue=2.2139240997414947e-10)

In [None]:
# 지수표기법 변경
"{:.11f}".format(2.2139240997414947e-10)

'0.00000000022'

### Wilcoxon 검정 (비모수 검정)
- 귀무가설 (H0): μ = μ0, "합격 원두(dark)" 상품의 중앙값 무게는 120g이다.
- 대립가설(H1): μ < μ0, "합격 원두(dark)" 상품의 중앙값 무게는 120g 보다 작다

(추가) 비모수 검정: 평균 -> 중앙값으로 변경 (중앙값도 평균값이라 동일하다고 하겠습니다.)

In [None]:
# Wilcoxon(윌콕슨)의 부호 순위 검정 수행
stats.wilcoxon(df['무게']-120, alternative='less')

WilcoxonResult(statistic=341.0, pvalue=0.9882949283346534)