# 단일표본검정

나커피 유튜버는 최근 판매되는 "합격 원두(dark)" 상품의 실제 무게를 조사하였다. 제조사는 "합격 원두(dark)"의 무게를 120g라고 표기하였다. 나커피 유튜버는 이 주장이 사실인지 확인하기 위해 상품의 무게를 측정하였다. 다음은 30개의 상품 샘플의 무게 측정 결과다. 이 측정 결과를 바탕으로 제조사의 주장인 상품의 무게(120g)가 사실인지 검정해보시오. (데이터는 정규분포를 따른다고 가정한다.)
- 귀무가설: μ = μ0, "합격 원두(dark)" 상품의 평균 무게는 120g이다.
- 대립가설: μ ≠ μ0, "합격 원두(dark)" 상품의 평균 무게는 120g 아니다.

- μ(뮤): 현재 조사하려는 상품의 실제 평균 무게
-
μ0(뮤 제로): 제조사가 주장하는 상품의 평균 무게(120g)

## 1. 기초

In [1]:
import pandas as pd
df = pd.DataFrame({
    '무게':[119, 121, 121, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           123, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

### 단일표본검정
- 하나의 집단에 대한 표본평균이 예측된 평균과 같은지 여부를 검정.
- 하나의 집단에 대한 표본평균과 새롭게 수집된 데이터의 예측된 평균이 같은지 여부를 검정

- 양측검정: 기존에 알려진 사실보다 크거나 작음에 대해 모두 검정하는 것
- 단측검정: ex) 120g 보다 작다. 크다.

In [6]:
# 단일표본검정
from scipy import stats

# stats.ttest_1samp(실제값=관측값, 모집단평균)
stats.ttest_1samp(df['무게'], 120)

# 검정통계량: 2.153709967150663 -> 크면 두 집단 간의 평균 차이가 크고, 통계척으로 유의미한 차이가 있다고 해석
# pvalue: 0.03970987897788578
# df: 29 -> 자유도: 관측치-1
# 결과: pvalue가 0.05 유의수준보다 작기 때문에 귀무가설 기각, 대립가설 채택 평균의 무게는 120g이 아니다.

TtestResult(statistic=2.153709967150663, pvalue=0.03970987897788578, df=29)

In [7]:
# 코랩 사이파이 버전 (시험환경 1.7)
import scipy
print(scipy.__version__) # 1.11.4

1.11.4


In [8]:
# 대립가설: 합격 원두(dark)" 상품의 평균 무게는 120g 아니다. -> 양측검정
stats.ttest_1samp(df['무게'], 120, alternative='two-sided')

# 검정통계량: 2.153709967150663
# pvalue: 0.03970987897788578
# 결과: pvalue가 0.039로 유의수준 0.05보다 작으므로 귀무가설 기각. 상품의 평균 무게는 120g 아님

TtestResult(statistic=2.153709967150663, pvalue=0.03970987897788578, df=29)

In [11]:
# 대립가설: 합격 원두(dark)" 상품의 평균 무게는 120g 보다 크다 -> 단측검정
stats.ttest_1samp(df['무게'], 120, alternative='greater')

# 검정통계량: 2.153709967150663
# pvalue: 0.01985493948894289
# 결과: pvalue가 0.019로 유의수준 0.05보다 작으므로 귀무가설 기각. 상품의 평균 무게는 120g보다 크다.

TtestResult(statistic=2.153709967150663, pvalue=0.01985493948894289, df=29)

In [12]:
# 대립가설: 합격 원두(dark)" 상품의 평균 무게는 120g 보다 작다 -> 단측검정
stats.ttest_1samp(df['무게'], 120, alternative='less')

# 검정통계량: 2.153709967150663
# pvalue: 0.9801450605110571
# 결과: pvalue가 0.98 유의수준 0.05보다 크므로 귀무가설 채택. 상품의 평균 무게는 120g보다 작지않다.

TtestResult(statistic=2.153709967150663, pvalue=0.9801450605110571, df=29)

## 2. 심화
- 정규분포를 따르는지 안따르는지 모르는 경우


In [14]:
# 데이터 (정규성에 만족하지 않게 일부 변경)
import pandas as pd
df = pd.DataFrame({
    '무게':[219, 121, 121, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           123, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

### Shapiro-Wilk 검정
- 귀무가설 (H0): 주어진 데이터 샘플은 정규 분포를 따른다.
- 대립가설(H1): 주어진 데이터 샘플은 정규 분포를 따르지 않는다.

In [24]:
# Shapiro-Wilk(샤피로-윌크) 정규성 검정
from scipy import stats

stats.shapiro(df['무게'])

# statistic=0.3572896718978882
# pvalue=2.2139254318709334e-10 -> 0.00000000022
# 결과: pvalue가 0.05를 넘기지 않기 때문에 귀무가설 채택

ShapiroResult(statistic=0.3572896718978882, pvalue=2.2139254318709334e-10)

In [25]:
# 지수표기법 변경
print('{:.11f}'.format(2.2139254318709334e-10)) # 0.00000000022

0.00000000022


### Wilcoxon 검정 (비모수 검정)
- 정규분포를 따르지 않는 경우 비모수검정 진행
- 귀무가설 (H0): μ = μ0, "합격 원두(dark)" 상품의 중앙값 무게는 120g이다.
- 대립가설(H1): μ < μ0, "합격 원두(dark)" 상품의 중앙값 무게는 120g 보다 작다

(추가) 비모수 검정: 평균 -> 중앙값으로 변경 (중앙값도 평균값이라 동일하다고 하겠습니다.)

In [26]:
# Wilcoxon(윌콕슨)의 부호 순위 검정 수행
from scipy import stats

stats.wilcoxon(df['무게'] - 120 , alternative='less')

WilcoxonResult(statistic=341.0, pvalue=0.9882949283346534)

# 대응표본검정

퇴근후딴짓 크리에이터는 수험생의 점수 향상을 위해 새로운 교육 프로그램을 도입했다. 도입 전과 도입 후의 점수 차이를 확인하기 위해 동일한 수험생의 점수를 비교하였습니다. 다음은 교육 전과 후의 점수 데이터이다. 새로운 교육 프로그램이 효과가 있는지 검정하시오.(데이터는 정규분포를 따른다고 가정한다.)

μ<sub>d</sub> = (before – after)의 평균

- 귀무가설: μ<sub>d</sub> ≥ 0, 새로운 교육 프로그램은 효과가 없다.
- 대립가설: μ<sub>d</sub> < 0, 새로운 교육 프로그램은 효과가 있다.



## 1. 기초

In [None]:
# 데이터
import pandas as pd
df = pd.DataFrame({
    'before':[85,90,92,88,86,89,83,87,65,50],
    'after':[88,89,96,89,85,88,85,89,78,61]
})

### 대응표본검정

In [None]:
# 대응표본검정


μ<sub>d</sub> = (after - before)의 평균
- 귀무가설: μ<sub>d</sub> ≤ 0
- 대립가설: μ<sub>d</sub> > 0

In [None]:
# 대응표본검정


## 2. 심화

In [None]:
# 데이터
import pandas as pd
df = pd.DataFrame({
    'before':[85,90,92,88,86,89,83,87,65,50],
    'after':[88,89,96,89,85,88,85,89,78,61]
})

μ<sub>d</sub> = (after - before)의 평균
- 귀무가설: μ<sub>d</sub> ≤ 0
- 대립가설: μ<sub>d</sub> > 0

### Shapiro-Wilk 검정

In [None]:
# Shapiro-Wilk(샤피로-윌크) 정규성 검정


### Wilcoxon 검정 (비모수 검정)

In [None]:
# Wilcoxon(윌콕슨)의 부호 순위 검정 수행


In [None]:
# Wilcoxon(윌콕슨)의 부호 순위 검정 수행 (diff)


# 독립표본검정
- 두 그룹의 차이를 통계적으로 검증
- 두 그룹의 분산이 같은지 다른지 확인해야 함 (python 기본은 분산이 같다임)

다음은 빅데이터 분석기사 실기 시험 점수이다. A그룹과 B그룹의 평균 점수가 차이가 있는지 유의수준 0.05하에서 가설 검정하시오.
(데이터는 정규분포를 따르고 분산이 동일하다고 가정한다.)
- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): 그룹별 시험 평균 점수는 차이가 있다. (μ1 ≠ μ2)

## 1. 기초

In [None]:
# 데이터 - 길이가 다를 수 있음
A = [85, 90, 92, 88, 86, 89, 83, 87,
     84, 50, 60, 39, 28, 48, 38, 28]
B = [82, 82, 88, 85, 84, 74, 79, 69,
     78, 76, 85, 84, 79, 89]

### 독립표본검정

In [None]:
# 독립표본검정
from scipy import stats

# print(help(stats.ttest_ind))

# 처리를 하지 않고 차이만 물어본다면 데이터 순서대로 넣음
# 처리를 했다하면 (처리집단, 대조집단) 순으로 넣음
# (처리집단 : 새로운것 적용한 집단, 대조집단 : 아무것도 적용 안한 집단)
stats.ttest_ind(A, B)

# TtestResult(statistic=-2.051813915505951, pvalue=0.04964542271174967, df=28.0)
# -> pvalue가 0.05 보다 작기 때문에 귀무가설 기각, 대립가설 채택 -> 결론 : 차이가 있다

TtestResult(statistic=-2.051813915505951, pvalue=0.04964542271174967, df=28.0)

### 등분산
- 두 그룹의 분산이 같은지 다른지 확인해야 함
- python default : equal_var = False 기본은 분산이 같다임

In [None]:
# 두 집단의 분산이 다르다(equal_var=False)
from scipy import stats

stats.ttest_ind(A, B, equal_var=False)

TtestResult(statistic=-2.1837307810153024, pvalue=0.04352730399590312, df=16.729279968729678)

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 평균 점수가 더 높다. (μ1 < μ2)

In [None]:
# 독립표본검정(less)
from scipy import stats

stats.ttest_ind(A, B, equal_var=True, alternative='less')

TtestResult(statistic=-2.051813915505951, pvalue=0.024822711355874834, df=28.0)

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): A그룹 시험 평균 점수가 더 높다. (μ1 > μ2)

In [None]:
# 독립표본검정(greater)
from scipy import stats

stats.ttest_ind(A, B, equal_var=True, alternative='greater') # 귀무가설 채택

TtestResult(statistic=-2.051813915505951, pvalue=0.9751772886441252, df=28.0)

## 2. 심화

In [None]:
# 데이터
import pandas as pd
A = [85, 90, 92, 88, 86, 89, 83, 87,
     84, 50, 60, 39, 28, 48, 38, 28]
B = [82, 82, 88, 85, 84, 74, 79, 69,
     78, 76, 85, 84, 79, 89]

### Shapiro-Wilk 검정
- 독립표본에선 두 그룹 각각 검증

In [None]:
# Shapiro-Wilk(샤피로-윌크) 정규성 검정
from scipy import stats

print(stats.shapiro(A)) # 귀무가설 기각 - 정규성분포 불만족 -> 비모수 검정으로
print(stats.shapiro(B)) # 귀무가설 채택 - 정규성분포 만족

ShapiroResult(statistic=0.8128696084022522, pvalue=0.004057693760842085)
ShapiroResult(statistic=0.9610027074813843, pvalue=0.7395777702331543)


### Levene 검정
- shapiro 검정에서 두 집단이 정규성분포를 만족하는 경우

In [None]:
# Levene(레빈) 등분산 검정 (귀무가설: 분산이 동일하다)
stats.levene(A, B) # 0.05보다 작으므로 귀무가설 기각 -> 분산이 다르다

LeveneResult(statistic=8.013957643762076, pvalue=0.008497116974003)

### 독립표본검정

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 평균 점수가 더 높다. (μ1 < μ2)

In [None]:
# 독립표본검정
stats.ttest_ind(A, B, equal_var=False, alternative='less')

TtestResult(statistic=-2.1837307810153024, pvalue=0.02176365199795156, df=16.729279968729678)

### Mann-Whitney U 검정 (비모수 검정)

- 귀무가설(H0): 그룹별 시험 중앙값 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 중앙값 점수가 더 높다. (μ1 < μ2)

(추가) 비모수 검정: 평균 -> 중앙값으로 변경 (중앙값도 평균값이라 동일하다고 하겠습니다.)

In [None]:
# Mann-Whitney U(만-휘트니 유) 검정
from scipy import stats

stats.mannwhitneyu(A, B, alternative='less') # 귀무가설 채택

MannwhitneyuResult(statistic=106.0, pvalue=0.40944636368515097)