# 검정 방법
1. 정규성을 따른다 : 단일표본 T 테스트
2. 정규성을 따르지 않는다 : 윌콕슨 부호순위 검정

## 가설검정 순서(중요)
1. 가설설정(귀무, 대립)
2. 유의수준 설정, 정규성 검정
3. 검정통계량 계산
4. P-value 계산
5. 귀무가설 채택/기각 여부 결정

# 1번 문제.
mtcars 데이터의 mpg열의 평균이 20과 같다고 할 수 있는지?
- 귀무가설(H0) : U0 = 20
- 대립가설(H1) : U0 != 20
- 유의수준(Alpha) = 0.05

In [None]:
import pandas as pd
import numpy as np
from scipy.stats import stats
from scipy.stats import shapiro

df = pd.read_csv('/content/mtcars.csv')
#-- 1. 정규성 검정
# h0 : 정규분포를 따른다.
# h1 : 정규분포를 따르지 않는다.

U0= 20
alpha = 0.05
statics, p_value = shapiro(df['mpg'])
if p_value > alpha :
  print("정규분포를 따르며 T검정 진행.")
else :
  print("정규분포를 따르지 않는다 윌콕슨 부호순위 검정 진행.")

정규분포를 따르며 T검정 진행.


In [None]:
#-- 2. 검정통계량, P_value 계산

statics, p_value = scipy.stats.ttest_1samp(df['mpg'], popmean = U0, alternative='two-sided')
print(statics.round(4))
print(p_value.round(4))

#-- 2-1. 윌콕슨을 사용하는 경우
# statics, p_value = scipy.stats.wilcoxon(df['mpg']-U0, alternative='two-sided')
# print(statics.round(4))
# print(p_value.round(4))

0.0851
0.9328


In [None]:
#-- 3. 귀무가설 채택/기각 결정
if p_value > alpha:
  print("채택")
  print("mpg 평균이 20이라고 할 수 있음")
  print(df['mpg'].mean())
else :
  print("기각")
  print("mpg 평균이 20이라고 할 수 없음")
  print(df['mpg'].mean())

채택
mpg 평균이 20이라고 할 수 있음
20.090625000000003


# 문제 2. mpg열의 평균이 17보다 크다고 할 수 있는지 검정하시오 (유의수준 0.05)


In [None]:
H0 = "mpg 평균이 17보다 작거나 같다"
H1 = "mpg 평균이 17보다 크다"
U0 = 17
alpha = 0.05

In [None]:
#-- 정규성 검정
static, pvalue = shapiro(df['mpg'])
if pvalue > alpha:
  print('정규성 채택 t_test')
else:
  print('정규성 기각 윌콕슨')

정규성 채택 t_test


In [None]:
#-- 통계량 계산(T검정)
statics, pvalue = scipy.stats.ttest_1samp(df['mpg'], popmean = U0, alternative = 'greater')
print(statics, pvalue)

#-- 통계량 계산(윌콕슨)
# statics, pvalue = scipy.stats.wilcoxon(df['mpg']-U0, alternative = 'greater')

2.900840527201366 0.003394155007833913


In [None]:
#-- 귀무가설 채택/기각 결정
if pvalue  > alpha :
  print('채택')
  print(H0)
else :
  print('기각')
  print(H1)

기각
mpg 평균이 17보다 크다


# 문제 3. mpg열의 평균이 17보다 작다고 할 수 있는지 검정하시오 (유의수준 0.05)


In [None]:
import pandas as pd
import numpy as np
from scipy.stats import stats
from scipy.stats import shapiro

df = pd.read_csv('/content/mtcars.csv')

In [None]:
H0 = 'mpg 열의 평균이 17보다 크거나 같다'
H1 = 'mpg 열의 평균이 17보다 작다'
alpha = 0.05
U0 = 17

In [None]:
#-- 1. 정규성 검정
statics, pvalue = shapiro(df['mpg'])
if pvalue > alpha :
  print('정규성 채택')
else :
  print('정규서 기각')

정규성 채택


In [None]:
#-- 2. 통계량 계산 (T검정)
statics, pvalue = scipy.stats.ttest_1samp(df['mpg'], popmean = U0, alternative = 'less')
print(statics.round(4), pvalue.round(4))

#-- 2-1. 통계량 계산 (윌콕슨)
wil_s, wil_p = scipy.stats.wilcoxon(df['mpg'] - U0, alternative = 'less')
print(wil_s.round(4), wil_p.round(4))

2.9008 0.9966
395.5 0.9938


In [None]:
#-- 3. 귀무가설 채태/기각 결정
if pvalue > alpha:
  print('채택')
  print(H0)
else:
  print('기각')
  print(H1)

채택
mpg 열의 평균이 17보다 크거나 같다
