[구글 코랩(Colab)에서 실행하기](https://colab.research.google.com/github/lovedlim/bigdata_analyst_cert_v2/blob/main/part3/ch1/ch1_hypothesis_testing.ipynb)

# 2. 단일 표본검정

### 1. 기본학습

In [3]:
import pandas as pd
df = pd.DataFrame({
    'weights':[122, 121, 120, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           120, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

In [4]:
# 영화관에서 판매하는 팝콘 라지 사이즈의 무게는 일반적으로 120g으로 알려져 있다.
# 이제 이 데이터를 갖고 t-test를 수행한다. 가설검정 프로세스 순서로 풀어본다.

# 1. 통계적 가설 설정
# - 귀무가설 H0: 팝콘 평균 무게는 120g이다
# - 대립가설 H1: 팝콘 평균 무게는 120g이 아니다

# 2. 유의수준: 0.05 (별도 안내될 수 있음)

# 3. 검정통계량 & 유의확률 
from scipy import stats
t_statistic, p_value = stats.ttest_1samp(df['weights'], 120)
t_statistic, p_value

(2.1155384372682344, 0.043092957066609296)

In [None]:
# p_value < 유의수준
# p_value가 유의수준보다 낮으니 유의미하게 다르다고 할 수 있다.

In [None]:
from scipy import stats
t_statistic, p_value = stats.ttest_1samp(df['weights'], 120, alternative='greater')
# 대립가설: 평균 무게는 120g보다 크다
# 유의수준 0.05보다 낮으니 대립가설 채택
print("t-statistic:", t_statistic)
print("p-value:", p_value)

t-statistic: 2.1155384372682344
p-value: 0.021546478533304648


In [3]:
print(stats.ttest_1samp(df['weights'], 120))

TtestResult(statistic=2.1155384372682344, pvalue=0.043092957066609296, df=29)


In [4]:
import scipy
print(scipy.__version__)
# 1.10.1 이상

1.14.1


In [5]:
print(stats.ttest_1samp(df['weights'], 120, alternative='two-sided'))

TtestResult(statistic=2.1155384372682344, pvalue=0.043092957066609296, df=29)


In [6]:
print(stats.ttest_1samp(df['weights'], 120, alternative='greater'))

TtestResult(statistic=2.1155384372682344, pvalue=0.021546478533304648, df=29)


In [7]:
print(stats.ttest_1samp(df['weights'], 120, alternative='less'))

TtestResult(statistic=2.1155384372682344, pvalue=0.9784535214666953, df=29)


### 2. 심화학습

In [8]:
import pandas as pd
df = pd.DataFrame({
    'weights':[125, 126, 118, 124, 117, 127, 123, 122, 119, 142]
})

In [9]:
# 정규성을 만족하는가?
from scipy import stats
stats.shapiro(df['weights'])

ShapiroResult(statistic=0.8164570347000635, pvalue=0.022960129822451016)

In [13]:
# 정규성 불만족 -> wilcoxon검정
s, p = stats.wilcoxon(df['weights'] - 120, alternative='greater')
print(s, p)

47.0 0.0244140625


In [9]:
from scipy import stats
stats.shapiro(df['weights'])

ShapiroResult(statistic=0.8164570347000635, pvalue=0.022960129822451016)

In [10]:
# Wilcoxon의 부호 순위 검정 수행
stats.wilcoxon(df['weights'] - 120, alternative='less')

WilcoxonResult(statistic=47.0, pvalue=0.9814453125)

# 3. 대응 표본검정

### 1. 기본학습

In [14]:
import pandas as pd
df = pd.DataFrame({
    'before':[85, 90, 92, 88, 86, 89, 83, 87],
    'after':[85.5,89.9,92.6,89.5,85.8,88.8,84.6,87.8]
})

In [None]:
# 어떤 기업이 새로운 교육 프로그램을 도입해 직원의 성과를 개선하려고 한다. 
# 이때 동일한 직원 그룹에 대해 교육 전과 후의 성과를 비교했다.
# 새로운 교육 프로그램이 효과가 있는지 가설검정하시오. (유의수준 0.05) 단, 성과 데이터 차이는 정규 분포를 따름

from scipy import stats
stats.ttest_rel(df['before'], df['after'])
# 대립가설 교육 전 그룹의 평균이 교육 후 그룹의 평균보다 낮다 <- 채택

TtestResult(statistic=-2.2127749675452324, pvalue=0.06254057467512476, df=7)

In [12]:
from scipy import stats
print(stats.ttest_rel(df['before'], df['after'], alternative='less'))

TtestResult(statistic=-2.2127749675452324, pvalue=0.03127028733756238, df=7)


In [13]:
print(stats.ttest_rel(df['after'], df['before'], alternative='greater'))

TtestResult(statistic=2.2127749675452324, pvalue=0.03127028733756238, df=7)


In [14]:
print(stats.ttest_rel(df['after'], df['before']))

TtestResult(statistic=2.2127749675452324, pvalue=0.06254057467512476, df=7)


 ### 2. 심화학습

In [19]:
import pandas as pd
df = pd.DataFrame({
    'before':[85, 90, 92, 88, 86, 89, 83, 87],
    'after':[86, 92, 94, 89, 84, 90, 84, 88]
})

In [20]:
from scipy import stats

df['diff'] = df['after'] - df['before']
stats.shapiro(df['diff'])

ShapiroResult(statistic=0.6886147375920879, pvalue=0.0016734051223900109)

In [24]:
stats.wilcoxon(df['before'], df['after'], alternative='less')

WilcoxonResult(statistic=7.0, pvalue=0.07421875)

In [16]:
from scipy import stats
df['diff'] = df['after'] - df['before']
stats.shapiro(df['diff'])

ShapiroResult(statistic=0.6886147375920879, pvalue=0.0016734051223900109)

In [17]:
stats.wilcoxon(df['after'], df['before'], alternative='greater')

WilcoxonResult(statistic=29.0, pvalue=0.07421875)

In [18]:
stats.wilcoxon(df['diff'], alternative='greater')

WilcoxonResult(statistic=29.0, pvalue=0.07421875)

# 4. 독립 표본검정

### 1. 기본학습

In [37]:
import pandas as pd
class1 = [85, 90, 92, 88, 86, 89, 83, 87]
class2 = [80, 82, 88, 85, 84]
stats.shapiro(class2)
stats.levene(class1, class2)

LeveneResult(statistic=0.0027925869510027727, pvalue=0.958802951766629)

In [None]:
# 다음은 어느 학교의 반별 수학 시험 점수다. 
# 1반과 2반의 평균 점수가 차이가 있는지 유의 수준 0.05 하에서 가설검정 하시오
# (μ1: 1반 평균, μ2: 2반 평균)

# 귀무 가설: 반 평균 점수는 차이가 없다?
# 대립 가설: 반 평균 점수는 차이가 있다
stats.ttest_ind(class1, class2, alternative='two-sided') # 대립 채택, 귀무 기각




# 귀무: 1반 점수가 2반 점수 보다 크지 않다
# 대립: 1반 점수가 2반 점수 보다 크다
stats.ttest_ind(class1, class2, alternative='greater') # 대립 채택, 귀무 기각


TtestResult(statistic=2.2108140580092237, pvalue=0.02457428894626093, df=11.0)

In [20]:
from scipy import stats
print(stats.ttest_ind(class1, class2))

TtestResult(statistic=2.2108140580092237, pvalue=0.04914857789252186, df=11.0)


In [21]:
print(stats.ttest_ind(class1, class2, equal_var=False))

TtestResult(statistic=2.1818699281825236, pvalue=0.059589330071355334, df=8.272682358753572)


In [22]:
print(stats.ttest_ind(class1, class2, equal_var=True, alternative='less'))

TtestResult(statistic=2.2108140580092237, pvalue=0.9754257110537391, df=11.0)


In [23]:
print(stats.ttest_ind(class1, class2, equal_var=True, alternative='greater'))

TtestResult(statistic=2.2108140580092237, pvalue=0.02457428894626093, df=11.0)


### 2. 심화학습

In [36]:
import pandas as pd
class1 = [85, 90, 92, 88, 86, 89, 83, 87]
class2 = [80, 82, 88, 85, 84]

from scipy import stats
print(stats.shapiro(class1))
print(stats.shapiro(class2))

ShapiroResult(statistic=0.9981893537736595, pvalue=0.999986994137081)
ShapiroResult(statistic=0.9917398436295009, pvalue=0.9854182266624983)


In [25]:
print(stats.levene(class1, class2))

LeveneResult(statistic=0.0027925869510027727, pvalue=0.958802951766629)


In [26]:
print(stats.ttest_ind(class1, class2, alternative='less', equal_var=True))

TtestResult(statistic=2.2108140580092237, pvalue=0.9754257110537391, df=11.0)


In [38]:
import pandas as pd
class1 = [85, 90, 92, 88, 86, 89, 83, 87]
class2 = [80, 82, 88, 85, 130]

from scipy import stats
print(stats.shapiro(class1))
print(stats.shapiro(class2))

ShapiroResult(statistic=0.9981893537736595, pvalue=0.999986994137081)
ShapiroResult(statistic=0.6880497349322277, pvalue=0.007151570728885509)


In [41]:
stats.mannwhitneyu(class1, class2, alternative='greater')

MannwhitneyuResult(statistic=26.0, pvalue=0.2097357217306488)

In [28]:
stats.mannwhitneyu(class1, class2, alternative='less')

MannwhitneyuResult(statistic=26.0, pvalue=0.8299904236851448)