# 01. 가설 검정
--------------------------
    어떤 주장을 제기하고, 그 주장이 통계적으로 유의한지를 판단하기 위해 사용되는 것
    분석 대상을 전체를 확인하는것이 가장 좋지만 시간과 엄청난 비용이 들어가기 때문에, 모집단의 일부 표본(sample) 데이터를 통해 가설검정을 진행한다.

- 귀무가설(H0) : 기존에 알려진 사실
- 대립가설(H1) : 밝히려고(입증하려고) 하는 사실

### 가설 검정 프로세스
---------
      기각역을 이용하는 방법과 유의확률을 이용하는 방법
1. 통계적 가설 검정
        검정하려는 가설을 설정한다. 귀무가설은 기존에 알려진 또는 일반적인 사실(주장)이고 대립가설은 입증하고자 하는 가설(주장)이다.
2. 유의수준 결정
        유의수준은 귀무가설을 기각하기 위해 필요한 기준값이다. 일반적으로 0.05 또는 0.01과 같은 값이 사용된다. 유의수준은 검정 결과를 해석하는데 중요한 역할을 한다.
3. 검정 통계량 및 유의확률 계산
        표본 데이터의 검정 통계량을 계산한다. 검정 통계량은 가설을 평가하기 위해 사용되는 값으로 검정 통계량을 사용해 유의확률(P-value)을 계산한다.
4. 결과 도출
        유의확률 << 유의수준 : 귀무가설 기각
        유의확률 >> 유의수준 : 귀무가설 채택

# 02. 단일 표본 검정
-----------------------------
    단일 표본 검정(One Sample t-test)은 어떤 집단의 평균이 특정 값과 유의미하게 다른지를 검정하는 통계 방법이다.
    예를 들어 영화관에서 판매하는 팝콘의 무게는 120g으로 알려져 있다. 판매할 때마다 무게가 다른 것 같아 평균 무게가 120g 인지를 확인하고자 한다.
  
  - 표본
        팝콘
  - t-test
        표본의 크기, 표본의 평균, 표본의 표준편차 등을 활용해 기존에 알려진 120g과 다른지 t-검정을 수행한다. 검정 결과는 p_value(p-값)이 주어지는데 이 값이 얼마나 작은지에 따라 평균이 120g과 같은지 다른지를 판단할 수 있다.
        즉 평균이 120g이 아니라고 할 만한 충분한 근거가 있다는 의미다.
        이런 방식으로 단일표본 t-test는 주어진 표본 데이터가 어떤 특정 값과 다르다는 것을 통계적으로 판단하는 데 사용한다.

      - 단일 표본 검정에서는 scipy.stats의 ttest_1samp()를 활용한다.
            ttest_1samp(a, popmean, alternative)
            - a : 모집단에서 뽑은 표본 데이터
            - popmean : 비교하려는 모집단의 평균 또는 기대 값
            - alternative(대립가설 정의)
              실제 (μ) > 기존에 알려진 무게(μ₀)를 비교한다.

Q. 영화관에서 판매하는 팝콘 라지 사이즈의 무게는 일반적으로 120g으로 알려져 있다. 이제 이 데이터를 갖고 t-test를 수행한다. 가설검정 프로세스 순서로 풀어본다. (별도의 안내가 없다면 0.05를 기준으로 한다.)

In [None]:
import pandas as pd
df = pd.DataFrame({
    'weights':[122, 121, 120, 119, 125, 115, 121, 118, 117, 127,
           123, 129, 119, 124, 114, 126, 122, 124, 121, 116,
           120, 123, 127, 118, 122, 117, 124, 125, 123, 121],
})

from scipy import stats
t_statistic,p_value = stats.ttest_1samp(df['weights'],120)
print("t-statistic :",t_statistic)
print("p-value:",p_value)

t-statistic : 2.1155384372682344
p-value: 0.043092957066609296


# 03. 양측 검정과 단측 검정
-----------------------------
1. 양측 검정(Two-tailed test)
        귀무가설, 즉 기존에 알려진 사실보다 크거나 작음에 대해 모두 검정한다. 팝콘 라지 사이즈 예시에서 대립가설을
        " 팝콘 라지 사이즈의 평균 무게는 120g이 아니다."
        라고 설정한다면 양측검정이다. 평균 무게가 120g보다 클 수도 작을 수도 있다.
2. 단측 검정(One-tailed test)
        귀무가설, 즉 기존에 알려진 사실보다 크거나 작음에 대해 검정한다.
        예시에서 "팝콘 라지 사이즈의 평균 무게는 120g보다 크다"
        라고 설정한다면 이는 단측 검정이다. 여기서는 평균 무게인 120g보다 클 경우만 고려하고 있다.
        기본적으로 scipy 라이브러리의 ttest_1samp() 함수는 기본적으로 양측 검정을 수행한다. 단측 검정이 필요하다면 alternative 파라미터를 활용한다.
        alternative : two-sided(기본값)/ greater(평균보다 크다)/ less(평균보다 작다)

In [None]:
stats.ttest_1samp(df['weights'],120,alternative="two-sided")

TtestResult(statistic=2.1155384372682344, pvalue=0.043092957066609296, df=29)

In [None]:
print("크다: ",stats.ttest_1samp(df['weights'],120,alternative='greater'))
print("작다: ",stats.ttest_1samp(df['weights'],120,alternative='less'))


크다:  TtestResult(statistic=2.1155384372682344, pvalue=0.021546478533304648, df=29)
작다:  TtestResult(statistic=2.1155384372682344, pvalue=0.9784535214666953, df=29)


### 데이터가 정규성 가정을 만족하지 않는 경우
-------------------
    비모수 검정 방식을 고려한다.
    - 샤피로-윌크 검정(Shapiro-Wilk test)
    - 만약 샤피로- 윌크 검정 결과가 데이터 정규성을 갖지 않는경우 -> 윌콕슨(Wilcoxon) 부호검정을 통해 가설검정

In [9]:
# 평균 무게가 120g이다. 평균보다 작다고 할수있는가?  유의수준(0.05)
import pandas as pd
df = pd.DataFrame({
    'weights':[125,126,118,124,117,127,123,122,119,142],
})

# 샤피로-윌크 검정
from scipy import stats
print("Shapiro value: ",stats.shapiro(df['weights']))

# 윌콕슨 부호 순위 검정 (평균이 아닌 중앙값에 대한 검정) , 비교하는 중앙값을 빼줘야한다.
print("Wilcoxon value :",stats.wilcoxon(df['weights'] - 120 , alternative='less'))

Shapiro value:  ShapiroResult(statistic=0.8164570347000635, pvalue=0.022960129822451016)
Wilcoxon value : WilcoxonResult(statistic=47.0, pvalue=0.9814453125)


### 대응 표본 검정
---------------
    같은 모집단에 대하여 시간차를 두고 두 번(사전,사후) 두 시점을 비교
    예시) 체중 감량프로그램, 약물 효과(전후), 교육 프로그램(전후)
```python
  from scipy import stats
  ttest_rel(a,b,alternative)    
```
- a : 첫 번째 모집단에서 뽑은 표본 데이터
- b : 두 번째 모집단에서 뽑은 표본 데이터 (a와 b의 데이터 수는 같다.)
- alternative(대립가설 정의) μₖ = (a-b) 평균
  - μₖ > 0 : greater, a의 평균이 b의 평균보다 크다.
  - μₖ < 0 : less , a의 평균이 b의 평균보다 작다.
  - μₖ = 0 : two-sides(기본값)

Q. 어떤 기업이 새로운 교육 프로그램을 도입해 직원의 성과를 개선하려고 한다. 이때 동일한 직우너 그룹에 대해 교육 전과 후의 성과를 비교했다. 새로운 교육 프로그램이 효과있는지 가설검정을 하시오. (유의 수준 0.05) 단 성과 데이터 차이는 정규 분포를 따른다고 가정한다.

In [11]:
import pandas as pd
df = pd.DataFrame({
    'before' :[85,90,92,88,86,89,83,87],
    'after' :[85.5,89.9,92.6,89.5,85.8,88.8,84.6,87.8]
})
# μₖ = before - after
# 귀무가설 : 새로운 교육 프로그램은 효과가 없다.(before==after | before >after , μₖ >=0 )
# 대립가설 : 새로운 교육 프로그램은 효과가 있다.(before이 작다,μₖ<0)
from scipy import stats
print(stats.ttest_rel(df['before'],df['after'],alternative='less'))
# pvalue=0.03127028733756238 << 유의수준 0.05 , 귀무가설 기각 -> 대립가설 채택.

TtestResult(statistic=-2.2127749675452324, pvalue=0.03127028733756238, df=7)


In [12]:
# 양측검증 시행
print(stats.ttest_rel(df['after'],df['before']))

TtestResult(statistic=2.2127749675452324, pvalue=0.06254057467512476, df=7)


In [13]:
# 데이터 정규성 검정에 샤피로-윌크는 순서가 중요하지 않다.
from scipy import stats
df['diff'] = df['after'] - df['before']
stats.shapiro(df['diff'])

ShapiroResult(statistic=0.885486928626845, pvalue=0.21232743678800203)

In [14]:
# 윌콕슨 이나 t-검정은 순서가 중요하다
stats.wilcoxon(df['after'],df['before'],alternative='greater')

WilcoxonResult(statistic=30.0, pvalue=0.0546875)

In [15]:
stats.wilcoxon(df['diff'],alternative='greater')

WilcoxonResult(statistic=30.0, pvalue=0.0546875)

#### 독립 표본 검정
--------------
    두 그룹(표본)간의 평균이 서로 다름을 판단하는 통계 방법

```python
from scipy import stats
stats.ttest_ind(a,b,alternative,equal_val)
```
- a : 첫 번째 모집단에서 뽑은 표본 데이터
- b : 두 번째 모집단에서 뽑은 표본 데이터(a와 b의 데이터 수는 다를 수 있다.)
- alternative (대립가설 정의)
  - μ1 > μ2 : greater, a의 평균이 b의 평균보다 작다.
  - μ1 < μ2 : less, a의 평균이 b의 평균보다 작다.
  - μ1 ≠ μ2 : two-sides(기본값) 두 그룹 간 평균차이가 있다.

- equal_val
  - True : 두 모집단의 분산이 같다고 가정한다.
  - False : 두 모집단의 분산이 다르다고 가정한다.

----------------------
Q. 어느 학교의 반별 수학 시험 점수다. 1반과 2반의 평균 점수가 차이가 있는지 유의수준 0.05 하에서 가설검정하시오.(μ1 : 1반 평균, μ2 : 2반 평균)

In [16]:
import pandas as pd
class1 = [85,90,92,88,86,89,83,87]
class2 = [80,82,88,85,84]

from scipy.stats import ttest_ind
ttest_ind(class1,class2)

TtestResult(statistic=2.2108140580092237, pvalue=0.04914857789252186, df=11.0)

In [17]:
print(stats.ttest_ind(class1,class2,equal_var=False))

TtestResult(statistic=2.1818699281825236, pvalue=0.059589330071355334, df=8.272682358753572)


In [18]:
# 단측검정
# 귀무가설 : 반별 수학평균은 같다.μ1 = μ2
# 대립가설 : 2반의 수학평균이 더 높다. μ1 < μ2
print(stats.ttest_ind(class1,class2,equal_var=True,alternative='less'))

TtestResult(statistic=-2.2108140580092237, pvalue=0.9754257110537391, df=11.0)


In [20]:
# 단측검정
# 귀무가설 : 반별 수학평균은 같다.μ1 = μ2
# 대립가설 : 1반의 수학평균이 더 높다. μ1 > μ2
print(stats.ttest_ind(class1,class2,equal_var=True,alternative='greater'))

TtestResult(statistic=2.2108140580092237, pvalue=0.02457428894626093, df=11.0)


Q. 다음의 어느 학교의 반별 수학 시험 점수다. 1반과 2반의 평균 점수가 차이가 있는지 유의 수준 0.05 하에서 가설검정하시오. (μ1 : 1반 평균, μ2 : 2반 평균)
- 귀무가설 : 반별 수학 평균 점수는 같다.
- 대립가설 : 2반의 수학 평균 점수가 더 높다.

In [21]:
import pandas as pd
class1 = [85,90,92,88,86,89,83,87]
class2 = [80,82,88,85,84]
# class1은 pvalue=0.999986994137081, class2는 pvalue=0.9854182266624983 / 정규성 만족한다.
from scipy import stats
print(stats.shapiro(class1))
print(stats.shapiro(class2))

ShapiroResult(statistic=0.9981893537736595, pvalue=0.999986994137081)
ShapiroResult(statistic=0.9917398436295009, pvalue=0.9854182266624983)


In [22]:
print(stats.levene(class1,class2))
# pvalue=0.958802951766629 등분산성 만족한다.

LeveneResult(statistic=0.0027925869510027727, pvalue=0.958802951766629)


In [23]:
print(stats.ttest_ind(class1,class2,alternative='less',equal_var=True))
# 독립 표본 t-검정

TtestResult(statistic=2.2108140580092237, pvalue=0.9754257110537391, df=11.0)


#### 비모수 검정 예시
    정규성 가정이 만족하지 못한 경우 비모수 검정인 Mann-Whitney U 검정 수행

- 2개의 모집단 -> 정규성을 만족하는가? -> Yes 분산이 동일한가?(등분산성) -> Yes 독립표본 검정
- 2개의 모집단 -> 정규성을 만족하는가? -> Yes 분산이 동일한가?(등분산성) ->
No Welch의 t검정
- 2개의 모집단 -> 정규성을 만족하는가? No-> Mann-Whitney U 검정


In [25]:
import pandas as pd
class1 = [85,90,92,88,86,89,83,87]
class2 = [80,82,88,85,130]

from scipy import stats
print(stats.shapiro(class1))
print(stats.shapiro(class2))
# pvalue=0.007151570728885509 정규성 만족하지 못한다.
# 맨-휘트니 검정
stats.mannwhitneyu(class1,class2,alternative='less')

ShapiroResult(statistic=0.9981893537736595, pvalue=0.999986994137081)
ShapiroResult(statistic=0.6880497349322277, pvalue=0.007151570728885509)


MannwhitneyuResult(statistic=26.0, pvalue=0.8299904236851448)