# 독립표본검정

다음은 빅데이터 분석기사 실기 시험 점수이다. A그룹과 B그룹의 평균 점수가 차이가 있는지 유의수준 0.05하에서 가설 검정하시오.
(데이터는 정규분포를 따르고 분산이 동일하다고 가정한다.)
- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): 그룹별 시험 평균 점수는 차이가 있다. (μ1 ≠ μ2)

## 1. 기초

In [1]:
# 데이터
A = [85, 90, 92, 88, 86, 89, 83, 87,
     84, 50, 60, 39, 28, 48, 38, 28]
B = [82, 82, 88, 85, 84, 74, 79, 69,
     78, 76, 85, 84, 79, 89]

### 독립표본검정

In [3]:
# 독립표본검정
from scipy import stats
stats.ttest_ind(A, B) #(처리집단, 대조집단)

TtestResult(statistic=-2.051813915505951, pvalue=0.04964542271174967, df=28.0)

### 등분산

In [4]:
# 두 집단의 분산이 다르다(equal_var=False)
stats.ttest_ind(A, B, equal_var=False) #(처리집단, 대조집단)

TtestResult(statistic=-2.1837307810153024, pvalue=0.04352730399590312, df=16.729279968729678)

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 평균 점수가 더 높다. (μ1 < μ2)

In [7]:
# 독립표본검정(less)
stats.ttest_ind(A, B, equal_var=True, alternative='less') #(처리집단, 대조집단)

TtestResult(statistic=-2.051813915505951, pvalue=0.024822711355874834, df=28.0)

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): A그룹 시험 평균 점수가 더 높다. (μ1 > μ2)

In [8]:
# 독립표본검정(greater)
stats.ttest_ind(A, B, equal_var=True, alternative='greater') #(처리집단, 대조집단)

TtestResult(statistic=-2.051813915505951, pvalue=0.9751772886441252, df=28.0)

## 2. 심화

In [None]:
# 데이터
import pandas as pd
A = [85, 90, 92, 88, 86, 89, 83, 87,
     84, 50, 60, 39, 28, 48, 38, 28]
B = [82, 82, 88, 85, 84, 74, 79, 69,
     78, 76, 85, 84, 79, 89]

### Shapiro-Wilk 검정

In [9]:
# Shapiro-Wilk(샤피로-윌크) 정규성 검정
from scipy import stats
print(stats.shapiro(A))
print(stats.shapiro(B))

ShapiroResult(statistic=0.8128696504554708, pvalue=0.00405770158688692)
ShapiroResult(statistic=0.9610027583368682, pvalue=0.739578582064332)


### Levene 검정

In [13]:
# Levene(레빈) 등분산 검정 (귀무가설: 분산이 동일하다)
stats.levene(A, B)

LeveneResult(statistic=8.013957643762076, pvalue=0.008497116974003)

### 독립표본검정

- 귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 평균 점수가 더 높다. (μ1 < μ2)

In [14]:
# 독립표본검정
stats.ttest_ind(A, B, equal_var=False, alternative='less')

TtestResult(statistic=-2.1837307810153024, pvalue=0.02176365199795156, df=16.729279968729678)

### Mann-Whitney U 검정 (비모수 검정)

- 귀무가설(H0): 그룹별 시험 중앙값 점수는 차이가 없다. (μ1 = μ2)
- 대립가설(H1): B그룹 시험 중앙값 점수가 더 높다. (μ1 < μ2)

(추가) 비모수 검정: 평균 -> 중앙값으로 변경 (중앙값도 평균값이라 동일하다고 하겠습니다.)

In [12]:
# Mann-Whitney U(만-휘트니 유) 검정
from scipy import stats
print(stats.mannwhitneyu(A, B, alternative='less'))

MannwhitneyuResult(statistic=106.0, pvalue=0.40944636368515097)
