# R Statistical Test(모수 검정 vs 비모수 검정)

- author: "Kwon DoHyung"
- toc: true 
- comments: true
- categories: [CSE, R, math, statistics]
- image: images/2020-11-06-r-statistical-test/Untitled14.png
- permalink: /r-statistical-test/

# single sample t-test

해당 노트는 R에서 빈번하게 사용되는 통계 기법 등에 대해 다루는 노트다. 통계는 크게 모수 검정(parametric test)와 비모수 검정(non-parametic test)로 나눌 수 있다. R이 가정하는 것은 모집단이 정규분포를 따른다는 것이다. 정규분포를 따른다는 것은 평균이 0, 분산이 1인 경우를 말한다.

모집단이 정규 분포를 따르는 경우도 있지만 따르지 않는 경우도 있다. 모집단이 정규 분포를 따르는 경우를 모수 검정, 모집단이 정규 분포를 따르지 않는 경우를 비모수 검정이라고 한다. 

비모수 검정은 표본수가 적거나 모집단이 정규분포임을 가정하기 어려운 경우, 측정 자료의 수준이 이산형 등의 categorical인 경우에 사용된다.

비교 그룹이 두 가지인 경우, 모수 검정으로는 paired t-test, independent (student) t-test를 통해 두 집단 간의 평균을 비교한다. 비모수 검정(즉, 정규 분포를 따르지 않는 경우)에서는 Mann-Whiteney U-test, Wilcoxon rank sum test, Crank Sum 비교, median 등을 사용된다. 특히, mean이 아닌 중간값(median)을 사용한다.

그룹이 세 개 이상인 경우의 비교에서, 모수 검정에서는 One-way ANOVA를 대표적으로 사용한다. 비모수 검정에서는 Kruskal-Willis test를 사용한다.

통계에서는 정규성을 따르는지 여부가 굉장히 중요하다. 내가 다루고자 하는 데이터가 정규성이 있는지 없는지 검증하는 과정이 내가 쓰고 있는 통계 기법에 대한 신뢰성을 보장해준다. 따라서 정규성 검증이 우선적으로 수행되어야 한다. 정규성 검증 방법으로 Q-Q plot 그리기, Shapiro-Wilk test(샤피로 윌크 검정), Kolmogorov-Smirnov test(콜모고로프-스미노트 검정)이 있다. 이 세 가지 방법으로 정규성을 따르는지 따진다. 각 테스트에서 p값이 0.05보다 커야 정규성을 따르는 것으로 판단할 수 있다.

## Q-Q plot: Qunatile-Quantile plot

실제 데이터값과 이론적 데이터값의 분포를 비교했을 때 어느 정도 일치하는지를 Plot으로, 즉 시각적으로 확인하는 방법이다. 대각선의 치우친 정도에 따라 정규성을 판단하게 된다. 따라서 해석이 주관적일 수 있다는 단점이 있다. 시각적인 방법 외에 p값을 판단하기 위한 통계적인 기법으로 Shapiro-Wilk test(샤피로 윌크 검정), Kolmogorov-Smirnov test(콜모고로프-스미노트 검정)이 있다. 

### qqnorm()

정규분포의 Q-Q plot을 그리는 함수. 1Q와 3Q를 지나는 선을 그리는 함수다. 정규분포일 경우 직선을 띈다.

### qqplot()

두 개의 자료가 같은 분포에서 추출되었는지를 검증한다. 같은 분포를 따를 경우 y=x 그래프로 나온다.

### 실습 코드

```r
set.seed(1234)
x<-sample(x=1:200, size=30, replace=F)
qqnorm(x) # normal Q-Q plot 생성
qqline(x, col=2) # 대각선 추가
```

![](../images/2020-11-06-r-statistical-test/Untitled.png)

오른쪽 대각선으로 직선의 모양을 띄고 있으므로 정규분포를 따른다고 추정할 수 있으며, 모수 추정법을 시도해 볼 수 있다.

## SW-test: Shapiro-Wilk test(샤피로 윌크 검정)

p > 0.05일 경우 정규성을 띈다고 가정할 수 있다.

### 실습 코드

```r
set.seed(1234)
x<-sample(x=1:200, size=30, replace=F)
shapiro.test(x)
```

![](../images/2020-11-06-r-statistical-test/Untitled1.png)
p값이 0.9122로, 0.05보다 크므로 정규분포를 따른다고 가정할 수 있고 따라서 모수 추정법을 쓸 수 있다.

## KS-test: Kolmogorov-Smirnov test(콜모고로프-스미노트 검정)

Empirical Distribution Function(EDF)에 기반한 검정 방법. 자료의 평균과 표준편차, 히스토그램을 표준정규분포와 비교하여 적합도를 검정하며, p > 0.05일 경우 정규성을 띈다고 가정할 수 있다.

### 실습 코드

**ks.test()**

```r
set.seed(1234)
x<-sample(x=1:200, size=30, replace=F)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))
```

![](../images/2020-11-06-r-statistical-test/Untitled2.png)

p값이 0.9952로, 0.05보다 크므로 정규분포를 따른다고 가정할 수 있고 따라서 모수 추정법을 쓸 수 있다.

**lillie.test()**

```r
# install.packages("nortest")
library(nortest)

set.seed(1234)
x<-sample(x=1:200, size=30, replace=F)
lillie.test(x)
```

![](../images/2020-11-06-r-statistical-test/Untitled3.png)

p값이 0.961로, 0.05보다 크므로 정규분포를 따른다고 가정할 수 있고 따라서 모수 추정법을 쓸 수 있다.

---

# Paired t-test

두 집단 간의 대응 표본에 대한 t-검정을 말한다. 표본의 각 케이스마다 대응되는 두 개의 관측치가 있다는 관점에서 single sample t-test와는 차이가 있다.

각 환자가 주어지고, 동일한 집단에 속한 각 환자의 약물을 처리 전과 후를 비교하고자 할 때, 약물에 대한 효과를 보기 위해 검정하는 경우가 그 예다.

즉, 약물 처리 전과 후 두 그룹에 대한 t-test를 수행하기 위한 방법이다. 모수 검정이므로 우선 정규성이 만족되어야 하며, 두 집단간 분산이 등분산을 이루어야 한다. 이 두 조건을 만족하면 paired t-test를 사용할 수 있다. 

## 등분산성 test: bartlett test

### 실습 코드

```r
before = c(0.430, 0.266, 0.567, 0.531, 0.707, 0.716, 0.651, 0.589, 0.469, 0.723)
after = c(0.415, 0.238, 0.390, 0.410, 0.605, 0.609, 0.632, 0.523, 0.411, 0.612)
data = data.frame(before = before, after = after)
dim(data)
data
```

![](../images/2020-11-06-r-statistical-test/Untitled4.png)

```r
var.test(data(달러표시)before, data(달러표시)after)
```

![](../images/2020-11-06-r-statistical-test/Untitled5.png)

p-value값이 0.7441로 나온다. 0.05보다 큰 값이므로 두 집단의 등분산성을 인정할 수 있다. 

## t-test

두 집단이 등분산을 이루고 있으므로 두 집단 간이 정규분포를 따르는지를 따지기 위한 t-test를 수행해야 한다.

![](../images/2020-11-06-r-statistical-test/Untitled6.png)

t-test() 함수에서 요구하는 파라미터는 위와 같다. 만약 y를 기술하지 않으면 single sample에 대한 t-test가 된다.

### 실습 코드

```r
t.test(data(달러표시)before, data(달러표시)after, paired=T)
```

![](../images/2020-11-06-r-statistical-test/Untitled7.png)

mean of the differences는 두 집단 간 평균의 차이를 의미한다.

# 독립표본 t-test (independent sample t-test 또는 Student sample t-test)

비교하려는 집단은 서로 독립적인 집단에서 추출된 샘플이며, 이 두 집단의 샘플에 대한 **평균의 차이**를 통계적으로 검정한다. 즉, 모집단이 서로 다르다. 그러므로 상관성이 서로 없을 가능성이 크다. 따라서 두 집단의 평균의 차이를 검증해야 한다.

R에 내장된 데이터셋을 살피기 위해 `data()`를 입력한다.

```r
data
```

![](../images/2020-11-06-r-statistical-test/Untitled8.png)

이들 중 iris를 사용할 예정이다.

### 실험 코드

```r
# iris
dim(iris)
head(iris)
data = iris[c(1:100), c("Species", "Sepal.Length")] # 종과 꽃잎의 길이만 비교하겠다.
head(data)
colnames(data) = c("species", "sepal")

# bartlett test
bartlett.test(sepal~species, data=data) # p-value가 적으므로 분산이 이질적이라고 할 수 있다. 

# t-test
t.test(sepal~species, var.eqaul=F, data=data)
```

![](../images/2020-11-06-r-statistical-test/Untitled9.png)

p 값이 차이가 있기 때문에 두 집단 즉 Species(종)과 sepal.Length(꽃잎의 길이)간에는 확연한 차이가 있다고 판단할 수 있다.

# Wilcox-test: 두 모집단의 중심 차이에 대한 비모수검정

독립표본 t-test (independent sample t-test 또는 Student sample t-test)이 정규성을 충족하는 두 집단 간의 평균의 차이를 이용하여 비교하는 검정법이었다. 만약 비교하려는 두 집단이 정규성을 충족하지 못하는 경우이거나 그 분포의 형태를 알 수 없을 경우엔 정규성을 충족하지 못함을 가정하여 비모수 검정을 사용한다. 이 때 wilcox-test를 수행하게 된다. 즉 모집단이 정규성 가정을 충족하지 못하거나, 모집단의 분포 형태를 모르는 경우에 사용된다. 두 모집단의 중심(median)의 차이에 대한 비모수 검정이며, 다른 말로는 wilcoxon rank sum test, Mann-Whiteney U-test라고도 한다.

### 실험 코드 1

```r
## 정규성을 충족하지 못하는 두 모집단의 중심 차이에 대한 비모수검정
## Wilcox rank sum test, Mann-Whiteney U-test
## Dataset
library(MASS)
#str(Cars93)
#head(Cars93)
wilcox.test(Price ~ Origin, 
            data=Cars93, 
            alternative = c("two.sided"), 
            mu = 0, 
            conf.int = FALSE, 
            conf.level = 0.95)
```

![](../images/2020-11-06-r-statistical-test/Untitled10.png)

p 값이 0.6724로 0.05보다 크므로 두 집단 간에는 차이가 없다고 할 수 있다. 

### 실험 코드 2

```r
## paired 2 sample : Wilcoxon signed rank test
# 정규성을 따르지 않는 10명의 환자의 치료제에 복용에 따른 혈중 타겟 단백질 농도 비교시 
before = c(51.4, 52.0, 45.5, 54.5, 52.3, 50.9, 52.7, 50.3, 53.8, 53.1)
after = c(50.1, 51.5, 45.9, 53.1, 51.8, 50.3, 52.0, 49.9, 52.5, 53.0)

# wilcox signed rank test
wilcox.test(before, after, 
            alternative = c("greater"), 
            paired = TRUE, 
            conf.level = 0.95)
```

![](../images/2020-11-06-r-statistical-test/Untitled11.png)

p가 0.05보다 충분히 작은 값인 0.006172이므로 두 집단 간에 차이가 있다고 판단할 수 있다.

# 일원분산 분석: one-way ANOVA

모두 검정 중 정규성을 충족하나, 비교하려는 집단이 세 개 이상인 경우에 해당한다. 두 집단일 경우 평균이나 중간값을 비교했다. 그러나 집단이 세 개 이상인 경우에는 집단 내에서의 분포가 얼마나 차이가 있는지 분산을 비교해야 한다. A집단 내의 분산, B집단 내의 분산이 다르다면 두 집단은 다르다고 판단할 수 있는 원리다. 즉 세 개의 집단에 대한 분산을 비교한다.

### 실습 코드

```r
## One-way ANOVA :One-way ANOVA : aov(), oneway.test
# 정규성을 충족하는 독립된 세 집단 이상의 평균을 비교하고자 할 때 사용하는 분석 방법
##--- Are there any daily outcome differences among temperature conditions?
# group 1 : temperature condition 1 
# group 2 : temperature condition 2
# group 3 : temperature condition 3

# daily outcome by tmep condition (group 1/2/3)
outcome01=c(50.5, 52.1, 51.9, 52.4, 50.6, 51.4, 51.2, 52.2, 51.5, 50.8)
outcome02=c(47.5, 47.7, 46.6, 47.1, 47.2, 47.8, 45.2, 47.4, 45.0, 47.9)
outcome03=c(46.0, 47.1, 45.6, 47.1, 47.2, 46.4, 45.9, 47.1, 44.9, 46.2)

outcome=c(outcome01, outcome02, outcome03)
group=c(rep("G1", 10),rep("G2", 10), rep("G3", 10))

## 데이터 프레임으로 결합
group_outcome=data.frame(outcome, group)
head(group_outcome)

# descriptive statistics by group
tapply(outcome, group, summary)
```

![](../images/2020-11-06-r-statistical-test/Untitled12.png)

- `tapply()` 함수는 테이블 형태의 데이터에 적용할 수 있는 apply 함수다.

정규성을 충족하고 있다. 이제, 등분산성을 검증해야 한다.

```r
## Bartlett test (등분산성 검증)
bartlett.test(outcome ~ group, data = group_outcome)
```

![](../images/2020-11-06-r-statistical-test/Untitled13.png)

p값이 0.4368로 충분히 크다. 등분산성을 이루고 있다고 할 수 있다.

정규성과 등분산성이 모두 충족되므로 모수 검정을 실시할 수 있게 된다.

```r
## one-way ANOVA
aov(outcome ~group, data=group_outcome)
summary(aov(outcome ~group, data=group_outcome))
```

![](../images/2020-11-06-r-statistical-test/Untitled14.png)

그룹간 Residuals가 주어지고, 그것에 대한 통계처리된 값들이 나온다. p값이 1.2e-13으로 작게 나온다. 즉 세 그룹은 서로 다르다고 할 수 있다. ANOVA의 단점은 어느 그룹과 어느 그룹이 차이가 있는지는 보여주지 못한다는 단점이 있다.

# Kruskal-Willis 검정

세 집단을 비교하는 방법으로 정규성을 충족하지 않는 집단에 대한 비모수 검정 방법에 해당한다. 비모수 검정은 평균이 아닌 중간값을 비교하듯, 이 방법도 크기순으로 정렬한 후 가장 작은 값부터 순위를 메겨, 그룹별 순위합을 구하는 방법이다. 그룹 간에 순위합에 차이가 없다면 순위합도 비슷하다고 할 수 있고, 크기 차이가 많이 난다면 순위합도 차이가 많이 날 것이라는 기본적인 가정하에 나온 기법이다. 

데이터에 대한 등분산 검증을 먼저 실시하게 된다. 정규성을 띌 경우 bartlett-test를 실시하지만, 여기서는 정규성을 띄지 않으므로 levene test를 실시한다.

### 실습 코드

```r
## 정규성을 충족하지 않는 K개의 독립진단에 대한 비모수 검정
## Kruskal-Willis 검정 
value1 <- c(98,95,76,95,83,99,82,75,88)
value2 <- c(95,71,80,81,77,70,80,72,81)
value3 <- c(77,79,91,84,80,93,87,81,83)
category <- c(rep("A",9),rep("B",9),rep("C",9))
data <- data.frame(value=c(value1,value2,value3), category)
head(data)

## 등분산 검증 (levene.test) 
## levene test는 barlettetest 보다 정규성을 띠지 않는 경우에 보다 민감
#install.packages("lawstat")
library(lawstat)

levene.test(data(달러표시)value,data(달러표시)category)

## Kruskal-Willis
kruskal.test(value~category, data=data)
```

![](../images/2020-11-06-r-statistical-test/Untitled15.png)

등분산을 띄고(P-value: 0.2023 > 0.05), Kruskal-Wallis test에서 나온 P-value가 0.05793으로 0.05보다 크므로 세 집단에는 통계적으로 차이가 없다고 볼 수 있다.

# 문제

다음은 A집단과 B집단의 키를 측정한 결과이다. A와 B 그룹 사이에 신장 차이가 있는지 판단하기 위해 사용되는 R 통계방법을 모두 고르시오.

A = c(171.2, 190.1, 184.3, 179.6, 183.2, 174.1, 186.7, 187.2, 187.2, 179.5)
B = c(175.3, 176.1, 173.2, 176.7, 181.3, 178.6, 180.2, 172.6, 180.9, 172.1)

- [ ]  t.test(A~B)
- [ ]  var.test(A, B)
- [ ]  aov(A, B)
- [ ]  wilcox.test(A~B)
- [ ]  t.test(A, B)

```r
A = c(171.2, 190.1, 184.3, 179.6, 183.2, 174.1, 186.7, 187.2, 187.2, 179.5)

B = c(175.3, 176.1, 173.2, 176.7, 181.3, 178.6, 180.2, 172.6, 180.9, 172.1)
data = data.frame(A = A, B = B)
dim(data)
data
var.test(data(달러표시)A, data(달러표시)B)
t.test(data(달러표시)A, data(달러표시)B)
```

또는

```r
A = c(171.2, 190.1, 184.3, 179.6, 183.2, 174.1, 186.7, 187.2, 187.2, 179.5)
B = c(175.3, 176.1, 173.2, 176.7, 181.3, 178.6, 180.2, 172.6, 180.9, 172.1)
var.test(A, B)
t.test(A~B)
```

# Reference

- [https://m.blog.naver.com/PostView.nhn?blogId=dic1224&logNo=80209540135&proxyReferer=https:%2F%2Fwww.google.com%2F](https://m.blog.naver.com/PostView.nhn?blogId=dic1224&logNo=80209540135&proxyReferer=https:%2F%2Fwww.google.com%2F)