# 1. 일표본 T-검정 (One sample T-test)

* 개념 : 단일모집단에서 관심이 있는 연속형 벼수의 평균값을 특정기준값과 비교하고자 할 때 사용

$$ H_0 : \mu_0 = \mu_1 \quad H_1 : not\,\, H_0$$

* 모집단이 정규성을 따른다고 가정하고 표본의 크기가 30보다 클 경우, 중심극한정리에 따라 정규분포를 따른다고 가정함.

* 정규성을 만족할 경우 `t-test`, 그렇지 않은 경우 ` wilcox.test` 함수를 이용하여 T-검정을 수행


## 1.1 R 실습

$$H_0 : \mu = 2.6 \quad H_1 :  not \, H_0$$

In [3]:
library(MASS)

In [5]:
 str(cats) ## 

'data.frame':	144 obs. of  3 variables:
 $ Sex: Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
 $ Bwt: num  2 2 2 2.1 2.1 2.1 2.1 2.1 2.1 2.1 ...
 $ Hwt: num  7 7.4 9.5 7.2 7.3 7.6 8.1 8.2 8.3 8.5 ...


* 표본의 크기가 30보다 크므로 정규성을 만족한다고 가정

In [6]:
t.test(cats$Bwt,mu=2.6,alternative= "two.sided")


	One Sample t-test

data:  cats$Bwt
t = 3.0565, df = 143, p-value = 0.002673
alternative hypothesis: true mean is not equal to 2.6
95 percent confidence interval:
 2.643669 2.803553
sample estimates:
mean of x 
 2.723611 


* 검정통계량의 근거한 p-value 값을 보았을 때 귀무가설을 기각한다.

***

# 2. 대응표본 T-검정 (Paired Sample T-Test)

* 단일모집단에 대해 두번의 처리를 가했을 때, 두 개의 처리에 따른 평균 차이를 비교하고자 할 때 사용

$$ H_0 : \mu_x = \mu_y \quad H_1 : not \,\,H_0$$

* 표본 내의 개체들에 대해서 두 번의 측정을 실시 $\to$ 즉, 관측값들은 서로 독립적이지 않고 쌍으로 이루어져 있다.

* 가정 : 정규성을 가정하며, 종속변수는 연속형 변수이다.

## 2-1. R 실습

In [9]:
data <- data.frame(before = c(7,3,4,5,2,1,6,6,5,4),
                  after = c(8,4,5,6,2,3,6,8,6,5))

In [15]:
shapiro.test(c(data$before,data$after)) ## 정규성을 만족


	Shapiro-Wilk normality test

data:  c(data$before, data$after)
W = 0.95961, p-value = 0.5362


In [18]:
t.test(data$before,data$after, paired=T,alternative="less")


	Paired t-test

data:  data$before and data$after
t = -4.7434, df = 9, p-value = 0.0005269
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
       -Inf -0.6135459
sample estimates:
mean of the differences 
                     -1 


* 결과적으로 영양제 복용 후 수면시간이 더 길었다.

***

# 3. 독립표본 T-검정 (Independent Sample T-Test)

* 두 개의 독립된 모집단의 평균을 비교하고자 할 때 사용하는 검정 방법

* 가정 : 두 모집단은 정규성을 만족하며, 서로 독립적이어야 한다. 또한 등분산성 가정을 확인해야함.

## 3-1. R 실습

In [20]:
library(MASS)

In [21]:
str(cats)

'data.frame':	144 obs. of  3 variables:
 $ Sex: Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
 $ Bwt: num  2 2 2 2.1 2.1 2.1 2.1 2.1 2.1 2.1 ...
 $ Hwt: num  7 7.4 9.5 7.2 7.3 7.6 8.1 8.2 8.3 8.5 ...


In [22]:
var.test(Bwt~Sex,data=cats)


	F test to compare two variances

data:  Bwt by Sex
F = 0.3435, num df = 46, denom df = 96, p-value = 0.0001157
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.2126277 0.5803475
sample estimates:
ratio of variances 
         0.3435015 


* 등분산 검정결과 성별에 따른 두집단은 등분산성을 만족하지 않음

In [23]:
t.test(Bwt~Sex, data=cats, alternative="two.sided",var.equal = F)


	Welch Two Sample t-test

data:  Bwt by Sex
t = -8.7095, df = 136.84, p-value = 8.831e-15
alternative hypothesis: true difference in means between group F and group M is not equal to 0
95 percent confidence interval:
 -0.6631268 -0.4177242
sample estimates:
mean in group F mean in group M 
       2.359574        2.900000 


* **"고양이들의 성별에 따른 평균 몸무게에는 통계적으로 유의한 차이가 존재한다."** 고 결론을 내릴 수 있다.