# t-검정(t-test)

통계에서 두 개의 모집단을 비교하려는 목적으로 사용되는 가설 검정 방법 중 하나입니다.  <br>
t-검정은 일반적으로 평균 차이에 대한 통계적 유의성을 평가하는 데 사용됩니다.  <br>

- 기본적으로 t-검정은 다음과 같은 세 가지 주요 유형으로 나뉩니다.
  1. 독립 표본 t-검정 (Independent two-sample t-test)
  2. 대응 표본 t-검정 (Paired t-test)
  3. 단일 표본 t-검정 (One-sample t-test)

## 독립 표본 t-검정

두 개의 독립된 모집단에서 얻은 표본을 사용하여 두 모집단의 평균 사이에 통계적으로 유의한 차이가 있는지를 확인합니다.

In [15]:
import numpy as np
from scipy.stats import ttest_ind

# 데이터를 생성하는 예제
np.random.seed(42)  # 재현성을 위한 시드 설정
sample1 = np.random.normal(10, 1, 30)  # 평균이 10, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치
sample2 = np.random.normal(10.5, 1, 30)  # 평균이 10.5, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치

# 독립 표본 t-검정
stat, p_val = ttest_ind(sample1, sample2)
print("독립 표본 t-검정:")
print(f"t-statistic: {stat}, p-value: {p_val}")

독립 표본 t-검정:
t-statistic: -2.3981151520102553, p-value: 0.01971794186575755


## 대응 표본 t-검정 (Paired t-test)

짝지어진 관찰치가 있는 두 모집단에서 얻은 표본을 사용하여 두 모집단의 평균 사이에 통계적으로 유의한 차이가 있는지를 확인합니다.

대응 표본 t-검정은 종종 특정 처리 전과 후를 비교하기 위해 사용됩니다.

In [16]:
import numpy as np
from scipy.stats import ttest_rel

# 데이터를 생성하는 예제
np.random.seed(42)  # 재현성을 위한 시드 설정
sample1 = np.random.normal(10, 1, 30)  # 평균이 10, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치
sample2 = np.random.normal(10.5, 1, 30)  # 평균이 10.5, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치

# 대응 표본 t-검정
before_treatment = np.random.normal(10, 1, 20)  # 처리 전, 평균 10, 표준편차 1, 20개의 관찰치
after_treatment = before_treatment + np.random.normal(0, 1, 20)  # 처리 후, 처리 전 데이터를 기반으로 임의의 변화 추가

stat, p_val = ttest_rel(before_treatment, after_treatment)
print("대응 표본 t-검정:")
print(f"t-statistic: {stat}, p-value: {p_val}")

대응 표본 t-검정:
t-statistic: 0.15454123534429023, p-value: 0.8788128126598481


## 단일 표본 t-검정 (One-sample t-test)

한 모집단에서 얻은 표본을 사용하여 모집단의 평균이 특정 값과 통계적으로 유의하게 다른지를 확인합니다.

In [17]:
import numpy as np
from scipy.stats import ttest_1samp

# 데이터를 생성하는 예제
np.random.seed(42)  # 재현성을 위한 시드 설정
sample1 = np.random.normal(10, 1, 30)  # 평균이 10, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치
sample2 = np.random.normal(10.5, 1, 30)  # 평균이 10.5, 표준편차가 1인 가상 데이터 생성, 30개의 관찰치

# 단일 표본 t-검정 - 평균이 10인지 비교
single_sample = np.random.normal(9.8, 1, 25)  # 평균이 9.8, 표준편차가 1인 가상 데이터 생성, 25개의 관찰치
stat, p_val = ttest_1samp(single_sample, 10)  # 평균이 10인지 검정
print("단일 표본 t-검정:")
print(f"t-statistic: {stat}, p-value: {p_val}")

단일 표본 t-검정:
t-statistic: -1.010636524816135, p-value: 0.3222716324651379
