# 유의성 검정

**[수업 목표]**

- 각각의 유의성 검정 방법들에 이해하고 특징을 파악한다
- 신뢰구간과 가설검정의 관계에 대해 설명할 수 있다
- 제 1종 오류와 2종 오류에 대해 이해하고 구분할 수 있다


## 3.1. A/B 검정
두 그룹 (A, B)과 비교하는게 포인트!
### 두 개를 비교하여 구매 전환율이 큰 것을 선택
온라인 쇼핑몰에서 두 가지 디자인(A와 B)에 대한 랜딩 페이지를 테스트하여 어떤 디자인이 더 높은 구매 전환율을 가져오는지 평가.

In [1]:
import numpy as np
import scipy.stats as stats

# 가정된 전환율 데이터
group_a = np.random.binomial(1, 0.30, 100)  # 30% 전환율
group_b = np.random.binomial(1, 0.45, 100)  # 45% 전환율

#전환 했으면 1, 안 했으면 0

# t-test를 이용한 비교
t_stat, p_val = stats.ttest_ind(group_a, group_b)
print(f"T-Statistic: {t_stat}, P-value: {p_val}")

T-Statistic: -0.2861570479289373, P-value: 0.7750570149584516


#### stats.ttest_ind가 뭔가요?
- `scipy.stats.ttest_ind` 함수는 독립표본 t-검정(Independent Samples t-test)을 수행하여 두 개의 독립된 집단 간 평균의 차이가 유의미한지 평가합니다.
- 이 함수는 두 집단의 데이터 배열을 입력으로 받아서 t-통계량과 p-값을 반환합니다.
  - **t-통계량 (statistic)**
    - t-검정 통계량입니다. 두 집단 간 평균 차이의 크기와 방향을 나타냅니다.
  - **p-값 (pvalue)**
    - p-값은 귀무 가설이 참일 때, 현재 데이터보다 극단적인 결과가 나올 확률입니다.
    - 이 값이 유의수준(α) 보다 작으면 귀무 가설을 기각하고 이 값이 유의수준(α) 보다 크면 귀무 가설을 기각하지 않습니다.

#### 실전 예시 !!!
- 딜라이트룸 A/B 테스트 사례
    - https://medium.com/delightroom/알라미의-a-b-테스팅-일지-1-eb811fe72a17
- 당근마켓 A/B 테스트 사례
    - https://medium.com/daangn/거래-후기-실험을-통해-따뜻한-거래-경험-만들기-3d7ac18d8e3


## 3.2. 가설검정
데이터가 특정 가설을 지지하는지 검정하는게 포인트!
### 가설을 설정하여 검증
- 새로운 약물이 기존 약물보다 효과가 있는지 검정
- 이 때 새로운 약물은 기존 약물과 큰 차이가 없다는 것이 귀무가설!
- 대립가설은 새로운 약물이 기존 약물과 대비해 교과가 있다는 것!

In [3]:
# 기존 약물(A)와 새로운 약물(B) 효과 데이터 생성
A = np.random.normal(50, 10, 100)
B = np.random.normal(55, 10, 100)

# 평균 효과 계산
mean_A = np.mean(A)
mean_B = np.mean(B)

# t-검정 수행
t_stat, p_value = stats.ttest_ind(A, B)

print(f"A 평균 효과: {mean_A}")
print(f"B 평균 효과: {mean_B}")
print(f"t-검정 통계량: {t_stat}")
print(f"p-값: {p_value}")

# t-검정의 p-값 확인 (위 예시에서 계산된 p-값 사용)
print(f"p-값: {p_value}")
if p_value < 0.05:
    print("귀무가설을 기각합니다. 통계적으로 유의미한 차이가 있습니다.")
else:
    print("귀무가설을 기각하지 않습니다. 통계적으로 유의미한 차이가 없습니다.")

A 평균 효과: 49.545815209831574
B 평균 효과: 54.88667575992312
t-검정 통계량: -3.896815371940078
p-값: 0.00013331300810777007
p-값: 0.00013331300810777007
귀무가설을 기각합니다. 통계적으로 유의미한 차이가 있습니다.


## 3.3. t검정
t검정은 두 집단 간의 평균 차이가 통계적으로 유의미한지 확인하는 검정 방법

### p-값을 통한 유의성 확인
- 두 클래스의 시험 성적 비교(독립표본 t검정)
- 다이어트 전후 체중 비교(대응표본 t검정)

In [4]:
# 학생 점수 데이터
scores_method1 = np.random.normal(70, 10, 30)
scores_method2 = np.random.normal(75, 10, 30)

# 독립표본 t검정
t_stat, p_val = stats.ttest_ind(scores_method1, scores_method2)
print(f"T-Statistic: {t_stat}, P-value: {p_val}")

T-Statistic: -3.2574787687139963, P-value: 0.0018809326547391777


## 3.4. 다중검정
여러 가설을 동시에 검정! 하지만 오류가 발생할 수 있음!

### 여러 약물의 효과를 동시에 검정
이 때 본페로니 보정을 사용해볼 수 있음

In [5]:
import numpy as np
import scipy.stats as stats

# 세 그룹의 데이터 생성
np.random.seed(42)
group_A = np.random.normal(10, 2, 30)
group_B = np.random.normal(12, 2, 30)
group_C = np.random.normal(11, 2, 30)

# 세 그룹 간 평균 차이에 대한 t검정 수행
p_values = []
p_values.append(stats.ttest_ind(group_A, group_B).pvalue)
p_values.append(stats.ttest_ind(group_A, group_C).pvalue)
p_values.append(stats.ttest_ind(group_B, group_C).pvalue)

# 본페로니 보정 적용
alpha = 0.05
adjusted_alpha = alpha / len(p_values)

# 결과 출력
print(f"본페로니 보정된 유의 수준: {adjusted_alpha:.4f}")
for i, p in enumerate(p_values):
    if p < adjusted_alpha:
        print(f"검정 {i+1}: 유의미한 차이 발견 (p = {p:.4f})")
    else:
        print(f"검정 {i+1}: 유의미한 차이 없음 (p = {p:.4f})")

본페로니 보정된 유의 수준: 0.0167
검정 1: 유의미한 차이 발견 (p = 0.0000)
검정 2: 유의미한 차이 발견 (p = 0.0058)
검정 3: 유의미한 차이 없음 (p = 0.1461)


## 3.5. 카이제곱검정
범주형 데이터의 분석에 사용한다는 것이 포인트!
### 카이제곱검정
- 범주형 데이터의 표본 분포가 모집단 분포와 일치하는지 검정(적합도 검정)하거나
- 두 범주형 변수 간의 독립성을 검정(독립성 검정)
### 범주형 데이터의 분포 확인 및 독립성 확인을 위해 사용
- 주사위의 각 면이 동일한 확률로 나오는지 검정(적합도 검정)
- 성별과 직업 만족도 간의 독립성 검정(독립성 검정)

In [6]:
# 적합도 검정
observed = [20, 30, 25, 25]
expected = [25, 25, 25, 25]
chi2_stat, p_value = stats.chisquare(observed, f_exp=expected)
print(f"적합도 검정 카이제곱 통계량: {chi2_stat}, p-값: {p_value}")

# 독립성 검정
observed = np.array([[10, 10, 20], [20, 20, 40]])
chi2_stat, p_value, dof, expected = stats.chi2_contingency(observed)
print(f"독립성 검정 카이제곱 통계량: {chi2_stat}, p-값: {p_value}")

# 성별과 흡연 여부 독립성 검정
observed = np.array([[30, 10], [20, 40]])
chi2_stat, p_value, dof, expected = stats.chi2_contingency(observed)
print(f"독립성 검정 카이제곱 통계량: {chi2_stat}, p-값: {p_value}")

적합도 검정 카이제곱 통계량: 2.0, p-값: 0.5724067044708798
독립성 검정 카이제곱 통계량: 0.0, p-값: 1.0
독립성 검정 카이제곱 통계량: 15.041666666666666, p-값: 0.00010516355403363106


#### stats.chisquare 함수가 뭔가요?
- `scipy.stats.chisquare` 함수는 카이제곱 적합도 검정을 수행하여 관찰된 빈도 분포가 기대된 빈도 분포와 일치하는지 평가합니다. 이 검정은 주로 단일 표본에 대해 관찰된 빈도가 특정 이론적 분포(예: 균등 분포)와 일치하는지 확인하는 데 사용됩니다.
- 반환 값
    - **chi2**: 카이제곱 통계량입니다.
    - **p**: p-값입니다. 이는 관찰된 데이터가 귀무 가설 하에서 발생할 확률입니다.


#### stats.chi2_contingency 함수가 뭔가요?

- `scipy.stats.chi2_contingency` 함수는 카이제곱 검정을 수행하여 두 개 이상의 범주형 변수 간의 독립성을 검정합니다. 이 함수는 관측 빈도를 담고 있는 교차표(contingency table)를 입력으로 받아 카이제곱 통계량, p-값, 자유도, 그리고 기대 빈도(expected frequencies)를 반환합니다.
- 반환 값
    - **chi2 :** 카이제곱 통계량입니다.
    - **p** : p-값입니다. 이는 관측된 데이터가 귀무 가설 하에서 발생할 확률입니다.
    - **dof** : 자유도입니다. 이는 (행의 수 - 1) * (열의 수 - 1)로 계산됩니다.
    - **expected** : 기대 빈도입니다. 이는 행 합계와 열 합계를 사용하여 계산된 이론적 빈도입니다.

## 3.6. 제 1종 오류와 제 2종 오류
두가지의 오류를 구분하는 것이 포인트!