## 문제: 두 교육 방법의 효과 비교
연구자는 두 가지 다른 교육 방법이 학생들의 성적에 미치는 영향을 비교하고자 합니다. 연구자는 무작위로 선발된 20명의 학생들을 두 그룹으로 나누어 한 그룹에는 교육 방법 A를, 다른 그룹에는 교육 방법 B를 적용합니다. 교육이 끝난 후, 두 그룹의 성적을 비교하기 위해 독립 표본 t-검정과 ANOVA F-검정을 실시하려고 합니다.

다음은 두 그룹의 성적입니다:
다음의 두 가지 검정을 사용하여 두 교육 방법 간의 성적 차이가 통계적으로 유의한지를 검증하세요

1. 독립 표본 t-검정을 실시하여 t 통계량을 구하세요.
2. 독립 표본 t-검정을 실시하여 p-값을 구하세요.
3. ANOVA F-검정을 실시하여 F 통계량을 구하세요.
4. ANOVA F-검정을 실시하여 p-값을 구하세요.


## 독립 표본 t-검정
- t-검정 통계량 : 두 그룹의 평균 차이를 표춘 오차로 나눈 값. t-분포를 따름
- p-값 : 귀무가설이 참일 때, 관찰된 평균 차이 이상을 관찰할 확률. p-값이 작을수록 두 그룹의 평균 차이가 우연히 발생할 가능성이 적다.

## ANOVA F-검정(일원 분산 분석)
- F-검정 통계량 : 그룹 간 분산과 그룹 내 분산의 비율. 값이 클수록 그룹 간 평균 차이가 크다는 것을 나타냄.
- p-값 : 귀무가설이 참일 때, 관찰된 그룹 간 분산 이상을 관찰할 확률. p-값이 작을수록 그룹 간 평균 차이가 우연히 발생할 가능성이 적다.

In [5]:
import pandas as pd
from scipy.stats import ttest_ind, f_oneway

In [6]:
df = pd.DataFrame({
    'A':[77, 75, 82, 80, 81, 83, 84, 76, 75, 87],
    'B':[80, 74, 77, 79, 71, 74, 78, 69, 70, 72]})

In [7]:
# 유의 수준 설정
alpha = 0.05

In [3]:
# 독립 표본 t-검정 실시 후 t 통계량과 p-value
t_stat, p_value_t = ttest_ind(df['A'], df['B'])

(3.1068522301122954, 0.006087373605949963)

In [10]:
print("<독립 표본 t-검정 결과>")
print("t 통계량:", t_stat)
print("p-값:", p_value_t)
if p_value_t < alpha:
    print("두 그룹 간의 차이가 통계적으로 유의합니다 (p < 0.05).")
else:
    print("두 그룹 간의 차이가 통계적으로 유의하지 않습니다 (p ≥ 0.05).")

<독립 표본 t-검정 결과>
t 통계량: 3.1068522301122954
p-값: 0.006087373605949963
두 그룹 간의 차이가 통계적으로 유의합니다 (p < 0.05).


In [12]:
# ANOVA F-검정 실시 후 F통계량과 p-value
f_stat, p_value_f = f_oneway(df['A'], df['B'])

In [15]:
print("<ANOVA F-검정 결과>")
print("F 통계량:", f_stat)
print("p-값:", p_value_f)
if p_value_f < alpha:
    print("두 그룹 간의 차이가 통계적으로 유의합니다 (p < 0.05).")
else:
    print("두 그룹 간의 차이가 통계적으로 유의하지 않습니다 (p ≥ 0.05).")

<ANOVA F-검정 결과>
F 통계량: 9.652530779753763
p-값: 0.006087373605949924
두 그룹 간의 차이가 통계적으로 유의합니다 (p < 0.05).
