##  어떤 특정 약물을 복용한 사람들의 평균 체온이 복용하지 않은 사람들의 평균 체온과 유의미하게 다른지 검정해보려고 합니다.

- 가정:

    - 약물을 복용한 그룹과 복용하지 않은 그룹의 체온 데이터가 각각 주어져 있다고 가정합니다.
    - 각 그룹의 체온은 정규분포를 따른다고 가정합니다.

- 검정통계량, p-value, 검정결과를 출력하시오



In [1]:
from scipy import stats

# 가설 설정
# H0: 약물을 복용한 그룹과 복용하지 않은 그룹의 평균 체온은 유의미한 차이가 없다.
# H1: 약물을 복용한 그룹과 복용하지 않은 그룹의 평균 체온은 유의미한 차이가 있다.

### 언제 독립표본 t검정이고, 일표본t검정이고, 대응표본 t검정인가?

- 일표본 = 집단이 하나. 표본평균과 모평균이 동일한지 측정하는 것이 목적.

- 독립표본 = 독립적인 집단이 두 개. 1반과 2반의 존재. 독립적인 두 집단의 평균을 비교하는 것이 목적.

- 대응표본 t검정 = 한 그룹에 처리를 하고 나서 사후 효과가 있는지 검정하기 위함. 한 집단의 사전, 사후 평균에 차이가 있는지 확인하는 것이 목적

- 엥, 이거 완전 독립표본이랑 뭐가 다르냐? 하겠지만 이렇게 다릅니다.

    - 독립표본은 "처리를 한 집단", "처리를 하지 않은 집단" 이렇게 두 집단이 존재함.

    - 대응표본 t 검정은 "처리를 하지 않은 집단의 평균"을 잰 후 "처리를 한 후에 다시 집단의 평균을 측정함"

In [2]:
# 데이터 수집
group1 = [36.8, 36.7, 37.1, 36.9, 37.2, 36.8, 36.9, 37.1, 36.7, 37.1]
group2 = [36.5, 36.6, 36.3, 36.6, 36.9, 36.7, 36.7, 36.8, 36.5, 36.7]

In [4]:
help(stats.ttest_ind)

Help on function ttest_ind in module scipy.stats._stats_py:

ttest_ind(a, b, axis=0, equal_var=True, nan_policy='propagate', permutations=None, random_state=None, alternative='two-sided', trim=0)
    Calculate the T-test for the means of *two independent* samples of scores.
    
    This is a test for the null hypothesis that 2 independent samples
    have identical average (expected) values. This test assumes that the
    populations have identical variances by default.
    
    Parameters
    ----------
    a, b : array_like
        The arrays must have the same shape, except in the dimension
        corresponding to `axis` (the first, by default).
    axis : int or None, optional
        Axis along which to compute test. If None, compute over the whole
        arrays, `a`, and `b`.
    equal_var : bool, optional
        If True (default), perform a standard independent 2 sample test
        that assumes equal population variances [1]_.
        If False, perform Welch's t-test, which

In [5]:
stat, pvalue = stats.ttest_ind(group1, group2)

In [6]:
print(f't-value: {stat:.4f}')
print(f'p-value: {pvalue:.4f}')

t-value: 3.7964
p-value: 0.0013


In [8]:
if pvalue < 0.05:
    print('H0 를 기각하고 대립가설을 채택한다.')
else:
    print('H0 를 기각하지 않고, 귀무가설을 채택한다.')

H0 를 기각하고 대립가설을 채택한다.


## scipy stats 의 ttest_ind 의 사용방법

__stats.ttest_ind 함수는 기본적으로 양측(two-sided) 검정을 수행__

- scipy의 stats 라이브러리의 ttest_ind 함수는 두 개의 독립된 표본 간의 t-검정을 수행하는 데 사용됩니다. 이 때 귀무가설과 대립가설은 사용자에게 따라 다르게 설정할 수 있습니다.

- 기본적으로 ttest_ind 함수에서의 귀무가설은 "두 개의 표본은 평균이 동일하다"입니다. 즉, 귀무가설은 mu_a = mu_b입니다. 따라서 대립가설은 "두 개의 표본은 평균이 서로 다르다"라고 설정됩니다. 이는 ttest_ind 함수의 기본 동작입니다.

- 그러나, 만약 대립가설을 mu_a > mu_b 또는 mu_a < mu_b와 같이 특정 방향으로 설정하여 확률을 살펴보고자 한다면, ttest_ind 함수를 사용할 수 없습니다. ttest_ind 함수는 양측(two-sided) 검정을 수행하는 함수이기 때문입니다.

- 만약 mu_a > mu_b와 같은 대립가설을 확인하고자 한다면, 다른 방법을 사용해야 합니다. 예를 들어, ttest_ind를 사용하여 얻은 t-값과 p-값을 기반으로 검정 결과를 해석할 수 있습니다. t-값이 양수인 경우는 mu_a가 mu_b보다 큰 경우를 의미하며, p-값은 양측 검정 결과이기 때문에 p/2가 해당 방향으로의 p-값이 됩니다. 