# 2群データに対するt検定
```
2つの平均値の間で、平均値に差があるか検定する。
例えば薬を飲む前と飲んだ後で体温に差が出るか調べる場合に利用される。
```

In [8]:
import pandas as pd
import numpy as np
import scipy as sp
from scipy import stats
from matplotlib import pyplot as plt
%matplotlib inline
import seaborn as sns
sns.set()
%precision 3


'%.3f'

In [9]:
paired_test_data = pd.read_csv("3-9-1-paired-t-test.csv")
print(paired_test_data)

  person medicine  body_temperature
0      A   before              36.2
1      B   before              36.2
2      C   before              35.3
3      D   before              36.1
4      E   before              36.1
5      A    after              36.8
6      B    after              36.1
7      C    after              36.8
8      D    after              37.1
9      E    after              36.9


```
帰無仮説：薬を飲む前と後で体温は変わらない
対立仮説：薬を飲む前と後の体温が異なっている。
```

# 対応のあるt検定

In [10]:
before = paired_test_data.query('medicine == "before"')["body_temperature"]
after = paired_test_data.query('medicine == "after"')["body_temperature"]
#アレイに変換
before = np.array(before)
after = np.array(after)
diff = after - before
diff

array([ 0.6, -0.1,  1.5,  1. ,  0.8])

In [12]:
#この差の値の平均値が0と異なるか調べる
stats.ttest_1samp(diff,0)

Ttest_1sampResult(statistic=2.9016934836205959, pvalue=0.044043109730074276)

In [13]:
stats.ttest_rel(after, before)

Ttest_relResult(statistic=2.9016934836205959, pvalue=0.044043109730074276)

```
p値が0.05を下回ったので『薬を飲む前と後の体温は有意に異なる』と主張することができる。
```

# 対応のないt検定　welch検定
```
変数xと変数yの平均値の差を検定する。
変数x：大きな針で釣った魚の体長
変数y：小さな針で釣った魚の体長
```

In [17]:
# 平均値
mean_bef = sp.mean(before)
mean_aft = sp.mean(after)
#分散
sigma_bef = sp.var(before, ddof = 1)
sigma_aft = sp.var(after, ddof = 1)
#サンプルサイズ
m = len(before)
n = len(after)
#t値
t_value = (mean_aft - mean_bef) / sp.sqrt((sigma_bef/m + sigma_aft/n))
t_value

3.156

In [18]:
#対応のないt検定はstats.ttest_ind関数を使えば簡単に計算できます

In [19]:
stats.ttest_ind(after, before, equal_var = False)

Ttest_indResult(statistic=3.1557282344421034, pvalue=0.013484775682079892)

```
p値が0.05を下回ったので有意差がある。
対応のあるt検定とは異なっている。同じデータに対して同じ目的の検定を実施しても
検定の手法が変わるとp値も変わる
```