https://openbook4.me/projects/183/sections/1367
## t検定とは、
* 数十件程度のデータでも正確にz検定を行えるようにしたもの
* 「平均値の差」が「平均値の差の標準誤差」の何倍かを考えて、それがどれほどありえないか、つまり、p値をもとめるためのもの

標本が大きい時(三十件以上)は、平均値の差が正規分布になるため、 z検定をつかうことができる。しかし、標本が小さくなってくると、平均値の差が正規分布の形ではなく、t分布になってくる。
つまり、標本が小さいときはz検定ではなく、t検定をつかわなければならない。
ちなみに、標本が大きい時は、z検定とt検定の結果は一致するので、基本的にt検定を使う。

### p値とは
- 帰無仮説(棄却されることを期待される仮説)が正しいと仮定したときに出る確率である。p値がおおよそ0.05を下回るとき、仮説はありえないとされ、棄却される。

何を言ってるかわからないと思うので、具体的にt検定を行い、平均値に差が、あるかどうかをたしかめてみる。

In [None]:
from pandas import DataFrame
from scipy import stats
import numpy as np

data = {'国語':  [68, 75, 80, 71, 73, 79, 69, 65],
        '数学': [86, 83, 76, 81, 75, 82, 87, 75],
        '理科' : [85, 69, 77, 77, 75, 74, 87, 69],
        '英語': [80, 76, 84, 93, 76, 80, 79, 84]}
df = DataFrame(data, index = ["生徒" + str(i+1)  for i  in np.arange(8)])
df

In [None]:
t, p = stats.ttest_rel(df['国語'], df['数学'])
print( "p値 = %(p)s" %locals() )

p値が0.05より小さいので、国語と数学の平均点には有意差があるといえる。

In [None]:
t, p = stats.ttest_rel(df['理科'], df['英語'])
print( "p値 = %(p)s" %locals() )

p値が0.05より大きいので、理科と英語の平均点には有意差があるとはいえない。

上記に関して、有意差がない、とは言えないので注意。

## Welchのt検定
もし比較するデータに対応がない場合、等分散かどうか調べ、等分散ではなかった場合、 Welchのt検定を行う必要がある。

ためしに、各科目の点数は同じ生徒ではなくそれぞれ別の生徒の点数だとして、 対応がない場合を考えてみよう

等分散かどうか調べるために、F値をまず求める。

In [None]:
#分子に大きい数値をとる
f = np.var(df['国語']) / np.var(df['数学'])
dfx = len(df['国語']) - 1
dfy = len(df['数学']) - 1
p_value = stats.f.cdf(f, dfx, dfy)
print("F値 = %(f)s" %locals())
print("dfx 自由度 %(dfx)s" %locals())
print("dfy 自由度 %(dfy)s" %locals())
print("p値 = %(p_value)s" %locals())

p値が0.05より大きくなったので、非等分散とはいえない、という曖昧な答えになったが、 等分散として考える

t検定をするとき、等分散かどうかのoption(equal_var)をつけたいときは、 scipyのstatsのttest_relではなく、statsのttest_indを使う。

In [None]:
t, p = stats.ttest_ind(df['国語'], df['数学'], equal_var = True)
print( "p値 = %(p)s" %locals() )

よって、p値が0.0062 (< 0.05)なので、この場合も有意差があるとわかった。