# 仮説検定（Hypothesis Testing）

## 平均値の検定　（母分散が未知） t検定
$$
t = \frac{\hat{\mu} - \mu_0}{\sqrt{\sigma^2 \big/ N}}
$$
上記の$t$検定量は自由度$ df = N - 1 $の$t$分布に従う（ $df$: Degree of Freedom）<br>
scipy.stats.t https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html <br>

In [None]:
# -*- coding: utf-8 -*-

import numpy as np
import scipy as sp
from scipy import stats

import matplotlib.pyplot as plt
%matplotlib inline

FLAG_fig = False

#### 例１：あるクラス，テストの平均点と補講の効用（片側検定）

In [None]:
data = np.array([1, -1, -2, 3, -1, 5, 4, 0, 7, -1])

In [None]:
m = np.average(data) # mean
s = np.std(data, ddof=1) # std, ddof=1 : unbiased
N = len(data) # the number of sample
print(m,s,N)

In [None]:
alp = 0.05
talp = stats.t.ppf((1-alp),N-1)
print('talp (alpha=0.05, df=%d) =%f' %((N-1),talp))

m0 = 0 # null hypothesis
t = (m-m0)/(s/np.sqrt(N))
print('t=', t)

talp > t より，H0は棄却できない。
通常は，talp, t のようなpp(percent point)を求めるよりは，
p値(p value)を求める。これを次に示す。

In [None]:
prob = stats.t.cdf(t,N-1)
print('p value=',1-prob)

有意水準を0.05 とおくと，これよりp valueの方が大きいので，H0を棄却できない。

#### 例2：精密部品の直径（両側検定）

In [None]:
data2 = np.array([1.5399, 1.5390, 1.5399, 1.5395, 1.5400, 1.5390, 1.5399, 1.5399])
m = np.mean(data2)        # mean
s = np.std(data2, ddof=1) # std, ddof=1 : unbiased
N = len(data2)            # 
df = N - 1               # DoF (degree of freedom)
m0 = 1.54                 # H0 (null hypothesis)
print('sample mean =',m,'  std = ',s,' The number of data = ',N)

In [None]:
t = (m-m0)/(s/np.sqrt(N))   # サンプルから求まるpp値
prob = stats.t.cdf(t, df)
if t >=  0:
    p = 1 - prob
else:
    p = prob

print('t = ',t)
print('p value =',2*p)

注意：上記のように，tが負の値をとるときは，p = prob とする。  
$\alpha=0.05$と置くならば，p value $< \alpha$ よりH0を棄却

実は，次の関数を用いると計算は楽<br>
t, p = scipy.stats.ttest_1samp(data, m0)<br>
data: 1群のサンプルデータ<br>
m0: 帰無仮説H0で仮定した平均値<br>
t: t値<br>
p: p値，両側検定を前提としている。片側検定ではこの半分の値を用いる<br>
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_1samp.html

In [None]:
t, p = stats.ttest_1samp(data2, m0)
print('t = ',t)
print('both side p = ',p)
print('one  side p = ',p/2)

## 分散の検定　（母平均が未知） $\chi ^2$検定
$$
\chi^2 = \frac{N-1}{\sigma_0^2} \hat{\sigma}^2 \sim \chi^2 (N-1)
$$
上記の$\chi^2$検定量は自由度$ df = N - 1 $の$\chi^2$分布に従う（ $df$: Degree of Freedom）<br>
scipy.stats.chi2 https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2.html <br>
$\chi^2$分布は非対称の分布形状である。

#### 例３：先の例の精密部品の直径のばらつき（分散）の検定
分散の検定ゆえに片側検定である

In [None]:
var = np.var(data2, ddof=1)
print('variance =',var)

var0 = 1.e-7
alp = 0.05
N = len(data2) 
df = N - 1

chi2 = (N-1)*var / var0
chi2_alp = stats.chi2.ppf( (1-alp), df=df)
print('chi2 =',chi2, '  chi2_alp=',chi2_alp)
pval = 1 - stats.chi2.cdf(chi2, df)
print('p value=',pval)

chi2 < chia2_alp または p value > alp より，H0を棄却できない  
平均値の検定で，平均値がずれているという結論だった。
分散の検定でH0を棄却できていないので，事実とはまだ言えないが，  
この部品は高精度であるが，低正確度（Wikipedia参照）の可能性がある。

## 2標本の平均値の差の検定

2標本，両方の母分散が共に未知である場合を扱う。この場合ウェルチのt検定（Welch's t-test）を用いる。  
統計検定量$t$は複雑ゆえ，次を参照されたい：https://en.wikipedia.org/wiki/Welch%27s_t-test  
この自由度は，ウェルチ-サタスウェイトの式（Welch–Satterthwaite equation）より近似的に求められる。
https://en.wikipedia.org/wiki/Welch%E2%80%93Satterthwaite_equation  

自由度も自動的に計算する関数が次のscipy.stats.ttest_ind,  入力で equal_var = False を指定する  
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

#### 例4：2つの温度計の性能検定（対応の無い2標本，分散が未知）

In [None]:
s1 = np.array([37.1, 36.7, 36.6, 37.4, 36.8, 36.7, 36.9, 37.4, 36.6, 36.7])
s2 = np.array([36.8, 36.6, 36.5, 37.0, 36.7, 36.5, 36.6, 37.1, 36.4, 36.7])

In [None]:
t, p = stats.ttest_ind(s1, s2, equal_var = False)
print('t = ',t, ' p value = ',p)

p value を見て，alpha = 5% より大きいのでH0を棄却できない。すなわち，2つの体温計の平均値が等しいという仮説は棄却できない。

参考までに，自由度の計算の仕方を紹介する。  
ウェルチ=サタスウェイトの式により近似自由度を計算する   
https://en.wikipedia.org/wiki/Welch%27s_t-test

In [None]:
s1m = s1.mean()
s1v = s1.var(ddof=1)
s2m = s2.mean()
s2v = s2.var(ddof=1)

bunshi = ((s1v/len(s1)) + (s2v/len(s2)))**2
bunbo = (s1v)**2/((len(s1)**2)*(len(s1)-1)) + (s2v)**2/((len(s2)**2)*(len(s2)-1))
df = bunshi/bunbo
df

自由度は実数となる

In [None]:
prob = stats.t.cdf(t, df)
p = 1-prob
print(2*p)  # 両側検定とすれば，2*pとなる

この結果は，先の p valueと一致する

## 相関と無相関の検定
相関係数$\hat{\rho}$には次の性質がある。
$$
- 1 \le \hat{\rho}  \le 1
$$
統計検定量は次を用いる
$$
t = \frac{{ |\hat \rho _{xy} | \sqrt {N - 2} }}{{\sqrt {1 - \hat \rho _{xy} ^2 } }}
$$
これは，自由度$(N-2)$の$t$分布に従う

ピアソンの相関係数と帰無仮説(無相関)と設定した場合のp値　の両方を同時に計算する  
scipy.stats.pearsonr  
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.pearsonr.html

#### 例5：親子の身長の相関の検定


In [None]:
x = np.array([168, 172, 181, 179, 166, 185, 177, 176, 169, 161])
y = np.array([111, 125, 129, 120, 126, 133, 130, 116, 118, 115])
corr, pvalue = stats.pearsonr(x,y)
print('corr. coef.=',corr, '  p value=',pvalue)

alp = 0.05 のとき，p value < alp より，H0（無相関）を棄却，alp = 0.01のとき棄却できない

In [None]:
plt.scatter(x,y)
plt.xlabel('Height of Faters')
plt.ylabel('Height of Sons')
if FLAG_fig: plt.savefig('fig_Stat_CorrelationTest.png')