# 統計的仮説検定

仮説検定とは仮説に対してそれが正しいのか否かを統計学的に検証する方法です。例えば、「AとBは差がある」と統計的に言いたいときに使います。

1. **帰無仮説**とよばれる言いたいこととは反対の仮説(「AとBには差がない」)を設定する
2. 帰無仮説のもとで、検定統計量を計算し、どの程度起こりうるものなのか」を調べる
3. その確率がある基準となる確率(**有意水準**)より小さい場合、そもそも仮説が間違っていたと考えて、帰無仮説を**棄却**して、**対立仮説**(「AとBに差はある」)を採択する

### 第1種の過誤と第2種の過誤
帰無仮説が正しいにもかかわらず、棄却してしまうことを**第1種の過誤**といい、その確率を$\alpha$で表します。一方、この帰無仮説が誤っているにもかかわらず受容してしまうことを、**第2種の過誤**といい、その確率を$\beta$で表します。

この$\beta$の補数$1-\beta$は**検出力**と呼ばれ、帰無仮説が誤っているときに正しく棄却できる確率を表します。


## 信頼区間と仮説検定の関係

帰無仮説(例「2群間の母平均は等しい」)が有意水準$\alpha$で棄却される場合において、「2群間の母平均の差」の信頼水準$1-\alpha$に対する信頼区間には0が含まれません。また、逆に信頼水準$1-\alpha$に対する信頼区間に0が含まれない場合には、帰無仮説は有意水準$\alpha$で棄却されることはないという関係にあります。

$p$値が小さいことは必ずしも仮説の確からしさが強いことを意味しません。一方で、信頼区間は効果の大きさの推定に関して、重要な情報($p$値だけからでは得られない情報)を与えます。信頼区間を求めることができる場合は、$p$値と併記することことが強く推奨されます。

記述例: 提案手法と既存手法の性能差の95%信頼区間は(0.1,1.5)であり、提案手法は有意に性能が向上している(p=0.03)。

---
# 2群の平均の差の検定
母集団Aが平均$\mu_A$で分散が$\sigma_A^2$の正規分布に、母集団Bが平均$\mu_B$で分散が$\sigma_B^2$の正規分布に従っている場合を考えます。このとき、母集団Aから標本$N_A$個取り出したときの標本平均$\bar{X_A}$、母集団Bから標本$N_B$個取り出したときの標本平均$\bar{X_B}$を求めて、標本平均の差$\bar{X_A}-\bar{X_B}$を計算すると、正規分布$N(\mu_A-\mu_B,\frac{\sigma_A^2}{N_A}+\frac{\sigma_B^2}{N_B})$に従います。

## 母分散が未知だが等しい場合
母分散は未知だが、事前に等しいと分かっていて$\sigma_A^2=\sigma_B^2=\sigma^2$と仮定できるとき、標本平均の差$\bar{X_A}-\bar{X_B}$は、正規分布$N(\mu_A-\mu_B,\sigma^2(\frac{1}{N_A}+\frac{1}{N_B}))$に従います。
共通の母分散を標本分散$s_A^2,s_B^2$を合併した分散$s^2$で推定します。
$$s^2=\frac{(N_A-1)s_A^2+(N_B-1)s_B^2}{N_A+N_B-2}$$
このとき、統計検定量$t$
$$t=\frac{(\bar{X_A}-\bar{X_B})-(\mu_A-\mu_B)}{s\sqrt{\frac{1}{N_A}+\frac{1}{N_B}}}$$
を計算すると、自由度$N_A+N_B-2$のt分布に従います。したがって、帰無仮説$\mu_A=\mu_B$の下で、どの程度起こり得る現象なのか調べることができ$p$値を求めることができます。


## 母分散が未知で等しいとも限らない場合
標本平均の差$\bar{X_A}-\bar{X_B}$の分布を正確に求めることができませんが、ウェルチが提案した手法で近似できることが知られています。統計検定量$t$
$$t=\frac{(\bar{X_A}-\bar{X_B})-(\mu_A-\mu_B)}{\sqrt{\frac{s_A^2}{N_A}+\frac{s_B^2}{N_B}}}$$
を計算すると、自由度$\nu$が
$$\nu=\frac{(\frac{s_A^2}{N_A}+\frac{s_B^2}{N_B})^2}{\frac{(s_A^2/N_A)^2}
{N_A-1}+\frac{(s_B^2/N_B)^2}{N_B-1}}$$
にもっとも近い整数$\nu^*$であるようなt分布で近似できます。したがって、帰無仮説$\mu_A=\mu_B$の下で、どの程度起こり得る現象なのか近似的に調べ、$p$値を求めることができます。

Pythonでは、計算の詳細を理解できていなくても、2群の標本データx,yをそれぞれ与えることで統計検定量$t$と$p$値を求めることができます

```
# 母分散が2群で等しい場合
from scipy import stats
t,p=stats.ttest_ind(x, y, equal_var=True)

# 母分散が2群で等しいとは限らない場合
from scipy import stats
t,p=stats.ttest_ind(x, y, equal_var=False)
```


ttest_ind()関数は、デフォルトでequal_var=Trueとなっていて、特に指定しないと等分散性を仮定して検定を行ってしまいます。
しかし、母分散が両群で同じであることが予め分かっている場合を除いて、等分散性を仮定しない方が安全ですので、equal_var=Falseを設定するようにしてください。


## 仮説検定を試してみる(2群間の母平均の差の検定)

母平均は一般的には既知ではないですが、自分で生成したテストデータであれば既知となるように作ることができます。 今回は母集団が両群ともに、分散1であるが、平均が1だけ異なる正規分布($\mu_A=5,\mu_B=6,\sigma_A=\sigma_B=1$)であると仮定して、標本をそれぞれN=10個生成してみます。

In [None]:
import numpy as np
x = np.random.normal(5,1,10)
y = np.random.normal(6,1,10)
print(x)
print(y)

母集団の分散は共通に設定したことから、等分散性を仮定した2標本t検定を有意水準5%で実施します。

In [None]:
from scipy import stats
t,p=stats.ttest_ind(x, y,equal_var=True)
print("p.value={}".format(p))

if(p<0.05):
  print("帰無仮説は棄却され、対立仮説が採択されました")
else:
  print("帰無仮説は棄却されませんでした")

今回の場合は、2群間で母平均に差があるように設定したので、確率$1-\beta$で対立仮説が採択され、確率$\beta$で帰無仮説が棄却できないことになります。

## 演習課題1

先ほどと同様の2群間の平均値の差の検定において、帰無仮説が棄却されるかどうかのシミュレーションを、以下のパラメータを様々に変えて行うことを考えます。
- 標本の大きさ$N$ (10, 20, $\cdots$)
- 2群の母平均の差$\mu_A-\mu_B$ (0, 1, 2, $\cdots$)
- 有意水準 (0.05, 0.01, $\cdots$)
- 2群の母分散 (今回は両群とも1で固定とします)


上記パラメータを引数とし、Python上で10000回シミュレーションを行い、2群間の平均に差はないとする帰無仮説が何回棄却されるかを表示する関数を作成しなさい。

また、作成した関数に対して、パラメータを様々に変えて実行し、
有意水準$\alpha$、データ数N、母平均の差、および検出力$1-\beta$の関係について考察しなさい。
- 考察の一例: 有意水準5%で検出力80%を確保するために必要なNと母平均の差の関係

## 解答1

(演習課題1に対する解答を記載してください。必要に応じて、テキストやコードを追加しても構いません)

In [None]:
#データ数:n
#二群のそれぞれの母平均: m1, m2
#有意水準: alpha
def t_diff_simu(n,m1,m2,alpha):
  #ここにソースを記載

print(t_diff_simu(10,5,5,0.05)) #N=10,母平均が同じ,有意水準5%
print(t_diff_simu(10,5,5,0.01)) #N=10,母平均が同じ,有意水準1%
print(t_diff_simu(10,5,6,0.05)) #N=10,母平均が1異なる,有意水準5%
print(t_diff_simu(10,5,6,0.01)) #N=10,母平均が1異なる,有意水準1%
print(t_diff_simu(20,5,6,0.01)) #N=20,母平均が1異なる,有意水準1%
# 以下略

---
# マン・ホイットニーのU検定
母集団の分布の形を仮定せずに仮説を検定するノンパラメトリックな検定の一つです。
独立な2組の標本の有意差検定として用いられ、順位が定義できる変数(すなわち順位尺度)ならば適用可能です。ウィルコクソンの順位和検定と呼ばれるものと実質的に同じ方法です。

統計検定量$U_1$は、標本1と標本2が同一の分布に従うという帰無仮説の下で、どのような分布をするかわかっており、2群間の差が偶然期待されるよりも小さいかどうかを検定します。$U$の求め方には2通りあります。

1つ目の方法は、小標本に対して適した直接法です。
今、標本1の数を$n_1$、標本2の数を$n_2$とします。
標本1と標本2の各要素を総当たりで比較して($n_1 n_2$個のペア)、標本1の方が大きかったペアの数を数え、その数を統計検定量$U_1$とします。

2つ目の方法は、大標本に対して適した間接法です。
すべての標本($n_1+n_2$個)を一緒にして、順位をつけ、その中で標本1の要素の順位を総和したものを$S_1$とします。このとき、
$U_1=n_1n_2+\frac{n1(n1+1)}{2}-S_1$
という関係が成り立っていることから、順位和を用いて検定量$U$を間接的に求めることができます。

>例: 母集団Aと母集団Bからそれぞれ6個の標本を抽出し、順番に入れ替えたところ、
A,B,B,A,B,B,B,A,A,A,A,B
が得られたとする。
AがBよりも大きかったペアの個数は、
6,4,1,1,1,1
であることから、直接法では$U=6+4+1+1+1+1=14$と求められる。
また、Aの順位はそれぞれ、
1,4,8,9,10,11であることから、順位和S=43であり、
$U=n_1n_2+\frac{n1(n1+1)}{2}-S_1=6*6+6*7/2-43=14$
と間接的に求めることもできます。

$U$の確率分布は漸化式によって求められるほか、$n_1,n_2$がある程度大きい場合、$U_1$は正規分布$N(\frac{n_1n_2}{2},\frac{n_1n_2(n_1+n_2+1)}{12})$にほぼ従うことを利用して計算することもできる。



##演習課題2-1
標本1と標本2が同一の分布に従うという帰無仮説の下で、統計検定量$U$は正規分布に漸近近似できます。同一の分布から抽出した2組の標本に対して、直接法もしくは間接法により$U$を求めるという作業を10000回繰り返して、$U$の分布をヒストグラムにて示しなさい。



## 解答2-1
(演習課題2-1に対する解答を記載してください。必要に応じて、テキストやコードを追加しても構いません)

In [None]:
#解答2-1を作成するためのPythonソースを以下に記載してください
(演習2-1の解答をここに)

## 演習課題2-2
Pythonでは、2群のデータx,yをそれぞれ与えることで、マン・ホイットニーのU検定における統計検定量$U$と$p$値を求めることができます
```
# u: 統計検定量U
# p: p値
from scipy import stats
u,p=stats.mannwhitneyu(x,y)
```
演習課題1と同様に、様々な2群からなる母集団から標本を抽出しなさい。
そして、マン・ホイットニーのU検定および2標本t検定を実施して、$p$値を比較しなさい。両者で検定結果にどのような差があるかや、どのような分布でどちらの検定方法が有用と考えられるか等考察しなさい。
なお、演習課題1では、正規分布のみを使用したが、本課題ではベータ分布などほかの分布についても調べること。


##解答2-2
(演習課題2-2に対する解答を記載してください。必要に応じて、テキストやコードを追加しても構いません)

# 演習課題3
下記の仮説検定の問題をPythonを用いて解きなさい。その際、その検定手法やパラメータ(等分散性を仮定したか)を選んだ理由等も述べなさい

1.  ドラム缶の製造工場において、4人の作業員別に良品・不良品の個数を調べたところ、以下の結果が得られた。作業員によって不良率に差がないという仮説を有意水準5%で検定しなさい。
> * 作業員A: 良:7142, 不良:90
> * 作業員B: 良:3021, 不良:60
> * 作業員C: 良:1841, 不良:38
> * 作業員D: 良:5880, 不良:29

2.　次のデータは20匹のラットを10匹ずつ2群に分けて 、一方には普通の餌を与え(対照群)、もう一方には薬を混入した餌を与えた(投薬群)場合の血液1$mm^3$中の赤血球数を示したものである(単位:100万個)。投薬群と対照群のそれぞれの平均の差、すなわち薬の効果の95%信頼区間を求めなさい。また、有意水準5%で両群に差があるか検定しなさい。
> * 投薬群 [7.97,7.66,7.59,8.44,8.05,8.08,8.35,7.77,7.98,8.15]
> * 対照群 [8.06,8.27,8.45,8.05,8.51,8.14,8.09,8.15,8.16,8.42]


##解答3
(演習課題3に対する解答を記載してください。必要に応じて、テキストやコードを追加しても構いません)