# 統計的仮説検定
推測統計の中でも利用頻度の高い重要なもので、統計的仮説検定の手順と様々な用語を説明する。その後、標準正規分布を使った検定、t分布を使った検定、無相関検定、カイ二乗検定といった代表的な統計的仮説検定の方法について説明する。

## 統計的仮説検定の必要性
<pre>
<b>なぜ必要か？</b>
以下のような例を考えてみる。
ある研究者（以下Aさん）が、日本人の大学生において自尊感情とソーシャルスキルの間には相関があると主張をするために、実際に大学生を対象にデータを集めた。Aさんの関心は日本人の大学生全体だが、流石に全員からデータを集めるのは現実的ではないので50人の大学生を無作為に選びそれらの学生データを収集したところ、自尊感情とソーシャルスキルの間の相関は0.5であった。この結果から「相関関係がある」とAさんは結論づけた。

もしAさんに意地悪なライバルがいた場合、どんなことを言われるのか。例えば「例え母集団全体では全く相関がなくても、標本に相関関係が見られることがある」「たまたま抽出した標本に相関関係のある人たちを選んだのでは？」実際に母集団全体では無相関でも標本に相関が確認できる場合もある。

<b>ではどうすれば反論できるのか？</b>
Aさんは自分の主張が正しいというためには母集団全てのデータを集めなければならないのか？それが難しいから標本による検証を行ったので無理です。残された方法があるならば、「母集団に全く相関がないとしたら、抽出した標本の結果が得られる可能性は非常に小さい」という証明をするしかない。完全には否定できないものの限られた標本データからある程度の合理性を持った主張として強力である。

<b>統計的仮説検定</b>は確率論に基づきこのような主張を行うための方法である。
</pre>

## 統計的仮説検定の手順と用語
|手順|やること|
|:---|:---|
|1|母集団に関する帰無仮説と対立仮説を設定する|
|2|検定統計量を選ぶ|
|3|有意水準αの値を決める|
|4|データから検定統計量の実現値を求める|
|5|検定統計量の実現値が棄却域に入れば帰無仮説を棄却して、対立仮説を採択する。棄却域に入らなければ帰無仮説を採択する|

<p>統計的仮説検定では、はじめに帰無仮説を立てる。例えば母集団に関して母平均$\mu=0$、母相関係数$\rho=0$、母平均の差$\mu_1 - \mu_2 = 0$といった「〇〇がない」という帰無仮説だ。これとは逆に「〇〇がある」という対立仮説を立てる。例えば、母平均は0でない、母相関が0でないなどだ。つまり<b>差がないという帰無仮説と差があるという対立仮説を立てる。</b></p>
<p>
対立仮説の設定によって、検定は両側検定もしくは片側検定となる。対立仮説が母平均$\mu\neq0$、母相関係数$\rho\neq0$、母平均の差が$\mu_1 - \mu_2 \neq 0$などの場合は両側検定となる。一方で対立仮説が母平均$\mu>0$、母相関係数$\rho>0$、母平均の差が$\mu_1 - \mu_2 > 0$などの場合は片側検定となる。</p>

<p>続いてこれらを吟味するための検定統計量を決める。そして有意水準を設定する。ここまではデータを収集する前にやっておくべきことである。データが手に入ったら、そのデータから検定統計量の実現値を計算する。</p>

<p>
そして、その値が棄却域に入れば、帰無仮説を棄却して「有意な相関がある」とか「有意な差がある」という判断をする。一方で棄却域に入らない場合は帰無仮説を棄却できないとして、「有意な相関がない」とか「有意な差がない」という判断をする。
</p>

## 帰無仮説と対立仮説
<p>「差がない」「効果がない」などと仮説を立てることを帰無仮説という。帰無仮説は記号では$H_0$と表される。帰無仮説は一般に、本来主張したいことと逆の仮説になる。本当は「差がある」ことを主張したいのにあえて「差がない」という仮説を始める。</p>

<p>帰無仮説が棄却されたときに採択される仮説が対立仮説という。対立仮説は$H_1$と表される。</p>

<p>統計仮説検定ではまず、帰無仮説と対立仮説を定める。そして帰無仮説は正しいということで話を進める。実際に得られたデータから計算された検定統計量の値がとても極端な値であり、そのような値は滅多に手に入らない。非常に珍しい値だということがわかったとする。つまり帰無仮説が正しいとしたらほぼ起こり得ない結果が起こったということである。このとき実際のデータの様子から「帰無仮説が正しい」という前提を疑い、帰無仮説を棄却する。一方実際のデータが帰無仮説のもとであり得るような極端な値でなかった場合は帰無仮説を採択する。</p>


## 検定統計量
統計的仮説検定のために用いられる標本統計量のことを検定統計量という。実際のデータから検定統計量の値を計算する。こうして標本から計算された検定統計量の具体的な値のことを検定統計量の実現値という。検定統計量の実現値は帰無仮説にそぐわず対立仮説にあっているほど0から離れた値をとる。代表的な検定統計量には$t,\chi^2,F$などがある

## 有意水準と棄却域
帰無仮説を棄却して、対立仮説を採択するかどうかを決定するとき、どの程度低い確率の結果が得られたら帰無仮説を棄却するかという基準を有意水準という。通常5%や1%で設定されることが多い。有意水準は$\alpha$で表される。$\alpha=0.05$と書いたら有意水準が5%である。検定統計量が決まったら次に標本分布を考える。帰無仮説のもとでの標本分布を帰無分布と呼ぶ。帰無仮説のもとで非常に生じにくい検定統計量の値の範囲を棄却域と呼ぶ。棄却域部分以外を採択域といい、棄却域と採択域の境界を臨界値と呼ぶ。

## 統計的仮説検定の結果報告
検定統計量の実現値が棄却域に入った場合、「差がない」という帰無仮説を棄却し「差がある」という対立仮説を採択する。こうした判断を「検定結果は5%水準で有意である」とか「$p<0.05$で有意差が見られた」という。一方帰無仮説を棄却できない場合は「検定の結果、差が有意でない」や「有意な差は認められなかった」などと記述する。

## $p$値
$p$値とは、帰無仮説が正しいという仮定のもとで、標本から計算した検定統計量の実現値以上の値が得られる確率である。$p$値が有意水準$\alpha$より小さい時に帰無仮説を棄却する。

## 第１種の誤りと第２種の誤り
- 帰無仮説が真の時、棄却してしまう（第１種の誤り）
- 帰無仮説が偽の時、採択してしまう（第２種の誤り）

## 検定力
間違っている帰無仮説を正く棄却できる確率のことであり、この確率が低い状態で統計検定を行うのは適切ではない。

## 標準正規分布を用いた検定（１つの平均値の検定・母分散$\sigma^2$が既知）
<p>ここでは標準正規分布を帰無分布とする１つの平均値の検定方法を紹介する。検定統計量は$Z=\frac{\overline{X}-\mu}{\sigma\sqrt{n}}$とする。正規母集団から無作為に標本を抽出する場合、標本平均の分布も正規分布に従う。その標本分布は平均$\mu$、分散$\frac{\sigma^2}{n}$の正規分布になる$(\overline{X}-N(\mu,\frac{\sigma^2}{n}))$</p>
これを標準化すると、$Z=\frac{\overline{X}-\mu}{\sigma\sqrt{n}}~N(0,1)$となり、Zは標準正規分布に従う。

<pre>例題：過去のデータから「心理学テスト」の得点は平均12、分散10の正規分布に従うことが知られている。「指導法データ」の20人の心理学テスト得点はこの母集団からの無作為標本と考えて良いか？
</pre>

In [1]:
import numpy as np
test = np.array([13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15])

### (1)帰無仮説と対立仮説の設定
- 帰無仮説$H_0$：$\mu=12$（心理学テストの母平均は12である）
- 対立仮説$H_1$：$\mu\neq12$（心理学テストの母平均は12ではない）
<p>対立仮説の設定より両側検定となる</p>

### (2)検定統計量の選択
$Z=\frac{\overline{X}-\mu}{\sigma\sqrt{n}}$

### (3)有意水準$\alpha$の決定
5%、つまり$\alpha=0.05$とする両側検定である。

### (4)検定統計量の実現値を求める
母集団分布$X〜N(12,10)$より、平均点の標本分布は$\overline{X}〜N(12, \frac{10}{20})$となる。検定統計量を求める

In [23]:
population_mean = 12 # 母平均
population_var = 10  # 母分散
a = test.mean() - population_mean
b = np.sqrt(population_var/len(test))
z = a/b
print(z)

-2.82842712474619


### (5)帰無仮説の棄却 or 採択の決定
標準正規分布の両側検定・有意水準5%の時の棄却域を求めよう。

In [16]:
from scipy import stats
alpha = 0.05
under_p = stats.norm.ppf(alpha / 2)
upper_p = stats.norm.ppf(1 - alpha / 2)

In [22]:
# 検定統計量の実現値は棄却域に入るのか？
z < under_p or z > upper_p

True

zは棄却域に入るため、帰無仮説は棄却される。検定の結果は5%水準で有意であったつまり指導法データの心理学テスト得点は母平均12であるとは言えない。もしくは平均12、分散10の正規母集団からの無作為標本とは言えない