# ベイズ統計の入口

ベイズ統計は機械学習において，中心的な役割を果たす統計手法です．

ベイズ統計は，<font color='blue'>条件付確率，加法定理，乗法定理</font>によって構築されていると言っても過言ではありません．  
そして，その中心的な役割を果たすのが<font color='blue'>**ベイズの定理**</font>です．

機械学習では，データから取得した情報に基づいて事象の確率を変化させていきます．
このアプローチは，計算式としては単純ですが膨大な量の計算が必要になるので，手計算の世界では非現実的な方法でした．
コンピューターサイエンスの発展による機械学習の登場によってベイズ統計に注目が集まるようになりました．

## ベイズの定理

事象の集合$A$および$B$について次の式が成り立ちます．

> <font color=blue>$$
\begin{eqnarray}
P(A{\mid}B) 
&=& \frac{P(B{\mid}A)P(A)}{P(B)} \\
&=& \frac{P(B{\mid}A)P(A)}{P(B{\mid}A)P(A) + P(B{\mid}A^c)P(A^c)}  \\
\end{eqnarray}
$$</font>

この式をベイズの定理と言います．
ここで $A^c$ は $A$ の補集合です．

## ベイズ定理の用語

ベイズの定理では次の解釈を与えています．

- $P(A)$：事象$A$の事前確率
- $P(A{\mid}B)$：事象$B$が起きた後の事象$A$の事後確率


## 証明

乗法定理の式を$A$と$B$を入替えた2通りの表現で記述します．

$$ P(A{\cap}B) = P(B){\cdot}P(A{\mid}B) $$
$$ P(B{\cap}A) = P(A){\cdot}P(B{\mid}A) $$

これらの式から$P(A{\cap}B)=P(B{\cap}A)$なので2つの式が結びつきます．

$$ P(B){\cdot}P(A{\mid}B) = P(A){\cdot}P(B{\mid}A) $$

両辺を$P(B)$で割れば次の式が得られます．

<font color=blue> $$ P(A{\mid}B) = \frac{P(B{\mid}A)P(A)}{P(B)} $$ </font>

右辺の分母にある$P(B)$ですが，$B = (B{\cap}A)\cup(B{\cap}A^c)$ であるので，
この式に加法定理と乗法定理を適用して式変形を行います．

$$
\begin{eqnarray}
P(B)
&=& P((B{\cap}A)\cup(B{\cap}A^c)) \\
&=& P(B{\cap}A) + P(B{\cap}A^c) \\
&=& P(B{\mid}A)P(A) + P(B{\mid}A^c)P(A^c) \\
\end{eqnarray}
$$

これを上式に代入すればベイズの定理が求まります．

## ベイズの定理の一般化

最初に提示したベイズの定理は事象$A$が起こる確率を考えましたが，この事象を複数の排反する事象 $A_1,A_2,\cdots,A_n$とします．
さらに，これらの事象のどれかが必ず起こるものとします．
すなわち，次の2つの条件が成立すると仮定します．

- $ A_i \cap A_j = \emptyset \ (i \neq j) $
- $ A_1 \cup A_2 \cup \cdots \cup A_n = \Omega $

このとき次の式が成立します．

> <font color=blue>$$
P(A_i{\mid}B) = \frac{P(B{\mid}A_i)P(A_i)}{\sum_{j=1}^{n}P(B{\mid}A_j)P(A_j)} 
$$</font>

この式が一般的なベイズの定理です．

証明は，$B = (A_1{\cap}B) \cup (A_2{\cap}B) \cup \cdots \cup (A_n{\cap}B)$ に対して加法定理と乗法定理を適用すれば一般的なベイズの定理の式が求まります．

## ベイズの定理の解釈

事象$B$を得られたとき，その原因が事象$A_i \ (i=1,\cdots,n)$ のどれか1つだと仮定します．

- 原因$A_i$について，それぞれの起こりやすさの確率が$P(A_i)$です．
- 原因$A_i$が発生したときに結果$B$が起こる確率は$P(B{\mid}A_i)$です．
- $P(A_i{\mid}B)$は，事象$B$が得られたときに，その原因が$A_i$である確率です．

ベイズ統計は機械学習において中心的な役割を果たします．

*****
## ベイズ定理の具体例

次の図のように，2つの箱があり，その中に「黄，青，緑」の玉が入っている状況を考えます．

![ベイズ玉箱](./images/ball_2box.jpg)

これらの箱は自分からは見えないところにあり，誰かに頼んで，玉を1つ取ってきてもらいます．

### 事前確率

2つの箱に差異が無く，どちらの箱から玉を抜き出すかは同じ条件とします．
玉を抜き出した箱が箱1である確率は 1/2 です．また，箱2である確率も 1/2 です．
これらの確率を<font color='blue'>事前確率</font>と言います．

### 事後確率

さて，抜き出した玉の色が判明したときに，抜き出した箱の確率は変化します．
例えば，玉の色が黄色だとすると，必ず箱1から抜き出したことになるので，箱1の確率は 1 となり，箱2の確率は 0 となります．
黄色の場合は明らかですが，その他の色の場合についてベイズ定理を用いて計算します．

このように玉の色を知った後，玉を取り出した箱の確率を<font color='blue'>事後確率</font>と言います．

### ベイズ定理の適用

取り出した玉が緑色だった場合に，箱2から取り出された確率 $P(2{\mid}G)$ をベイズ定理で求めます．
ベイズ定理を適用すると次の式になります．

$$ \begin{eqnarray}
P(2{\mid}G) 
&=& \frac{P(G{\mid}2)P(2)}{P(G{\mid}2)P(2)+P(G{\mid}1)P(1)} \\
&=& \frac{ \frac{3}{5}{\cdot}\frac{1}{2} }{ \frac{3}{5}{\cdot}\frac{1}{2}+\frac{1}{5}{\cdot}\frac{1}{2} } \\
&=& \frac{3}{4} \\
\end{eqnarray} $$

このように緑の玉を取り出した結果から，75%の確率で箱2を選んでいるであろうと推測されます．

*****