# ベイズの定理

基本的には**条件付き確率**

## 条件付き確率

$
\displaystyle
P(Y|X) = \frac{P(X,Y)}{P(X)}
$

> $x$が条件であることに注意

$X$が起こった条件の下で、$Y$が起こる確率

![ベン図](bayes_theorem_img/bayes_theorem.png)

### $X$と$Y$は交換可能

$X$と$Y$は入れ替えても成り立つ。

$
\displaystyle
P(X|Y) = \frac{P(X,Y)}{P(Y)}
$

$P(X,Y) = P(Y,X)$は自明。「$X$かつ$Y$」と「$Y$かつ$X$」は同じ。

### 更に変形

$
\displaystyle
P(X,Y) = P(Y|X)P(X)
$
を用いて、更に変形すると

$
\displaystyle
P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)}
$

## ベイズの定理

$
\displaystyle
P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)}
$

えｗｗｗ条件付き確率を変形しただけじゃんｗｗｗ  
そうだよ？  
ただ、この解釈が面白い

ここで以下の通りに解釈する。

- X: 原因
- Y: 結果

普通、この条件の下で条件付き確率$P(Y|X)$を扱うと時系列が「原因→結果」となっていることが分かる。  
しかし、このベイズの定理$P(X|Y)$は「結果→原因」の時系列を表現している。

つまり、ベイズの定理とは**結果から原因を探る確率定理**であると解釈することができる。

## 例題

**結果から原因を探る確率定理**と言っても良く分からないので、有名な例題を説いてみる。

罹患率$0.01%$の病気について

|状態|陽性|陰性|
|:--:|:--:|:--:|
|罹患|98%|2%|
|非罹患|20%|80%|

> 特殊な医学用語として、以下のようなものがある。
> - 罹患しているが陰性判定が出てしまうことを**偽陰性**
> - 罹患していないが陽性判定が出てしまうことを**偽陽性**

Q. 陽性だと診断された場合、罹患している確率はいくらか？

> 因果関係が「結果→原因」になっていることが分かるだろうか？これをベイズの定理で推定していく。

- X: 罹患
- Y: 陽性

$
\displaystyle
P(X|Y) = \frac{P(Y|X)P(X)}{P(Y)}
$

解説

罹患していて陽性判定される確率は図から$98%$であることが明らかである。

$P(Y|X) = 0.98$

次に、罹患している確率は、罹患率$0.001%$であることから

$P(X) = 0.0001$

次に、陽性である確率は「罹患していて陽性」と「罹患していなくて陽性」の２パターンあるため場合分けを考える必要がある。

$
\begin{align}
P(Y) &= 0.00001 \times 0.98 + 0.9999 \times 0.2\\
&= 0.200078
\end{align}
$

以上、３式をベイズの定理に当てはめる。

$
\begin{align}
P(X|Y) &= \frac{P(Y|X)P(X)}{P(Y)}\\
&= \frac{0.98 \times 0.0001}{0.20078}\\
&= 0.00048981
\end{align}
$

約0.05%

## 解説

なんの情報もないのに知っている確率を**事前確率**と呼ぶ。  
今回の例題であれば罹患率$0.01%$がそれに当たる。

また、「陽性である」という情報を用いた場合の確率を**事後確率**と呼ぶ。  
これはベイズの定理で求めた$0.05%$がそれに当たる。

事前確率から情報を入力することで事後確率へ確率が変化したと言える。  
つまり、ベイズの定理とは**確率の更新プロセス**と見ることができる。



## 補足解説

[混同行列(Confusion Matrix) とは 〜 2 値分類の機械学習のクラス分類について](https://qiita.com/TsutomuNakamura/items/a1a6a02cb9bb0dcbb37f)

罹患率$0.01%$の病気について

|状態|陽性|陰性|
|:--:|:--:|:--:|
|罹患|98%|2%|
|非罹患|20%|80%|

### 正解率 - Accuracy -

どれだけ正しいTrueを出せているか。  
Trueであれば、PositiveだろうがNegativeだろうが関係なし。

$
\begin{align}
\displaystyle
\frac{TP + TN}{TP + TN + FP + FN}
&= \frac{0.98 + 0.2}{0.98 + 0.02 + 0.2 + 0.8}\\
&= \frac{1.18}{2}\\
&= 0.554
\end{align}
$

![accuracy](bayes_theorem_img/accuracy.png)

### 適合率 - Precision -

> Precision: 精度

Positiveの中でどれだけ正しかったか。

$
\begin{align}
\displaystyle
\frac{TP}{TP +  FP}
&= \frac{0.98}{0.98 + 0.8}\\
&= \frac{0.98}{1.78}\\
&= 0.55...
\end{align}
$

![precision](bayes_theorem_img/precision.png)

### 再現率 - Recall -

$
\begin{align}
\displaystyle
\frac{TP}{TP +  FN}
&= \frac{0.98}{0.98 + 0.02}\\
&= \frac{0.98}{1}\\
&= 0.98
\end{align}
$

![true_positive_rate](bayes_theorem_img/recall_true_positive_rate.png)

### F値

$
\begin{align}
\displaystyle
\frac{2 \times precision \times recall}{precision + recall}
&= \frac{2 \times 0.55 \times 0.98}{0.55 + 0.98}\\
&= \frac{1.078...}{1.53...}\\
&= 0.704...
\end{align}
$