# 条件付き確率とベイズの定理
ベイズの定理は、人工知能だけではなく様々な分野で利用される有用な概念です。  
今回は、条件付き確率を解説した上で、ベイズの定理を学んでいきます。

### 条件付き確率とは？

条件付き確率とは、あるできごとBが起きるという条件のもとで別のできごとAが起きる確率のことをいいます。  
条件つき確率は、次のように表されます。

$$P(A|B)$$

この値は、Bが起きたときのAの確率を表します。  

条件付き確率は次の式で求めることができます。  

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

$P(B)$はできごとBが起きる確率です。  
$P(A \cap B)$は、AとBが同時に起きる確率です。  
Bのうち、Aが起きたものの割合と考えることができます。

### 条件付き確率の例
上記の説明だと分かりにくいので、条件付き確率の例を考えてみましょう。

袋の中に白い玉と黒い玉が5つずつ入っています。  
白い球のうち3つには0という数字が、2つには1という数字が書かれています。  
黒い球のうち2つには0という数字が、3つには1という数字が書かれています。  

この袋から球を1つ取り出したら、白い球でした。  
この球の番号が0である確率を求めましょう。  

$P(A|B)$において、AとBを次のように設定します。
A: 番号が0である
B: 白い球である

ここで、以下の式により条件付き確率を求めます。

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

右辺における$P(B)$は、白い球である確率なので次のように簡単に求めることができます。

$$P(B) = \frac{5}{10} = \frac{1}{2}$$

また、$P(A \cap B)$は袋の中に10個の球があり、白くて番号が0の球は3個なので次のようにして求めることができます。

$$P(A \cap B) = \frac{3}{10}$$

従って、条件付き確率は次のように求めることができます。

$$P(A|B) = \frac{P(A \cap B)}{P(B)} = \frac{\frac{3}{10}}{\frac{1}{2}} = \frac{3}{5}$$

取り出した球が白である場合、その番号が0である確率は$\frac{3}{5}$、すなわち60%となりました。  
今回はシンプルなケースを扱いましたが、より複雑な条件では条件付き確率の式がとても役に立ちます。

### ベイズの定理とは？
ベイズの定理は次の式で表されます。

$$P(B|A) = \frac{P(A|B)P(B)}{P(A)}$$

条件付き確率$P(B|A)$を求めるのに、$P(A|B)$と$P(A)$、$P(B)$を使います。  
$P(A|B)$は簡単に求めることができるけれど$P(B|A)$を求めることができない場合、ベイズの定理が役に立ちます。

## ベイズの定理の活用例
日本人の0.01%が罹患する、ある病気を考えましょう。  
検査により、実際に病気に罹患している人が陽性と判定される確率が98%とします。  
また、罹患していない人が陰性と判定される確率は90%とします。  
ある人が検査により陽性と判定された場合、実際に罹患している可能性は何%でしょうか。

検査で陽性であることを$A_1$、陰性であることを$A_2$とします。  
このとき、
$$A_2 = 1 - A_1$$
という関係が成り立ちます。

また、実際に罹患していることを$B_1$、罹患していないことを$B_2$とします。
このとき、
$$B_2 = 1 - B_1$$
という関係が成り立ちます。

以上を踏まえて、ベイズの定理を次のように使うことができます。

$$P(B_1|A_1) = \frac{P(A_1|B_1)P(B_1)}{P(A_1)}$$

$P(B_1|A_1)$が、陽性と判定されたとき実際に罹患している確率です。  
右辺を求めていきましょう。

$P(A_1|B_1)$は罹患している人が陽性と判定される確率なので、次のようになります。
$$P(A_1|B_1) = 0.98$$

また、$P(B_1)$は病気に罹患している確率なので次のようになります。  
$$P(B_1) = 0.0001$$

$P(A_1)$ですが、陽性と判定される確率なので、罹患していて陽性と判定される確率と罹患していなくて陽性と判定される確率の和で求めることができます。
$$P(A_1) = P(B_1)P(A_1|B_1) + P(B_2)P(A_1|B_2) = (1-0.9999)\times 0.98 + 0.9999\times (1-0.9) = 0.100088$$

従って、陽性と判定さ入れた場合、実際に罹患している確率は次のように求めることができます。  
$$P(B_1|A_1) = \frac{P(A_1|B_1)P(B_1)}{P(A_1)} = \frac{0.98\times 0.0001}{0.100088} = 0.00097914$$

検査に陽性であっても実際に病気である確率は0.1%程度のようです。  
この病気で陽性と判定されても、あまり気に病む必要は無さそうですね。

人工知能では、このベイズの定理を用いたベイズ推定により、パラメータの推定を行うことがあります。

### 演習:
袋の中に白い玉と黒い玉が3つずつ入っています。  
白い球のうち2つには0という数字が、1つには1という数字が書かれています。  
黒い球のうち1つには0という数字が、2つには1という数字が書かれています。  

この袋から球を1つ取り出したら、白い球でした。  
この球の番号が0である確率を求めましょう。  

答えは紙に書いても、下のセルにLaTeXで書いても構いません。