確率のキーワード周りを勉強してみる。  
一般的な概念として分かりやすい例なので、サイコロを例に考えてみる。

### 試行と事象

とりえる値をランダムに1回抽出することを **試行** という
そして結果としてランダムに一つ出現する。

In [1]:
import numpy as np

dice = np.array([1, 2, 3, 4, 5, 6])  # サイコロの取りえる値

In [2]:
print(np.random.choice(dice))  # 事象

3


こうした個々の結果を **事象** という。  
具体的には個々の結果を **基本事象** といい、発生し得るすべての基本自称を集めた集合（上記だと `dice` 変数）を **標本空間** という。  
この標本空間の一部（1個の場合≒基本事象も含む）を指して言う場合に **事象** という。

## 事象の計算周り

空集合も事象としてみなすことができ、これを **空事象** という。サイコロでいうと、 7 が出る確率なんて存在しないので、空事象とみなせる。  
ある事象を $K$ （仮に、2, 4, 6 の事象と仮定）したとき、これ以外の取りえる値 (1, 3, 5) を **余事象** といい、 $c$ を使って表す

$$
K = \{ 2, 4, 6 \} \\
K^c = \{ 1, 3, 5 \}
$$

また、二つの事象を

$$
A = \{ 2, 4, 6 \} \\
B = \{ 1, 2, 5, 6 \}
$$

としたとき、 **積事象** (両方の事象に含まれる事象)を $A \cap B$ 、**和事象** (両方の事象の集合) を $A \cup B$ と記述する。

$$
A \cap B = \{ 2, 6 \} \\
A \cup B = \{ 1, 2, 4, 5, 6 \}
$$

またそれぞれ発生する確率を次の様に書く（ [tex: P] は確率で用いる一般的な名称 ）

$$
P(X) = \frac{1}{6} 基本事象の発生確率 \\
P( \phi ) = 0  空事象の発生確率 \\
P(A \cap B) = \frac{1}{3} 積事象の発生確率 \\
P(A \cup B) = \frac{5}{6} 和事象の発生確率
$$

## 条件付確率

はい、高校で理系を選択してれば習う項目です。  
事象 A が発生した後に事象 B が発生する確率等、前提の付く確率を **条件付確率** といい

$$
P(B|A) = P_A(B) = \frac{P(A \cup B)}{P(A)}
$$

の様に表し、[tex: P(A) > 0 ] のときは以下の様にもできる。

$$
P(A \cup B) = P(B | A)P(A)
$$

サイコロを 2 回振って、1回目が偶数(A)が、2回目が 5 以上(B)が出る確率を計算すると

$$
A =\{ 2, 4, 6 \}, B = \{ 5, 6 \} \\
P(A) = \frac{3}{6} \\
P(B) = \frac{2}{6} \\
P(A \cap B) = P(\{ 6 \}) = \frac{1}{6} \\
P(B|A) = \frac{ \frac{1}{6} }{ \frac{3}{6} } = \frac{1}{6} \cdot \frac{6}{3} =  \frac{1}{3}
$$

※ A/B は互いに独立した事象（相互の作用がない事象）なので実は特殊ケース

## 独立と従属

次の関係を持つ事象 A, B は、互いに独立である（定義）

$ P(A|B) = P(A) $

B の事象が A の事象に影響を与えていない状況である。  
これは ↑ の計算でも同じ事象が起きてる。（↑ の条件付確率の例だと、サイコロを振って 偶数が出る確率は 2 回目にのサイコロで 5 以上が出る確率には影響していない）

$$
P(A \cup B) = P(B | A)P(A)
$$

この式に当てはめると

$$
P(A \cup B) = P(B | A)P(A) = P(B)P(A)
$$

なので、条件付き確率の例でも一致する。  
この式が成立しない場合というのは、事象 A、B に何らかの因果関係があるということで、 **従属** するという。

従属している場合を考えると、「くじ」を考える。「当たりが2本、ハズレが2本の計4本があり、自分はくじ引きの列の2番目にいる。前の人が当たりを引いた上で、自分もアタリを引く可能性は？」

$$
P(A) = \frac{1}{2} … 前の人が当たりを引く可能性 \\
P(B) = \frac{1}{3} … 自分が当たりを引く可能性 \\
P(A \cap B) = \frac{1}{2} \cdot \frac{1}{3} = \frac{1}{6} … A, B が両方起こる確率 \\
P_A(B) = \frac{ \frac{1}{6} }{ \frac{1}{2} } = \frac{1}{3} 
$$

## モンティホール問題

> 3 つのドア A, B, C のうちいずれか 1 つのドアの向こうに賞品が無作為に隠されている。
> 挑戦者はドアを 1 つだけ開けて、賞品があれば、それをもらうことができる。
> 挑戦者がドアを選ぶと、司会者は残った 2 つのドアのうちはずれのドアを 1 つ無作為に開ける。 このとき、挑戦者は開けるドアを変更することができる
> この時、挑戦者は司会者の開けた後にドアを変更すべきか？

### 条件ごとに考える

挑戦者が先に選ぶドアを A としておく。この時、司会がドアBを開けたとき、Aが当たりである確率を考える。  
挑戦者ががドア A を開けた後、司会者がドア B を開ける確率（事象 S）を考えたとき

$$
P(A) = P(B) = P(C) = \frac{1}{3}  ... 挑戦者がドア A を選ぶ確率
$$

で、 A が当たりの場合は、司会者はB/C 両方開けれるので $P(S) = \frac{1}{2}$ なので

$$
P(A \cap S) = P(A)P_A(S) = \frac{1}{3} \cdot \frac{1}{2} = \frac{1}{6}
$$

B が当たりだった場合は、司会はBが開けられないので

$$
P(B \cap S) = P(B)P_B(S) = \frac{1}{3} \cdot 0 = 0
$$

C が当たりの場合は司会はBを開けるので

$$
P(C \cap S) = P(C)P_C(S) = \frac{1}{3} \cdot 1 = \frac{1}{3}
$$

なので、司会が B のドアを開ける確率は

$$
P(S) = P(A \cap S) + P(B \cap S) + P(C \cap S) = \frac{1}{6} + \frac{1}{3} = \frac{1}{2}
$$

で、求めたいのは「Aが当たりである確率」なので

$$
P_S(A) = \frac{ P(A \cap S) }{ P(S) } = \frac{1}{6} \cdot \frac{2}{1} = \frac{1}{3}
$$

要するに最初に挑戦者が 3 択で一つ選んで、そのまま通したのだから、そりゃ $\frac{1}{3}$ だよねって話。  
では、司会者がドア B を開けたときの、ドア C が当たりである確率は

$$
P_S(B) = \frac{ P(C \cap S) }{ P(S) } = \frac{1}{3} \cdot \frac{2}{1} = \frac{2}{3}
$$

つまり最初に選んだ A よりも、選びなおした方が当たる確率が高くなる。

## ベイズ定理

$A$ を結果事象、 $B$ をその原因事象としたとき、「 $A$ の原因が $B$ に起因したものである確率 」を以下の式で示す

$$
P(B|A) = P_A(B) = \frac{P_B(A) P(B)}{ P_B(A) P(B) + P_{B^c}(A) P(B^c) }
$$

$P(B|A) = P_A(B)$ は事象 $A$ が起きた後の $B$ の発生確率(事後確率)。    
この時 $P(B)$ は事象 $A$ が発生する前の事象 $B$ の確率(事前確率)。  
$P(A|B) = P_B(A)$ は $A$ が発生した際に、 $B$ が原因である確率(尤度)。

これは原因が一つであることを前提とした式で、原因が複数 ( $B_1, B_2, B_3, ...$ 等)ある場合の一般式は

$$
P(B_i|A) = P_A(B_i) = \frac{P(A|B_i) P(B_i)}{ \sum^k_{j=1} P(A|B_j) P(B_j) }
$$

## 実計算

* ある病気 $X$ に感染している可能性は 0.1 % である。
* ある PCR 検査したとき、感染している患者は 99% の確率で陽性反応が出る。
* 健康な人に PCR 検査を行った時、3% の確率で陽性反応が誤検知される。
* あなたは陽性反応が出ている。実際に感染しているか否か？

事象から定義してみる。

* A : X に感染している
* B : PCR が陽性を示す

$$
P_A(B) ... 感染している人が陽性反応を示す = 0.99 \\
P(A) ... 感染している可能性 = 0.001 \\
P_{A^c}(B) ... 感染していないが陽性反応が出てしまった 0.03 \\
P(A^c) ... 非感染者の割合 = 0.999
$$

とすると、ベイズ定理に当てはめると

$$
P_A(B) = \frac{P_B(A) P(B)}{ P_B(A) P(B) + P_{B^c}(A) P(B^c) }
$$

因果的には PCR (B) → 感染？ (A) なので、AB読み替えで

$$
P_B(A) = \frac{P_A(B) P(A)}{ P_A(B) P(A) + P_{A^c}(B) P(A^c) } \\
= \frac{ 0.99 \cdot 0.001 }{ 0.99 \cdot 0.001 + 0.03 \cdot 0.999 } \\
= \frac{ 0.00099 }{ 0.00099 + 0.02997 }
= 0.03197674418604651
$$

結論: 約 3.2% の確率で感染しています。

と、いうように扱うことができた。