# はじめに
* ベイズの公式は、確信度を事前に割り当てることと、データにおける条件付きの事後的な再割り当てとの、数学的関係
    * 例：天気についての2つの質問
        * 「東京が曇っている確率はどれくらいか？」
        * 「では、東京で雨が降っているが、曇っている確率はどれくらいか？」
    * 下記のように推論した
        1. 天気が曇っているか、晴れているかについて、事前の確信度を持った
        2. 他のデータ(雨が降っている）を考慮した
        3. 新たなデータ（雨が降っている）の元で、天気の状態に確信度を割り当てた
* 補足：日本だと天気を「晴れ・くもり・雨」と分類すると思うが、この例では天気を「晴れ・くもり」と分類し、「雨」は1つの現象と捉えている？



# 5.1. ベイズの公式
* Thomas Bayes(1702-1761)
* 頻度主義
    * 推定や決定にベイズの公式を用いない流派
    * Ronald Fisher(1890-1962)
* 20世紀においてはフィッシャー的アプローチが優勢だったが、21世紀では18世紀に期限のあるベイジアン・アプローチが優勢



## 5.1.1. 条件付き確率の定義から導出されるもの
* 条件付き確率の直感的な定義
$$
p(c|r) = \frac {p(r,c)}{p(r)}
$$
* $r$(目の色)が与えられた時の$c$(髪の色)の確率は、$r$が生じる確率に対して、$r$と$c$が同時に生じた確率である。
* この式を起点として、ベイズの公式を導出する。
* 式の変形を行なっていく。両辺に$p(r)$をかけると下記。
$$
p(c|r)p(r) = p(r,c)
$$
* また、$p(r|c)=\frac {p(r,c)}{p(c)}$という定義(rとcを入れ替えた)から始めて、上と同様の操作を行うと下記。
$$
p(r|c)p(c) = p(r,c)
$$
* 上2つの式は右辺が$p(r,c)$で同じ。そのため、下記。
$$
p(c|r)p(r) = p(r|c)p(c)
$$
+ 両辺を$p(r)$で割ると、
$$
p(c|r) = \frac {p(r|c)p(c)}{p(r)}
$$
+ 分母$p(r)$は下記のように表せる。
$$
p(r) = \sum_{c^*} p(r,c^*)
= \sum_{c^*} p(r|c^*)p(c^*)
$$
+ よって、
$$
p(c|r) = \frac {p(r|c)p(c)}{\sum_{c^*} p(r|c^*)p(c^*)}
$$
+ 「ベイズの公式」は、上に出てきた式のうち、下記の2つ
$$
p(c|r) = \frac {p(r|c)p(c)}{p(r)}
$$
$$
p(c|r) = \frac {p(r|c)p(c)}{\sum_{c^*} p(r|c^*)p(c^*)}
$$



## 5.1.2. 2次元分割表から直感的にわかるベイズの公式
+ 補足：p.107 表5.4 の上から2行目検査結果の$\theta = :)$と$\theta=:($は逆では？
+ ベイズの公式
$$
p(c|r) = \frac {p(r|c)p(c)}{\sum_{c^*} p(r|c^*)p(c^*)}
$$
+ 表5.1
<img src="./img/table5_1.png">
+ わかっている行の値に対する条件付き確率化は、既知の値が真である行にのみ限定的に注目し、その行の合計確率で割ることによる確率の正規化であることが、鍵となる考え方

+ 具体例1：目の色と髪の色
+ 目の色と髪の色の様々な組み合わせの同時確率と周辺確率を示したもの
+ 表5.2
<img src="./img/table5_2.png">
+ ランダムに選ばれた人の目の色が青だとわかれば、この人は「青」の行に属するとわかり、そこに焦点を合わせることができる。
+ 表5.3
<img src="./img/table5_3.png">
+ 目の色を知る前の髪の色に関する「事前の」（周辺）信念から、観測された目の色の時の髪の色に関する「事後」（条件付き）信念に変化した（ブロンド:0.21→0.45)
+ 行の値に関する情報（目の色）を与えられた時の列の値（髪の色）の確信度の条件付き再割り当てを示している
+ ただこの例では、同時確率$p(r,c)$を直接算出した数値にして使っている。

+ 具体例2：珍しい病気の診断 p107
+ 表5.4
<img src="./img/table5_4.png">
+ T=+ :検査結果陽性、T=-:検査結果陰性。検査結果は病気のパラメータの値に関する信念を修正するのに用いる
+ 的中率99%:検査結果が陽性なら、99%の確率で病気$p(T=+|\theta =:(  )=0.99$
+ フォールスアラーム率5%:病気でないのに、病気だと誤って示す確率$p(T=+|\theta =:)  )=0.05$

* 問題：母集団からランダムに人をサンプリング。検査を行い陽性だった時、その人が病気である事後確率は？$p(\theta =:(|T=+)$
* 直感だと、的中率と同程度のように思える（99%)
+ 表5.4(同上)
<img src="./img/table5_4.png">
### 事前の信念
+ 表の最下部に、病気に罹患している背景確率が記載されており、$p(:()=0.001$。病気でない確率は$p(:))=1-0.001=0.999$。
+ 検査結果についての情報がなければ、この周辺確率が事前の信念。 

### 同時確率
+ 検査が陽性、病気に罹患している同時確率は表の左上
+ $p(T=+,\theta=:()=p(T=+|\theta=:()\times p(\theta=:()= 0.99\times 0.001$
+ 検査が陽性になり病気に罹患している同時確率＝検査の的中率$\times$病気の基礎率

### 改めて問題(事後確率)
* 問題：母集団からランダムに人をサンプリング。検査を行い陽性だった時、その人が病気である事後確率は？$p(\theta=:(|T=+)$
+ $T=+$とマークされている行に着目すると、
$$
p(\theta=:(|T=+) = \frac {p(T=+|\theta=:()\times p(\theta=:()}{\sum_{\theta} p(T=+|\theta)p(\theta)}\\
= \frac{0.99\times0.001}{0.99\times0.001+0.05\times(1-0.001)}\\
= 0.019
$$


+ つまり、99%の的中率である検査の結果が陽性でも、病気に罹患している事後確率は1.9%。
+ これは、病気の事前確率が低く(罹患してない事前確率が高く）、検査のフォールスアラーム率が高いため。

## まとめ
+ 病気の有無の事前確信度を見た(事前確率)。
+ 検査結果を元に、行(検査結果ごと)に注意を向け、ベイズの公式によって行における病気の有無の条件付き確率を算出した(事後分布)。
    + 条件付き確率は、得られたデータ(検査結果)に基づいて病気の有無に対して再割り当てされた確信度。

## 5.2. パラメータとデータへの適用 p109
+ ベイズの公式を有効に使えるのは、行の変数がデータ値、列の変数がパラメータ値を表している場合
<img src="./img/table5_5.png">
+ ベイズの公式は、特定のデータの行において、事前（パラメータ値の周辺分布)から事後(パラメータ値の条件付き分布)に注意を移させる。


### ベイズの公式の因数の名称
$$
p(\theta|D) = \frac {p(D|\theta) p(\theta)} {p(D)}
$$
* $p(\theta|D)$:事後確率(データDを考慮に入れたθ値の確信度)
* $p(D|\theta)$:尤度(パラメータ値θのあるモデルによって生じるデータの確率
+ $p(\theta)$:事前確率(データDなしのθ値の確信度)
+ $p(D)$：エビデンスor周辺尤度(モデルに関するデータDの全確率)
    + θの事前確率に酔って重みづけられた全てのθの値を通して、尤度の平均$p(D|\theta)$をとる操作

## 5.2.1. データの順序の不変性(p111)
+ 問題：あるデータ$D$を考慮する場合、事前信念$p(\theta)$から事後信念$p(\theta|D)$を得ることができる。さらに$D'$を観測したとする。それによって、信念を$p(\theta|D)$から$p(θ|D',D)$に更新できた。この時、$D$,$D'$の更新の順番によって、信念は左右されるか？
+ 答え：左右されるかどうかは、尤度$p(D|\theta)$を定義するモデルの関数次第。
+ データの確率が独立している場合($p(D,D'|\theta)=p(D|\theta)\times p(D|\theta)$)はデータの順序は関係ない。
+ 本書の全ての例では、独立なデータを生成する数学的な尤度関数を用いている。
+ (間違えてたらご指摘ください)

## 5.3. コインのバイアスを推定する
+ 例：コイントス
+ バイアス：表が出る確率。表が出やすいことを、「表にバイアスされている」ということもある。

### ベイジアン分析のステップ(p24 2.3.)
1. データの見極め
2. モデルの定義
3. パラメータの事前分布の設定
4. パラメータに確信度を再分配
5. 事後予測とデータの照らし合わせ

### 1. データの見極め
+ コイントス
+ 投げた結果をy。表を1、裏を0。

### 2. モデルの定義
+ 意味のあるパラメータを持つ記述的モデルを作る。
+ 表が出る確率を$p(y=1)$とする。
+ 表の確率をパラメータ値$\theta$であらわす。
+ $p(y=1|\theta) = \theta$
    + 「パラメータ値θが与えられた時、結果が表になる確率」
+ 表と裏の確率の式を1つの式にする。
    + $p(y|\theta) = \theta^y(1-\theta)^{(1-y)}$
+ 複数回コイントスした結果に関する尤度の式は下記。
    + $p(\{y_i\}|\theta)= \prod_i p(y_i|\theta)=\theta^{front}(1-\theta)^{back}$
    + $front$は表の回数、$back$は裏の回数



### 3. パラメータの事前分布の設定
+ パラメータ値の事前分布を確立していく。
+ この例では、非現実的であるが、$\theta$は0.0,0.1,0.2,...,1.0の11個しか取り得ないものとしている。
+ 事前分布は、工場で製造されているコインのタイプについての、私たちの信念を示すもの。
    + $\theta$が0.5付近のコインを作ると仮定し、$\theta=0.5$の上下のバイアスには低い事前確信度を割り当てる。
<img src="./img/fig5_1.png">

### 4. パラメータに確信度を再分配
#### モチベーション
+ パラメータ値$\theta$の事前分布は私たちの仮説にすぎない。
+ このパラメータ値に確信度を再割り当てしたい。
+ そのためにデータを集め、ベイズの公式に適用する。

#### 再分配
+ コインを1回投げて表が出たとする。(N=1のとき、z(表の回数)=1)
+ 先ほど、尤度関数は $p(y|\theta) = \theta^y(1-\theta)^{(1-y)}$とした。
+ 尤度の