## 第3章 ベイズ推論とは
- 簡潔に定義すると、
  - ベイズ推論とは、統計的分析の手法の一つ（他には最尤推定という代表手法がある）
  - 事前分布と観測された事象から、それらの起因である原因事象を確率的に推論する（事後分布を求める）

 

## 3.1 ベイズ推論利用の目的
- 「なぜベイズ推論を利用するのか」の問いに対する答えを考える場合、もう一つの有力な推論手法である最尤推定と比較して考えてみる。
- 両手法とも、目的は「確率分布のパラメータ値を推測する」こと。

- 最尤推定では、事前に __パラメータに関する尤度関数が定まっている__ 事が前提。
  - 手順
    - （事前準備）確率モデルと観測値から尤度関数を作る
    -　尤度関数から最適値（最大になる値）を求める　勾配降下法が用いられたりする。つまり、結果は __1点の値__
     - ここでいう「確率モデル」は、観測値が従っていると仮定される確率分布
     - 例：観測データが正規分布に従う仮定の場合、その分布のパラメータ（平均・分散）を最尤推定で点で求める

- ベイズ推論では、
  - __特定のパラメータ値ではなく、パラメータ値の確率分布を求めることが目的__
  - 手順
    - 確率モデルと事前分布、観測値から結果を導出
    - その結果が事後分布（確率分布）
     - ここでいう「事前分布」は、パラメータがどのような値を取りうるかについての事前の知識や仮定を反映した確率分布
     - 観測データを用いて、この事前分布のデータを更新して事後分布を導くイメージ
     - 例：正規分布の標準偏差に関する事前知識がある場合、その標準偏差の事前分布を設定する。
  - 確率分布で推論できた後、この結果に確からしさの基準（94%HDIなど）を設定して、予測値がAーBの範囲に含まれるという __幅による予測が可能__

- 確率分布の予測は、あくまで着目している事象が確率分布に従うと仮定した上でその確率分布の特性を規定するパラメータ値を予測すること
  - 特定の値を予測したところで、現実と一致することはまずない
  - であるなら、 __幅で予測した方が活用の可能性が高いよね__ という感じ


- 現実世界に落とし込むと、「幅での予測」は、
  - ある販促キャンペーンの見込み応募数で、幅を持たせて予測できることで在庫商品をどれくらい押さえておくべきかの判断材料が多くなるというメリットがある。

### ChatGPTによる補足

#### 最尤推定とベイズ推論でのくじの当選確率の予測

#### 最尤推定の場合
1. **二項分布を確率モデルとして設定**  
   - くじの当選確率 \( p \) を求める。
   - 二項分布:

   $$
   P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}
   $$

2. **観測データからパラメータ \( p \) を推定**  
   - 観測データから、最尤推定により \( p \) を1点の値として推定。

---

#### ベイズ推論の場合
1. **二項分布と事前分布を設定**  
   - 当選確率 \( p \) に対して **事前分布** を設定（例: ベータ分布）。

   $$
   p(p) = \frac{p^{\alpha - 1} (1 - p)^{\beta - 1}}{B(\alpha, \beta)}
   $$

2. **観測データで事前分布を更新し、事後分布を得る**  
   - ベイズの定理を使い、事前分布を更新して事後分布を得る。

3. **事後分布から推定された当選確率の範囲を得る**  
   - 事後分布を使って当選確率 \( p \) の範囲を予測（例: 94% HDI）。

---

#### まとめ
- **最尤推定**：観測データから当選確率 \( p \) を1点の値として推定。
- **ベイズ推論**：事前分布を更新し、当選確率 \( p \) を確率分布として推定。


## 3.5 ベイズ推論の精度を上げる方法
1. 観測値を増やす
  - 確率モデル構築が適切である場合は、多くの観測値を用いるとより精度の向上が期待される
  - 同じ観測値の当たり比率でも、試行回数が多いと幅が狭まる！

2. 事前分布を工夫する
  - 前情報で、「くじが当たる確率が10%未満、90%以上ではない」ことが分かっている場合、事前分布の時点で0.1<p<0.9の一様分布を設定する　等
