# 9 GLMのベイズモデル化と事後分布の推定

## 9.1 例題：種子数のポアソン回帰（個体差なし）
第3章の例題と同じ。個体ごとの平均種子数が体サイズ\\( x_i \\)にどのように依存しているかを調べる。

個体差は存在しないので、単にポワソン分布で表現できる。

## 9.2 GLMのベイズモデル化

* 個体\\( i \\)の種子数\\( y_i \\)のばらつきを平均\\( \lambda_i \\)のポアソン分布\\( p(y_i|\lambda_i) \\)に従うとする
* 線型予測子と対数リンク関数を使って、この平均を\\( \lambda_i=exp(\beta_1 + \beta_2x_i) \\)と指定する
* 個体差はないのでランダム効果の項はなし

このモデルの尤度関数は

$$ L(\beta_1, \beta_2) = \prod_ip(y_i|\lambda_i) = \prod_ip(y_i|\beta_1 + \beta_2x_i) $$

パラメーター\\( \\{\beta_1, \beta_2\\} \\)がある値を取るときに\\( {\bf Y} \\)が得られる確率は、\\( p({\bf Y}|\beta_1, \beta_2)=L(\beta_1, \beta_2) \\)となる

ベイズモデルの事後分布は（尤度）×（事後分布）に比例するので以下の関係が成り立つ。

$$ p(\beta_1, \beta_2 | {\bf Y}) \propto p({\bf Y} | \beta_1, \beta_2)p(\beta_1)p(\beta_2) $$

* \\( p(\beta_1, \beta_2 | {\bf Y}) \\)：事後分布。
* \\( p(\beta_1)p(\beta_2) \\)：それぞれ切片\\( \beta_1 \\)と傾き\\( \beta_2 \\)の事前分布

これらを適切に指定すればベイズモデル化したGLMとなる。

## 9.3 無情報事前分布

切片\\( \beta_1 \\)と傾き\\( \beta_2 \\)の確率分布がわからない。

そこで、線形予測子のパラメータ\\( \beta \ast \\)の値は\\( [-\infty, \infty] \\)の範囲で「好きな値でよい」といったことを表現する事前分布 \\( p( \beta \ast ) \\) を設定する。これを**無情報事前分布という**

「好きな値で良い」をどのように表現するかは、区間全体の密度関数の積分を1にするため、**標準偏差がとても大きい「平べったい正規分布」**を用いる。



## 9.4 ベイズ統計モデルの事後分布の推定

切片\\( \beta_1 \\)と傾き\\( \beta_2 \\)の事後分布\\( p(\beta_1, \beta_2|{\bf Y})\\)をMCMCサンプリングを使って推定する。


### 9.4.1 ベイズ統計モデルのコーディング

WinBUGSを使用。

### 9.4.2 事後分布推定の準備

データやパラメータを準備する必要があるが、WinBUGSを直接使わず、RからWinBUGSを呼び出す。
### 9.4.3 どれだけ長くMCMCサンプリングすればいいのか？

サンプリングする長さや値を記録する間隔をどのようにすればいいのかは、得られた結果を元に試行錯誤するしか無い。

* 歪な分布であればサンプル数を増やす。
* 複数のサンプリングの比較をするとよい。(WinBUGSではchainsで反復数を指定可能)
* サンプル列間の乖離の大小を調べる。これを**収束診断**と呼ぶ。
* 収束診断は\\( \hat{R} > 1.1 \\)となるようなときにばらつきが大きい。
* ばらつきが多い場合は定常分布・事後分布は推定できないと判断する。

$$ \hat{R} = \sqrt{\hat{var}^{+} / W} $$

* \\( W\\)：サンプル列ごとの分散の平均
* \\( \hat{var}^{+} \\)：周辺確率分布の分散

$$ \hat{var}^{+} = \frac{n-1}{n}W+\frac{1}{n}B $$

#### サンプル列が収束しない原因

* サンプル数や使いたくない区間(burnin)が小さすぎる
* thinで間引きする。
* 不適切な統計モデリング
* BUGSコーディングミス
* データ誤り
* パラメータの初期値があまりに不適切

## 9.5 MCMCサンプルから事後分布を推定

post.bugsをmcmcクラスに変更し、図示する。

\\( \beta_1と\beta_2 \\)の周辺事後分布が得られる（カーネル密度推定で近似された確率密度関数で表現されている）

同時分布である事後分布\\( P( \beta_1, \beta_2 | {\bf Y}) \\)において、\\( \beta_2 \\)で積分すると\\( beta_1 \\)の周辺事後分布
$$ P( \beta_1 | {\bf Y}) = \int p(\beta_1, \beta_2 | {\bf Y}) d\beta_2 $$
が得られる

### 9.5.1 事後分布の統計量

## 9.6 複数パラメーターのMCMCサンプリング
### 9.6.1 ギブスサンプリング：この章の例題の場合
### 9.6.2 WinBUGSの挙動はどうなっている？