# 11 空間構造のある階層ベイズモデル

今までは場所差は独立して決まるものと仮定してきた。

**空間相関**…隣り合った場所の類似性を考慮する。

## 11.1 例題:一次元空間上の個体数分布

調査区画をjとし、左から1,2,...50とする

区画上の種子数を取るとなだらかに変化している。

## 11.2 階層ベイズモデルに空間構造をくみこむ

共通の平均個体数\\( \lambda \\)のポワソン分布に従うと仮定した場合に標本平均10.9に対し標本分散が27.4にもなってしまう。

区画jごとに平均\\( \lambda_i \\)が異なっているとする。しかし、全ての\\( \lambda_i \\)を最尤推定するのはデータの読み上げになってしまう。

そこで、全体に共通する大域的な密度(\\( \beta \\))と局所的な差異(\\( \lambda \\))を同時に組み込むために、以下のようにあらわす

$$ log\lambda_j = \beta + r_j $$

### 11.2.1 空間構造のない階層事前分布

10章の階層事前分布

$$ p(r_i | s ) = \frac{1}{\sqrt{2\pi s^2}} exp \biggl(\frac{-r_i^2}{2s^2}\biggr) $$

だと、場所差\\( r_i \\)が独立になってしまう。

### 11.2.2 空間構造のある階層事前分布

以下の仮定により簡略化する。

* 区画の場所差は「近傍」区画の場所差にしか影響されない
* 区画jの近傍の個数\\( n_j \\)は有限個であり,どの区画が近傍であるかはモデル設計者が指定する
* 近傍の直接の影響はどれも等しく\\( 1/n_j \\)

さらに、隣の区画だけが相互作用すると仮定する。

$$ p(r_j | \mu_j,s ) = \sqrt{\frac{n_j}{2\pi s^2}} exp \biggl\{-\frac{(r_j - \mu_j)^2}{2s^2/j_j}\biggr\} $$

この正規分布の平均\\( \mu_j \\)は近傍である\\( r_{j-1} \\)と\\( r_{j+1} \\)の平均値に等しいとする。


$$ \mu_j = \frac{r_{j-1} + r_{j+1}}{2} $$

* j=1, と50は端なので、\\( \mu_1 = r_2, \mu_50 = r_49 \\)とする
* 標準偏差は\\( s/\sqrt{n_j} \\)とする
* 確率分布\\( p(r_j | \mu_j, s) \\)のバラ付きのパラメータsはどの場所でも同じだと仮定する。

このような事前分布は**条件付き自己回帰(CAR)**という。

場所差全体の事前分布である同時分布\\( p(\{r_j\}|s \\)は以下のようになる。

$$ p(\{r_j\}|s \propto exp \biggl\{-\frac{1}{2s^2} \sum_{j \sim j'}(r_j-r_{j'})^2 \biggr\} $$

\\( j \sim j' \\)は、ある区画jと別の区画j'が近傍であるような全ての\\( \{j,j'\} \\)の組み合わせ。

この同時分布において\\( r_j \\)を除くすべての\\( \{r*\} \\)を定数とおくと,先ほど登場した条件つき事前分布\\( p(r_j|\mu_j,s) \\)が得られる

## 11.3 空間統計モデルをデータにあてはめる

事後分布は下記のとおり。

$$ p(\beta, s, \{r_j\} | {\bf Y} \propto p(\{r_j\}|s)p(s)p(\beta)\prod_jp(y_j|\lambda_j) $$

* データ\\( y_j \\)が得られる確率\\( p(y_j|\lambda_j) \\)は平均\\( \lambda_j = exp(\beta + r_j) \\)のポアソン分布とする。
* 切片\\( \beta \\)の事前分布は無情報事前分布\\( P(\beta) \\)を指定する。（大域的パラメータ）
* 場所差\\( r_j \\)の事前分布は,空間相関を考慮した階層事前分布であり,上の式では同時分布\\( p(\{r_j\}|s) \\)使用。（局所的パラメータ）
* MCMCサンプリングでは個々の\\( r_j \\)の条件つき事前分布\\( p(\{r_j\}|s) \\)を使用。

## 11.4 空間統計モデルが作りだす確率場

一般に相互作用する確率変数たちでうめつくされた空間は確率場とよばれる。

ばらつきパラメータsが大きくなるほど隣とは無関係に値を選べるようになり、事後分布からMCMCサンプリングすると大きく振れる。

## 11.5 空間相関モデルと欠測のある観測データ

空間相関を組み込むと、欠測のある観測データに対してもより良い予測ができるようになる。

## 11.6 この章のまとめと参考文献

* 空間構造のあるデータを統計モデル化する場合,近傍とは似ているけれど遠方とは似ていない,といった空間相関を考慮しなければならない
* 空間相関のある場所差を生成するintrinsic Gaussian CARモデルはWin-BUGSで簡単にあつかえる
* 空間相関のある場所差は確率場を使って表現できる
* 空間相関を考慮した階層ベイズモデルは観測データの欠測部分を予測するような用途にも使える