# マルコフ連鎖の基本定理の証明

参考：
* [Various proofs of the Fundamental Theorem of Markov Chains](https://arxiv.org/abs/2204.00784)
* [鈴木先生のマルコフ連鎖](https://ibis.t.u-tokyo.ac.jp/suzuki/lecture/2019/probth/PME_2_ver3.pdf)

エルゴード性があるマルコフ連鎖では，定常分布が存在し，その定常分布が連鎖の極限で得られることが知られています（ここで，初期分布には依存しません）．

この事実のことを「基本定理（fundamental theorem）」と言います．
基本定理は非常に重要な定理で，マルコフ連鎖の応用の根幹を担ってます．

例えばインターネットのpage rank algorithmが最も有名な応用事例でしょう．詳細は論文に任せますが，web searchをマルコフ連鎖としてモデル化して，定常分布の確率が高い順に表示することで推薦を行ってるっぽいです．

今回は基本定理の様々な証明を学びます．

**表記**

* $\Omega$：状態空間
* $\Omega \times \Omega$の行列$P$の$P(x, \cdot)$で$P$の$x$行目を表す．これは$x$から次状態に行く遷移確率
* 定常分布：$\pi P = \pi$を満たす$\pi$のこと
* 任意の要素$i, j$で$A_{ij} > 0$の行列を正と呼ぶ．
* $G(P)$：$P$の背後にあるグラフ．
  * $G(P)$が[強連結](https://manabitimes.jp/math/1250)のとき，つまりすべてのノードに任意のノードからアクセス可能なとき，$G(P)$を既約である，という．
  * 状態$s$について，$s$からスタートして$s$に戻ってくるのが$d(s)$の倍数に限るとき，$d(s)$のことを連鎖の周期と言います．任意の状態について$d(s)=1$のとき，$G(P)$を非周期的といいます．
* 一般に，$i\to j$かつ$j \to i$のとき，$i, j$は$P$に関して**同値**である，といいます．communicatingのことです．


## 周期についての定理

### 定理：同値類の状態の周期は同じ

$i, j \in \Omega$をrecurrentな状態とします．
$i \leftrightarrow j$ならば，$d(i)=d(j)$です．

**証明**
まず，$i \leftrightarrow j$なので，
$P^k_{i,j} > 0$かつ$P^\ell_{i,j} > 0$を満たす$k, \ell$が存在します．
このとき，
$$
P^{k+\ell}_{i, i} \geq P^{k}_{i, j}P^{\ell}_{j, i} > 0
$$
* なので，$k+\ell$ステップで$i$から$i$に帰ってくれるので，$k+\ell$は$d(i)$の倍数です．

一方で．$P^m_{j, j} > 0$である任意の$m$について，
$$
P^{k+\ell+m}_{i, i} \geq P^{k}_{i, j}P^m_{j, j}P^{\ell}_{j, i} > 0
$$
が成り立ってます．
* よって，$k+\ell+m$も$d(i)$の倍数になります．
* ここで，$k+\ell$が$d(i)$の倍数なので，$m$も$d(i)$の倍数になります．
* ところで，$d(j)$は以上を満たす$m$の最大公約数なので，$d(i)\times 何か=m$は$d(j)$以下になります．

以上の$j$と$i$を入れ替えても同じことが言えるので，$d(i) \geq d(j)$も言えます．
よって，$d(i)=d(j)$です．


### 定理：$i\leftrightarrow j$のときの往路の性質

$i\leftrightarrow j$のとき，その共通の周期を$d$とすると，
$P^{\ell}_{i, j}>0, P^{m}_{i, j}>0 \Rightarrow \ell=m \bmod d$
が成り立ちます．

**証明**
$j\to i$なので，ある$n$が存在して，$P^n_{j, i} > 0$です．よって，
$$
\begin{aligned}
& P^{\ell+n}_{i, i} \geq P^{\ell}_{i, j} P^{n}_{j, i}>0 \\
& P^{m+n}_{i, i} \geq P^{m}_{i, j} P^{n}_{j, i}>0
\end{aligned}
$$
です．よって，$\ell+n$と$m+n$回の移動で$i\to i$ができるので，どちらも$d$の倍数です．

よって，$\ell - m = (\ell + n) - (m+n)$も$d$の倍数になるので，$\ell = m \operatorname{mod} d$です．

---

以上の定理を使うと，既約かつ閉なクラス$R \subset \Omega$を次のように分割できます：

$R$内の状態$i$を基準として，各$j \in R$を考えましょう．
そして，$P^\ell_{i, j} > 0$なる$\ell$を見つけたとします．このとき，

$$
R=C_i(1) \cup C_i(2) \cup C_i(3) \cup \cdots \cup C_i(d)
$$

として分割できます．ここで，$C_i$には$\ell$を$d$で割った余りが$i$のものを割り当ててます．


### エルゴード性についての定理

* [Various proofs of the Fundamental Theorem of Markov Chains](https://arxiv.org/abs/2204.00784)

### 補題：エルゴードなMDPではいつか正の確率行列になる

有限マルコフ連鎖の$P$がエルゴードであるとき，つまり既約かつ非周期的ならば，任意の$l \geq k$について$P^l$が正になるような$k$が存在する．

**証明**

まず，$i \in \Omega$について，
$$
A_{i i}=\{|w| \mid w \text { is a walk from } i \text { to } i,|w| \geq 1\}
$$
を$i$から$i$に戻るための経路の長さの全パターンとします．
連鎖が非周期的なので，$A_{ii}$の最大公約数は$1$です．

ここで，$A_{ii}$が和について閉じていることを意識しておきましょう．
実際，$i\to i$の経路 $w_1$と$w_2$がある場合，$|w_1|, |w_2| \in A_{ii}$であり，さらに$w_1$と$w_2$を組み合わせても$i\to i$なので，$|w_1| + |w_2| \in A_{ii}$でもあります．

さらに話を進めるために，次を使います：

---

$A=\{a_1, a_2, \dots\}$を次を満たす正の整数の列とします．

1. $\operatorname{gcd}\left\{a_1, a_2, \ldots\right\}=1$
2. 和について閉じている

このとき，ある$N < \infty$が存在し，任意の$n \geq N$について$n \in A$が成り立ちます．

---

上の事実を$A_{ii}$に使うと，ある$N_i < \infty$が存在して，任意の$n \geq N_i$について$i\to i$に$n$ステップで帰ることができます．

さて，$j$を連鎖$M$上の任意の状態とします．$M$は既約なので，$G(P)$上には$i\to j$に行く経路が少なくとも１つ存在します．その長さを$l_{ij}$としましょう．

ここで，$K_{ij}=N_i + l_{ij}$としましょう．
上の事実から，任意の$m \geq K_{ij}$について，長さ$m$で$i\to j$に行く経路が存在します（最初の$m - l_{ij}$の長さを$i\to i$で消費すれば良い）．

よって，ある$K$が存在して，任意の$l \geq K$で$P^l$が正になります．

---


## 基本定理とその証明

* $P^{\infty} \stackrel{\text { def }}{=} \lim _{n \rightarrow \infty} P^n$とします．

このとき，エルゴード性があるときは次が成り立ちます．

任意の正な$n\times n$の確率行列$P$について，次を満たす$\pi_1, \pi_2, \ldots, \pi_n$が存在します：

$$
P^{\infty}=\left[\begin{array}{cccc}
\pi_1 & \pi_2 & \ldots & \pi_n \\
\pi_1 & \pi_2 & \ldots & \pi_n \\
\cdot & \cdot & \ldots & \cdot \\
\pi_1 & \pi_2 & \ldots & \pi_n
\end{array}\right]
$$

そして，$\pi \stackrel{\text { def }}{=}\left(\pi_1, \pi_2, \ldots, \pi_n\right)$は$P$の定常分布です．
また，任意の初期状態分布$\sigma=\left(\sigma_1, \sigma_2, \ldots, \sigma_n\right)$からスタートした系列$\left(\sigma^{(i)}\right)_{i \geq 1}$は，$i\to \infty$で$\pi$に収束します．



これを示すために，次を示します：

### 補題：確率行列の収束

$P$を正な確率行列ととする．
$P^i$について，任意の固定された列$k$について，その最大と最小値を$m^i$と$M^i$とすると，以下が成立します：
1. $(m^i)_{i \geq 1}$は非減少
2. $(M^i)_{i \geq 1}$は非増加
3. $\Delta^i = M^i - m^i$は$i\to \infty$で0に収束する

この補題から，次が直ちに成立します：

* $P$が正の確率行列のとき，$P^i$の$k$列目が$i\to \infty$で$\pi_k$に収束するような値$\pi_k$が存在する
    * 証明：$P^i$も正の確率行列なので，$0 < m^i \leq M^i < 1$です．任意の有界かつ非減少（or 非増加）な系列は極限を持ちます．また，3つ目の性質から，１と２の極限は同じになります（つまり，任意の$\epsilon > 0$について，$\Delta^i < \epsilon$）．
    * ちなみに３つ目単体では不十分です．例えば$((-1)^i)_i$なる系列は収束しないですが，２つの系列がどちらもこれに従うとき，その差が０になってます．

さて，この確率行列の収束性を証明してみましょう．

---

**1と2の証明**

まず，$m$の定義から，
$$
\begin{aligned}
m^{(i+1)} & \stackrel{\text { def }}{=} \min _r P_{r k}^{i+1} \\
& =\min _r \sum_s P_{r s} P_{s k}^i \\
& \geq \min _r \sum_s P_{r s} m^{(i)} \\
& =m^{(i)} \min _r \sum_s P_{r s} \\
& =m^{(i)}
\end{aligned}
$$
なので，$m^{i+1} \geq m^i$です．同様にして，$M^{i+1}\leq M^i$も言えます．

**3の証明**

さて，$P^{i+1}$の，任意の$r, k$番目の要素を考えましょう．
$P^{i+1} = PP^i$なので，$P_{r k}^{i+1}=\sum_l P_{r l} P_{l k}^i$です．
$P^i$の$k$列目の最大値$M^i$が$s$行目にあるとします．このとき，

$$
\begin{aligned}
P_{r k}^{i+1} & =P_{r s} M^{(i)}+\sum_{l \neq s} P_{r l} P_{l k}^i \\
& \geq P_{r s} M^{(i)}+\left(1-P_{r s}\right) m^{(i)} \\
& =m^{(i)}+P_{r s}\left(M^{(i)}-m^{(i)}\right) \\
& \geq m^{(i)}+p_{\min }\left(M^{(i)}-m^{(i)}\right)
\end{aligned}
$$

ここで，$p_{\min}$は$P$の中で一番小さい値を指します．
これは任意の$r, k$について成り立つので，もちろん$m^{i+1}$を与える要素でも成り立ちます．よって，
$$
m^{(i+1)} \geq m^{(i)}+p_{\min }\left(M^{(i)}-m^{(i)}\right)
$$
が成り立ちます．同様にすると，
$$
M^{(i+1)} \leq M^{(i)}-p_{\min }\left(M^{(i)}-m^{(i)}\right)
$$
も成立します．２つを合体させると：
$$
M^{(i+1)}-m^{(i+1)} \leq\left(1-2 p_{\min }\right)\left(M^{(i)}-m^{(i)}\right)
$$
であり，$\Delta^{(i+1)} \leq\left(1-2 p_{\min }\right) \Delta^{(i)}$が得られます．$\Delta^{(1)} \leq 1$なので，繰り返すと
$$
\Delta^{(n)} \leq\left(1-2 p_{\min }\right)^{n-1}
$$
が得られます．ここで，マルコフ連鎖が３以上の状態を持つとき，明らかに
$0<\left(1-2 p_{\min }\right)<1$なので，上の式から$\Delta^{(n)}\to 0$です．
よって，
$$
P^\infty=
\left[\begin{array}{cccc}
\pi_1 & \pi_2 & \ldots & \pi_n \\
\pi_1 & \pi_2 & \ldots & \pi_n \\
\cdot & \cdot & \ldots & \cdot \\
\pi_1 & \pi_2 & \ldots & \pi_n
\end{array}\right]
$$
が成立します．

---

* この$\pi$が定常分布になってる
* 任意の初期分布$\sigma$から始まっても定常分布に収束する

ことは論文参照．