# Part 2: Markov Chains

## Introduction

- 首先给出一个简单的例子：一个质点在数轴上随机运动，每次向左或向右移动一步，概率均为 0.5。
  - 这个过程可以用马尔可夫链来描述，状态空间是整数集 $\mathbb{Z}$，转移概率矩阵 $P$ 满足 $P(i, i+1) = P(i, i-1) = 0.5$。
- Markov链是一个离散的时间随机过程，满足无后效性（Markov property），即未来状态只依赖于当前状态，而与过去状态无关。其在时间 $n$ 的状态记为 $X_n$，状态空间为有限或可数无限集合，例如$E = \mathbb{Z}$。
- Markov性质：对于任意的 $n \geq 0$ 和状态 $i_0, i_1, \ldots, i_n, j$，有
  $$ P(X_{n+1} = j | X_n = i_n, X_{n-1} = i_{n-1}, \ldots, X_0 = i_0) = P(X_{n+1} = j | X_n = i_n). $$
  - 该性质的证明可以通过全概率公式迭代展开来实现。
  - 齐次(homogeneous) Markov链：转移概率不随时间变化，即 $P(X_{n+1} = j | X_n = i) = P(X_1 = j | X_0 = i)$。

### Transition Probability Matrix 转移概率矩阵

- 一步转移概率（One-step transition probability）：$P_{ij} = P(X_{n+1} = j | X_n = i)$，表示从状态 $i$ 转移到状态 $j$ 的概率。
- 转移概率矩阵（Transition Probability Matrix）：$P = (P_{ij})_{i,j \in E}$，满足每行和为1，即 $\sum_{j \in E} P_{ij} = 1$，因为每一行都代表一个conditional pmf。
  - 例如，在上文的随机游走例子中，转移概率矩阵为：
    $$
    P = \begin{pmatrix}
    \ddots & \ddots & \ddots & & \\
    & 0.5 & 0 & 0.5 & \\
    & & 0.5 & 0 & 0.5 \\
    & & & \ddots & \ddots & \ddots
    \end{pmatrix}
    $$
- 另一示例如下：假设今天是否下雨取决于过去两天的天气状况。具体来说，假设如果 (i) 过去两天都下雨，那么明天下雨的概率为 0.7； (ii) 今天下雨但昨天没有，概率为 0.5； (iii) 昨天下雨但今天没有，那么明天下雨的概率为 0.4； (iv) 过去两天都没有下雨，明天下雨的概率为 0.2。
  - 该过程本身不是Markov链，但可以通过将状态空间扩展为过去两天的天气状况来构造一个Markov链。引入如下状态：
    | State | Rains Today? | Rains Yesterday? |
    |---|---|---|
    | 0 | Y | Y |
    | 1 | Y | N |
    | 2 | N | Y |
    | 3 | N | N |
    - 转移概率矩阵为：
    $$
    P = \begin{pmatrix}
    0.7 & 0 & 0.3 & 0 \\
    0.5 & 0 & 0.5 & 0 \\
    0 & 0.4 & 0 & 0.6 \\
    0 & 0.2 & 0 & 0.8
    \end{pmatrix}
    $$
      - 为何要扩展状态空间？因为Markov性质要求未来状态只依赖于当前状态，而不是过去的多个状态。通过扩展状态空间，我们将过去的信息包含在当前状态中，从而满足Markov性质。如果将转移概率矩阵写作4行2列的形式，就无法满足Markov性质，因为未来状态将依赖于过去的两个状态。

### 两个重要性质

1. **联合分布**：对于任意的 $n \geq 0$ 和状态 $i_0, i_1, \ldots, i_n$，有
   $$ P(X_0 = i_0, X_1 = i_1, \ldots, X_n = i_n) = P(X_0 = i_0) P_{i_0 i_1} P_{i_1 i_2} \cdots P_{i_{n-1} i_n}. $$
   - 该性质的证明可以通过数学归纳法来实现。
2. **条件概率**：对于任意 $n > k_1 > k_2 > \dots > k_m \ge 0$。 $$ P(X_n = i | X_{k_1} = i_{k_1}, X_{k_2} = i_{k_2}, \dots, X_{k_m} = i_{k_m}) = P(X_n = i | X_{k_m} = i_{k_m}) $$
   - 该性质的证明可以通过全概率公式和Markov性质来实现。

## Chapman-Kolmogorov Equations

- $n$步转移概率（n-step transition probability）：$P_{ij}^{(n)} = P(X_n = j | X_0 = i)$，表示从状态 $i$ 转移到状态 $j$ 经过 $n$ 步的概率。
- $n$步转移概率矩阵：$P^{(n)} = (P_{ij}^{(n)})_{i,j \in E}$。
- Chapman-Kolmogorov方程：对于任意的 $m, n \geq 0$ 和状态 $i, j \in E$，有
  $$ P_{ij}^{(m+n)} = \sum_{k \in E} P_{ik}^{(m)} P_{kj}^{(n)}. $$
  - 即，经过 $m+n$ 步从状态 $i$ 转移到状态 $j$ 的概率，可以通过$m$步后的中间状态 $k$ 的所有可能性来计算。
- 对于$n \geq 1$，有 $P^{(n)} = P^n$，即 $n$ 步转移概率矩阵等于转移概率矩阵的 $n$ 次幂。特别地，$P^{(0)} = I$，其中 $I$ 是单位矩阵。

### $X_n$在时间$n$的分布

- $X_n$的pmf可以被表示为一个行向量，即$\mu_n = (\mathbb{P}\{X_n = 0\}, \mathbb{P}\{X_n = 1\}, \dots, \mathbb{P}\{X_n = i\}, \dots)$
- 对于任一状态$j$，有
  $$ \mathbb{P}\{X_n = j\} = \sum_{i \in E} \mathbb{P}\{X_n = j | X_0 = i\} \mathbb{P}\{X_0 = i\} = \sum_{i \in E} P_{ij}^{(n)} \mathbb{P}\{X_0 = i\} = \sum_{i \in E} P_{ij}^{(n)} \mu_0(i). $$

#### 一些重要符号

- 一步转移概率：$P_{ij}^1 = p_{ij} = P(X_{n+1} = j | X_n = i)$
- $n$步转移概率：$P_{ij}^{(n)} = P(X_n = j | X_0 = i)$. 
- $n$步转移概率矩阵：$P^{(n)} = (P_{ij}^{(n)})_{i,j \in E}$。

## Classification of States 状态分类

### Basic Concepts

- 状态$i$导致 (leads to) 状态$j$，记为 $i \to j$，如果存在整数 $n \geq 0$ 使得 $P_{ij}^{(n)} > 0$。即从状态 $i$ 出发，有正概率在 $n$ 步后到达状态 $j$。
- 状态$i$与状态$j$ 互通 (communicate)，记为 $i \leftrightarrow j$，如果 $i \to j$ 且 $j \to i$。即状态 $i$ 和状态 $j$ 可以相互到达。
- 传递性：如果 $i \to j$ 且 $j \to k$，则 $i \to k$。如果 $i \leftrightarrow j$ 且 $j \leftrightarrow k$，则 $i \leftrightarrow k$。
- 可达类 (communicating class)：状态空间 $E$ 的一个子集 $C$，其中任意两个状态 $i, j \in C$ 都满足 $i \leftrightarrow j$。即在该子集中，任意两个状态都可以相互到达。
- 不可约 (irreducible) Markov链：如果状态空间 $E$ 本身是一个可达类，即任意两个状态 $i, j \in E$ 都满足 $i \leftrightarrow j$。即从任意状态出发，都可以到达任意其他状态。

### Recurrence and Transience 重返与瞬时

- 令$i$为某一状态，则$\tau_i = \inf\{n \geq 1: X_n = i | X_0 = i\}$表示从状态$i$出发，首次返回状态$i$所需的步数；并令$f_i = \mathbb{P}(\tau_i < \infty)$表示从状态$i$出发，最终返回状态$i$的概率。定义在时间$n$第一次返回状态$i$的概率为$f_{ii}^{(n)} = \mathbb{P}(\tau_i = n | X_0 = i)$，则有$f_i = \sum_{n=1}^{\infty} f_{ii}^{(n)}$（特别地，$f_{ii}^{(1)} = P_{ii}^{(1)}$）。由全概率公式可知
  $$ P_{ii}^{(n)} = \mathbb{P}(X_n = i | X_0 = i) = \sum_{m=1}^{n} f_{ii}^{(m)} P_{ii}^{(n-m)}. $$
  - 该式表示从状态$i$出发，经过$n$步后回到状态$i$的概率，可以通过在第$m$步首次返回状态$i$，然后在剩余的$n-m$步中再次回到状态$i$来计算。
- **重返态** (recurrent state)：状态 $i$ 是重返态，如果从状态 $i$ 出发，最终会以概率 1 重返状态 $i$。即 $f_i = 1$（此后，状态 $i$ 将被无限次访问）。否则，状态 $i$ 是**瞬时态** (transient state)（在有限次数的访问后，可能不再返回状态 $i$）。
- **定理**：状态 $i$ 是重返态的充分必要条件是 $\sum_{n=1}^{\infty} P_{ii}^{(n)} = \infty$。即从状态 $i$ 出发，经过任意多步后回到状态 $i$ 的概率之和发散。
  - 证明可以通过定义生成函数 $F(s) = \sum_{n=1}^{\infty} f_{ii}^{(n)} s^n$ 和 $P(s) = \sum_{n=0}^{\infty} P_{ii}^{(n)} s^n$，并利用它们之间的关系 $P(s) = 1 + F(s) P(s)$ 来实现。
- 例如，考虑一个随机游走过程，质点从0开始，每一步向右移动的概率为$p$，向左移动的概率为$q = 1 - p$。考虑经过$2n$步后回到0的概率：
    $$ P_{00}^{(2n)} = \binom{2n}{n} p^n q^n. $$
    - 利用Stirling公式 ($n! \sim \sqrt{2 \pi n} \left( \frac{n}{e} \right)^n$)，可以近似计算 $\binom{2n}{n} \approx \frac{4^n}{\sqrt{\pi n}}$，从而得到
        $$ P_{00}^{(2n)} \approx \frac{(4pq)^n}{\sqrt{\pi n}}. $$
    - 因此，当 $p = q = 0.5$ 时，$\sum_{n=1}^{\infty} P_{00}^{(2n)}$ 发散，状态0是重返态；当 $p \neq q$ 时，$\sum_{n=1}^{\infty} P_{00}^{(2n)}$ 收敛，状态0是瞬时态。
- 如果状态 $i$ 与状态 $j$ 互通，则 $i$ 是重返态的充分必要条件是 $j$ 是重返态。即在同一个可达类中的状态要么都是重返态，要么都是瞬时态。
  - 证明：假设状态 $i$ 是重返态，则 $\sum_{n=1}^{\infty} P_{ii}^{(n)} = \infty$。由于 $i \leftrightarrow j$，存在整数 $m, k \geq 0$ 使得 $P_{ij}^{(m)} > 0$ 且 $P_{ji}^{(k)} > 0$。因此，对于任意的 $n \geq 1$，有
    $$ P_{jj}^{(m+n+k)} \geq P_{ji}^{(k)} P_{ii}^{(n)} P_{ij}^{(m)}. $$
    - 由此可得
    $$ \sum_{n=1}^{\infty} P_{jj}^{(n)} \geq P_{ji}^{(k)} P_{ij}^{(m)} \sum_{n=1}^{\infty} P_{ii}^{(n)} = \infty. $$
    - 因此，状态 $j$ 也是重返态。反之亦然。

### General Resolvent Equation 一般解析方程

- 定义$f_{ij}^{(n)} = \mathbb{P}(\text{从状态 } i \text{ 出发，在第 } n \text{ 步首次到达状态 } j)$，并令$f_{ij} = \sum_{n=1}^{\infty} f_{ij}^{(n)}$表示从状态$i$出发，最终到达状态$j$的概率。则有
  $$ P_{ij}^{(n)} = \sum_{m=1}^{n} f_{ij}^{(m)} P_{jj}^{(n-m)}. $$
  - 该式表示从状态$i$出发，经过$n$步后到达状态$j$的概率，可以通过在第$m$步首次到达状态$j$，然后在剩余的$n-m$步中再次回到状态$j$来计算。
- 定义生成函数 (generating functions)：
  - $F_{ij}(s) = \sum_{n=1}^{\infty} f_{ij}^{(n)} s^n$，其中 $|s| < 1$。这里的$s$是一个形式变量，不是概率。
  - $U_{ij}(s) = \sum_{n=0}^{\infty} P_{ij}^{(n)} s^n$，其中 $|s| < 1$。
- 则有一般解析方程 (General Resolvent Equation)：
  $$ U_{ij}(s) - \mathbf{1}_{{i = j}} = F_{ij}(s) U_{jj}(s), $$
  - 其中 $\mathbf{1}_{{i = j}}$ 是指示函数，当$i=j$时为1，否则为0。
  - 该方程表示从状态$i$出发，经过任意步数后到达状态$j$的概率生成函数，可以通过首次到达状态$j$的概率生成函数和从状态$j$出发再次回到状态$j$的概率生成函数来计算。
  - 证明：通过将生成函数的定义代入上述关系式，并利用卷积性质来实现。具体地，有
    \begin{align*}
    U_{ij}(s) &= \sum_{n=0}^{\infty} P_{ij}^{(n)} s^n = P_{ij}^{(0)} + \sum_{n=1}^{\infty} P_{ij}^{(n)} s^n \\
    &= \mathbf{1}_{{i = j}} + \sum_{n=1}^{\infty} \left( \sum_{m=1}^{n} f_{ij}^{(m)} P_{jj}^{(n-m)} \right) s^n \\
    &= \mathbf{1}_{{i = j}} + \left( \sum_{m=1}^{\infty} f_{ij}^{(m)} s^m \right) \left( \sum_{k=0}^{\infty} P_{jj}^{(k)} s^k \right) \\
    &= \mathbf{1}_{{i = j}} + F_{ij}(s) U_{jj}(s).
    \end{align*}
- **定理**：如果状态$j$是瞬时态，则对于任意状态$i$，有
  $$ P_{ij}^{(n)} \to 0 \text{ as } n \to \infty. $$
  - 证明：由于状态$j$是瞬时态，$\sum_{n=1}^{\infty} P_{jj}^{(n)} < \infty$。因此，对于任意 $\epsilon > 0$，存在整数 $N$ 使得 $\sum_{n=N}^{\infty} P_{jj}^{(n)} < \epsilon$。对于任意状态$i$，有
    $$ P_{ij}^{(n)} = \sum_{m=1}^{n} f_{ij}^{(m)} P_{jj}^{(n-m)} \leq \sum_{m=1}^{N} f_{ij}^{(m)} P_{jj}^{(n-m)} + \sum_{m=N+1}^{n} f_{ij}^{(m)} P_{jj}^{(n-m)}. $$
    - 当 $n \to \infty$ 时，第二项趋近于0，因此 $P_{ij}^{(n)} \to 0$。
- 推论1：对一个有限状态空间的Markov连，至少存在1个重返态。（可以通过反证法证明）
- 推论2：对一个有限状态空间的不可约Markov链，所有状态都是重返态。（可以通过反证法证明）

## Limiting Probabilities 极限转移概率

- 从一个示例开始：一个Markov链的转移概率矩阵为$$ P = \begin{pmatrix} 0.7 & 0.3 \\ 0.4 & 0.6 \end{pmatrix} $$ 当$n$足够大时，$P^n$趋近于$$ \begin{pmatrix} \frac{4}{7} & \frac{3}{7} \\ \frac{4}{7} & \frac{3}{7} \end{pmatrix} $$ 即无论初始状态如何，经过足够多的步数后，状态分布都趋近于$(\frac{4}{7}, \frac{3}{7})$。这表明Markov链具有某种稳定性，称为极限转移概率。
- Def: 一个Markov链的极限概率为$$ \lim_{n \to \infty} P_{ij}^n = \pi_j $$ 其中$i$代表初始状态，$j$代表最终状态。
  - 其中$\mathbf{\pi} = (\pi_j)$可以被看作一个pmf，因为$\sum_{j \in E} \pi_j = 1$且$\pi_j \geq 0$。 这里$\mathbf{\pi}$称为**平稳分布** (stationary distribution)，它是一个行向量。
  - 平稳分布$\pi$有如下性质：
    1. $\pi = \pi P$，即$\pi_j = \sum_{i \in E} \pi_i P_{ij}$。这表明如果初始分布为$\pi$，则经过一步转移后，分布仍然是$\pi$。
    2. $P(X_n = j) \to \pi_j$ as $n \to \infty$，即无论初始状态如何，经过足够多的步数后，状态分布都趋近于$\pi$。
    3. $\mathbb{E}\left(\frac{1}{n} \sum_{k=1}^n 1_{\{X_k = j\}}\right) \to \pi_j, \quad n \to \infty $，即在长期运行中，状态$j$被访问的频率趋近于$\pi_j$。
- 得到$\pi = (\pi_1, \cdots, \pi_m)$后，可以推出当$n$足够大时，$P^n$趋近于$$ \begin{pmatrix} \pi_1 & \pi_2 & \cdots & \pi_m \\ \pi_1 & \pi_2 & \cdots & \pi_m \\ \vdots & \vdots & \ddots & \vdots \\ \pi_1 & \pi_2 & \cdots & \pi_m \end{pmatrix} $$ 即无论初始状态如何，经过足够多的步数后，状态分布都趋近于$\pi$。

### 极限转移概率的存在条件

- **非周期性** (aperiodic)：状态 $i$ 的周期 $d(i)$ 定义为 $\{n \geq 1: P_{ii}^{(n)} > 0\}$ 的最大公约数。如果 $d(i) = 1$，则状态 $i$ 是非周期性的。否则，状态 $i$ 是周期性的。
  - 例如，如果一个Markov链的状态空间为 $\{0, 1\}$，且转移概率矩阵为
    $$
    P = \begin{pmatrix}
    0 & 1 \\
    1 & 0
    \end{pmatrix},
    $$
    则状态0和状态1的周期均为2，因此它们都是周期性的。这个Markov链不存在极限转移概率，即使存在$\mu$使得$\mu = \mu P$。
- **不可约性** (irreducible)：如果状态空间 $E$ 本身是一个可达类，即任意两个状态 $i, j \in E$ 都满足 $i \leftrightarrow j$。即从任意状态出发，都可以到达任意其他状态。反之，任何可约的Markov链都不存在极限转移概率。
- **基本极限定理**(Basic Limit Theorem)：对于一个不可约且非周期性的Markov链，存在唯一的平稳分布$\pi$，且对于任意状态$i, j \in E$，有
  $$ \lim_{n \to \infty} P_{ij}^{(n)} = \pi_j. $$
  - 进一步地，如果一个不可约Markov链的某一状态是重返态，则所有状态都是重返态。进一步地，如果对于某一状态$i$，有$\mathbb{E}(\tau_i | X_0 = i) < \infty$，则称该Markov链是**正重返** (positive recurrent) 的；否则，称为**零重返** (null recurrent) 的。特别地，一个有限状态空间的不可约Markov链必然是正重返的。
    - 例如，一个简单的随机游走在一维整数线上是零重返的，而在二维整数平面上是正重返的（返回原点的期望时间是有限的）。
  - 对于零重返或瞬态的不可约Markov链，极限转移概率不存在。因为对于任意状态$i, j \in E$，有$P_{ij}^{(n)} \to 0$ as $n \to \infty$。
  - 如果所有状态都是正重返的，则存在唯一的平稳分布$\pi$，且$\pi_j = \frac{1}{\mathbb{E}(\tau_j | X_0 = j)}$。即状态$j$被访问的频率与返回状态$j$的期望时间成反比。

## Mean Time Spent in Transient States 瞬时态的平均停留时间

- 回顾：对于一个形式变量$z$，有生成函数：
  $$ U_{ij}(z) = \sum_{n=0}^{\infty} P_{ij}^{(n)} z^n, \quad |z| < 1. $$
  $$ F_{ij}(z) = \sum_{n=1}^{\infty} f_{ij}^{(n)} z^n, \quad |z| < 1. $$
- 由一般解析方程，有
  $$ U_{ij}(z) - \mathbf{1}_{{i = j}} = F_{ij}(z) U_{jj}(z). $$
- 定义$$s_{ij} = \sum_{n=0}^{\infty} P_{ij}^{(n)} = \mathbb{E}(\sum_{n=0}^{\infty} \mathbf{1}_{\{X_n = j\}} | X_0 = i)$$
  - 该值表示从状态$i$出发，在整个过程中访问状态$j$的期望次数。
  - 如果状态$j$是瞬时态，则$s_{ij} < \infty$。
- 考虑一个Markov链，其中状态空间$E$可以划分为两个子集$T = \{1, 2, \cdots, M\}$和$R = \{M+1, M+2, \cdots, N\}$，其中$T$包含所有的瞬时态，$R$包含所有的重返态。
- 令矩阵
  $$
  P = \begin{pmatrix}
  P_T & P_{TR} \\
  P_{RT} & P_R
  \end{pmatrix}
  $$
  - 其中$P_T$是$T$中状态之间的转移概率矩阵，$P_R$是$R$中状态之间的转移概率矩阵，$P_{TR}$是从$T$到$R$的转移概率矩阵，$P_{RT}$是从$R$到$T$的转移概率矩阵。
- **引理**：对于任意$i \in R$和$j \in T$，有$p_{ij}^n = 0$。即从重返态出发，不会访问瞬时态。等价地，瞬时态的平均停留时间$s_{ij} = 0$。
  - 证明：由于状态$i$是重返态，状态$j$是瞬时态，且不可约Markov链中重返态与瞬时态不互通，因此从状态$i$出发，不可能访问状态$j$，即$s_{ij} = 0$。
- **定理**：对于任意$i, j \in T$，有
  $$ s_{ij} = \mathbf{1}_{{i = j}} + \sum_{k=1}^{M} p_{ik} s_{kj} = (I - P_T)^{-1}(i, j). $$
  - 其中$I$是$M \times M$的单位矩阵，$(I - P_T)^{-1}$是$(I - P_T)$的逆矩阵。
  - 该定理表明，从瞬时态$i$出发，访问瞬时态$j$的期望次数可以通过矩阵$(I - P_T)^{-1}$来计算。
  - 写为矩阵形式，得到$$S = (I - P_T)^{-1}$$
  - 证明：由一般解析方程，有
    $$ U_{ij}(z) - \mathbf{1}_{{i = j}} = F_{ij}(z) U_{jj}(z). $$
    - 当$z \to 1^-$时，$U_{ij}(z) \to s_{ij}$，且由于状态$j$是瞬时态，$F_{ij}(z)$在$z=1$处解析，因此有
    $$ s_{ij} - \mathbf{1}_{{i = j}} = \sum_{k=1}^{M} p_{ik} s_{kj}. $$
    - 将其写为矩阵形式，得到
    $$ S - I = P_T S. $$
    - 整理后得到
    $$ S(I - P_T) = I. $$
    - 由于$I - P_T$是非奇异的（因为$P_T$的谱半径小于1），因此有
    $$ S = (I - P_T)^{-1}. $$
- 对于矩阵中的特定元素，有$$f_{ij} = \frac{s_{ij} - \mathbf{1}_{{i = j}}}{s_{jj}}$$
  - 该值表示从状态$i$出发，最终访问状态$j$的概率。

## Time Reversible Markov Chains 可逆马尔可夫链

- 考虑一个Markov链的反向过程，其从$i$到$j$的转移概率$$q_{ij} = P(X_{n-1} = j | X_n = i)$$
  - 该转移概率可以通过贝叶斯公式计算：
    $$ q_{ij} = \frac{P(X_n = i | X_{n-1} = j) P(X_{n-1} = j)}{P(X_n = i)} = \frac{P_{ji} P(X_{n-1} = j)}{P(X_n = i)}. $$
  - 如果Markov链的初始分布为平稳分布$\pi$，则$P(X_n = i) = \pi_i$，因此有
    $$ q_{ij} = \frac{\pi_j P_{ji}}{\pi_i}. $$
- **定义**：一个不可约Markov链是可逆的 (time reversible)，如果存在一个pmf $\pi = (\pi_i)$ 使得对于任意状态 $i, j \in E$，有
  $$ \pi_i P_{ij} = \pi_j P_{ji}. $$
  - 这样的Markov链的反向过程也是一个不可约Markov链，且与正向过程具有相同的转移概率矩阵$P$，初始分布为$\pi$。
- 任何满足平衡方程$$\mu_i p_{ij} = \mu_j p_{ji}$$的pmf $\mu = (\mu_i)$都是该Markov链的平稳分布。
  - 证明：对于任意状态$j$，有
    $$ \sum_{i \in E} \mu_i P_{ij} = \sum_{i \in E} \mu_j P_{ji} = \mu_j \sum_{i \in E} P_{ji} = \mu_j. $$
    - 因此，$\mu = \mu P$，即$\mu$是该Markov链的平稳分布。
- Ehrenfest模型：假设有$N$个粒子在两个盒子中随机运动，每个粒子在每一步有概率$p$从一个盒子移动到另一个盒子，有概率$q = 1 - p$留在原来的盒子中。定义状态$i$为第一个盒子中的粒子数，则状态空间为$\{0, 1, \cdots, N\}$，转移概率矩阵为
  $$
  P_{ij} = \begin{cases}
  \frac{i}{N} p & \text{if } j = i - 1, \\
  \frac{i}{N} q + \frac{N - i}{N} p & \text{if } j = i, \\
  \frac{N - i}{N} q & \text{if } j = i + 1, \\
  0 & \text{otherwise}.
  \end{cases}
  $$
  - 可以验证该Markov链是不可约且非周期性的，因此存在唯一的平稳分布$\pi$。通过平衡方程，可以得到
    $$ \pi_i = \binom{N}{i} p^i q^{N-i}, \quad i = 0, 1, \cdots, N. $$
    - 即平稳分布是一个二项分布，表示在长期运行中，第一个盒子中的粒子数服从二项分布。