# Part 3: Poisson Process

## Exponential Distribution 指数分布

- 回顾指数分布的性质：
  - 记作$X \sim \text{Expo}(\lambda)$，其中$\lambda > 0$是速率参数。
  - 概率密度函数（PDF）: $f_X(x) = \lambda e^{-\lambda x}$，对于$x \geq 0$，否则为0。
  - 累积分布函数（CDF）: $F_X(x) = 1 - e^{-\lambda x}$，对于$x \geq 0$，否则为0。
  - 均值和方差：$\mathbb{E}[X] = \frac{1}{\lambda}$，$\text{Var}(X) = \frac{1}{\lambda^2}$。
  - 无记忆性（Memoryless Property）：对于所有$s, t \geq 0$，有$P(X > s + t | X > s) = P(X > t)$。
  - 矩母生成函数（MGF）：$M_X(t) = \mathbb{E}[e^{tX}] = \frac{\lambda}{\lambda - t}$，对于$t < \lambda$。
- 指数分布可以延伸至Gamma分布的特殊情况。多个指数分布的和服从Gamma分布。当形状参数$k=1$时，Gamma分布退化为指数分布。
  - 其中，Gamma分布的概率密度函数为：
    $$ f_X(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)} $$
    其中$k > 0$是形状参数，$\lambda > 0$是速率参数，$\Gamma(k)$是Gamma函数。
- 指数分布的重要性质：
  1. 多个指数分布的最小值仍然服从指数分布。$$\min(X_1, X_2, \ldots, X_n) \sim \text{Expo}(\lambda_1 + \lambda_2 + \ldots + \lambda_n)$$
    - 推论：如果$X_1 \sim \text{Exp}(\lambda_1)$且$X_2 \sim \text{Expo}(\lambda_2)$，则$P(X_1 < X_2) = \frac{\lambda_1}{\lambda_1 + \lambda_2}$。可以使用全概率公式证明。  
      推广至$n$个变量：$$P(X_1 < X_2 < \ldots < X_n) = \frac{\lambda_1}{\sum_{j=1}^n \lambda_j} \cdot \frac{\lambda_2}{\sum_{j=2}^n \lambda_j} \cdots \frac{\lambda_{n-1}}{\lambda_{n-1} + \lambda_n}$$ 仍然可以使用全概率公式证明。
    - 推论：$$\mathbb{E}[X_1 \mathbf{1}_{X_1 < X_2}] = \frac{\lambda_1}{(\lambda_1 + \lambda_2)^2}$$
  2. 令$R_n$为$X_1, \ldots, X_n$中最小值的索引，则$R_n$服从离散分布：
    $$ P(R_n = i) = \frac{\lambda_i}{\sum_{j=1}^n \lambda_j} $$
    - 证明思路：$P(R_n = i) = P(X_i < \min X_j, j \neq i)$，利用指数分布的性质进行计算。
  

## Poisson Process 泊松过程

- 泊松过程的两个定义：
  1. **增量定义**：对于任意$t, s \geq 0$，增量$N(t+s) - N(t)$服从参数为$\lambda s$的Poisson分布，并且增量之间相互独立。其中，时间参数是连续的，状态空间是离散的。
    - 独立增量 (Independent Increments)：对于任意的$0 \leq t_1 < t_2 < \ldots < t_n$，增量$N(t_2) - N(t_1), N(t_3) - N(t_2), \ldots, N(t_n) - N(t_{n-1})$相互独立。
    - 平稳增量 (Stationary Increments)：对于任意的$s, t \geq 0$，增量$N(t+s) - N(t)$的分布仅依赖于$s$，而与$t$无关，且服从参数为$\lambda s$的Poisson分布。
    - 由此可得：$P(N(t) = k) = e^{-\lambda t} \frac{(\lambda t)^k}{k!}$，$k = 0, 1, 2, \ldots$
  2. **间隔时间定义**：事件发生的时间间隔$X_i$独立且服从参数为$\lambda$的指数分布。即$X_i \sim \text{Exp}(\lambda)$，且$N(t) = \max\{n: S_n \leq t\}$，其中$S_n = \sum_{i=1}^n X_i$。

- 泊松过程的性质：
  - 回顾：小$o$符号的定义：对于函数$f(h)$，如果$\lim_{h \to 0} \frac{f(h)}{h} = 0$，则称$f(h)$为$o(h)$。
  - 令$N_h$为在时间间隔$h$内发生的事件数，其中$h \sim 0$。则：
    - $P(N_h = 0) = 1 - \lambda h + o(h)$
    - $P(N_h = 1) = \lambda h + o(h)$
    - $P(N_h \geq 2) = o(h)$
- 令$X_1, \ldots, X_n \sim \text{i.i.d. Bernoulli}(p)$，则$N = \sum_{i=1}^n X_i \sim \text{Binomial}(n, p)$。当$n \to \infty$且$p \to 0$时，若保持$np = \lambda$不变，则$N$收敛于参数为$\lambda$的Poisson分布，即$N \sim \text{Poisson}(\lambda)$。这称为Poisson极限定理。可通过MGF证明。

- 证明两个定义的等价性：使用h-法（h-method）证明增量定义蕴含间隔时间定义。即在时间$(s_i + h_i, s_{i+1})$内未发生，而在时间$(s_{i+1}, s_{i+1} + h_{i+1})$内发生一次。将所有这些概率相乘并取极限，得到：$$f(s_1, \dots, s_n) = \lambda^n e^{-\lambda s_n} \mathbf{1}_{\{0 < s_1 < s_2 < \ldots < s_n\}}$$
  - 回顾：设$f_{X_1, X_2}(x_1, x_2)$为二维随机变量$(X_1, X_2)$的联合pdf，且$g_1(x_1, x_2)$和$g_2(x_1, x_2)$是两个可微函数，定义新的随机变量$Y_1 = g_1(X_1, X_2)$和$Y_2 = g_2(X_1, X_2)$。如果存在反函数$x_1 = h_1(y_1, y_2)$和$x_2 = h_2(y_1, y_2)$，则$(Y_1, Y_2)$的联合pdf为
  $$ f_{Y_1, Y_2}(y_1, y_2) = f_{X_1, X_2}(h_1(y_1, y_2), h_2(y_1, y_2)) \cdot \left| J \right| $$
  其中$J$为Jacobian行列式。
  - 这里，由于$T_1 = X_1$，$T_2 = X_1 + X_2$，$\cdots$，$T_n = X_1 + X_2 + \cdots + X_n$，显然Jacobian行列式为1，因此联合pdf为：$$g(t_1, \dots, t_n) = \lambda^n e^{-\lambda(t_1 + \dots + t_n)} \mathbf{1}_{\{t_1 > 0, \dots, t_n > 0\}} = \prod_{j=1}^n \lambda e^{-\lambda t_j} \mathbf{1}_{\{t_j > 0\}}$$
  - 这和间隔时间定义是一致的。

### Conditional Distribution of Interval Times 条件分布

- 给定条件：在时间$[0, t]$内发生了$1$次事件，即$N(t) = 1$。则在该条件下，事件发生的时间$T_1$服从均匀分布，即$T_1 | N(t) = 1 \sim \text{Uniform}(0, t)$。
  - 证明：使用h-method，考虑在时间$(0, s)$内未发生，在$(s, s+h)$内发生一次，在$(s+h, t)$内未发生。将这些概率相乘并取极限，得到：$$P(T_1 \leq s | N(t) = 1) = \frac{s}{t}$$
- 推广到发生$n$次事件的情况：在时间$[0, t]$内发生了$n$次事件，即$N(t) = n$。则在该条件下，事件发生的时间$(T_1, T_2, \ldots, T_n)$的联合分布与$n$个独立且均匀分布在$(0, t)$上的随机变量的顺序统计量相同。即：$$f(s_1, \dots, s_n | N_t = n) = \frac{n!}{t^n} \mathbf{1}_{\{0 < s_1 < \dots < s_n < t\}}$$
  - 证明：使用h-method，考虑在时间$(0, s_1)$内未发生，在$(s_1, s_1+h_1)$内发生一次，在$(s_1+h_1, s_2)$内未发生，在$(s_2, s_2+h_2)$内发生一次，$\ldots$，在$(s_n, s_n+h_n)$内发生一次，在$(s_n+h_n, t)$内未发生。将这些概率相乘并取极限，得到：$$P(T_1 \leq s_1, T_2 \leq s_2, \ldots, T_n \leq s_n | N(t) = n) = \frac{n!}{t^n} \int_0^{s_1} \int_{s_1}^{s_2} \cdots \int_{s_{n-1}}^{s_n} dx_1 dx_2 \cdots dx_n$$
  - 这和$n$个独立且均匀分布在$(0, t)$上的随机变量的顺序统计量的联合分布是一致的。

## Interarrival Times 到达时间间隔

- 定义：在泊松过程中，事件发生的时间间隔$X_i$独立且服从参数为$\lambda$的指数分布。即$X_i \sim \text{Exp}(\lambda)$。令$S_n = \sum_{i=1}^n X_i$表示第$n$次事件发生的时间，则$S_n$服从参数为$(n, \lambda)$的Gamma分布。即$S_n \sim \text{Gamma}(n, \lambda)$。
  - 证明：使用卷积的方法，计算$S_2 = X_1 + X_2$的概率密度函数：
    $$ f_{S_2}(t) = \int_0^t f_{X_1}(x) f_{X_2}(t - x) dx = \int_0^t \lambda e^{-\lambda x} \lambda e^{-\lambda (t - x)} dx = \lambda^2 t e^{-\lambda t} $$
    - 这正是参数为$(2, \lambda)$的Gamma分布的概率密度函数。通过数学归纳法，可以推广到任意$n$，得到：
      $$ f_{S_n}(t) = \frac{\lambda^n t^{n-1} e^{-\lambda t}}{(n-1)!} $$
- 联合分布：对于$n$次事件发生的时间$(S_1, S_2, \ldots, S_n)$，其联合概率密度函数为：
  $$ f_{S_1, S_2, \ldots, S_n}(s_1, s_2, \ldots, s_n) = \lambda^n e^{-\lambda s_n} \mathbf{1}_{\{0 < s_1 < s_2 < \ldots < s_n\}} $$
  - 证明：使用h-method，考虑在时间$(0, s_1)$内未发生，在$(s_1, s_1+h_1)$内发生一次，在$(s_1+h_1, s_2)$内未发生，在$(s_2, s_2+h_2)$内发生一次，$\ldots$，在$(s_n, s_n+h_n)$内发生一次。在$(s_n+h_n, \infty)$内未发生。将这些概率相乘并取极限，得到上述联合概率密度函数。
- 条件分布：给定条件$S_n = t$，则在该条件下，事件发生的时间$(S_1, S_2, \ldots, S_{n-1})$的联合分布与$n-1$个独立且均匀分布在$(0, t)$上的随机变量的顺序统计量相同。即：
  $$ f_{S_1, S_2, \ldots, S_{n-1} | S_n = t}(s_1, s_2, \ldots, s_{n-1}) = \frac{(n-1)!}{t^{n-1}} \mathbf{1}_{\{0 < s_1 < s_2 < \ldots < s_{n-1} < t\}} $$
  - 证明：类似地，使用h-method，考虑在时间$(0, s_1)$内未发生，在$(s_1, s_1+h_1)$内发生一次，在$(s_1+h_1, s_2)$内未发生，在$(s_2, s_2+h_2)$内发生一次，$\ldots$，在$(s_{n-1}, s_{n-1}+h_{n-1})$内发生一次，在$(s_{n-1}+h_{n-1}, t)$内未发生。将这些概率相乘并取极限，得到上述条件联合概率密度函数。

## Further Properties of Poisson Process 泊松过程的进一步性质

### Coloring Theorem 着色定理

- 定义：考虑一个参数为$\lambda$的泊松过程$N(t)$，将每个事件以概率$p$标记为“红色”，以概率$1-p$标记为“蓝色”，且标记是独立的。则红色事件构成一个参数为$p\lambda$的泊松过程，蓝色事件构成一个参数为$(1-p)\lambda$的泊松过程，且两个过程相互独立。
  - 证明：使用增量定义，考虑时间间隔$h$内的事件数$N_h$。则红色事件数$N_h^R$服从参数为$p\lambda h$的Poisson分布，蓝色事件数$N_h^B$服从参数为$(1-p)\lambda h$的Poisson分布。由于标记是独立的，红色和蓝色事件数相互独立。因此，红色和蓝色事件分别构成参数为$p\lambda$和$(1-p)\lambda$的泊松过程，且相互独立。

### Merging Theorem 合并定理

- 定义：考虑两个独立的泊松过程$N_1(t)$和$N_2(t)$，其参数分别为$\lambda_1$和$\lambda_2$。则合并后的过程$N(t) = N_1(t) + N_2(t)$构成一个参数为$\lambda_1 + \lambda_2$的泊松过程。
  - 证明：使用增量定义，考虑时间间隔$h$内的事件数$N_h = N_{1,h} + N_{2,h}$。由于$N_{1,h}$和$N_{2,h}$相互独立，且分别服从参数为$\lambda_1 h$和$\lambda_2 h$的Poisson分布，因此$N_h$服从参数为$(\lambda_1 + \lambda_2) h$的Poisson分布。因此，合并后的过程构成一个参数为$\lambda_1 + \lambda_2$的泊松过程。
- 这个定理和着色定理是互为逆过程。

## Compound Poisson Process 复合泊松过程

- 定义：设$N(t)$为参数为$\lambda$的泊松过程，$\{Y_i\}$为一列独立同分布的随机变量，且与$N(t)$独立。则复合泊松过程定义为：
  $$ S(t) = \sum_{i=1}^{N(t)} Y_i $$
- 从到达时间的角度来看，复合泊松过程就是在每个到达时间点上叠加一个随机变量$Y_i$。
- 由于$N(t) \sim \text{Pois}(\lambda t)$，因此复合泊松过程的分布可以通过条件概率的方法来计算：
  $$ P(S(t) \leq x) = \sum_{n=0}^{\infty} P\left(\sum_{i=1}^n Y_i \leq x\right) P(N(t) = n) $$
- 复合泊松过程的矩母生成函数（MGF）为：
  $$ M_{S(t)}(s) = \mathbb{E}[e^{s S(t)}] = \exp\left(\lambda t (M_Y(s) - 1)\right) $$
  其中$M_Y(s)$为随机变量$Y_i$的矩母生成函数。
- 复合泊松过程的均值和方差为：
  - 均值：$\mathbb{E}[S(t)] = \lambda t \mathbb{E}[Y]$
  - 方差：$\text{Var}(S(t)) = \lambda t \mathbb{E}[Y^2]$

## Non-homogeneous Poisson Process 非齐次泊松过程

- 定义：非齐次泊松过程是指其速率参数$\lambda(t)$是时间的函数，而不是常数。即在时间间隔$[t, t+s]$内，增量$N(t+s) - N(t)$服从参数为$\int_t^{t+s} \lambda(u) du$的Poisson分布，并且增量之间相互独立。
  - 独立增量 (Independent Increments)：对于任意的$0 \leq t_1 < t_2 < \ldots < t_n$，增量$N(t_2) - N(t_1), N(t_3) - N(t_2), \ldots, N(t_n) - N(t_{n-1})$相互独立。
  - 非平稳增量 (Non-stationary Increments)：对于任意的$s, t \geq 0$，增量$N(t+s) - N(t)$的分布依赖于$t$，且服从参数为$\int_t^{t+s} \lambda(u) du$的Poisson分布。
- 由此可得：$P(N(t) = k) = e^{-\Lambda(t)} \frac{(\Lambda(t))^k}{k!}$，其中$\Lambda(t) = \int_0^t \lambda(u) du$，$k = 0, 1, 2, \ldots$