<a href="https://colab.research.google.com/github/yukinaga/minnano_ai/blob/master/section_1/first_colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


## ポアソン分布


### 概要

- 発生頻度の少ない事象において、単位時間内に発生する回数 $X$ が従う分布 $Po(\lambda)$
- 平均発生回数を $\lambda$ とする
- １日に受信するメール数、１年間に発生する地震回数など
- 二項分布において、試行回数 $n$ が十分に大きく発生確率 $p$ が小さい場合、ポアソン分布 $Po(np)$ に近づく。

### 確率質量関数

$$
  f(x) = \frac{\lambda^x e^{-\lambda}}{x!}
$$


In [7]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson
from ipywidgets import interact


# 確率質量関数
# x: 発生回数
# lambda_: 平均発生回数
def probability_mass_function(x, lambda_):
    return poisson.pmf(x, lambda_)


@interact(lambda_=(0, 20, 1))
def show_pmf(lambda_):
    x = range(100)
    y = probability_mass_function(x, lambda_)
    plt.ylim(0, 0.5)
    plt.bar(x, y)

interactive(children=(IntSlider(value=10, description='lambda_', max=20), Output()), _dom_classes=('widget-int…

### 平均、分散

$$
  \begin{align}
  E[X] &= \lambda \\
  V[X] &= \lambda \\
  \end{align}
$$

### 再生性

$X_1, X_2$がそれぞれポアソン分布に従い、互いに独立な場合、$X_1 + X_2$ も二項分布に従う

$$
  X_1 \sim Po(\lambda_1),  X_2 \sim Po(\lambda_2) \\
  \Leftrightarrow X_1 + X_2\sim Po(\lambda_1 + \lambda_2)
$$


### 二項分布からの近似

試行回数 $n$ が十分に大きく発生確率 $p$ が小さい場合、ポアソン分布 $Po(np)$ に近づく。
$np = \lambda$ とすると、

$$
  \begin{align}
  f(x) &=\displaystyle \lim_{n \to \infty}\frac{n!}{x!(n-x)!} p^x (1-p)^{n-x} \\
       &=\displaystyle \lim_{n \to \infty}\frac{n(n-1)...(n-x+1)}{x!} p^x (1-p)^{n-x} \\
       &\simeq \frac{(np)^x}{x!}(1-p)^{n} \\
       &\simeq \frac{\lambda^x}{x!}\left(1-\frac{\lambda}{n}\right)^{n} \\
       &\simeq \frac{\lambda^x}{x!}e^{-\lambda} \\
  \end{align}
$$

すなわち

$$
 Bin(n,p) \xrightarrow{試行回数を極限} Po(\lambda)
$$


### 指数分布との関係

時間差 $t$ で$\lambda$ 回発生するイベントを考える。単位時間の発生回数 $X$ は $Po(\lambda t)$ に従う。  
$t$ 経過後に次の１回が発生する確率(時間差$t$ の間に発生しない確率)は、

$$
f(1) = 1-e^{-\lambda t} \equiv g(t)
$$

微小時間 $dt$ における確率密度は、

$$
\frac{dg(t)}{dt} = \lambda e^{-\lambda t}
$$

これは指数分布 $Exp(\lambda)$ の確率密度関数に一致する。すなわち

$$
 Po(\lambda t) \xrightarrow{時間を連続化} Exp(\lambda)
$$


### 正規分布との関係

$\displaystyle \lim_{\lambda \to \infty}Po(\lambda) = N(\lambda, \lambda)$ を示す。

ポアソン分布のモーメント母関数は

$$
M_{X}(t) = exp[\lambda e^{\lambda} - \lambda]
$$

$X = \sqrt{\lambda}Z + \lambda$ のように標準化すると、

$$
  \begin{align}
   M_{X}(t) &= \displaystyle \lim_{\lambda \to \infty} M_{\sqrt{\lambda}Z + \lambda}(t)
             = M_{\sqrt{\lambda}Z}(t) M_{\lambda}(t) \\
            &= \displaystyle \lim_{\lambda \to \infty} exp[\lambda e^{t/\sqrt{\lambda}} - \lambda]\cdot exp[-\sqrt{\lambda} t] \\
            &\simeq exp[\lambda (1 + t/\sqrt{\lambda} + t^2/2\lambda) - \lambda]\cdot exp[-\sqrt{\lambda} t] \\
            &= e^{t^2/2}
  \end{align}
$$

標準正規分布のモーメント母関数に一致する。
