# 確率モデル

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import pandas as pd
import scipy as sp

# 日本語フォントの設定（Mac:'Hiragino Sans', Windows:'MS Gothic'）
plt.rcParams['font.family'] = 'Hiragino Sans'

## 確率モデルとは？

確率モデルとは，数理モデルの変数が確率変数となっているモデルであり，自然現象から社会現象まで様々な現象のモデル化に用いられる．
例えば，コイン投げは，表と裏が一定の確率で出るという数理モデルで記述することができ，最も基本的な確率モデルである．
また，株価の変動は，毎時刻ごとに株価の上がり幅と下がり幅が確率的に決まるようなモデル（ランダムウォーク）によって記述することができる．

## 乱数の生成

本節の内容は，文献{cite}`Odaka2018` を参考にしている．

ある数列が与えられたとき，数の並び方に規則性や周期性がない場合，この数列の各要素を**乱数**と呼ぶ．
乱数を生成するにはいくつかの方法がある．
例えば，サイコロを振って出た目は乱数の一種である．
また，カオスや量子力学的な性質を利用した乱数は**物理乱数**と呼ばれる．

一方，コンピュータ上で乱数を使ったシミュレーションを行うためには，アルゴリズムにしたがって乱数を生成する．
この乱数は，完全にランダムな値ではなく，アルゴリズムが分かれば値を予測することができてしまうため，**疑似乱数**と呼ばれる．
しかし，疑似乱数でもアルゴリズムを工夫すれば，十分にランダムに見える値を生成することができるため，乱数として扱うことができる．

### 一様乱数

乱数の中でも，ある範囲の値が同じ確率で出現するような乱数を**一様乱数**と呼ぶ．
一様乱数は，乱数の中でも最も基本的な乱数であり，様々な確率モデルの構築に用いられる．

#### 線形合同法

一様乱数を生成するアルゴリズムの中で，最も基本的なものが**線形合同法**である．
線形合同法は，いくつかの問題があるため，現在ではあまり使われていないが，乱数の生成アルゴリズムの基礎を理解するために，ここで紹介する．

線形合同法のアルゴリズムは以下の通りである．

```{admonition} 線形合同法のアルゴリズム
1. 以下の条件を満たす整数 $ a, b, M $ を決める：
   
   $$
    0 < a < M\\
    0 \leq b < M
   $$
   
2. 乱数列の初期値 $ x_0 $ を決める（乱数の**シード**と呼ぶ）．
3. 以下の漸化式によって乱数列 $ \{x_n\} $ を生成する：
    
    $$
    x_{n+1} = (ax_{n} + b) \% M
    $$
    
    ※ $ \% $ は剰余を表す．

```

以上のアルゴリズムを用いると，$ 0\sim M-1 $ の範囲の乱数を得ることができる．
また，$ a, b, M $ がいくつかの条件を満たすと，最大周期が $ M $ となることが知られている．
よって，良い乱数を生成するためには，条件を満たした上で $ M $ が大きい方が良い．
例えば，$ M=2^{32} $ の場合には，$ a=1664525,\ b=1013904223 $ が良い値とされている．

これをPythonで実装すると以下のようになる．

In [7]:
a, b = 1664525, 1013904223
M = 2**32
seed = 7

x = np.array([seed])
for i in range(50):
    x = np.append(x, (a*x[i] + b) % M)

In [10]:
# [0, 1)の一様乱数
x_2 = x/M
x_2

array([1.62981451e-09, 2.38780840e-01, 9.13493265e-01, 6.12491666e-01,
       9.26981459e-01, 4.93411752e-02, 8.55783557e-01, 3.60985156e-01,
       5.31063413e-02, 6.87840362e-02, 9.83937001e-01, 9.72805032e-01,
       5.31250787e-01, 4.51857624e-01, 5.47839395e-01, 6.05035996e-01,
       7.77417307e-01, 7.79812368e-01, 4.18077372e-01, 4.74107998e-01,
       8.52143480e-01, 3.62463913e-01, 4.81507250e-01, 9.19412524e-02,
       7.49137200e-01, 8.34201422e-01, 3.58112941e-01, 1.78849068e-01,
       9.81763498e-01, 1.22066186e-01, 4.54777922e-01, 4.56323499e-01,
       1.08007917e-01, 1.14025554e-01, 6.21596273e-01, 7.72828794e-01,
       8.45414575e-02, 6.05567168e-01, 9.26347775e-01, 2.65727673e-01,
       5.90512078e-01, 3.52738515e-01, 3.12762065e-01, 5.12465403e-01,
       7.11687763e-01, 3.09756791e-01, 1.58196866e-01, 8.74136699e-01,
       6.25576151e-01, 3.79314075e-01, 9.96355266e-01])

In [9]:
# [-1, 1)の一様乱数
x_3 = 2*x - 1
x_3

array([        13, 2051111795, 7846847393, 5261263351, 7962710101,
        423837467, 7351124777, 3100838879,  456179997,  590850371,
       8451954481, 8356331591, 4563409509, 3881427435, 4705904569,
       5197219631, 6677963821, 6698537235, 3591257281, 4072556695,
       7319856757, 3113541307, 4136115785,  789769343, 6435039549,
       7165735651, 3076166737, 1536301799, 8433284229, 1048540555,
       3906512601, 3919789007,  927780941,  979472051, 5339471329,
       6638548791,  726205589, 5201782363, 7957266793, 2282583327,
       5072460125, 3030000771, 2686605681, 4402044295, 6113351333,
       2660790571, 1358900729, 7508777071, 5373658221, 3258283091,
       8558626561])

#### より精度の高い一様乱数 

メルセンヌ・ツイスター法

### 任意の確率分布に従う乱数

#### 逆関数法

累積分布関数が $ F(x) $ であるような確率分布に従う乱数を生成するには，一様乱数 $ U $ に対して，$ F^{-1}(U) $ を計算すれば良い．
これを**逆関数法**と呼ぶ．
逆関数法は，累積分布関数の逆関数が求まるような確率分布であれば，どのような確率分布にも適用することができる．

```{admonition} 逆関数法の証明
:class: dropdown

$ [0, 1] $ の範囲の一様乱数を $ U $ とすると，累積分布関数は

$$
    P(U \leq u) = u
$$

と表される．
ここで，求めたい確率分布の累積分布関数を $ F(x) $ とし，その逆関数が存在するとする．
このとき，上の式は

$$
    P(F^{-1}(U) \leq F^{-1}(u)) = u
$$

と変形できる．
また，$ F^{-1}(u) = x $ と変数変換すると，$ u = F(x) $ である．
よって，

$$
    P(F^{-1}(U) \leq x) = F(x)
$$

以上より，一様乱数 $ U $ に対して，新たな確率変数を $ X=F^{-1}(U) $ と定義すると，$ X $ は求めたい確率分布 $ F(x) $ に従う．
```

#### 複雑な確率分布の場合

正規分布の場合は，中心極限定理（後述）を用いた方法やボックス・ミュラー法が有名．
また，マルコフ連鎖モンテカルロ法（MCMC）は，マルコフ連鎖に基づいて任意の確率分布に従う乱数を生成する方法であり，様々な分野で利用されている．

## 大数の法則と中心極限定理

### ベルヌーイ試行

### 二項分布

### 大数の法則

### 中心極限定理

## ランダムウォーク