## 4章　はじめてのベイズ推論実習

### 共通処理

In [None]:
%matplotlib inline
# 日本語化ライブラリ導入
!pip install japanize-matplotlib | tail -n 1

In [None]:
# ライブラリのimport

# NumPy用ライブラリ
import numpy as np

# Matplotlib中のpyplotライブラリのインポート
import matplotlib.pyplot as plt

# matplotlib日本語化対応ライブラリのインポート
import japanize_matplotlib

# pandas用ライブラリ
import pandas as pd

# データフレーム表示用関数
from IPython.display import display

# seaborn
import seaborn as sns

# 表示オプション調整

# NumPy表示形式の設定
np.set_printoptions(precision=3, floatmode='fixed')

# グラフのデフォルトフォント指定
plt.rcParams["font.size"] = 14

# サイズ設定
plt.rcParams['figure.figsize'] = (6, 6)

# 方眼表示ON
plt.rcParams['axes.grid'] = True

# データフレームでの表示精度
pd.options.display.float_format = '{:.3f}'.format

# データフレームですべての項目を表示
pd.set_option("display.max_columns",None)

In [None]:
import pymc as pm
import arviz as az

print(f"Running on PyMC v{pm.__version__}")
print(f"Running on ArViz v{az.__version__}")

### 問題定義
常に確率が一定で、前回の結果が次回に一切影響しない(数学的には「独立な事象」という)くじ引きがあります。  
ある人がこのくじ引きを5回引いたところ、結果は「当たり、はずれ、はずれ、当たり、はずれ」でした。  
一回のくじ引きにあたる確率を $p$ とするとき、この $p$ の値を求めなさい。

### 4.2 最尤推定

####  尤度関数のグラフ

In [None]:
def lh(p):
    return p ** 2 * (1-p) ** 3

# グラフ描画用x座標の定義
# 0.0 < x < 1.0
p = np.arange(0.0, 1.0, 0.01)

# グラフ描画
plt.rcParams['figure.figsize'] = (6, 4)
plt.plot(p, lh(p))
plt.xlabel('p(確率値)')
plt.ylabel('尤度')
plt.title(f'尤度関数');

#### PyTorchで解く

In [None]:
import torch # ライブラリインポート

def log_lh(p): # 対数尤度関数
    return (2 * torch.log(p) + 3 * torch.log(1-p))

num_epochs = 40 # 繰り返し回数
lr = 0.01           # 学習率

# パラメータ初期値 (p=0.1)
p = torch.tensor(0.1, dtype=torch.float32, requires_grad=True)

logs = np.zeros((0,3))
for epoch in range(num_epochs):
    loss = -log_lh(p)       # 損失計算
    loss.backward()         # 勾配計算
    with torch.no_grad():
        p -= lr * p.grad    # パラメータ修正
        p.grad.zero_()      # 勾配値の初期化
    log = np.array([epoch, p.item(), loss.item()]).reshape(1,-1)
    logs = np.vstack([logs, log])

In [None]:
plt.rcParams['figure.figsize'] = (8, 4)
fig, axes = plt.subplots(1, 2)
axes[0].plot(logs[:,0], logs[:,1])
axes[0].set_title('p(確率値)')
axes[1].plot(logs[:,0], logs[:,2])
axes[1].set_title('loss(損失)')
plt.tight_layout();

### 4.3 ベイズ推論(確率モデル定義)

#### データ(観測値)準備

In [None]:
X = np.array([1, 0, 0, 1, 0])
print(X)

#### 確率モデル定義

In [None]:
# コンテキスト定義
model1 = pm.Model()

with model1:
    # pm.Uniform: 一様分布
    p = pm.Uniform('p', lower=0.0, upper=1.0)

    # pm.Bernoulli ベルヌーイ分布
    X_obs = pm.Bernoulli('X_obs', p=p, observed=X)

#### 確率モデルの可視化

In [None]:
g = pm.model_to_graphviz(model1)
display(g)

### 4.4 ベイズ推論(サンプリング)

#### パラメータ値を明示的に設定してサンプリング

In [None]:
with model1:
    idata1_1 = pm.sample(
        # 乱数系列の数(デフォルト2)
        chains=3,
        # 捨てるサンプル数(デフォルト1000)
        tune=2000,
        # 取得するサンプル数(デフォルト1000)
        draws=2000,
        random_seed=42)

#### すべてデフォルト値でサンプリング

In [None]:
with model1:
    idata1_2 = pm.sample(random_seed=42)

### 4.5 ベイズ推論( 結果分析)

#### plot_trace 関数呼び出し

In [None]:
axes = az.plot_trace(idata1_2, compact=False)
plt.tight_layout();

#### plot_posteror関数呼び出し

In [None]:
plt.rcParams['figure.figsize'] = (6, 6)
ax = az.plot_posterior(idata1_2)
ax.set_xlim(0, 1)
ax.set_title('ベイズ推論結果　初期版');

#### summary関数呼び出し

In [None]:
summary1_2= az.summary(idata1_2)
display(summary1_2)

### 4.6 ベイズ推論(二項分布バージョン)

#### 確率モデル定義　二項分布バージョン

In [None]:
# コンテキスト定義
model2 = pm.Model()

with model2:
    # pm.Uniform: 一様分布
    p = pm.Uniform('p', lower=0.0, upper=1.0)

    # pm.Binomial:  二項分布
    # p: 成功確率
    # n: 試行数
    X_obs = pm.Binomial('X_obs', p=p, n=5, observed=2)

####  二項分布バージョンの確率モデル可視化

In [None]:
# モデル構造可視化
g = pm.model_to_graphviz(model2)
display(g)

#### サンプリング

In [None]:
with model2:
    idata2 = pm.sample(random_seed=42)

#### 結果分析

##### plot_trace関数呼び出し

In [None]:
axes = az.plot_trace(idata2, compact=False)
plt.tight_layout();

##### plot_posteror関数呼び出し

In [None]:
plt.rcParams['figure.figsize'] = (6, 6)
ax = az.plot_posterior(idata2)
ax.set_xlim(0, 1)
ax.set_title('ベイズ推論結果　二項分布版');

##### summary関数呼び出し

In [None]:
summary2 = az.summary(idata2)
display(summary2)

### 4.7 ベイズ推論(試行数を増やす)

#### 確率モデル定義

In [None]:
# コンテキスト定義
model3 = pm.Model()

with model3:
    # pm.Uniform: 一様分布
    p = pm.Uniform('p', lower=0.0, upper=1.0)

    # pm.Binomial:  二項分布
    # p: 成功確率
    # n: 試行数
    X_obs = pm.Binomial('X_obs', p=p, n=50, observed=20)

#### 確率モデル可視化

In [None]:
g = pm.model_to_graphviz(model3)
display(g)

#### サンプリング

In [None]:
# サンプリング
with model3:
    idata3 = pm.sample(random_seed=42)

#### 結果分析

##### plot_trace関数呼び出し

In [None]:
axes = az.plot_trace(idata3, compact=False)
plt.tight_layout();

##### plot_posterior関数呼び出し

In [None]:
plt.rcParams['figure.figsize'] = (6, 6)
ax = az.plot_posterior(idata3)
ax.set_xlim(0, 1)
ax.set_title('試行回数を増やす(n=50)');

##### summary関数呼び出し

In [None]:
summary3 = az.summary(idata3)
display(summary3)

### 4.8 事前分布を変更する


In [None]:
# コンテキスト定義
model4 = pm.Model()

with model4:
    # モデル定義

    # 一様分布のパラメータを変更
    p = pm.Uniform('p', lower=0.1, upper=0.9)

    # 5回中2回あたりという観測値はそのまま
    X_obs = pm.Binomial('X_obs', p=p, n=5, observed=2)

    # サンプル値取得
    idata4 = pm.sample(random_seed=42)

In [None]:
plt.rcParams['figure.figsize'] = (6, 6)
# 事後分布の可視化
ax = az.plot_posterior(idata4)
ax.set_title('事前分布変更版　[0.1, 0.9]')
ax.set_xlim(0, 1)

# サンプル値の集計
summary4 = az.summary(idata4)
display(summary4)

### 4.9 ベータ分布との比較

#### ベータ分布とベイズ推論結果の重ね描き

In [None]:
# 真のベータ関数の定義
from scipy import stats
alpha = 20 + 1
beta = 30 + 1
true_beta = stats.beta(alpha, beta)

plt.rcParams['figure.figsize'] = (6, 6)
# ベイズ推論結果の可視化
# idata3は4.7節で計算した結果を利用
ax = az.plot_posterior(idata3)
ax.lines[0].set_label('ベイズ推論結果')

# 真のベータ関数の可視化
x = np.linspace(*ax.get_xlim())
ax.plot(x, true_beta.pdf(x), color='orange', label='真値')
ax.legend(loc='center right');

### コラム ArviZのFAQ

#### plot_posterior関数でyスケールを表示

In [None]:
plt.rcParams['figure.figsize'] = (6, 6)
ax = az.plot_posterior(idata1_2)

# y軸の線の表示
ax.spines['left'].set_visible(True)

# y軸ラベル表示
ax.set_ylabel("Density")

# y軸のティックの位置を自動的に決定
from matplotlib.ticker import AutoLocator
ax.yaxis.set_major_locator(AutoLocator())

ax.set_xlim(0, 1)
ax.set_title('ベイズ推論結果　 y軸スケール表示版');

#### plot_trace関数グラフでタイトルを変更

In [None]:
axes = az.plot_trace(idata1_2, compact=False)
plt.tight_layout()
axes[0,1].set_title('グラフタイトルの変更');

#### バージョンの確認

In [None]:
!pip install watermark | tail -n 1
%load_ext watermark
%watermark --iversions