<a href="https://colab.research.google.com/github/yukinaga/bayesian_statistics/blob/main/section_4/02_binomial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 二項分布の利用
二項分布を利用してベイズ推定のコードを記述します。   

## 二項分布
「二項分布」は以下の式で表されます。

$$p(x\mid \theta, N) = {}_N C_x\theta^{N}(1-\theta)^{N-x} = \frac{N!}{x!(N-x)!}\theta^{N}(1-\theta)^{N-x}$$

ウェブサイトにおけるボタンのクリック率の例では、$\theta$がボタンのクリック率、$N$がサイトの表示回数、$x$がボタンのクリック数になります。  
以下のコードは、SciPyの`stats`を使い二項分布を表示します。  

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

plt.style.use("seaborn-darkgrid")

def show_binom(x, n, theta):
    plt.bar(
        x,
        stats.binom.pmf(x, n, theta),
        alpha=0.5,
        label=r"$N$:"+str(n)+","+r"$\theta$:"+str(theta)
        )

x = range(40)  # xの範囲は0から39まで

show_binom(x, 10, 0.4)
show_binom(x, 20, 0.4)
show_binom(x, 40, 0.4)
show_binom(x, 60, 0.4)

plt.xlabel(r"$x$")
plt.ylabel(r"$p(x\mid\theta, N)$")
plt.legend()
plt.show()

ウェブサイトにおけるボタンのクリック率の例では、複数回サイトが表示された際のクリック回数は二項分布となります。  
従って、この二項分布を尤度として使うことで複数のベイズ更新を1つにまとめることができます。  

## 事前確率の用意
二項分布を使ってベイズ更新を行いましょう。  
まずは事前確率を用意します。

In [None]:
import numpy as np

thetas = np.linspace(0, 1, 500)  # パラメータ
p = np.ones(len(thetas)) / len(thetas)  # パラメータの確率分布: 一様分布
print(p)

## 尤度を計算する関数
二項分布を利用し尤度を計算する関数を用意します。  
正規化を行うため、定数である${}_N C_x$のコードは省略できます。  

In [None]:
def likehood(x, N):
    return thetas**x * (1-thetas)**(N-x)  # 二項分布、Cの表記は省略

## 事後確率を計算する関数
事後確率を計算するための関数を設定します。

In [None]:
def posterior(x, N, prior):
    lipr = prior * likehood(x, N)  # 事前確率と尤度の積
    return lipr / lipr.sum()  # 正規化

## 二項分布をベイズ更新に利用
二項分布を利用し、一度にベイズ更新を行います。

In [None]:
def show_posterior(clicks, n):
    p = np.ones(len(thetas)) / len(thetas)  # 事前分布
    p = posterior(clicks, n, p)
    plt.plot(thetas, p, label=str(clicks)+"/"+str(n))

show_posterior(1, 5)
show_posterior(2, 20)
show_posterior(5, 100)

plt.xlim(0, 0.5)
plt.xlabel(r"$\theta$")
plt.ylabel(r"$p(\theta)$")
plt.legend()
plt.show()

個々にベイズ更新をした場合と同じグラフの形状を得ることができました。