<a href="https://colab.research.google.com/github/tomonari-masada/course2022-stats1/blob/main/MLE_for_binomial_distributions.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# PyTorchによる二項分布の最尤推定

In [None]:
import matplotlib.pyplot as plt
import torch

## PyTorchを使った二項分布の作り方

* 総試行回数と、パラメータを指定。

* まずは$\phi=0$と設定して、100回試行の場合の52という回数の対数尤度を求める。
 * 尤度はほぼゼロになる。つまり、$\phi=0$のとき、52回という回数はほぼありえない、ということ。

In [None]:
phi = torch.tensor([0.])
m = torch.distributions.binomial.Binomial(100, probs=phi)

In [None]:
m.log_prob(torch.tensor([52]))

* 確率の値に直す。

In [None]:
m.log_prob(torch.tensor([52])).exp()

* 次に$\phi=0.5$と設定して、100回試行の場合の52という回数の対数尤度を求める。
 * 尤度は大きくなる。つまり、$\phi=0.5$のときなら、52回という回数はかなりありえる、ということ。

In [None]:
phi = torch.tensor([0.5], requires_grad=True)
m = torch.distributions.binomial.Binomial(100, probs=phi)

In [None]:
m.log_prob(torch.tensor([52]))

In [None]:
m.log_prob(torch.tensor([52])).exp()

In [None]:
x = range(101)
plt.plot(x, m.log_prob(torch.tensor(x)).exp().detach().numpy(), '.')
plt.title("N=100, phi_head=0.5");

## 対数尤度最大化をPyTorchで実装

* 二項分布のパラメータは、微分可能なテンソルとして作っておく。
* そして、そのパラメータを更新するoptimizerを作る。

In [None]:
phi = torch.tensor([0.132], requires_grad=True) # 適当に初期化
optimizer = torch.optim.SGD([phi], lr=0.001)

* negative log likelihoodを最小化する。
 * PyTorchでは最小化の計算しかできないので、最大化したいときは、マイナスを付けたものを最小化する。

In [None]:
for i in range(30):
  optimizer.zero_grad()
  m = torch.distributions.binomial.Binomial(100, probs=phi)
  loss = - m.log_prob(torch.tensor([52]))
  loss.backward()
  optimizer.step()
  print(f"{i+1} | {phi.item():.4f}")

## おまけ：対数尤度最大化をTensorFlowで実装

In [None]:
import tensorflow as tf
import tensorflow_probability as tfp

In [None]:
phi = tf.Variable(0.132) # 適当に初期化
opt = tf.keras.optimizers.Adam(learning_rate=0.01)

In [None]:
m = tfp.distributions.Binomial(100, probs=phi)
for i in range(200):
  loss = lambda: - m.log_prob(52)
  opt.minimize(loss, var_list=[phi])
  print(f"{i+1} | {phi.numpy():.4f}")