## Maximum Likelihood for Bernoulli with PyTorch

Let's say that we have 100 samples from a Bernoulli distribution:

In [1]:
import torch
import numpy as np

from torch.autograd import Variable

sample = np.array([ 1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  1.,
        1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  0.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,  0.,
        0.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,
        0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,
        1.,  1.,  0.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  0.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.])



In [2]:
np.mean(sample)

0.72499999999999998

Let's now define the probability `p` of generating 1, and put the sample into a PyTorch `Variable`:

In [3]:
x = Variable(torch.from_numpy(sample), requires_grad=False).type(torch.FloatTensor)
p = Variable(torch.rand(1), requires_grad=True)

We are ready to learn the model using maximum likelihood:

In [4]:
learning_rate = 0.00002
for t in range(1000):
    NLL = -torch.sum(x) * torch.log(p) - torch.sum(1-x) * torch.log(1-p)
    NLL.backward()

    p.data -= learning_rate * p.grad.data
    p.grad.data.zero_()

    if t % 100 == 0:
        print("loglik  =", NLL.data.numpy(), "p =", p.data.numpy(), "dL/dp = ", p.grad.data.numpy())


('loglik  =', array([ 122.3896637], dtype=float32), 'p =', array([ 0.62336957], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.76246643], dtype=float32), 'p =', array([ 0.70910573], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63617706], dtype=float32), 'p =', array([ 0.72283959], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63379669], dtype=float32), 'p =', array([ 0.72471392], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63375092], dtype=float32), 'p =', array([ 0.72496229], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63375854], dtype=float32), 'p =', array([ 0.72499502], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63375854], dtype=float32), 'p =', array([ 0.72499853], dtype=float32), 'dL/dp = ', array([ 0.], dtype=float32))
('loglik  =', array([ 117.63375854]