## Maximum Likelihood for Bernoulli with PyTorch

Let's say that we have 100 samples from a Bernoulli distribution:

In [1]:
import torch
import numpy as np

from torch.autograd import Variable

sample = np.array([ 1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  1.,
        1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  0.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,  0.,
        0.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,
        0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,
        1.,  1.,  0.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  0.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.])



In [2]:
np.mean(sample)

0.72499999999999998

Let's now define the probability `p` of generating 1, and put the sample into a PyTorch `Variable`:

In [3]:
x = Variable(torch.from_numpy(sample)).type(torch.FloatTensor)
p = Variable(torch.rand(1), requires_grad=True)

We are ready to learn the model using maximum likelihood:

In [4]:
learning_rate = 0.00002
for t in range(1000):
    NLL = -torch.sum(torch.log(x*p + (1-x)*(1-p)) )
    NLL.backward()

    p.data -= learning_rate * p.grad.data
    p.grad.data.zero_()

    if t % 100 == 0:
        print("loglik  =", NLL.data.numpy(), "p =", p.data.numpy(), "dL/dp = ", p.grad.data.numpy())


loglik  = [ 364.2253418] p = [ 0.11723718] dL/dp =  [ 0.]
loglik  = [ 122.36915588] p = [ 0.62359965] dL/dp =  [ 0.]
loglik  = [ 117.76181793] p = [ 0.70914686] dL/dp =  [ 0.]
loglik  = [ 117.63616943] p = [ 0.72284538] dL/dp =  [ 0.]
loglik  = [ 117.63380432] p = [ 0.72471499] dL/dp =  [ 0.]
loglik  = [ 117.63375092] p = [ 0.72496235] dL/dp =  [ 0.]
loglik  = [ 117.63375854] p = [ 0.72499502] dL/dp =  [ 0.]
loglik  = [ 117.63375854] p = [ 0.72499853] dL/dp =  [ 0.]
loglik  = [ 117.63375854] p = [ 0.72499853] dL/dp =  [ 0.]
loglik  = [ 117.63375854] p = [ 0.72499853] dL/dp =  [ 0.]
