## Maximum Likelihood for Bernoulli with PyTorch

Let's say that we have 100 samples from a Bernoulli distribution:

In [1]:
import torch
import numpy as np

from torch.autograd import Variable

sample = np.array([ 1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  1.,  1.,
        1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  0.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,  0.,
        0.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  0.,  0.,  1.,  1.,  1.,
        0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  1.,  1.,  1.,
        1.,  1.,  0.,  0.,  1.,  1.,  0.,  1.,  1.,  0.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  0.,  1.,  1.,  1.,  1.,  0.,  0.,  1.,
        0.,  1.,  1.,  1.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,
        1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  0.,  0.,  1.,  1.,  1.,
        1.,  0.,  1.,  0.,  1.])



In [2]:
np.mean(sample)

0.725

Let's now define the probability `p` of generating 1, and put the sample into a PyTorch `Variable`:

In [3]:
x = Variable(torch.from_numpy(sample)).type(torch.FloatTensor)
p = Variable(torch.rand(1), requires_grad=True)

We are ready to learn the model using maximum likelihood:

In [4]:
learning_rate = 0.00002
for t in range(1000):
    NLL = -torch.sum(torch.log(x*p + (1-x)*(1-p)) )
    NLL.backward()

    if t % 100 == 0:
        print("loglik  =", NLL.data.numpy(), "p =", p.data.numpy(), "dL/dp = ", p.grad.data.numpy())

    
    p.data -= learning_rate * p.grad.data
    p.grad.data.zero_()



loglik  = [318.7865] p = [0.11629409] dL/dp =  [-1184.6011]
loglik  = [122.221664] p = [0.6235385] dL/dp =  [-86.4465]
loglik  = [117.75712] p = [0.70913595] dL/dp =  [-15.382416]
loglik  = [117.63608] p = [0.72284395] dL/dp =  [-2.1524048]
loglik  = [117.6338] p = [0.7247146] dL/dp =  [-0.2861328]
loglik  = [117.63376] p = [0.7249623] dL/dp =  [-0.03782654]
loglik  = [117.63375] p = [0.724995] dL/dp =  [-0.00500488]
loglik  = [117.63376] p = [0.72499853] dL/dp =  [-0.00146484]
loglik  = [117.63376] p = [0.72499853] dL/dp =  [-0.00146484]
loglik  = [117.63376] p = [0.72499853] dL/dp =  [-0.00146484]
