In [8]:
### author: PyTorch official Tutorial for beginner
### link: https://pytorch.org/tutorials/beginner/nlp/deep_learning_tutorial.html#sphx-glr-beginner-nlp-deep-learning-tutorial-py

In [9]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [10]:
##########################################################################################################################
# toy data
##########################################################################################################################

data = [("me gusta comer en la cafeteria".split(), "SPANISH"),
        ("Give it to me".split(), "ENGLISH"),
        ("No creo que sea una buena idea".split(), "SPANISH"),
        ("No it is not a good idea to get lost at sea".split(), "ENGLISH")]

test_data = [("Yo creo que si".split(), "SPANISH"),
             ("it is lost on me".split(), "ENGLISH")]

In [11]:
##########################################################################################################################
# data pre-processing
##########################################################################################################################
word_to_ix = {}
for sent, _ in data + test_data:
    for word in sent:
        if word not in word_to_ix:
            word_to_ix[word] = len(word_to_ix)
print(word_to_ix)

VOCAB_SIZE = len(word_to_ix)
NUM_LABELS = 2

##########################################################################################################################
# word list to tensor
##########################################################################################################################
def make_bow_vector(sentence, word_to_ix):
    vec = torch.zeros(len(word_to_ix))
    for word in sentence:
        vec[word_to_ix[word]] += 1
    return vec.view(1, -1)


def make_target(label, label_to_ix):
    return torch.LongTensor([label_to_ix[label]])

{'me': 0, 'gusta': 1, 'comer': 2, 'en': 3, 'la': 4, 'cafeteria': 5, 'Give': 6, 'it': 7, 'to': 8, 'No': 9, 'creo': 10, 'que': 11, 'sea': 12, 'una': 13, 'buena': 14, 'idea': 15, 'is': 16, 'not': 17, 'a': 18, 'good': 19, 'get': 20, 'lost': 21, 'at': 22, 'Yo': 23, 'si': 24, 'on': 25}


In [12]:
##########################################################################################################################
# Model
##########################################################################################################################
class BoWClassifier(nn.Module):  # inheriting from nn.Module!

    def __init__(self, num_labels, vocab_size):
        super(BoWClassifier, self).__init__()
        self.linear = nn.Linear(vocab_size, num_labels)

    def forward(self, bow_vec):
        return F.log_softmax(self.linear(bow_vec), dim=1)

In [13]:
##########################################################################################################################
# Train the model
##########################################################################################################################
model = BoWClassifier(NUM_LABELS, VOCAB_SIZE)
label_to_ix = {"SPANISH": 0, "ENGLISH": 1}

loss_function = nn.NLLLoss()
optimizer = optim.SGD(model.parameters(), lr=0.1)

for epoch in range(100):
    count = 0
    for instance, label in data:
        # Step 1. Remember that PyTorch accumulates gradients.
        # We need to clear them out before each instance
        model.zero_grad()

        # Step 2. Make our BOW vector and also we must wrap the target in a
        # Tensor as an integer. For example, if the target is SPANISH, then
        # we wrap the integer 0. The loss function then knows that the 0th
        # element of the log probabilities is the log probability
        # corresponding to SPANISH
        bow_vec = make_bow_vector(instance, word_to_ix)
        target = make_target(label, label_to_ix)

        if epoch == 0:
            print('----------------------------------------------{}------------------------------------------------'.format(count))
            print('input tensor: ', bow_vec)
            print('target tensor: ', target)
            count += 1

        # Step 3. Run our forward pass.
        log_probs = model(bow_vec)

        # Step 4. Compute the loss, gradients, and update the parameters by
        # calling optimizer.step()
        loss = loss_function(log_probs, target)
        loss.backward()
        optimizer.step()


----------------------------------------------0------------------------------------------------
input tensor:  tensor([[1., 1., 1., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0.]])
target tensor:  tensor([0])
----------------------------------------------1------------------------------------------------
input tensor:  tensor([[1., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0.]])
target tensor:  tensor([1])
----------------------------------------------2------------------------------------------------
input tensor:  tensor([[0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 1., 1., 1., 1., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0.]])
target tensor:  tensor([0])
----------------------------------------------3------------------------------------------------
input tensor:  tensor([[0., 0., 0., 0., 0., 0., 0., 1., 1., 1., 0., 0., 1., 0., 0., 1., 1., 1.,
         1., 1., 1.

In [14]:
##########################################################################################################################
# New update: Save the model
##########################################################################################################################
torch.save(model.state_dict(), 'model.pt')

In [15]:
##########################################################################################################################
# New update: Load the model
##########################################################################################################################
model.load_state_dict(torch.load('model.pt'))

<All keys matched successfully>

In [16]:
##########################################################################################################################
# Test the model
##########################################################################################################################

with torch.no_grad():
    count+=1
    for instance, label in test_data:
        bow_vec = make_bow_vector(instance, word_to_ix)

        print('----------------------------------------------{}------------------------------------------------'.format(count))
        print('input tensor: ', bow_vec)
        print('target tensor: ', target)
        count += 1

        log_probs = model(bow_vec)
        print('logit output: ', log_probs)

# Index corresponding to Spanish goes up, English goes down!
# print(next(model.parameters())[:, word_to_ix["creo"]])

----------------------------------------------1------------------------------------------------
input tensor:  tensor([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 1., 1., 0.]])
target tensor:  tensor([1])
logit output:  tensor([[-0.1241, -2.1483]])
----------------------------------------------2------------------------------------------------
input tensor:  tensor([[1., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
         0., 0., 0., 1., 0., 0., 0., 1.]])
target tensor:  tensor([1])
logit output:  tensor([[-2.1241, -0.1273]])
