# Import libraries

In [1]:
import random
import os
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from tqdm import trange
from torch.autograd import Variable
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from nltk.tokenize import word_tokenize
import gensim.downloader

from seqeval.scheme import IOB1

In [2]:
word2vec_goog1e_news: gensim.models.keyedvectors.KeyedVectors = gensim.downloader.load('word2vec-google-news-300')
word2vec_goog1e_news.add_vector("<pad>", np.zeros(300))
pad_index = word2vec_goog1e_news.key_to_index["<pad>"]
embedding_weights = torch.FloatTensor(word2vec_goog1e_news.vectors)
vocab = word2vec_goog1e_news.key_to_index



In [3]:
device = torch.device(torch.cuda.current_device() if torch.cuda.is_available() else "cpu")
print(f"Using: {device}")

Using: cpu


# Import Dataset

In [4]:
def tokenize_pd_series_to_lsit(list_of_text):
    tokenized = []
    for sentence in list_of_text:
        tokenized.append(word_tokenize(sentence.lower()))
    return tokenized

def format_label(label):
    return torch.unsqueeze(torch.tensor(label.to_list()), axis=1).tolist()

def indexify(data):
    setences = []
    for sentence in data:
        s = [vocab[token] if token in vocab
            else vocab['UNK']
            for token in sentence]
        setences.append(s)
    return setences


In [5]:
training_data = pd.read_csv(filepath_or_buffer="TREC_dataset/modified_training_data.csv", sep=",") 
test_data = pd.read_csv(filepath_or_buffer="TREC_dataset/modified_test_data.csv", sep=",")

X = training_data["text"]
y = training_data["label-coarse"]
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=500)

X_test = test_data["text"]
y_test = test_data["label-coarse"]

X_train_lst = X_train.to_list()
X_val_lst = X_val.to_list()
X_test_lst = X_test.to_list()

X_train_tokenized = tokenize_pd_series_to_lsit(X_train_lst)
X_val_tokenized = tokenize_pd_series_to_lsit(X_val_lst)
X_test_tokenized = tokenize_pd_series_to_lsit(X_test_lst)

no_of_labels = 5

In [6]:
X_train_tokenized_indexified = indexify(X_train_tokenized)
X_val_tokenized_indexified = indexify(X_val_tokenized)
X_test_tokenized_indexified = indexify(X_test_tokenized)

y_train_formatted = format_label(y_train)
y_val_formatted = format_label(y_val)
y_test_formatted = format_label(y_test)

In [7]:
def data_iterator(sentences, labels, total_size: int, batch_size: int, shuffle: bool=False):
    # make a list that decides the order in which we go over the data- this avoids explicit shuffling of data
    order = list(range(total_size))
    if shuffle:
        random.seed(230)
        random.shuffle(order)

    # one pass over data
    for i in range((total_size+1)//batch_size):
        # fetch sentences and tags
        batch_sentences = [sentences[idx] for idx in order[i*batch_size:(i+1)*batch_size]]
        batch_tags = [labels[idx] for idx in order[i*batch_size:(i+1)*batch_size]]

        # compute length of longest sentence in batch
        batch_max_len = max([len(s) for s in batch_sentences])

        # prepare a numpy array with the data, initialising the data with pad_ind and all labels with -1
        # initialising labels to -1 differentiates tokens with tags from PADding tokens
        batch_data = vocab['<pad>']*np.ones((len(batch_sentences), batch_max_len))
        batch_labels = np.array(batch_tags).squeeze()

        # copy the data to the numpy array
        for j in range(len(batch_sentences)):
            cur_len = len(batch_sentences[j])
            batch_data[j][:cur_len] = batch_sentences[j]

        # since all data are indices, we convert them to torch LongTensors
        batch_data, batch_labels = torch.LongTensor(batch_data), torch.LongTensor(batch_labels)
        # convert them to Variables to record operations in the computational graph
        batch_data, batch_labels = Variable(batch_data), Variable(batch_labels)

        yield batch_data, batch_labels, batch_sentences

In [8]:
from torch.nn.utils.rnn import pack_padded_sequence, pad_packed_sequence
class Net(nn.Module):
    """
    This is the standard way to define your own network in PyTorch. You typically choose the components
    (e.g. LSTMs, linear layers etc.) of your network in the __init__ function. You then apply these layers
    on the input step-by-step in the forward function. You can use torch.nn.functional to apply functions
    such as F.relu, F.sigmoid, F.softmax. Be careful to ensure your dimensions are correct after each step.

    You are encouraged to have a look at the network in pytorch/vision/model/net.py to get a better sense of how
    you can go about defining your own network.

    The documentation for all the various components available to you is here: http://pytorch.org/docs/master/nn.html
    """

    def __init__(self, embedding_weights, embedding_dim, lstm_hidden_dim, number_of_tags):
        """
        We define an recurrent network that predicts the NER tags for each token in the sentence. The components
        required are:

        - an embedding layer: this layer maps each index in range(params.vocab_size) to a params.embedding_dim vector
        - lstm: applying the LSTM on the sequential input returns an output for each token in the sentence
        - fc: a fully connected layer that converts the LSTM output for each token to a distribution over NER tags

        Args:
            params: (Params) contains vocab_size, embedding_dim, lstm_hidden_dim
        """
        super(Net, self).__init__()

        # the embedding takes as input the vocab_size and the embedding_dim
        # self.embedding = nn.Embedding(vocab_size, embedding_dim)
        self.embedding = nn.Embedding.from_pretrained(embedding_weights, padding_idx=pad_index)

        # the LSTM takes as input the size of its input (embedding_dim), its hidden size
        # for more details on how to use it, check out the documentation
        self.lstm = nn.LSTM(embedding_dim,
                            lstm_hidden_dim, batch_first=True)

        # the fully connected layer transforms the output to give the final output layer
        self.fc = nn.Linear(lstm_hidden_dim, number_of_tags)

    def forward(self, s, lengths):
        """
        Args:
            s: (Variable) contains a batch of sentences, of dimension batch_size x seq_len.
            lengths: (list) contains the original lengths of the sequences in the batch.

        Returns:
            out: (Variable) dimension batch_size*seq_len x num_tags with the log probabilities of tokens for each token
                 of each sentence.
        """
        # apply the embedding layer that maps each token to its embedding
        s = self.embedding(s)

        # pack the sequences before feeding them to the LSTM
        packed_input = pack_padded_sequence(s, lengths, batch_first=True, enforce_sorted=False)
        packed_output, _ = self.lstm(packed_input)

        # unpack the sequences after passing through the LSTM
        padded_output, _ = pad_packed_sequence(packed_output, batch_first=True)

        s = torch.mean(padded_output, dim=1)  # mean pooling

        # apply the fully connected layer and obtain the output (before softmax) for each token
        s = self.fc(s)

        # apply log softmax on each token's output
        return F.log_softmax(s, dim=1)

In [9]:
def accuracy(outputs, labels):
    outputs = np.argmax(outputs.cpu().detach().numpy(), axis=1)
    # compare outputs with labels
    labels = labels.squeeze()
    return np.sum([1 if first == second else 0 for first, second in zip(labels, outputs)]) / float(len(labels))

def loss_fn(outputs, labels):
    loss = F.cross_entropy(outputs, labels.squeeze())
    return loss

In [10]:
class RunningAverage:
    """A simple class that maintains the running average of a quantity

    Example:
    ```
    loss_avg = RunningAverage()
    loss_avg.update(2)
    loss_avg.update(4)
    loss_avg() = 3
    ```
    """

    def __init__(self):
        self.steps = 0
        self.total = 0

    def update(self, val):
        self.total += val
        self.steps += 1

    def __call__(self):
        return self.total / float(self.steps)

In [11]:
def train(model, optimizer, loss_fn, data_iterator, num_steps):
    """Train the model on `num_steps` batches

    Args:
        model: (torch.nn.Module) the neural network
        optimizer: (torch.optim) optimizer for parameters of model
        loss_fn: a function that takes batch_output and batch_labels and computes the loss for the batch
        data_iterator: (generator) a generator that generates batches of data and labels
        metrics: (dict) a dictionary of functions that compute a metric using the output and labels of each batch
        params: (Params) hyperparameters
        num_steps: (int) number of batches to train on, each of size params.batch_size
    """

    # set model to training mode
    model.train()

    # summary for current training loop and a running average object for loss
    summ = []
    loss_avg = RunningAverage()

    # Use tqdm for progress bar
    t = trange(num_steps)
    for i in t:
        # fetch the next training batch
        train_batch, labels_batch, _ = next(data_iterator)
        train_batch = train_batch.to(device)
        labels_batch = labels_batch.to(device)
        
        # compute model output and loss
        seq_lengths = torch.LongTensor(list(map(len, train_batch)))
        output_batch = model(train_batch, seq_lengths)
        loss = loss_fn(output_batch, labels_batch)

        # clear previous gradients, compute gradients of all variables wrt loss
        optimizer.zero_grad()
        loss.backward()

        # performs updates using calculated gradients
        optimizer.step()

        # Evaluate summaries only once in a while
        if i % 10 == 0:
            # extract data from torch Variable, move to cpu, convert to numpy arrays
            output_batch = output_batch.data.cpu().numpy()
            labels_batch = labels_batch.data.cpu().numpy()

        # update the average loss
        loss_avg.update(loss.item())
        t.set_postfix(loss='{:05.3f}'.format(loss_avg()))

def evaluate(model, loss_fn, data_iterator, num_steps):
    """Evaluate the model on `num_steps` batches.

    Args:
        model: (torch.nn.Module) the neural network
        loss_fn: a function that takes batch_output and batch_labels and computes the loss for the batch
        data_iterator: (generator) a generator that generates batches of data and labels
        metrics: (dict) a dictionary of functions that compute a metric using the output and labels of each batch
        params: (Params) hyperparameters
        num_steps: (int) number of batches to train on, each of size params.batch_size
    """

    # set model to evaluation mode
    model.eval()

    loss_avg = RunningAverage()
    accuracy_avg = RunningAverage()

    # compute metrics over the dataset
    for _ in range(num_steps):
        # fetch the next evaluation batch
        data_batch, labels_batch, _ = next(data_iterator)
        data_batch = data_batch.to(device)
        labels_batch = labels_batch.to(device)

        # compute model output
        seq_lengths = torch.LongTensor(list(map(len, data_batch)))
        output_batch = model(data_batch, seq_lengths)
        loss = loss_fn(output_batch, labels_batch)
        loss_avg.update(loss.item())
        accuracy_val = accuracy(output_batch, labels_batch)
        accuracy_avg.update(accuracy_val)
        
        # extract data from torch Variable, move to cpu, convert to numpy arrays
        output_batch = output_batch.data.cpu().numpy()
        labels_batch = labels_batch.data.cpu().numpy()

    print(f"{loss_avg()=}")
    print(f"{accuracy_avg()=}")
    
def train_and_evaluate(
        model,
        train_sentences,
        train_labels,
        val_sentences,
        val_labels,
        num_epochs: int,
        batch_size: int,
        optimizer,
        loss_fn
):
    for epoch in range(num_epochs):
        # Run one epoch
        print("Epoch {}/{}".format(epoch + 1, num_epochs))

        # compute number of batches in one epoch (one full pass over the training set)
        num_steps = (len(train_sentences) + 1) // batch_size
        train_data_iterator = data_iterator(
            train_sentences, train_labels, len(train_sentences), batch_size, shuffle=True)
        train(model, optimizer, loss_fn, train_data_iterator,
               num_steps)

        # Evaluate for one epoch on validation set
        num_steps = (len(val_sentences) + 1) // batch_size
        val_data_iterator = data_iterator(
            val_sentences, val_labels, len(val_sentences), batch_size, shuffle=False)
        evaluate(model, loss_fn, val_data_iterator, num_steps)

In [12]:
inv_vocab = {v: k for k, v in vocab.items()}

def id_to_words(sentence):
    new_sentence = [inv_vocab[i] for i in sentence]
    return new_sentence

In [13]:
import warnings
warnings.filterwarnings('ignore')

In [14]:
# manually change vocab size (unique no. of words) and change label size (unique no. of labels) for now
model = Net(embedding_weights, 300, 5, no_of_labels).to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)

# if (os.path.isfile("model_weights2.pth")):
#     model.load_state_dict(torch.load('model_weights2.pth'))
# else:
#     train_and_evaluate(model, X_train_tokenized_indexified , y_train_formatted , X_val_tokenized_indexified  , y_val_formatted, 10, 32, optimizer, loss_fn)
#     torch.save(model.state_dict(), 'model_weights2.pth')

train_and_evaluate(model, X_train_tokenized_indexified , y_train_formatted , X_val_tokenized_indexified  , y_val_formatted, 100, 32, optimizer, loss_fn)
torch.save(model.state_dict(), 'model_weights2.pth')

Epoch 1/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 65.49it/s, loss=1.489]


loss_avg()=1.3948206345240275
accuracy_avg()=0.42083333333333334
Epoch 2/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 87.47it/s, loss=1.259]


loss_avg()=1.141239865620931
accuracy_avg()=0.51875
Epoch 3/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.11it/s, loss=1.102]


loss_avg()=1.0492065787315368
accuracy_avg()=0.5416666666666666
Epoch 4/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 99.53it/s, loss=1.006]


loss_avg()=0.9569729288419088
accuracy_avg()=0.675
Epoch 5/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.04it/s, loss=0.904]


loss_avg()=0.8585570971171061
accuracy_avg()=0.7041666666666667
Epoch 6/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 99.40it/s, loss=0.804]


loss_avg()=0.7772855401039124
accuracy_avg()=0.7291666666666666
Epoch 7/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 95.58it/s, loss=0.738]


loss_avg()=0.7270649552345276
accuracy_avg()=0.7375
Epoch 8/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 88.77it/s, loss=0.684]


loss_avg()=0.6926843384901683
accuracy_avg()=0.7479166666666667
Epoch 9/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 87.42it/s, loss=0.647]


loss_avg()=0.6384107867876688
accuracy_avg()=0.7770833333333333
Epoch 10/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 93.97it/s, loss=0.595]


loss_avg()=0.6106194794178009
accuracy_avg()=0.7958333333333333
Epoch 11/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.45it/s, loss=0.562]


loss_avg()=0.5928643723328908
accuracy_avg()=0.79375
Epoch 12/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.55it/s, loss=0.528]


loss_avg()=0.5779496510823567
accuracy_avg()=0.8104166666666667
Epoch 13/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.18it/s, loss=0.508]


loss_avg()=0.566212675968806
accuracy_avg()=0.81875
Epoch 14/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 98.37it/s, loss=0.486]


loss_avg()=0.5515333771705627
accuracy_avg()=0.825
Epoch 15/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.06it/s, loss=0.464]


loss_avg()=0.542277596394221
accuracy_avg()=0.83125
Epoch 16/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 98.48it/s, loss=0.450]


loss_avg()=0.5334230124950409
accuracy_avg()=0.8333333333333334
Epoch 17/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 99.44it/s, loss=0.437]


loss_avg()=0.5293243845303853
accuracy_avg()=0.8354166666666667
Epoch 18/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 98.64it/s, loss=0.421]


loss_avg()=0.5302097102006277
accuracy_avg()=0.8291666666666667
Epoch 19/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.58it/s, loss=0.415]


loss_avg()=0.5650704165299734
accuracy_avg()=0.8083333333333333
Epoch 20/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 98.82it/s, loss=0.410]


loss_avg()=0.5329657872517903
accuracy_avg()=0.8333333333333334
Epoch 21/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 100.06it/s, loss=0.397]


loss_avg()=0.523949388662974
accuracy_avg()=0.8354166666666667
Epoch 22/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.32it/s, loss=0.391]


loss_avg()=0.5355722059806188
accuracy_avg()=0.8291666666666667
Epoch 23/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 97.95it/s, loss=0.377]


loss_avg()=0.5212397277355194
accuracy_avg()=0.8375
Epoch 24/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 88.33it/s, loss=0.365]


loss_avg()=0.516797615091006
accuracy_avg()=0.8375
Epoch 25/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 88.21it/s, loss=0.356]


loss_avg()=0.5050260424613953
accuracy_avg()=0.8416666666666667
Epoch 26/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 117.39it/s, loss=0.347]


loss_avg()=0.5068714608748753
accuracy_avg()=0.8416666666666667
Epoch 27/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 110.25it/s, loss=0.339]


loss_avg()=0.5160675952831905
accuracy_avg()=0.8333333333333334
Epoch 28/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 95.10it/s, loss=0.334]


loss_avg()=0.5018252362807591
accuracy_avg()=0.8458333333333333
Epoch 29/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 98.15it/s, loss=0.323]


loss_avg()=0.5005502571662267
accuracy_avg()=0.8395833333333333
Epoch 30/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 95.17it/s, loss=0.314]


loss_avg()=0.47843018074830373
accuracy_avg()=0.85625
Epoch 31/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.64it/s, loss=0.308]


loss_avg()=0.4913322369257609
accuracy_avg()=0.8604166666666667
Epoch 32/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 85.99it/s, loss=0.301]


loss_avg()=0.4896799047787984
accuracy_avg()=0.8520833333333333
Epoch 33/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.49it/s, loss=0.292]


loss_avg()=0.4881925076246262
accuracy_avg()=0.8520833333333333
Epoch 34/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 93.39it/s, loss=0.286]


loss_avg()=0.4866226494312286
accuracy_avg()=0.85
Epoch 35/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.49it/s, loss=0.283]


loss_avg()=0.4937994639078776
accuracy_avg()=0.85
Epoch 36/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 102.29it/s, loss=0.286]


loss_avg()=0.4795128176609675
accuracy_avg()=0.8541666666666666
Epoch 37/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 100.32it/s, loss=0.299]


loss_avg()=0.49955918987592063
accuracy_avg()=0.8479166666666667
Epoch 38/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 96.81it/s, loss=0.273]


loss_avg()=0.48973356584707894
accuracy_avg()=0.85625
Epoch 39/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 102.92it/s, loss=0.272]


loss_avg()=0.4958909591039022
accuracy_avg()=0.8520833333333333
Epoch 40/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 102.78it/s, loss=0.276]


loss_avg()=0.5016919900973638
accuracy_avg()=0.85625
Epoch 41/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 100.05it/s, loss=0.257]


loss_avg()=0.5102909982204438
accuracy_avg()=0.8458333333333333
Epoch 42/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 96.98it/s, loss=0.248]


loss_avg()=0.4989118774731954
accuracy_avg()=0.8541666666666666
Epoch 43/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 112.71it/s, loss=0.246]


loss_avg()=0.4846111565828323
accuracy_avg()=0.85
Epoch 44/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 108.56it/s, loss=0.255]


loss_avg()=0.48704952498277027
accuracy_avg()=0.85625
Epoch 45/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 112.88it/s, loss=0.238]


loss_avg()=0.47464048167069756
accuracy_avg()=0.8583333333333333
Epoch 46/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 112.77it/s, loss=0.237]


loss_avg()=0.4723758886257807
accuracy_avg()=0.8625
Epoch 47/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 104.12it/s, loss=0.233]


loss_avg()=0.4701789766550064
accuracy_avg()=0.8625
Epoch 48/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.04it/s, loss=0.245]


loss_avg()=0.469341567158699
accuracy_avg()=0.8708333333333333
Epoch 49/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.12it/s, loss=0.229]


loss_avg()=0.477691106001536
accuracy_avg()=0.8645833333333334
Epoch 50/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 110.62it/s, loss=0.220]


loss_avg()=0.4783967564503352
accuracy_avg()=0.8625
Epoch 51/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 110.95it/s, loss=0.247]


loss_avg()=0.5082133223613103
accuracy_avg()=0.8458333333333333
Epoch 52/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 107.53it/s, loss=0.236]


loss_avg()=0.47930044134457905
accuracy_avg()=0.8625
Epoch 53/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 113.09it/s, loss=0.218]


loss_avg()=0.461451119184494
accuracy_avg()=0.8666666666666667
Epoch 54/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 107.58it/s, loss=0.221]


loss_avg()=0.4686848074197769
accuracy_avg()=0.8625
Epoch 55/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 105.01it/s, loss=0.219]


loss_avg()=0.4734850287437439
accuracy_avg()=0.8645833333333334
Epoch 56/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 111.50it/s, loss=0.208]


loss_avg()=0.46701236367225646
accuracy_avg()=0.85625
Epoch 57/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 107.95it/s, loss=0.208]


loss_avg()=0.46459047198295594
accuracy_avg()=0.8625
Epoch 58/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 114.06it/s, loss=0.208]


loss_avg()=0.4602118631203969
accuracy_avg()=0.8666666666666667
Epoch 59/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 104.89it/s, loss=0.202]


loss_avg()=0.4683213392893473
accuracy_avg()=0.8625
Epoch 60/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 108.63it/s, loss=0.196]


loss_avg()=0.4732991437117259
accuracy_avg()=0.8604166666666667
Epoch 61/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 96.58it/s, loss=0.194]


loss_avg()=0.4764759133259455
accuracy_avg()=0.86875
Epoch 62/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 89.59it/s, loss=0.197]


loss_avg()=0.48737225830554964
accuracy_avg()=0.8604166666666667
Epoch 63/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 91.52it/s, loss=0.195]


loss_avg()=0.47267107168833417
accuracy_avg()=0.8604166666666667
Epoch 64/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 103.91it/s, loss=0.203]


loss_avg()=0.4571450700362523
accuracy_avg()=0.8708333333333333
Epoch 65/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 123.11it/s, loss=0.191]


loss_avg()=0.4543718824783961
accuracy_avg()=0.8708333333333333
Epoch 66/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.88it/s, loss=0.186]


loss_avg()=0.46574927667776744
accuracy_avg()=0.86875
Epoch 67/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 86.31it/s, loss=0.192]


loss_avg()=0.4653115173180898
accuracy_avg()=0.8645833333333334
Epoch 68/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.43it/s, loss=0.183]


loss_avg()=0.4735363672176997
accuracy_avg()=0.8708333333333333
Epoch 69/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.67it/s, loss=0.195]


loss_avg()=0.5099739849567413
accuracy_avg()=0.8625
Epoch 70/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 91.75it/s, loss=0.195]


loss_avg()=0.4663491447766622
accuracy_avg()=0.8645833333333334
Epoch 71/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 85.03it/s, loss=0.186]


loss_avg()=0.45482499003410337
accuracy_avg()=0.86875
Epoch 72/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 93.44it/s, loss=0.193]


loss_avg()=0.4648714244365692
accuracy_avg()=0.8708333333333333
Epoch 73/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 95.81it/s, loss=0.193]


loss_avg()=0.4565044869979223
accuracy_avg()=0.8625
Epoch 74/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 94.95it/s, loss=0.225]


loss_avg()=0.472234116991361
accuracy_avg()=0.8645833333333334
Epoch 75/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 93.73it/s, loss=0.180]


loss_avg()=0.4643377105394999
accuracy_avg()=0.8625
Epoch 76/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 74.84it/s, loss=0.174]


loss_avg()=0.4623458335796992
accuracy_avg()=0.8666666666666667
Epoch 77/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 79.73it/s, loss=0.176]


loss_avg()=0.4789614697297414
accuracy_avg()=0.8645833333333334
Epoch 78/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 92.99it/s, loss=0.173]


loss_avg()=0.46354031562805176
accuracy_avg()=0.8666666666666667
Epoch 79/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 91.43it/s, loss=0.168]


loss_avg()=0.461673512061437
accuracy_avg()=0.8708333333333333
Epoch 80/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 92.73it/s, loss=0.180]


loss_avg()=0.49430458347002665
accuracy_avg()=0.8645833333333334
Epoch 81/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 91.94it/s, loss=0.173]


loss_avg()=0.4660812973976135
accuracy_avg()=0.8666666666666667
Epoch 82/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 86.65it/s, loss=0.164]


loss_avg()=0.4664332211017609
accuracy_avg()=0.8666666666666667
Epoch 83/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.94it/s, loss=0.164]


loss_avg()=0.4528348793586095
accuracy_avg()=0.8708333333333333
Epoch 84/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 74.64it/s, loss=0.163]


loss_avg()=0.4456960568825404
accuracy_avg()=0.875
Epoch 85/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 76.84it/s, loss=0.166]


loss_avg()=0.45737791458765664
accuracy_avg()=0.8729166666666667
Epoch 86/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 85.72it/s, loss=0.162]


loss_avg()=0.46197752356529237
accuracy_avg()=0.86875
Epoch 87/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.73it/s, loss=0.163]


loss_avg()=0.464777272939682
accuracy_avg()=0.8708333333333333
Epoch 88/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.38it/s, loss=0.187]


loss_avg()=0.4776648938655853
accuracy_avg()=0.8666666666666667
Epoch 89/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 74.07it/s, loss=0.166]


loss_avg()=0.5000950227181117
accuracy_avg()=0.8541666666666666
Epoch 90/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 75.28it/s, loss=0.169]


loss_avg()=0.46446436941623687
accuracy_avg()=0.8604166666666667
Epoch 91/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.05it/s, loss=0.160]


loss_avg()=0.4742749551932017
accuracy_avg()=0.8729166666666667
Epoch 92/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 74.95it/s, loss=0.174]


loss_avg()=0.48737358351548515
accuracy_avg()=0.8520833333333333
Epoch 93/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.37it/s, loss=0.165]


loss_avg()=0.4895960400501887
accuracy_avg()=0.8625
Epoch 94/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.81it/s, loss=0.162]


loss_avg()=0.5093027263879776
accuracy_avg()=0.8583333333333333
Epoch 95/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 93.81it/s, loss=0.169]


loss_avg()=0.4609802623589834
accuracy_avg()=0.8770833333333333
Epoch 96/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 101.14it/s, loss=0.152]


loss_avg()=0.4583846946557363
accuracy_avg()=0.8729166666666667
Epoch 97/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 105.97it/s, loss=0.145]


loss_avg()=0.4555084904034932
accuracy_avg()=0.8708333333333333
Epoch 98/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 111.26it/s, loss=0.140]


loss_avg()=0.452629554271698
accuracy_avg()=0.8770833333333333
Epoch 99/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 111.05it/s, loss=0.142]


loss_avg()=0.490210168560346
accuracy_avg()=0.8666666666666667
Epoch 100/100


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 114.92it/s, loss=0.140]


loss_avg()=0.46817421317100527
accuracy_avg()=0.8729166666666667


## Final Test Accuracy

In [15]:
# Simple check with test dataset
model.eval()
test_data_iterator = data_iterator(X_test_tokenized_indexified, y_test_formatted, len(X_test_tokenized_indexified), len(X_test_tokenized_indexified), shuffle=False)
test_batch, labels_batch, test_sentences = next(test_data_iterator)
print(test_batch)
print(test_batch.shape)

seq_lengths = torch.LongTensor(list(map(len, test_batch)))
output_batch = model(test_batch.to(device),seq_lengths)
print(f"{output_batch=}")
print(f"{output_batch.shape=}")
final_test_accuracy = accuracy(output_batch, labels_batch.to(device))
print(f"{final_test_accuracy=}")

tensor([[    139,     353,       4,  ..., 3000000, 3000000, 3000000],
        [     83,     906,       4,  ..., 3000000, 3000000, 3000000],
        [     31,      10,   98307,  ..., 3000000, 3000000, 3000000],
        ...,
        [    139,     131,    1145,  ..., 3000000, 3000000, 3000000],
        [     83,       4,      11,  ..., 3000000, 3000000, 3000000],
        [     83,       4,   98307,  ..., 3000000, 3000000, 3000000]])
torch.Size([500, 17])
output_batch=tensor([[-5.9451e+00, -7.0270e+00, -1.0680e+01, -6.9970e+00, -4.4537e-03],
        [-3.1541e+00, -4.6392e+00, -3.3619e+00, -9.2535e-02, -6.5906e+00],
        [-6.4061e+00, -7.0194e+00, -1.0914e+01, -6.9850e+00, -3.4958e-03],
        ...,
        [-6.4613e+00, -7.1150e+00, -1.0842e+01, -7.5248e+00, -2.9390e-03],
        [-1.4473e+00, -3.9180e-01, -3.2685e+00, -5.3426e+00, -3.0769e+00],
        [-5.1387e-02, -3.6264e+00, -4.0215e+00, -6.8953e+00, -5.3949e+00]],
       grad_fn=<LogSoftmaxBackward0>)
output_batch.shape=torch.Size

In [31]:
def get_sentence_label(sentence: str) -> int:
    model.eval()
    sentence_tokenized = word_tokenize(sentence.lower())
    sentence_as_id = [
        vocab[token] if token in vocab
        else vocab['UNK']
        for token in sentence_tokenized
    ]
    seq_lengths = torch.LongTensor([len(sentence_as_id)])
    input = torch.tensor(sentence_as_id).unsqueeze(0)
    output = model(input, seq_lengths)
    label = np.argmax(output.detach().numpy())
    print(f"sentence = {sentence}, label = {label}")
    return label

get_sentence_label("What is a squirrel?")
get_sentence_label("Is Singapore located in Southeast Asia?")
get_sentence_label("Is Singapore in China?")
get_sentence_label("Name 11 famous martyrs .")
get_sentence_label("What ISPs exist in the Caribbean ?")
get_sentence_label("How many cars are manufactured every day?")

sentence = What is a squirrel?, label = 1
sentence = Is Singapore located in Southeast Asia?, label = 3
sentence = Is Singapore in China?, label = 1
sentence = Name 11 famous martyrs ., label = 3
sentence = What ISPs exist in the Caribbean ?, label = 1
sentence = How many cars are manufactured every day?, label = 4


4