# Import libraries

In [1]:
import random
import os
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from tqdm import trange
from torch.autograd import Variable
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import f1_score
from nltk.tokenize import word_tokenize
import gensim.downloader

from seqeval.metrics import f1_score as f1_score_seqeval
from seqeval.metrics import classification_report
from seqeval.scheme import IOB1

In [2]:
word2vec_goog1e_news: gensim.models.keyedvectors.KeyedVectors = gensim.downloader.load('word2vec-google-news-300')
word2vec_goog1e_news.add_vector("<pad>", np.zeros(300))
pad_index = word2vec_goog1e_news.key_to_index["<pad>"]
embedding_weights = torch.FloatTensor(word2vec_goog1e_news.vectors)
vocab = word2vec_goog1e_news.key_to_index



In [3]:
device = torch.device(torch.cuda.current_device() if torch.cuda.is_available() else "cpu")
print(f"Using: {device}")

Using: cpu


# Import Dataset

In [79]:
def tokenize_pd_series_to_lsit(list_of_text):
    tokenized = []
    for sentence in list_of_text:
        tokenized.append(word_tokenize(sentence.lower()))
    return tokenized

def format_label(label):
    return torch.unsqueeze(torch.tensor(label.to_list()), axis=1).tolist()

def indexify(data):
    setences = []
    for sentence in data:
        s = [vocab[token] if token in vocab
            else vocab['UNK']
            for token in sentence]
        setences.append(s)
    return setences

In [80]:
training_data = pd.read_csv(filepath_or_buffer="TREC_dataset/modified_training_data.csv", sep=",") 
test_data = pd.read_csv(filepath_or_buffer="TREC_dataset/modified_test_data.csv", sep=",")

X = training_data["text"]
y = training_data["label-coarse"]
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=500)

X_test = test_data["text"]
y_test = test_data["label-coarse"]

X_train_lst = X_train.to_list()
X_val_lst = X_val.to_list()
X_test_lst = X_test.to_list()

X_train_tokenized = tokenize_pd_series_to_lsit(X_train_lst)
X_val_tokenized = tokenize_pd_series_to_lsit(X_val_lst)
X_test_tokenized = tokenize_pd_series_to_lsit(X_test_lst)

no_of_labels = max(y_train.to_list()) + 1

In [81]:
X_train_tokenized_indexified = indexify(X_train_tokenized)
X_val_tokenized_indexified = indexify(X_val_tokenized)
X_test_tokenized_indexified = indexify(X_test_tokenized)

y_train_formatted = format_label(y_train)
y_val_formatted = format_label(y_val)
y_test_formatted = format_label(y_test)

In [82]:
def data_iterator(sentences, labels, total_size: int, batch_size: int, shuffle: bool=False):
    # make a list that decides the order in which we go over the data- this avoids explicit shuffling of data
    order = list(range(total_size))
    if shuffle:
        random.seed(230)
        random.shuffle(order)

    # one pass over data
    for i in range((total_size+1)//batch_size):
        # fetch sentences and tags
        batch_sentences = [sentences[idx] for idx in order[i*batch_size:(i+1)*batch_size]]
        batch_tags = [labels[idx] for idx in order[i*batch_size:(i+1)*batch_size]]

        # compute length of longest sentence in batch
        batch_max_len = max([len(s) for s in batch_sentences])

        # prepare a numpy array with the data, initialising the data with pad_ind and all labels with -1
        # initialising labels to -1 differentiates tokens with tags from PADding tokens
        batch_data = vocab['<pad>']*np.ones((len(batch_sentences), batch_max_len))
        batch_labels = np.array(batch_tags).squeeze()

        # copy the data to the numpy array
        for j in range(len(batch_sentences)):
            cur_len = len(batch_sentences[j])
            batch_data[j][:cur_len] = batch_sentences[j]

        # since all data are indices, we convert them to torch LongTensors
        batch_data, batch_labels = torch.LongTensor(batch_data), torch.LongTensor(batch_labels)
        # convert them to Variables to record operations in the computational graph
        batch_data, batch_labels = Variable(batch_data), Variable(batch_labels)

        yield batch_data, batch_labels, batch_sentences

In [83]:
from torch.nn.utils.rnn import pack_padded_sequence, pad_packed_sequence
class Net(nn.Module):
    """
    This is the standard way to define your own network in PyTorch. You typically choose the components
    (e.g. LSTMs, linear layers etc.) of your network in the __init__ function. You then apply these layers
    on the input step-by-step in the forward function. You can use torch.nn.functional to apply functions
    such as F.relu, F.sigmoid, F.softmax. Be careful to ensure your dimensions are correct after each step.

    You are encouraged to have a look at the network in pytorch/vision/model/net.py to get a better sense of how
    you can go about defining your own network.

    The documentation for all the various components available to you is here: http://pytorch.org/docs/master/nn.html
    """

    def __init__(self, embedding_weights, embedding_dim, lstm_hidden_dim, number_of_tags):
        """
        We define an recurrent network that predicts the NER tags for each token in the sentence. The components
        required are:

        - an embedding layer: this layer maps each index in range(params.vocab_size) to a params.embedding_dim vector
        - lstm: applying the LSTM on the sequential input returns an output for each token in the sentence
        - fc: a fully connected layer that converts the LSTM output for each token to a distribution over NER tags

        Args:
            params: (Params) contains vocab_size, embedding_dim, lstm_hidden_dim
        """
        super(Net, self).__init__()

        # the embedding takes as input the vocab_size and the embedding_dim
        # self.embedding = nn.Embedding(vocab_size, embedding_dim)
        self.embedding = nn.Embedding.from_pretrained(embedding_weights, padding_idx=pad_index)

        # the LSTM takes as input the size of its input (embedding_dim), its hidden size
        # for more details on how to use it, check out the documentation
        self.lstm = nn.LSTM(embedding_dim,
                            lstm_hidden_dim, batch_first=True)

        # the fully connected layer transforms the output to give the final output layer
        self.fc = nn.Linear(lstm_hidden_dim, number_of_tags)

    def forward(self, s, lengths):
        """
        Args:
            s: (Variable) contains a batch of sentences, of dimension batch_size x seq_len.
            lengths: (list) contains the original lengths of the sequences in the batch.

        Returns:
            out: (Variable) dimension batch_size*seq_len x num_tags with the log probabilities of tokens for each token
                 of each sentence.
        """
        # apply the embedding layer that maps each token to its embedding
        s = self.embedding(s)

        # pack the sequences before feeding them to the LSTM
        packed_input = pack_padded_sequence(s, lengths, batch_first=True, enforce_sorted=False)
        packed_output, _ = self.lstm(packed_input)

        # unpack the sequences after passing through the LSTM
        padded_output, _ = pad_packed_sequence(packed_output, batch_first=True)

        s = torch.mean(padded_output, dim=1)  # mean pooling

        # apply the fully connected layer and obtain the output (before softmax) for each token
        s = self.fc(s)

        # apply log softmax on each token's output
        return F.log_softmax(s, dim=1)

In [84]:
def accuracy(outputs, labels):
    outputs = np.argmax(outputs.cpu().detach().numpy(), axis=1)
    # compare outputs with labels
    labels = labels.squeeze()
    return np.sum([1 if first == second else 0 for first, second in zip(labels, outputs)]) / float(len(labels))

def loss_fn(outputs, labels):
    loss = F.cross_entropy(outputs, labels.squeeze())
    return loss

In [85]:
class RunningAverage:
    """A simple class that maintains the running average of a quantity

    Example:
    ```
    loss_avg = RunningAverage()
    loss_avg.update(2)
    loss_avg.update(4)
    loss_avg() = 3
    ```
    """

    def __init__(self):
        self.steps = 0
        self.total = 0

    def update(self, val):
        self.total += val
        self.steps += 1

    def __call__(self):
        return self.total / float(self.steps)

In [86]:
def train(model, optimizer, loss_fn, data_iterator, metrics, num_steps):
    """Train the model on `num_steps` batches

    Args:
        model: (torch.nn.Module) the neural network
        optimizer: (torch.optim) optimizer for parameters of model
        loss_fn: a function that takes batch_output and batch_labels and computes the loss for the batch
        data_iterator: (generator) a generator that generates batches of data and labels
        metrics: (dict) a dictionary of functions that compute a metric using the output and labels of each batch
        params: (Params) hyperparameters
        num_steps: (int) number of batches to train on, each of size params.batch_size
    """

    # set model to training mode
    model.train()

    # summary for current training loop and a running average object for loss
    summ = []
    loss_avg = RunningAverage()

    # Use tqdm for progress bar
    t = trange(num_steps)
    for i in t:
        # fetch the next training batch
        train_batch, labels_batch, _ = next(data_iterator)
        train_batch = train_batch.to(device)
        labels_batch = labels_batch.to(device)
        
        # compute model output and loss
        seq_lengths = torch.LongTensor(list(map(len, train_batch)))
        output_batch = model(train_batch, seq_lengths)
        loss = loss_fn(output_batch, labels_batch)

        # clear previous gradients, compute gradients of all variables wrt loss
        optimizer.zero_grad()
        loss.backward()

        # performs updates using calculated gradients
        optimizer.step()

        # Evaluate summaries only once in a while
        if i % 10 == 0:
            # extract data from torch Variable, move to cpu, convert to numpy arrays
            output_batch = output_batch.data.cpu().numpy()
            labels_batch = labels_batch.data.cpu().numpy()

        # update the average loss
        loss_avg.update(loss.item())
        t.set_postfix(loss='{:05.3f}'.format(loss_avg()))

def evaluate(model, loss_fn, data_iterator, metrics, num_steps):
    """Evaluate the model on `num_steps` batches.

    Args:
        model: (torch.nn.Module) the neural network
        loss_fn: a function that takes batch_output and batch_labels and computes the loss for the batch
        data_iterator: (generator) a generator that generates batches of data and labels
        metrics: (dict) a dictionary of functions that compute a metric using the output and labels of each batch
        params: (Params) hyperparameters
        num_steps: (int) number of batches to train on, each of size params.batch_size
    """

    # set model to evaluation mode
    model.eval()

    loss_avg = RunningAverage()
    accuracy_avg = RunningAverage()

    # compute metrics over the dataset
    for _ in range(num_steps):
        # fetch the next evaluation batch
        data_batch, labels_batch, _ = next(data_iterator)
        data_batch = data_batch.to(device)
        labels_batch = labels_batch.to(device)

        # compute model output
        seq_lengths = torch.LongTensor(list(map(len, data_batch)))
        output_batch = model(data_batch, seq_lengths)
        loss = loss_fn(output_batch, labels_batch)
        loss_avg.update(loss.item())
        accuracy_val = accuracy(output_batch, labels_batch)
        accuracy_avg.update(accuracy_val)
        
        # extract data from torch Variable, move to cpu, convert to numpy arrays
        output_batch = output_batch.data.cpu().numpy()
        labels_batch = labels_batch.data.cpu().numpy()

    print(f"{loss_avg()=}")
    print(f"{accuracy_avg()=}")
    
def train_and_evaluate(
        model,
        train_sentences,
        train_labels,
        val_sentences,
        val_labels,
        num_epochs: int,
        batch_size: int,
        optimizer,
        loss_fn,
        metrics
):
    for epoch in range(num_epochs):
        # Run one epoch
        print("Epoch {}/{}".format(epoch + 1, num_epochs))

        # compute number of batches in one epoch (one full pass over the training set)
        num_steps = (len(train_sentences) + 1) // batch_size
        train_data_iterator = data_iterator(
            train_sentences, train_labels, len(train_sentences), batch_size, shuffle=True)
        train(model, optimizer, loss_fn, train_data_iterator,
              metrics, num_steps)

        # Evaluate for one epoch on validation set
        num_steps = (len(val_sentences) + 1) // batch_size
        val_data_iterator = data_iterator(
            val_sentences, val_labels, len(val_sentences), batch_size, shuffle=False)
        val_metrics = evaluate(
            model, loss_fn, val_data_iterator, metrics, num_steps)

In [87]:
inv_vocab = {v: k for k, v in vocab.items()}

def id_to_words(sentence):
    new_sentence = [inv_vocab[i] for i in sentence]
    return new_sentence

In [88]:
import warnings
warnings.filterwarnings('ignore')

In [89]:
# manually change vocab size (unique no. of words) and change label size (unique no. of labels) for now
model = Net(embedding_weights, 300, 5, no_of_labels).to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)

# if (os.path.isfile("model_weights2.pth")):
#     model.load_state_dict(torch.load('model_weights2.pth'))
# else:
#     train_and_evaluate(model, X_train_tokenized_indexified , y_train_formatted , X_val_tokenized_indexified  , y_val_formatted, 10, 32, optimizer, loss_fn, metrics)
#     torch.save(model.state_dict(), 'model_weights2.pth')

train_and_evaluate(model, X_train_tokenized_indexified , y_train_formatted , X_val_tokenized_indexified  , y_val_formatted, 100, 32, optimizer, loss_fn, metrics)
torch.save(model.state_dict(), 'model_weights2.pth')

Epoch 1/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 73.88it/s, loss=1.823]


loss_avg()=1.7097840627034506
accuracy_avg()=0.2916666666666667
Epoch 2/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.35it/s, loss=1.544]


loss_avg()=1.3892892678578694
accuracy_avg()=0.46875
Epoch 3/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 78.61it/s, loss=1.274]


loss_avg()=1.209268037478129
accuracy_avg()=0.5083333333333333
Epoch 4/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 78.69it/s, loss=1.138]


loss_avg()=1.110475726922353
accuracy_avg()=0.5479166666666667
Epoch 5/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 82.01it/s, loss=1.050]


loss_avg()=1.0420822461446126
accuracy_avg()=0.6125
Epoch 6/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 87.03it/s, loss=0.968]


loss_avg()=0.953705362478892
accuracy_avg()=0.6708333333333333
Epoch 7/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.66it/s, loss=0.908]


loss_avg()=0.9033411145210266
accuracy_avg()=0.6583333333333333
Epoch 8/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 79.46it/s, loss=0.873]


loss_avg()=0.8652285257975261
accuracy_avg()=0.6729166666666667
Epoch 9/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 79.28it/s, loss=0.831]


loss_avg()=0.8328226526578267
accuracy_avg()=0.6833333333333333
Epoch 10/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.76it/s, loss=0.798]


loss_avg()=0.8124893188476563
accuracy_avg()=0.6895833333333333
Epoch 11/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 79.31it/s, loss=0.770]


loss_avg()=0.7880104581514994
accuracy_avg()=0.6979166666666666
Epoch 12/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 85.08it/s, loss=0.747]


loss_avg()=0.7726328492164611
accuracy_avg()=0.7
Epoch 13/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 77.81it/s, loss=0.727]


loss_avg()=0.7662349979082743
accuracy_avg()=0.7020833333333333
Epoch 14/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 87.16it/s, loss=0.699]


loss_avg()=0.7568993131319682
accuracy_avg()=0.6958333333333333
Epoch 15/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 90.95it/s, loss=0.675]


loss_avg()=0.7467823425928751
accuracy_avg()=0.7041666666666667
Epoch 16/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 79.11it/s, loss=0.654]


loss_avg()=0.7328240553538005
accuracy_avg()=0.7
Epoch 17/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 92.38it/s, loss=0.637]


loss_avg()=0.7236707131067912
accuracy_avg()=0.7083333333333334
Epoch 18/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 97.31it/s, loss=0.620]


loss_avg()=0.7218214352925618
accuracy_avg()=0.7208333333333333
Epoch 19/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 88.63it/s, loss=0.605]


loss_avg()=0.7156032065550486
accuracy_avg()=0.7145833333333333
Epoch 20/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 85.13it/s, loss=0.596]


loss_avg()=0.7076690415541331
accuracy_avg()=0.7208333333333333
Epoch 21/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 80.67it/s, loss=0.581]


loss_avg()=0.7014467517534891
accuracy_avg()=0.73125
Epoch 22/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 77.45it/s, loss=0.567]


loss_avg()=0.6951823810736338
accuracy_avg()=0.73125
Epoch 23/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 50.20it/s, loss=0.558]


loss_avg()=0.6902762214342754
accuracy_avg()=0.7270833333333333
Epoch 24/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 72.20it/s, loss=0.546]


loss_avg()=0.6833774149417877
accuracy_avg()=0.7458333333333333
Epoch 25/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 75.90it/s, loss=0.535]


loss_avg()=0.6717640697956085
accuracy_avg()=0.74375
Epoch 26/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 74.79it/s, loss=0.522]


loss_avg()=0.6635611931482951
accuracy_avg()=0.74375
Epoch 27/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 78.12it/s, loss=0.513]


loss_avg()=0.6645435273647309
accuracy_avg()=0.7458333333333333
Epoch 28/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 71.37it/s, loss=0.503]


loss_avg()=0.6648773709932964
accuracy_avg()=0.75
Epoch 29/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 60.90it/s, loss=0.491]


loss_avg()=0.6566971878210703
accuracy_avg()=0.7479166666666667
Epoch 30/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 54.96it/s, loss=0.481]


loss_avg()=0.6587600151697794
accuracy_avg()=0.7520833333333333
Epoch 31/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 55.80it/s, loss=0.474]


loss_avg()=0.6610501031080882
accuracy_avg()=0.75625
Epoch 32/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 50.56it/s, loss=0.471]


loss_avg()=0.6483118871847788
accuracy_avg()=0.76875
Epoch 33/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 57.25it/s, loss=0.459]


loss_avg()=0.6341272135575612
accuracy_avg()=0.7708333333333334
Epoch 34/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 53.98it/s, loss=0.446]


loss_avg()=0.6388363758722941
accuracy_avg()=0.7541666666666667
Epoch 35/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 65.42it/s, loss=0.438]


loss_avg()=0.622355196873347
accuracy_avg()=0.7770833333333333
Epoch 36/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 73.63it/s, loss=0.430]


loss_avg()=0.6253618737061818
accuracy_avg()=0.7875
Epoch 37/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 80.32it/s, loss=0.412]


loss_avg()=0.6307368258635203
accuracy_avg()=0.78125
Epoch 38/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.83it/s, loss=0.409]


loss_avg()=0.6303541501363118
accuracy_avg()=0.7729166666666667
Epoch 39/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 83.14it/s, loss=0.399]


loss_avg()=0.6201577266057332
accuracy_avg()=0.78125
Epoch 40/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 82.21it/s, loss=0.387]


loss_avg()=0.6131607631842295
accuracy_avg()=0.7875
Epoch 41/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 77.77it/s, loss=0.387]


loss_avg()=0.6167702635129293
accuracy_avg()=0.775
Epoch 42/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 82.74it/s, loss=0.374]


loss_avg()=0.6128643035888672
accuracy_avg()=0.7895833333333333
Epoch 43/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 81.61it/s, loss=0.366]


loss_avg()=0.616121107339859
accuracy_avg()=0.7875
Epoch 44/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 78.31it/s, loss=0.360]


loss_avg()=0.6081298887729645
accuracy_avg()=0.7875
Epoch 45/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 55.10it/s, loss=0.351]


loss_avg()=0.5990495840708415
accuracy_avg()=0.7833333333333333
Epoch 46/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 57.78it/s, loss=0.368]


loss_avg()=0.6011871914068858
accuracy_avg()=0.78125
Epoch 47/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:04<00:00, 32.60it/s, loss=0.348]


loss_avg()=0.598880136013031
accuracy_avg()=0.7916666666666666
Epoch 48/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 42.30it/s, loss=0.338]


loss_avg()=0.6074688076972962
accuracy_avg()=0.7875
Epoch 49/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 50.99it/s, loss=0.327]


loss_avg()=0.6154275218645732
accuracy_avg()=0.7895833333333333
Epoch 50/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 61.28it/s, loss=0.321]


loss_avg()=0.6597581346829732
accuracy_avg()=0.7625
Epoch 51/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 67.12it/s, loss=0.339]


loss_avg()=0.5957811464866002
accuracy_avg()=0.7895833333333333
Epoch 52/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 72.19it/s, loss=0.323]


loss_avg()=0.6060477594534556
accuracy_avg()=0.7833333333333333
Epoch 53/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 70.93it/s, loss=0.314]


loss_avg()=0.6148821920156479
accuracy_avg()=0.7854166666666667
Epoch 54/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 73.94it/s, loss=0.326]


loss_avg()=0.6047183454036713
accuracy_avg()=0.7895833333333333
Epoch 55/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 72.90it/s, loss=0.312]


loss_avg()=0.6024712691704432
accuracy_avg()=0.7916666666666666
Epoch 56/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 73.74it/s, loss=0.298]


loss_avg()=0.6323312242825826
accuracy_avg()=0.78125
Epoch 57/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:01<00:00, 78.61it/s, loss=0.290]


loss_avg()=0.6081956664721171
accuracy_avg()=0.7895833333333333
Epoch 58/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 75.84it/s, loss=0.305]


loss_avg()=0.6134749641021092
accuracy_avg()=0.7875
Epoch 59/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 75.48it/s, loss=0.330]


loss_avg()=0.5873272677262624
accuracy_avg()=0.7958333333333333
Epoch 60/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 69.60it/s, loss=0.304]


loss_avg()=0.596344405412674
accuracy_avg()=0.7958333333333333
Epoch 61/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 65.78it/s, loss=0.286]


loss_avg()=0.6000899155934651
accuracy_avg()=0.7979166666666667
Epoch 62/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 49.14it/s, loss=0.275]


loss_avg()=0.610914413134257
accuracy_avg()=0.79375
Epoch 63/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 57.34it/s, loss=0.270]


loss_avg()=0.5992539942264556
accuracy_avg()=0.7979166666666667
Epoch 64/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 48.60it/s, loss=0.267]


loss_avg()=0.6120087107022604
accuracy_avg()=0.79375
Epoch 65/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 53.77it/s, loss=0.263]


loss_avg()=0.6136766115824381
accuracy_avg()=0.7958333333333333
Epoch 66/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 49.80it/s, loss=0.259]


loss_avg()=0.624155847231547
accuracy_avg()=0.7895833333333333
Epoch 67/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 51.49it/s, loss=0.255]


loss_avg()=0.6356486797332763
accuracy_avg()=0.7895833333333333
Epoch 68/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 59.48it/s, loss=0.251]


loss_avg()=0.6355721215407054
accuracy_avg()=0.7916666666666666
Epoch 69/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 70.04it/s, loss=0.248]


loss_avg()=0.6395529707272848
accuracy_avg()=0.7958333333333333
Epoch 70/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 72.67it/s, loss=0.244]


loss_avg()=0.6447464843591054
accuracy_avg()=0.7895833333333333
Epoch 71/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 69.08it/s, loss=0.252]


loss_avg()=0.6377208868662516
accuracy_avg()=0.8
Epoch 72/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 50.82it/s, loss=0.249]


loss_avg()=0.6407160917917888
accuracy_avg()=0.7916666666666666
Epoch 73/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 63.18it/s, loss=0.243]


loss_avg()=0.6242128054300944
accuracy_avg()=0.8020833333333334
Epoch 74/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 43.83it/s, loss=0.252]


loss_avg()=0.6232833802700043
accuracy_avg()=0.8041666666666667
Epoch 75/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 42.82it/s, loss=0.237]


loss_avg()=0.6307671308517456
accuracy_avg()=0.79375
Epoch 76/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 51.57it/s, loss=0.233]


loss_avg()=0.6328926384449005
accuracy_avg()=0.8083333333333333
Epoch 77/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 51.72it/s, loss=0.229]


loss_avg()=0.6275633076826731
accuracy_avg()=0.7979166666666667
Epoch 78/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 55.23it/s, loss=0.223]


loss_avg()=0.6347911179065704
accuracy_avg()=0.8020833333333334
Epoch 79/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 56.75it/s, loss=0.222]


loss_avg()=0.6330463627974192
accuracy_avg()=0.8041666666666667
Epoch 80/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 66.93it/s, loss=0.220]


loss_avg()=0.6353099981943766
accuracy_avg()=0.8125
Epoch 81/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 69.89it/s, loss=0.251]


loss_avg()=0.6106225490570069
accuracy_avg()=0.80625
Epoch 82/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 68.37it/s, loss=0.222]


loss_avg()=0.6135014315446218
accuracy_avg()=0.8145833333333333
Epoch 83/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 64.81it/s, loss=0.210]


loss_avg()=0.616396031777064
accuracy_avg()=0.8125
Epoch 84/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 57.38it/s, loss=0.207]


loss_avg()=0.6183098057905833
accuracy_avg()=0.8145833333333333
Epoch 85/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 72.27it/s, loss=0.213]


loss_avg()=0.6233009795347849
accuracy_avg()=0.8145833333333333
Epoch 86/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 70.30it/s, loss=0.214]


loss_avg()=0.6426888684431712
accuracy_avg()=0.8083333333333333
Epoch 87/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 61.50it/s, loss=0.204]


loss_avg()=0.6178479472796122
accuracy_avg()=0.8166666666666667
Epoch 88/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 58.69it/s, loss=0.206]


loss_avg()=0.624766351779302
accuracy_avg()=0.80625
Epoch 89/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 63.66it/s, loss=0.253]


loss_avg()=0.6188277900218964
accuracy_avg()=0.8145833333333333
Epoch 90/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 49.40it/s, loss=0.212]


loss_avg()=0.6314241707324981
accuracy_avg()=0.8145833333333333
Epoch 91/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 59.92it/s, loss=0.200]


loss_avg()=0.632177472114563
accuracy_avg()=0.8166666666666667
Epoch 92/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 53.02it/s, loss=0.193]


loss_avg()=0.6448888560136159
accuracy_avg()=0.8104166666666667
Epoch 93/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:03<00:00, 48.43it/s, loss=0.190]


loss_avg()=0.6440182685852051
accuracy_avg()=0.8125
Epoch 94/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 56.75it/s, loss=0.192]


loss_avg()=0.6549542188644409
accuracy_avg()=0.8166666666666667
Epoch 95/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 56.12it/s, loss=0.189]


loss_avg()=0.6602927704652151
accuracy_avg()=0.8166666666666667
Epoch 96/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 66.58it/s, loss=0.186]


loss_avg()=0.6502032577991486
accuracy_avg()=0.8166666666666667
Epoch 97/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 56.90it/s, loss=0.184]


loss_avg()=0.6729796330134074
accuracy_avg()=0.8104166666666667
Epoch 98/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 63.94it/s, loss=0.181]


loss_avg()=0.670732992887497
accuracy_avg()=0.8041666666666667
Epoch 99/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 73.29it/s, loss=0.181]


loss_avg()=0.6558623075485229
accuracy_avg()=0.8104166666666667
Epoch 100/100


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 154/154 [00:02<00:00, 71.05it/s, loss=0.199]


loss_avg()=0.6450281759103139
accuracy_avg()=0.8166666666666667


# Final Test Accuracy

In [95]:
# Simple check with test dataset
test_data_iterator = data_iterator(X_test_tokenized_indexified, y_test_formatted, len(X_test_tokenized_indexified), len(X_test_tokenized_indexified), shuffle=False)
test_batch, labels_batch, test_sentences = next(test_data_iterator)

seq_lengths = torch.LongTensor(list(map(len, test_batch)))
final_test_accuracy = accuracy(model(test_batch.to(device),seq_lengths), labels_batch.to(device))
print(f"{final_test_accuracy=}")

final_test_accuracy=0.87
