In [1]:
import re 
import torch
import pickle 
import numpy as np
import pandas as pd
from tqdm import tqdm
from nltk.tokenize import word_tokenize
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

In [2]:
lr = 0.0001 #learning Rate
input_size = 50
num_epochs = 100
hidden_size = 50 
label_col = 'Product'
text_col_name = "Consumer complaint narrative"
label_encoder_path = "Output/label_encoder.pkl"
product_map = {'Vehicle loan or lease': 'vehicle_loan',
               'Credit reporting, credit repair services, or other personal consumer reports': 'credit_report',
               'Credit card or prepaid card': 'card',
               'Money transfer, virtual currency, or money service': 'money_transfer',
               'virtual currency': 'money_transfer',
               'Mortgage': 'mortgage',
               'Payday loan, title loan, or personal loan': 'loan',
               'Debt collection': 'debt_collection',
               'Checking or savings account': 'savings_account',
               'Credit card': 'card',
               'Bank account or service': 'savings_account',
               'Credit reporting': 'credit_report',
               'Prepaid card': 'card',
               'Payday loan': 'loan',
               'Other financial service': 'others',
               'Virtual currency': 'money_transfer',
               'Student loan': 'loan',
               'Consumer Loan': 'loan',
               'Money transfers': 'money_transfer'}

In [3]:
# define function for saving a file
def save_file(name, obj):
    """
    Function to save an object as pickle file
    """
    with open(name, 'wb') as f:
        pickle.dump(obj, f)

# define function for loading a file
def load_file(name):
    """
    Function to load a pickle object
    """
    return pickle.load(open(name, "rb"))

In [4]:
Glove_path = "D:\Project\RNN LSTM TEXT CLASSIFICATION\Output\glove.6B.50d.txt"

## Process glove embeddings

In [5]:
with open(Glove_path,'rt',encoding='utf-8') as f:
    emb = f.readlines()

## 40000 unique words are there in the embedding

In [6]:
len(emb)

400000

## Check the first record

In [7]:
# check first record
emb[0]

'the 0.418 0.24968 -0.41242 0.1217 0.34527 -0.044457 -0.49688 -0.17862 -0.00066023 -0.6566 0.27843 -0.14767 -0.55677 0.14658 -0.0095095 0.011658 0.10204 -0.12792 -0.8443 -0.12181 -0.016801 -0.33279 -0.1552 -0.23131 -0.19181 -1.8823 -0.76746 0.099051 -0.42125 -0.19526 4.0071 -0.18594 -0.52287 -0.31681 0.00059213 0.0074449 0.17778 -0.15897 0.012041 -0.054223 -0.29871 -0.15749 -0.34758 -0.045637 -0.44251 0.18785 0.0027849 -0.18411 -0.11514 -0.78581\n'

In [8]:
# split the first record and check for vocabulary
emb[0].split()[0]

'the'

In [9]:
# split the record and check for embeddings
emb[0].split()[1:]

['0.418',
 '0.24968',
 '-0.41242',
 '0.1217',
 '0.34527',
 '-0.044457',
 '-0.49688',
 '-0.17862',
 '-0.00066023',
 '-0.6566',
 '0.27843',
 '-0.14767',
 '-0.55677',
 '0.14658',
 '-0.0095095',
 '0.011658',
 '0.10204',
 '-0.12792',
 '-0.8443',
 '-0.12181',
 '-0.016801',
 '-0.33279',
 '-0.1552',
 '-0.23131',
 '-0.19181',
 '-1.8823',
 '-0.76746',
 '0.099051',
 '-0.42125',
 '-0.19526',
 '4.0071',
 '-0.18594',
 '-0.52287',
 '-0.31681',
 '0.00059213',
 '0.0074449',
 '0.17778',
 '-0.15897',
 '0.012041',
 '-0.054223',
 '-0.29871',
 '-0.15749',
 '-0.34758',
 '-0.045637',
 '-0.44251',
 '0.18785',
 '0.0027849',
 '-0.18411',
 '-0.11514',
 '-0.78581']

## Separate embeddings and vocabulary

In [10]:
vocabulary, embeddings = [], []

for item in emb:
    vocabulary.append(item.split()[0])
    embeddings.append(item.split()[1:])

In [11]:
vocabulary

['the',
 ',',
 '.',
 'of',
 'to',
 'and',
 'in',
 'a',
 '"',
 "'s",
 'for',
 '-',
 'that',
 'on',
 'is',
 'was',
 'said',
 'with',
 'he',
 'as',
 'it',
 'by',
 'at',
 '(',
 ')',
 'from',
 'his',
 "''",
 '``',
 'an',
 'be',
 'has',
 'are',
 'have',
 'but',
 'were',
 'not',
 'this',
 'who',
 'they',
 'had',
 'i',
 'which',
 'will',
 'their',
 ':',
 'or',
 'its',
 'one',
 'after',
 'new',
 'been',
 'also',
 'we',
 'would',
 'two',
 'more',
 "'",
 'first',
 'about',
 'up',
 'when',
 'year',
 'there',
 'all',
 '--',
 'out',
 'she',
 'other',
 'people',
 "n't",
 'her',
 'percent',
 'than',
 'over',
 'into',
 'last',
 'some',
 'government',
 'time',
 '$',
 'you',
 'years',
 'if',
 'no',
 'world',
 'can',
 'three',
 'do',
 ';',
 'president',
 'only',
 'state',
 'million',
 'could',
 'us',
 'most',
 '_',
 'against',
 'u.s.',
 'so',
 'them',
 'what',
 'him',
 'united',
 'during',
 'before',
 'may',
 'since',
 'many',
 'while',
 'where',
 'states',
 'because',
 'now',
 'city',
 'made',
 'like',
 

## Convert embeddings to numpy float array

In [12]:
embeddings = np.array(embeddings,dtype = np.float32)

In [13]:
embeddings.shape

(400000, 50)

## Add embeddings for padding and unknown items

In [14]:
vocabulary[:10]

['the', ',', '.', 'of', 'to', 'and', 'in', 'a', '"', "'s"]

In [15]:
embeddings

array([[ 0.418   ,  0.24968 , -0.41242 , ..., -0.18411 , -0.11514 ,
        -0.78581 ],
       [ 0.013441,  0.23682 , -0.16899 , ..., -0.56657 ,  0.044691,
         0.30392 ],
       [ 0.15164 ,  0.30177 , -0.16763 , ..., -0.35652 ,  0.016413,
         0.10216 ],
       ...,
       [-0.51181 ,  0.058706,  1.0913  , ..., -0.25003 , -1.125   ,
         1.5863  ],
       [-0.75898 , -0.47426 ,  0.4737  , ...,  0.78954 , -0.014116,
         0.6448  ],
       [ 0.072617, -0.51393 ,  0.4728  , ..., -0.18907 , -0.59021 ,
         0.55559 ]], dtype=float32)

In [16]:
vocabulary = ["<pad>","<unk>"] + vocabulary

In [17]:
embeddings = np.vstack([np.ones(50,dtype=np.float32),np.mean(embeddings,axis=0),embeddings])

In [18]:
embeddings

array([[ 1.        ,  1.        ,  1.        , ...,  1.        ,
         1.        ,  1.        ],
       [-0.12920076, -0.28866628, -0.01224866, ...,  0.10069408,
         0.00653003,  0.01685157],
       [ 0.418     ,  0.24968   , -0.41242   , ..., -0.18411   ,
        -0.11514   , -0.78581   ],
       ...,
       [-0.51181   ,  0.058706  ,  1.0913    , ..., -0.25003   ,
        -1.125     ,  1.5863    ],
       [-0.75898   , -0.47426   ,  0.4737    , ...,  0.78954   ,
        -0.014116  ,  0.6448    ],
       [ 0.072617  , -0.51393   ,  0.4728    , ..., -0.18907   ,
        -0.59021   ,  0.55559   ]], dtype=float32)

In [19]:
print(len(vocabulary),embeddings.shape)

400002 (400002, 50)


In [20]:
vocabulary_path = r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\vocabulary.pkl"

In [21]:
embeddings_path = r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\embeddings.pkl"

## Save embeddings and Vocabulary

In [22]:
save_file(vocabulary_path,vocabulary)
save_file(embeddings_path,embeddings)

## Process text data

In [23]:
data = pd.read_csv("D:\Project\RNN LSTM TEXT CLASSIFICATION\Data\complaints.csv")

In [24]:
data.head()

Unnamed: 0,Date received,Product,Sub-product,Issue,Sub-issue,Consumer complaint narrative,Company public response,Company,State,ZIP code,Tags,Consumer consent provided?,Submitted via,Date sent to company,Company response to consumer,Timely response?,Consumer disputed?,Complaint ID
0,2019-06-13,"Credit reporting, credit repair services, or o...",Credit reporting,Incorrect information on your report,Information belongs to someone else,,,CAPITAL ONE FINANCIAL CORPORATION,PA,186XX,,Consent not provided,Web,2019-06-13,Closed with explanation,Yes,,3274605
1,2019-11-01,Vehicle loan or lease,Loan,Struggling to pay your loan,Denied request to lower payments,I contacted Ally on Friday XX/XX/XXXX after fa...,Company has responded to the consumer and the ...,ALLY FINANCIAL INC.,NJ,088XX,,Consent provided,Web,2019-11-01,Closed with explanation,Yes,,3425257
2,2019-04-01,"Credit reporting, credit repair services, or o...",Credit reporting,Incorrect information on your report,Account status incorrect,,Company has responded to the consumer and the ...,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",PA,19067,,Consent not provided,Web,2019-04-01,Closed with explanation,Yes,,3198225
3,2021-11-01,"Credit reporting, credit repair services, or o...",Credit reporting,Problem with a credit reporting company's inve...,Was not notified of investigation status or re...,,,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",GA,31707,,,Web,2021-11-01,In progress,Yes,,4863965
4,2021-11-02,Debt collection,Medical debt,Took or threatened to take negative or legal a...,Threatened or suggested your credit would be d...,,,"Medical Data Systems, Inc.",VA,22033,,,Web,2021-11-02,In progress,Yes,,4866449


## Drop rows where the text column is empty

In [25]:
data.dropna(subset = [text_col_name],inplace=True)

In [26]:
data.head()

Unnamed: 0,Date received,Product,Sub-product,Issue,Sub-issue,Consumer complaint narrative,Company public response,Company,State,ZIP code,Tags,Consumer consent provided?,Submitted via,Date sent to company,Company response to consumer,Timely response?,Consumer disputed?,Complaint ID
1,2019-11-01,Vehicle loan or lease,Loan,Struggling to pay your loan,Denied request to lower payments,I contacted Ally on Friday XX/XX/XXXX after fa...,Company has responded to the consumer and the ...,ALLY FINANCIAL INC.,NJ,088XX,,Consent provided,Web,2019-11-01,Closed with explanation,Yes,,3425257
7,2019-07-08,"Credit reporting, credit repair services, or o...",Credit reporting,Problem with a credit reporting company's inve...,Their investigation did not fix an error on yo...,Hello This complaint is against the three cred...,Company has responded to the consumer and the ...,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",NY,109XX,,Consent provided,Web,2019-07-08,Closed with explanation,Yes,,3299394
8,2020-06-10,"Credit reporting, credit repair services, or o...",Credit reporting,Improper use of your report,Credit inquiries on your report that you don't...,I am a victim of Identity Theft & currently ha...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,MT,,Servicemember,Consent provided,Web,2020-06-10,Closed with explanation,Yes,,3692762
10,2019-07-03,"Credit reporting, credit repair services, or o...",Credit reporting,Incorrect information on your report,Account information incorrect,Two accounts are still on my credit history af...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,FL,328XX,,Consent provided,Web,2019-07-03,Closed with non-monetary relief,Yes,,3294745
13,2019-03-21,"Credit reporting, credit repair services, or o...",Other personal consumer report,Identity theft protection or other monitoring ...,Received unwanted marketing or advertising,Receiving daily telephone call ( s ) from XXXX...,Company has responded to the consumer and the ...,"NRA Group, LLC",MA,,,Consent provided,Web,2019-03-27,Closed with explanation,Yes,,3186954


## Replace Duplicate labels

In [27]:
data.replace({label_col: product_map},inplace=True)

In [28]:
data.head()

Unnamed: 0,Date received,Product,Sub-product,Issue,Sub-issue,Consumer complaint narrative,Company public response,Company,State,ZIP code,Tags,Consumer consent provided?,Submitted via,Date sent to company,Company response to consumer,Timely response?,Consumer disputed?,Complaint ID
1,2019-11-01,vehicle_loan,Loan,Struggling to pay your loan,Denied request to lower payments,I contacted Ally on Friday XX/XX/XXXX after fa...,Company has responded to the consumer and the ...,ALLY FINANCIAL INC.,NJ,088XX,,Consent provided,Web,2019-11-01,Closed with explanation,Yes,,3425257
7,2019-07-08,credit_report,Credit reporting,Problem with a credit reporting company's inve...,Their investigation did not fix an error on yo...,Hello This complaint is against the three cred...,Company has responded to the consumer and the ...,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",NY,109XX,,Consent provided,Web,2019-07-08,Closed with explanation,Yes,,3299394
8,2020-06-10,credit_report,Credit reporting,Improper use of your report,Credit inquiries on your report that you don't...,I am a victim of Identity Theft & currently ha...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,MT,,Servicemember,Consent provided,Web,2020-06-10,Closed with explanation,Yes,,3692762
10,2019-07-03,credit_report,Credit reporting,Incorrect information on your report,Account information incorrect,Two accounts are still on my credit history af...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,FL,328XX,,Consent provided,Web,2019-07-03,Closed with non-monetary relief,Yes,,3294745
13,2019-03-21,credit_report,Other personal consumer report,Identity theft protection or other monitoring ...,Received unwanted marketing or advertising,Receiving daily telephone call ( s ) from XXXX...,Company has responded to the consumer and the ...,"NRA Group, LLC",MA,,,Consent provided,Web,2019-03-27,Closed with explanation,Yes,,3186954


## Encode the label column and save the encoder and encoded labels 

In [29]:
label_encoder = LabelEncoder()
label_encoder.fit(data[label_col])
labels = label_encoder.transform(data[label_col])

In [30]:
labels[0]

8

In [31]:
label_encoder.classes_

array(['card', 'credit_report', 'debt_collection', 'loan',
       'money_transfer', 'mortgage', 'others', 'savings_account',
       'vehicle_loan'], dtype=object)

In [32]:
data[label_col]

1             vehicle_loan
7            credit_report
8            credit_report
10           credit_report
13           credit_report
                ...       
2326240               card
2326241    debt_collection
2326242           mortgage
2326243      credit_report
2326244      credit_report
Name: Product, Length: 809343, dtype: object

In [33]:
label_path = r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\labels.pkl"
label_encoder_path =  r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\label_encoder.pkl"

In [34]:
save_file(label_path,labels)
save_file(label_encoder_path,label_encoder)

## Process text Column

In [35]:
input_text = data[text_col_name]

In [36]:
input_text = [i.lower() for i in tqdm(input_text)]

100%|██████████████████████████████████████████████████████████████████████| 809343/809343 [00:05<00:00, 155851.37it/s]


## Remove Punctuation except apostrophe

In [37]:
input_text = [re.sub(r"[^\w\d'\s]+"," ",i) for i in tqdm(input_text)]

100%|███████████████████████████████████████████████████████████████████████| 809343/809343 [01:06<00:00, 12133.49it/s]


In [38]:
input_text

['i contacted ally on friday xx xx xxxx after falling behind on payments due to being out of work for a short period of time due to an illness  i chated with a representative after logging into my account regarding my opitions to ensure i protect my credit and bring my account current  \n\nshe advised me that before an extenstion could be done  i had to make a payment in the amount of  270 00  i reviewed my finances  as i am playing catch up on all my bills and made this payment on monday xx xx xxxx  this rep advised me  once this payment posts to my account to contact ally back for an extention or to have a payment deffered to the end of my loan  \n\nwith this in mind  i contacted ally again today and chatted with xxxx  i explained all of the above and the information i was provided when i chatted with the rep last week  she asked several questions and advised me that a one or two month  extension deffered payment could be done however partial payment is needed  what  she advised me  

## Remove Digits

In [39]:
input_text = [re.sub("\d+","",i) for i in tqdm(input_text)]

100%|███████████████████████████████████████████████████████████████████████| 809343/809343 [00:39<00:00, 20622.35it/s]


In [40]:
input_text

['i contacted ally on friday xx xx xxxx after falling behind on payments due to being out of work for a short period of time due to an illness  i chated with a representative after logging into my account regarding my opitions to ensure i protect my credit and bring my account current  \n\nshe advised me that before an extenstion could be done  i had to make a payment in the amount of     i reviewed my finances  as i am playing catch up on all my bills and made this payment on monday xx xx xxxx  this rep advised me  once this payment posts to my account to contact ally back for an extention or to have a payment deffered to the end of my loan  \n\nwith this in mind  i contacted ally again today and chatted with xxxx  i explained all of the above and the information i was provided when i chatted with the rep last week  she asked several questions and advised me that a one or two month  extension deffered payment could be done however partial payment is needed  what  she advised me     or

## Remove more then one consecutive instance of 'x'

In [41]:
input_text = [re.sub(r'[x]{2,}',"",i) for i in tqdm(input_text)]

100%|███████████████████████████████████████████████████████████████████████| 809343/809343 [00:29<00:00, 27817.50it/s]


In [42]:
input_text

['i contacted ally on friday    after falling behind on payments due to being out of work for a short period of time due to an illness  i chated with a representative after logging into my account regarding my opitions to ensure i protect my credit and bring my account current  \n\nshe advised me that before an extenstion could be done  i had to make a payment in the amount of     i reviewed my finances  as i am playing catch up on all my bills and made this payment on monday     this rep advised me  once this payment posts to my account to contact ally back for an extention or to have a payment deffered to the end of my loan  \n\nwith this in mind  i contacted ally again today and chatted with   i explained all of the above and the information i was provided when i chatted with the rep last week  she asked several questions and advised me that a one or two month  extension deffered payment could be done however partial payment is needed  what  she advised me     or there abouts would 

## Replace multiple spaces with single space

In [43]:
input_text = [re.sub(' +'," ",i) for i in tqdm(input_text)]

100%|████████████████████████████████████████████████████████████████████████| 809343/809343 [01:32<00:00, 8746.15it/s]


In [44]:
input_text

['i contacted ally on friday after falling behind on payments due to being out of work for a short period of time due to an illness i chated with a representative after logging into my account regarding my opitions to ensure i protect my credit and bring my account current \n\nshe advised me that before an extenstion could be done i had to make a payment in the amount of i reviewed my finances as i am playing catch up on all my bills and made this payment on monday this rep advised me once this payment posts to my account to contact ally back for an extention or to have a payment deffered to the end of my loan \n\nwith this in mind i contacted ally again today and chatted with i explained all of the above and the information i was provided when i chatted with the rep last week she asked several questions and advised me that a one or two month extension deffered payment could be done however partial payment is needed what she advised me or there abouts would be due within days from me a

## Tokenize the text

In [45]:
tokens = [word_tokenize(t) for t in tqdm(input_text)]

100%|█████████████████████████████████████████████████████████████████████████| 809343/809343 [49:32<00:00, 272.31it/s]


In [46]:
tokens = [i[:20] if len(i) > 19 else ['<pad>'] * (20 - len(i)) + i for i in tqdm(tokens)]

100%|█████████████████████████████████████████████████████████████████████████| 809343/809343 [19:56<00:00, 676.26it/s]


## Convert tokens to integer indices from vocabulary

In [47]:
def token_index(tokens,vocabulary,missing = '<unk>'):
    idx_token = []
    for text in tqdm(tokens):
        idx_text = []
        for token in text:
            if token in vocabulary:
                idx_text.append(vocabulary.index(token))
            else:
                idx_text.append(vocabulary.index(missing))
        idx_token.append(idx_text)
    return idx_token

In [48]:
tokens = token_index(tokens,vocabulary)

100%|████████████████████████████████████████████████████████████████████████| 809343/809343 [4:10:01<00:00, 53.95it/s]


In [49]:
len(tokens)

809343

In [50]:
tokens[0]

[43,
 5909,
 3660,
 15,
 187,
 51,
 2333,
 563,
 15,
 3115,
 447,
 6,
 136,
 68,
 5,
 163,
 12,
 9,
 638,
 568]

In [51]:
data.head()

Unnamed: 0,Date received,Product,Sub-product,Issue,Sub-issue,Consumer complaint narrative,Company public response,Company,State,ZIP code,Tags,Consumer consent provided?,Submitted via,Date sent to company,Company response to consumer,Timely response?,Consumer disputed?,Complaint ID
1,2019-11-01,vehicle_loan,Loan,Struggling to pay your loan,Denied request to lower payments,I contacted Ally on Friday XX/XX/XXXX after fa...,Company has responded to the consumer and the ...,ALLY FINANCIAL INC.,NJ,088XX,,Consent provided,Web,2019-11-01,Closed with explanation,Yes,,3425257
7,2019-07-08,credit_report,Credit reporting,Problem with a credit reporting company's inve...,Their investigation did not fix an error on yo...,Hello This complaint is against the three cred...,Company has responded to the consumer and the ...,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",NY,109XX,,Consent provided,Web,2019-07-08,Closed with explanation,Yes,,3299394
8,2020-06-10,credit_report,Credit reporting,Improper use of your report,Credit inquiries on your report that you don't...,I am a victim of Identity Theft & currently ha...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,MT,,Servicemember,Consent provided,Web,2020-06-10,Closed with explanation,Yes,,3692762
10,2019-07-03,credit_report,Credit reporting,Incorrect information on your report,Account information incorrect,Two accounts are still on my credit history af...,Company has responded to the consumer and the ...,Experian Information Solutions Inc.,FL,328XX,,Consent provided,Web,2019-07-03,Closed with non-monetary relief,Yes,,3294745
13,2019-03-21,credit_report,Other personal consumer report,Identity theft protection or other monitoring ...,Received unwanted marketing or advertising,Receiving daily telephone call ( s ) from XXXX...,Company has responded to the consumer and the ...,"NRA Group, LLC",MA,,,Consent provided,Web,2019-03-27,Closed with explanation,Yes,,3186954


In [52]:
vocabulary[tokens[0][0]]

'i'

## Save the tokens

In [53]:
token_path = r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\tokens.pkl"

In [54]:
save_file(token_path,tokens)

## Create Pytorch Dataset

In [80]:
class TextDataset(torch.utils.data.Dataset):

    def __init__(self, tokens, embeddings, labels):
        """
        :param tokens: List of word tokens
        :param embeddings: Word embeddings (from glove)
        :param labels: List of labels
        """
        self.tokens = tokens
        self.embeddings = embeddings
        self.labels = labels

    def __len__(self):
        return len(self.tokens)

    def __getitem__(self, idx):
        return self.labels[idx], self.embeddings[self.tokens[idx], :]

# Create Models

## RNN Model

In [81]:
class RNNNetwork(torch.nn.Module):

    def __init__(self, input_size, hidden_size, num_classes):
        """
        :param input_size: Size of embedding
        :param hidden_size: Hidden vector size
        :param num_classes: Number of classes in the dataset
        """
        super(RNNNetwork, self).__init__()
        # RNN Layer
        self.rnn = torch.nn.RNN(input_size=input_size,
                                hidden_size=hidden_size,
                                batch_first=True)
        # Linear Layer
        self.linear = torch.nn.Linear(hidden_size, num_classes)

    def forward(self, input_data):
        _, hidden = self.rnn(input_data)
        output = self.linear(hidden)
        return output

In [82]:
class LSTMNetwork(torch.nn.Module):

    def __init__(self, input_size, hidden_size, num_classes):
        """
        :param input_size: Size of embedding
        :param hidden_size: Hidden vector size
        :param num_classes: Number of classes in the dataset
        """
        super(LSTMNetwork, self).__init__()
        # LSTM Layer
        self.rnn = torch.nn.LSTM(input_size=input_size,
                                 hidden_size=hidden_size,
                                 batch_first=True)
        # Linear Layer
        self.linear = torch.nn.Linear(hidden_size, num_classes)

    def forward(self, input_data):
        _, (hidden, _) = self.rnn(input_data)
        output = self.linear(hidden[-1])
        return output

# Define Train function

In [61]:
def train(train_loader,valid_loader,model,criterion,optimizer,device,num_epochs,model_path):
    
    
    """
    Function to train the model
    :param train_loader: Data loader for train dataset
    :param valid_loader: Data loader for validation dataset
    :param model: Model object
    :param criterion: Loss function
    :param optimizer: Optimizer
    :param device: CUDA or CPU
    :param num_epochs: Number of epochs
    :param model_path: Path to save the model
    """
    best_loss = 1e8
    for i in range(num_epochs):
        print(f"Epoch {i+1} of {num_epochs}")
        valid_loss,train_loss = [],[]
        model.train()
        #train loop
        for batch_labels,batch_data in tqdm(train_loader):
            #move data to gpu if available 
            batch_labels = batch_labels.to(device)
            batch_labels = batch_labels.type(torch.LongTensor)
            batch_data = batch_data.to(device)
            #forward pass
            batch_output = model(batch_data)
            batch_output = torch.squeeze(batch_output)
            #calculate Loss
            loss = criterion(batch_output,batch_labels)
            train_loss.append(loss.item())
            optimizer.zero_grad()
            # backwards pass
            loss.backward()
            # Gradient update step
            optimizer.step()
        model.eval()
        # Validation loop
        for batch_labels,batch_data in tqdm(valid_loader):
            # Move data to gpu if available
            batch_labels = batch_labels.to(device)
            batch_labels = batch_labels.type(torch.LongTensor)
            batch_data = batch_data.to(device)
            # Forward pass
            batch_output = model(batch_data)
            batch_output = torch.squeeze(batch_output)
            # Calculate loss
            loss = criterion(batch_output, batch_labels)
            valid_loss.append(loss.item())
        t_loss = np.mean(train_loss)
        v_loss = np.mean(valid_loss)
        print(f"Train Loss : {t_loss}, Validation Loss: {v_loss}")
        if v_loss < best_loss:
            best_loss = v_loss
            # save model if validation loss improves
            torch.save(model.state_dict(),model_path)
        print(f"Best Validation Loss: {best_loss}")

# Define test  function

In [63]:
def test(test_loader,model,criterion,device):
    """
    Function to test the model
    param test_loader: Data loader for test dataset
    param model: Model object
    param criterion: Loss function
    param device: CUDA or CPU
    """
    model.eval()
    test_loss = []
    test_accu = []
    for batch_labels, batch_data in tqdm(test_loader):
        # Move data to device 
        batch_labels = batch_labels.to(device)
        batch_labels = batch_labels.type(torch.LongTensor)
        batch_data = batch_data.to(device)
        
        # Forward Pass
        batch_output = model(batch_data)
        batch_output = torch.squeeze(batch_output)
        # Calculate loss
        loss= criterion(batch_output, batch_labels)
        test_loss.append(loss.item())
        batch_preds = torch.agrmax(batch_output,axis =1 )
        # Move Prediciton to cpu
        if torch.cuda.is_available():
            batch_lables = batch_labels.cpu()
            batch_preds = batch_preds.cpu()
        # Compute accuracy
        test_accu.append(accuracy_score(batch_labels.detach().numpy(),batch_preds.detach().numpy()))
    test_loss = np.mean(test_loss)
    test_accu = np.mean(test_accu)
    print(f"Test Loss: {test_loss}, Test Accuracy: {test_accu}")

# Train RNN Model

## Load the files

In [67]:
tokens = load_file(token_path)
labels = load_file(label_path)
embeddings = load_file(embeddings_path)
label_encoder = load_file(label_encoder_path)
num_classes = len(label_encoder.classes_)

## Split data into train, Validation and test sets

In [83]:
x_train,x_test, y_train, y_test = train_test_split(tokens,labels, test_size=0.2)
x_train,x_valid,y_train,y_valid = train_test_split(x_train,y_train,test_size = 0.25)

## Create PyTorch Datasets

In [84]:
train_dataset = TextDataset(x_train,embeddings,y_train)
valid_dataset = TextDataset(x_valid,embeddings,y_valid)
test_dataset = TextDataset(x_test,embeddings,y_test)

## Create data loaders

In [85]:
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size = 16, shuffle = True, drop_last = True)
valid_loader = torch.utils.data.DataLoader(valid_dataset,batch_size = 16)
test_loader = torch.utils.data.DataLoader(test_dataset,batch_size=16)

# Create Model Object 

In [86]:
model = RNNNetwork(input_size,hidden_size,num_classes)

## Move the model to Gpu if available

In [87]:
if torch.cuda.is_available():
    model = model.cuda()

## Define Loss Function and Optimizer

In [88]:
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(),lr=lr)
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

In [90]:
rnn_model_path =  r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\model_rnn.pth"
lstm_model_path =  r"C:\Users\Anonymous\OneDrive\RNN AND LSTM\output\model_lstm.pth"

## Training Loop

In [91]:
train(train_loader,valid_loader,model,criterion,optimizer,device,num_epochs,rnn_model_path)

Epoch 1 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:30<00:00, 91.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.89it/s]


Train Loss : 1.3270192542529773, Validation Loss: 1.1899582470572134
Best Validation Loss: 1.1899582470572134
Epoch 2 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:13<00:00, 96.72it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.51it/s]


Train Loss : 1.103426886889255, Validation Loss: 1.0865435742237262
Best Validation Loss: 1.0865435742237262
Epoch 3 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:57<00:00, 101.90it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:56<00:00, 180.32it/s]


Train Loss : 1.001275792429239, Validation Loss: 0.9977400414369506
Best Validation Loss: 0.9977400414369506
Epoch 4 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:25<00:00, 93.16it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 257.23it/s]


Train Loss : 0.9544008455186149, Validation Loss: 0.9311385583848695
Best Validation Loss: 0.9311385583848695
Epoch 5 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:06<00:00, 99.04it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 260.88it/s]


Train Loss : 0.924242044710838, Validation Loss: 0.9299414072042517
Best Validation Loss: 0.9299414072042517
Epoch 6 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.27it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 278.42it/s]


Train Loss : 0.9042300148718243, Validation Loss: 0.8960402312855057
Best Validation Loss: 0.8960402312855057
Epoch 7 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:06<00:00, 99.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.58it/s]


Train Loss : 0.8887675201225124, Validation Loss: 0.8884530005641661
Best Validation Loss: 0.8884530005641661
Epoch 8 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:31<00:00, 111.66it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 287.60it/s]


Train Loss : 0.8770501151671127, Validation Loss: 0.911110485010707
Best Validation Loss: 0.8884530005641661
Epoch 9 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:41<00:00, 107.71it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.77it/s]


Train Loss : 0.8665439399198017, Validation Loss: 0.886059835480998
Best Validation Loss: 0.886059835480998
Epoch 10 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:56<00:00, 102.25it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 266.88it/s]


Train Loss : 0.8592259005787345, Validation Loss: 0.8574937790060769
Best Validation Loss: 0.8574937790060769
Epoch 11 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.52it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.43it/s]


Train Loss : 0.8524267061702797, Validation Loss: 0.8726107749726751
Best Validation Loss: 0.8574937790060769
Epoch 12 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [07:12<00:00, 70.13it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:57<00:00, 174.81it/s]


Train Loss : 0.8461400360021206, Validation Loss: 0.8583121532724346
Best Validation Loss: 0.8574937790060769
Epoch 13 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:58<00:00, 84.57it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 236.14it/s]


Train Loss : 0.8405706445480002, Validation Loss: 0.8661726015843904
Best Validation Loss: 0.8574937790060769
Epoch 14 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:19<00:00, 94.87it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 239.64it/s]


Train Loss : 0.8362180150384958, Validation Loss: 0.846771906091813
Best Validation Loss: 0.846771906091813
Epoch 15 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:20<00:00, 94.84it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 238.36it/s]


Train Loss : 0.8314370914905821, Validation Loss: 0.8456753951836047
Best Validation Loss: 0.8456753951836047
Epoch 16 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:22<00:00, 94.08it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 236.83it/s]


Train Loss : 0.8280107260287987, Validation Loss: 0.8374168114843276
Best Validation Loss: 0.8374168114843276
Epoch 17 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:26<00:00, 92.93it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 263.30it/s]


Train Loss : 0.824254642744139, Validation Loss: 0.82435133348161
Best Validation Loss: 0.82435133348161
Epoch 18 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:11<00:00, 97.47it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.58it/s]


Train Loss : 0.8211702804699467, Validation Loss: 0.8341427543093308
Best Validation Loss: 0.82435133348161
Epoch 19 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.16it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 266.62it/s]


Train Loss : 0.8177655558258639, Validation Loss: 0.823741437857526
Best Validation Loss: 0.823741437857526
Epoch 20 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.16it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.34it/s]


Train Loss : 0.815011167582953, Validation Loss: 0.821061049865571
Best Validation Loss: 0.821061049865571
Epoch 21 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.49it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.45it/s]


Train Loss : 0.8124232553306482, Validation Loss: 0.8213201795180961
Best Validation Loss: 0.821061049865571
Epoch 22 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:57<00:00, 102.01it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 272.49it/s]


Train Loss : 0.8100877675006575, Validation Loss: 0.8220600977273425
Best Validation Loss: 0.821061049865571
Epoch 23 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:50<00:00, 104.33it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.68it/s]


Train Loss : 0.8074206726024729, Validation Loss: 0.833740923931868
Best Validation Loss: 0.821061049865571
Epoch 24 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:08<00:00, 98.52it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.51it/s]


Train Loss : 0.8056781031321458, Validation Loss: 0.8183444288967154
Best Validation Loss: 0.8183444288967154
Epoch 25 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:46<00:00, 105.85it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 264.41it/s]


Train Loss : 0.8034437111464423, Validation Loss: 0.8084022337956498
Best Validation Loss: 0.8084022337956498
Epoch 26 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:46<00:00, 105.80it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 269.87it/s]


Train Loss : 0.8014815196041417, Validation Loss: 0.8091402019647385
Best Validation Loss: 0.8084022337956498
Epoch 27 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:46<00:00, 105.98it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 274.80it/s]


Train Loss : 0.7992456286708645, Validation Loss: 0.8248835136452788
Best Validation Loss: 0.8084022337956498
Epoch 28 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:50<00:00, 104.48it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 263.76it/s]


Train Loss : 0.7977300389128226, Validation Loss: 0.8151834107117242
Best Validation Loss: 0.8084022337956498
Epoch 29 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:10<00:00, 81.92it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 277.59it/s]


Train Loss : 0.7963137249405537, Validation Loss: 0.8146531637170704
Best Validation Loss: 0.8084022337956498
Epoch 30 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:21<00:00, 79.63it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:50<00:00, 201.05it/s]


Train Loss : 0.7941501666308431, Validation Loss: 0.8071803073202231
Best Validation Loss: 0.8071803073202231
Epoch 31 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:57<00:00, 84.97it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:47<00:00, 214.15it/s]


Train Loss : 0.7931281769474511, Validation Loss: 0.826414111625704
Best Validation Loss: 0.8071803073202231
Epoch 32 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:22<00:00, 94.04it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 272.20it/s]


Train Loss : 0.7917857811240329, Validation Loss: 0.8149480985563546
Best Validation Loss: 0.8071803073202231
Epoch 33 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.55it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 277.17it/s]


Train Loss : 0.7900870267266202, Validation Loss: 0.7971323615753263
Best Validation Loss: 0.7971323615753263
Epoch 34 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.42it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 269.33it/s]


Train Loss : 0.7890441678263111, Validation Loss: 0.8033832222918483
Best Validation Loss: 0.7971323615753263
Epoch 35 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.21it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 271.72it/s]


Train Loss : 0.7876628748760781, Validation Loss: 0.8164446855738451
Best Validation Loss: 0.7971323615753263
Epoch 36 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.04it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.96it/s]


Train Loss : 0.7861626928823784, Validation Loss: 0.8078656205122233
Best Validation Loss: 0.7971323615753263
Epoch 37 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:49<00:00, 104.81it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 265.02it/s]


Train Loss : 0.7852781846439327, Validation Loss: 0.7924074194577886
Best Validation Loss: 0.7924074194577886
Epoch 38 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.40it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 266.07it/s]


Train Loss : 0.7847315537077689, Validation Loss: 0.7940071270457485
Best Validation Loss: 0.7924074194577886
Epoch 39 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:52<00:00, 103.92it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 273.75it/s]


Train Loss : 0.7831233869424271, Validation Loss: 0.8069876352986223
Best Validation Loss: 0.7924074194577886
Epoch 40 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.57it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.79it/s]


Train Loss : 0.7821387706512871, Validation Loss: 0.7908786659022088
Best Validation Loss: 0.7908786659022088
Epoch 41 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.17it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 264.64it/s]


Train Loss : 0.7812529315496296, Validation Loss: 0.8036010229441445
Best Validation Loss: 0.7908786659022088
Epoch 42 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:49<00:00, 104.99it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 272.74it/s]


Train Loss : 0.7804388818670144, Validation Loss: 0.8251935364927971
Best Validation Loss: 0.7908786659022088
Epoch 43 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.61it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 271.25it/s]


Train Loss : 0.7794658492132408, Validation Loss: 0.8165228275503579
Best Validation Loss: 0.7908786659022088
Epoch 44 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:46<00:00, 105.84it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 268.20it/s]


Train Loss : 0.7790114308564726, Validation Loss: 0.7901721078984596
Best Validation Loss: 0.7901721078984596
Epoch 45 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:07<00:00, 98.75it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 265.28it/s]


Train Loss : 0.7778162192581513, Validation Loss: 0.7940427329042536
Best Validation Loss: 0.7901721078984596
Epoch 46 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.31it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 278.51it/s]


Train Loss : 0.7770455281591101, Validation Loss: 0.8043509701518564
Best Validation Loss: 0.7901721078984596
Epoch 47 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.69it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 271.73it/s]


Train Loss : 0.7761071711474234, Validation Loss: 0.7890826348210555
Best Validation Loss: 0.7890826348210555
Epoch 48 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.33it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 269.23it/s]


Train Loss : 0.7756172912883307, Validation Loss: 0.8132103126272566
Best Validation Loss: 0.7890826348210555
Epoch 49 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.17it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 273.32it/s]


Train Loss : 0.7747617308294655, Validation Loss: 0.7891790760841025
Best Validation Loss: 0.7890826348210555
Epoch 50 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:51<00:00, 104.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 275.72it/s]


Train Loss : 0.77367273078007, Validation Loss: 0.7928221947760689
Best Validation Loss: 0.7890826348210555
Epoch 51 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.61it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 272.42it/s]


Train Loss : 0.7733531928396303, Validation Loss: 0.7913850069169742
Best Validation Loss: 0.7890826348210555
Epoch 52 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.16it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.35it/s]


Train Loss : 0.7729528710609409, Validation Loss: 0.7829064968986286
Best Validation Loss: 0.7829064968986286
Epoch 53 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:50<00:00, 104.57it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.17it/s]


Train Loss : 0.7721603686785973, Validation Loss: 0.7841680199946235
Best Validation Loss: 0.7829064968986286
Epoch 54 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:43<00:00, 106.95it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 269.51it/s]


Train Loss : 0.7715231568193219, Validation Loss: 0.7828933817646633
Best Validation Loss: 0.7828933817646633
Epoch 55 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:51<00:00, 104.08it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.78it/s]


Train Loss : 0.7712817981019248, Validation Loss: 0.783634626117604
Best Validation Loss: 0.7828933817646633
Epoch 56 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:44<00:00, 106.78it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 276.52it/s]


Train Loss : 0.7707119709179665, Validation Loss: 0.7852906668568843
Best Validation Loss: 0.7828933817646633
Epoch 57 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:43<00:00, 106.92it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 266.15it/s]


Train Loss : 0.7700356934083352, Validation Loss: 0.7986728710019213
Best Validation Loss: 0.7828933817646633
Epoch 58 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:44<00:00, 106.78it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 277.29it/s]


Train Loss : 0.7695308432601625, Validation Loss: 0.7958618239300329
Best Validation Loss: 0.7828933817646633
Epoch 59 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:44<00:00, 106.53it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.82it/s]


Train Loss : 0.768630110553452, Validation Loss: 0.8013316149246826
Best Validation Loss: 0.7828933817646633
Epoch 60 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:43<00:00, 107.05it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.95it/s]


Train Loss : 0.767956314671668, Validation Loss: 0.7903310645869142
Best Validation Loss: 0.7828933817646633
Epoch 61 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.38it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 256.90it/s]


Train Loss : 0.767794794557613, Validation Loss: 0.7890089543718023
Best Validation Loss: 0.7828933817646633
Epoch 62 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.36it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 270.36it/s]


Train Loss : 0.7670661246261055, Validation Loss: 0.7816781291808667
Best Validation Loss: 0.7816781291808667
Epoch 63 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:12<00:00, 97.22it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 258.33it/s]


Train Loss : 0.7670409711024415, Validation Loss: 0.7935382579274242
Best Validation Loss: 0.7816781291808667
Epoch 64 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:23<00:00, 79.20it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 273.52it/s]


Train Loss : 0.7660640503564324, Validation Loss: 0.7928895607599513
Best Validation Loss: 0.7816781291808667
Epoch 65 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:06<00:00, 99.17it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 260.36it/s]


Train Loss : 0.7652953103005493, Validation Loss: 0.7776960046597181
Best Validation Loss: 0.7776960046597181
Epoch 66 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:23<00:00, 93.85it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:33<00:00, 302.34it/s]


Train Loss : 0.7653500515912373, Validation Loss: 0.7824189229176558
Best Validation Loss: 0.7776960046597181
Epoch 67 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 261.20it/s]


Train Loss : 0.7642753648374973, Validation Loss: 0.796529259971241
Best Validation Loss: 0.7776960046597181
Epoch 68 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:54<00:00, 103.12it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 266.63it/s]


Train Loss : 0.7643179496653881, Validation Loss: 0.7838436318149948
Best Validation Loss: 0.7776960046597181
Epoch 69 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:54<00:00, 103.12it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 239.25it/s]


Train Loss : 0.7634607359725227, Validation Loss: 0.7868646715140878
Best Validation Loss: 0.7776960046597181
Epoch 70 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.37it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 247.30it/s]


Train Loss : 0.7629158169897718, Validation Loss: 0.7828713271557384
Best Validation Loss: 0.7776960046597181
Epoch 71 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:29<00:00, 112.72it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 268.71it/s]


Train Loss : 0.7625982696515136, Validation Loss: 0.7820079444290928
Best Validation Loss: 0.7776960046597181
Epoch 72 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:28<00:00, 113.13it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:33<00:00, 300.06it/s]


Train Loss : 0.7625844420320808, Validation Loss: 0.7755736231456294
Best Validation Loss: 0.7755736231456294
Epoch 73 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:26<00:00, 113.83it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 293.12it/s]


Train Loss : 0.7622057953678206, Validation Loss: 0.7807019536957046
Best Validation Loss: 0.7755736231456294
Epoch 74 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:48<00:00, 105.22it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 294.39it/s]


Train Loss : 0.7614210298821895, Validation Loss: 0.7811815106648989
Best Validation Loss: 0.7755736231456294
Epoch 75 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:57<00:00, 101.98it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 280.19it/s]


Train Loss : 0.7608808562827267, Validation Loss: 0.7720822851703173
Best Validation Loss: 0.7720822851703173
Epoch 76 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:34<00:00, 110.73it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 275.26it/s]


Train Loss : 0.7612600537345329, Validation Loss: 0.7806774147832135
Best Validation Loss: 0.7720822851703173
Epoch 77 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:41<00:00, 107.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 247.48it/s]


Train Loss : 0.7602223758502592, Validation Loss: 0.7760705471471846
Best Validation Loss: 0.7720822851703173
Epoch 78 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [05:00<00:00, 100.93it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 259.24it/s]


Train Loss : 0.7597901631786167, Validation Loss: 0.7745282159413264
Best Validation Loss: 0.7720822851703173
Epoch 79 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [05:00<00:00, 101.06it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 254.51it/s]


Train Loss : 0.7595007265846458, Validation Loss: 0.7767260860715434
Best Validation Loss: 0.7720822851703173
Epoch 80 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:59<00:00, 101.17it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.39it/s]


Train Loss : 0.7591580620290224, Validation Loss: 0.7796436574730204
Best Validation Loss: 0.7720822851703173
Epoch 81 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:58<00:00, 101.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 238.99it/s]


Train Loss : 0.7585043296100084, Validation Loss: 0.7717261959058418
Best Validation Loss: 0.7717261959058418
Epoch 82 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:51<00:00, 104.27it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.26it/s]


Train Loss : 0.7585930168626238, Validation Loss: 0.7756423095105499
Best Validation Loss: 0.7717261959058418
Epoch 83 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.42it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.77it/s]


Train Loss : 0.7583176687715768, Validation Loss: 0.7862154414544608
Best Validation Loss: 0.7717261959058418
Epoch 84 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:52<00:00, 103.85it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 266.21it/s]


Train Loss : 0.7577396690236677, Validation Loss: 0.7785585891498493
Best Validation Loss: 0.7717261959058418
Epoch 85 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:57<00:00, 102.00it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 248.26it/s]


Train Loss : 0.7573120368808459, Validation Loss: 0.772552546306309
Best Validation Loss: 0.7717261959058418
Epoch 86 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:58<00:00, 101.56it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 250.55it/s]


Train Loss : 0.7570137887068793, Validation Loss: 0.779658045599474
Best Validation Loss: 0.7717261959058418
Epoch 87 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:56<00:00, 102.40it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 261.19it/s]


Train Loss : 0.7571058187497507, Validation Loss: 0.787308396917918
Best Validation Loss: 0.7717261959058418
Epoch 88 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:08<00:00, 98.54it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 261.61it/s]


Train Loss : 0.756848104251472, Validation Loss: 0.790467901586355
Best Validation Loss: 0.7717261959058418
Epoch 89 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [05:02<00:00, 100.48it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 261.92it/s]


Train Loss : 0.756355712130003, Validation Loss: 0.7740626544065187
Best Validation Loss: 0.7717261959058418
Epoch 90 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:18<00:00, 95.22it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 262.29it/s]


Train Loss : 0.7563072426742344, Validation Loss: 0.7886338062003347
Best Validation Loss: 0.7717261959058418
Epoch 91 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:53<00:00, 103.42it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.89it/s]


Train Loss : 0.755768821908428, Validation Loss: 0.777726130140821
Best Validation Loss: 0.7717261959058418
Epoch 92 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:52<00:00, 103.73it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 260.74it/s]


Train Loss : 0.7553905031715921, Validation Loss: 0.7800530795870686
Best Validation Loss: 0.7717261959058418
Epoch 93 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:52<00:00, 103.63it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 268.33it/s]


Train Loss : 0.7550387521390074, Validation Loss: 0.7733907648041407
Best Validation Loss: 0.7717261959058418
Epoch 94 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:54<00:00, 103.01it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:44<00:00, 228.27it/s]


Train Loss : 0.755269708673683, Validation Loss: 0.7728968073068146
Best Validation Loss: 0.7717261959058418
Epoch 95 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [08:24<00:00, 60.21it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:53<00:00, 189.69it/s]


Train Loss : 0.7548336086612458, Validation Loss: 0.7722327153523284
Best Validation Loss: 0.7717261959058418
Epoch 96 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [07:44<00:00, 65.34it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:59<00:00, 169.52it/s]


Train Loss : 0.7543468042331728, Validation Loss: 0.7784722565770962
Best Validation Loss: 0.7717261959058418
Epoch 97 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:46<00:00, 74.62it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [01:09<00:00, 144.78it/s]


Train Loss : 0.7542157314950984, Validation Loss: 0.7798266687332034
Best Validation Loss: 0.7717261959058418
Epoch 98 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [07:18<00:00, 69.19it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [01:11<00:00, 141.24it/s]


Train Loss : 0.7542295694577046, Validation Loss: 0.784620647478377
Best Validation Loss: 0.7717261959058418
Epoch 99 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [11:45<00:00, 43.05it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:58<00:00, 172.39it/s]


Train Loss : 0.7537687969583361, Validation Loss: 0.7709106346935674
Best Validation Loss: 0.7709106346935674
Epoch 100 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:12<00:00, 97.12it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 275.47it/s]


Train Loss : 0.7537694163730941, Validation Loss: 0.7974834278059463
Best Validation Loss: 0.7709106346935674


## Train LSTM

In [92]:
model = LSTMNetwork(input_size,hidden_size,num_classes)

In [93]:
if torch.cuda.is_available():
    model = model.cuda()

In [94]:
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(),lr=lr)
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

In [95]:
train(train_loader,valid_loader,model,criterion,optimizer,device,num_epochs,lstm_model_path)

Epoch 1 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:37<00:00, 109.42it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 291.24it/s]


Train Loss : 1.0717882515359947, Validation Loss: 0.8975599931494643
Best Validation Loss: 0.8975599931494643
Epoch 2 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:22<00:00, 115.51it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 290.35it/s]


Train Loss : 0.857142892966946, Validation Loss: 0.828357910755254
Best Validation Loss: 0.828357910755254
Epoch 3 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:22<00:00, 115.64it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 289.51it/s]


Train Loss : 0.8077611753180058, Validation Loss: 0.7991482754069212
Best Validation Loss: 0.7991482754069212
Epoch 4 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:22<00:00, 115.75it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 284.73it/s]


Train Loss : 0.7815356534336505, Validation Loss: 0.7809853307807813
Best Validation Loss: 0.7809853307807813
Epoch 5 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:20<00:00, 116.50it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 287.39it/s]


Train Loss : 0.7632384087025039, Validation Loss: 0.7679618353349448
Best Validation Loss: 0.7679618353349448
Epoch 6 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:14<00:00, 119.20it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 284.53it/s]


Train Loss : 0.749967820663895, Validation Loss: 0.7548939446365691
Best Validation Loss: 0.7548939446365691
Epoch 7 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:21<00:00, 115.88it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 275.05it/s]


Train Loss : 0.7393605760267676, Validation Loss: 0.7456355316689084
Best Validation Loss: 0.7456355316689084
Epoch 8 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:53<00:00, 85.75it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [01:13<00:00, 137.96it/s]


Train Loss : 0.7305130665109814, Validation Loss: 0.7411573126093194
Best Validation Loss: 0.7411573126093194
Epoch 9 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:39<00:00, 108.55it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 276.32it/s]


Train Loss : 0.7228159497159071, Validation Loss: 0.7406358189237935
Best Validation Loss: 0.7406358189237935
Epoch 10 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:41<00:00, 107.78it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 281.22it/s]


Train Loss : 0.7164983446788061, Validation Loss: 0.7310251922955965
Best Validation Loss: 0.7310251922955965
Epoch 11 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:19<00:00, 117.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 284.00it/s]


Train Loss : 0.7109608461145661, Validation Loss: 0.7258587086191582
Best Validation Loss: 0.7258587086191582
Epoch 12 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:11<00:00, 81.78it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:51<00:00, 197.83it/s]


Train Loss : 0.7061567590838602, Validation Loss: 0.7210354560508763
Best Validation Loss: 0.7210354560508763
Epoch 13 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:22<00:00, 94.03it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:43<00:00, 231.89it/s]


Train Loss : 0.701258508979145, Validation Loss: 0.7205811677614938
Best Validation Loss: 0.7205811677614938
Epoch 14 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:54<00:00, 103.02it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:48<00:00, 207.04it/s]


Train Loss : 0.6973639288225519, Validation Loss: 0.7159305954578661
Best Validation Loss: 0.7159305954578661
Epoch 15 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:30<00:00, 112.07it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 355.06it/s]


Train Loss : 0.6937003165171705, Validation Loss: 0.7170015671580892
Best Validation Loss: 0.7159305954578661
Epoch 16 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:36<00:00, 140.03it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 354.19it/s]


Train Loss : 0.6903307556958724, Validation Loss: 0.7135509025466422
Best Validation Loss: 0.7135509025466422
Epoch 17 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:02<00:00, 125.29it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.40it/s]


Train Loss : 0.6873743537893209, Validation Loss: 0.7086630118569862
Best Validation Loss: 0.7086630118569862
Epoch 18 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 142.85it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 361.86it/s]


Train Loss : 0.6843433220452542, Validation Loss: 0.7061511446377842
Best Validation Loss: 0.7061511446377842
Epoch 19 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:33<00:00, 141.84it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 359.41it/s]


Train Loss : 0.6817153427549799, Validation Loss: 0.7038076764582598
Best Validation Loss: 0.7038076764582598
Epoch 20 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 142.60it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 361.43it/s]


Train Loss : 0.6792189432854904, Validation Loss: 0.7076412423520182
Best Validation Loss: 0.7038076764582598
Epoch 21 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 143.03it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 364.88it/s]


Train Loss : 0.6769096770759863, Validation Loss: 0.7020980082507531
Best Validation Loss: 0.7020980082507531
Epoch 22 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:30<00:00, 144.34it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 358.70it/s]


Train Loss : 0.6746299174256144, Validation Loss: 0.7007741828305373
Best Validation Loss: 0.7007741828305373
Epoch 23 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 143.08it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.94it/s]


Train Loss : 0.6725570032413576, Validation Loss: 0.702997602531947
Best Validation Loss: 0.7007741828305373
Epoch 24 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:31<00:00, 143.36it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 361.80it/s]


Train Loss : 0.6704901923204862, Validation Loss: 0.7044013960779838
Best Validation Loss: 0.7007741828305373
Epoch 25 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:30<00:00, 144.21it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 363.44it/s]


Train Loss : 0.6689947395554484, Validation Loss: 0.6968851774243118
Best Validation Loss: 0.6968851774243118
Epoch 26 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:30<00:00, 144.06it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 364.32it/s]


Train Loss : 0.666795605528222, Validation Loss: 0.6977086091899961
Best Validation Loss: 0.6968851774243118
Epoch 27 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:21<00:00, 116.06it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 296.93it/s]


Train Loss : 0.6653375948737245, Validation Loss: 0.695050146734513
Best Validation Loss: 0.695050146734513
Epoch 28 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:28<00:00, 113.19it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:33<00:00, 304.99it/s]


Train Loss : 0.663804525917847, Validation Loss: 0.6965123909219305
Best Validation Loss: 0.695050146734513
Epoch 29 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:14<00:00, 119.36it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:39<00:00, 254.65it/s]


Train Loss : 0.6622152788832759, Validation Loss: 0.6932242561072433
Best Validation Loss: 0.6932242561072433
Epoch 30 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:27<00:00, 113.38it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 355.58it/s]


Train Loss : 0.6607251315358934, Validation Loss: 0.6953267077726197
Best Validation Loss: 0.6932242561072433
Epoch 31 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:33<00:00, 142.29it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 357.38it/s]


Train Loss : 0.659483994929706, Validation Loss: 0.6903555160577064
Best Validation Loss: 0.6903555160577064
Epoch 32 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:30<00:00, 144.19it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 359.42it/s]


Train Loss : 0.6581499388885165, Validation Loss: 0.6930783298313972
Best Validation Loss: 0.6903555160577064
Epoch 33 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 142.80it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:29<00:00, 348.30it/s]


Train Loss : 0.6568373521448065, Validation Loss: 0.6921236804433611
Best Validation Loss: 0.6903555160577064
Epoch 34 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:33<00:00, 142.46it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 359.12it/s]


Train Loss : 0.6555075262641592, Validation Loss: 0.6897329314232309
Best Validation Loss: 0.6897329314232309
Epoch 35 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:26<00:00, 78.56it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [01:10<00:00, 142.90it/s]


Train Loss : 0.654423115982918, Validation Loss: 0.6917950906079666
Best Validation Loss: 0.6897329314232309
Epoch 36 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:14<00:00, 81.12it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:42<00:00, 239.33it/s]


Train Loss : 0.6533997522260153, Validation Loss: 0.6885303830720755
Best Validation Loss: 0.6885303830720755
Epoch 37 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:31<00:00, 91.51it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:29<00:00, 346.28it/s]


Train Loss : 0.6521823501535361, Validation Loss: 0.6901122813141662
Best Validation Loss: 0.6885303830720755
Epoch 38 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:59<00:00, 126.61it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:45<00:00, 224.58it/s]


Train Loss : 0.6513182931206813, Validation Loss: 0.6882797714164102
Best Validation Loss: 0.6882797714164102
Epoch 39 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:07<00:00, 98.75it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 295.88it/s]


Train Loss : 0.650149120254169, Validation Loss: 0.6878543369011014
Best Validation Loss: 0.6878543369011014
Epoch 40 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:59<00:00, 126.97it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:31<00:00, 321.67it/s]


Train Loss : 0.6490852324669503, Validation Loss: 0.69444743052178
Best Validation Loss: 0.6878543369011014
Epoch 41 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:50<00:00, 131.61it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 331.18it/s]


Train Loss : 0.6484053360193329, Validation Loss: 0.6876583405975368
Best Validation Loss: 0.6876583405975368
Epoch 42 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:08<00:00, 122.17it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 330.21it/s]


Train Loss : 0.6473389091856986, Validation Loss: 0.6901626250227649
Best Validation Loss: 0.6876583405975368
Epoch 43 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:59<00:00, 126.54it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:32<00:00, 311.18it/s]


Train Loss : 0.646423367118153, Validation Loss: 0.6869508235427105
Best Validation Loss: 0.6869508235427105
Epoch 44 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:45<00:00, 106.12it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:44<00:00, 226.47it/s]


Train Loss : 0.6455921155472073, Validation Loss: 0.6865199935503118
Best Validation Loss: 0.6865199935503118
Epoch 45 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:57<00:00, 102.07it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:41<00:00, 243.68it/s]


Train Loss : 0.6446307915616075, Validation Loss: 0.6902195724205848
Best Validation Loss: 0.6865199935503118
Epoch 46 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:41<00:00, 107.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:29<00:00, 337.86it/s]


Train Loss : 0.6438396917889891, Validation Loss: 0.6877012668101816
Best Validation Loss: 0.6865199935503118
Epoch 47 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:48<00:00, 133.03it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:32<00:00, 310.79it/s]


Train Loss : 0.6430048148103267, Validation Loss: 0.6835856149097382
Best Validation Loss: 0.6835856149097382
Epoch 48 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:19<00:00, 116.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:32<00:00, 309.87it/s]


Train Loss : 0.6421683007688607, Validation Loss: 0.6838775598800758
Best Validation Loss: 0.6835856149097382
Epoch 49 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:52<00:00, 130.81it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 336.86it/s]


Train Loss : 0.6413446339653096, Validation Loss: 0.681327967499189
Best Validation Loss: 0.681327967499189
Epoch 50 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:52<00:00, 130.52it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:31<00:00, 325.93it/s]


Train Loss : 0.6407483413263149, Validation Loss: 0.6835895362732185
Best Validation Loss: 0.681327967499189
Epoch 51 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:07<00:00, 122.82it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 358.51it/s]


Train Loss : 0.6399923304958143, Validation Loss: 0.6832663737903196
Best Validation Loss: 0.681327967499189
Epoch 52 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 142.67it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.79it/s]


Train Loss : 0.6393658826400754, Validation Loss: 0.6844934647726284
Best Validation Loss: 0.681327967499189
Epoch 53 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:29<00:00, 144.59it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 359.87it/s]


Train Loss : 0.6385826316450092, Validation Loss: 0.6843109389435099
Best Validation Loss: 0.681327967499189
Epoch 54 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:29<00:00, 144.53it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.96it/s]


Train Loss : 0.6379608352925425, Validation Loss: 0.6825993780561842
Best Validation Loss: 0.681327967499189
Epoch 55 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:29<00:00, 145.00it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.70it/s]


Train Loss : 0.6373373266858167, Validation Loss: 0.6836404053015095
Best Validation Loss: 0.681327967499189
Epoch 56 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:30<00:00, 144.46it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 363.17it/s]


Train Loss : 0.6367229189889435, Validation Loss: 0.6828693429130928
Best Validation Loss: 0.681327967499189
Epoch 57 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:49<00:00, 132.22it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 285.78it/s]


Train Loss : 0.6361088943321878, Validation Loss: 0.6836613805273623
Best Validation Loss: 0.681327967499189
Epoch 58 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:33<00:00, 111.07it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 269.50it/s]


Train Loss : 0.6356938463989553, Validation Loss: 0.6845342666050644
Best Validation Loss: 0.681327967499189
Epoch 59 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:24<00:00, 114.66it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 292.62it/s]


Train Loss : 0.6349595040290369, Validation Loss: 0.685038583033362
Best Validation Loss: 0.681327967499189
Epoch 60 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:22<00:00, 115.46it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 274.72it/s]


Train Loss : 0.634374532234384, Validation Loss: 0.6826329268912789
Best Validation Loss: 0.681327967499189
Epoch 61 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:31<00:00, 111.76it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 247.95it/s]


Train Loss : 0.6337486769106773, Validation Loss: 0.6815875332010491
Best Validation Loss: 0.681327967499189
Epoch 62 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:09<00:00, 121.69it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 261.90it/s]


Train Loss : 0.633276118447596, Validation Loss: 0.6800046972182943
Best Validation Loss: 0.6800046972182943
Epoch 63 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:20<00:00, 94.84it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:40<00:00, 251.19it/s]


Train Loss : 0.6327326219802634, Validation Loss: 0.6810200250600507
Best Validation Loss: 0.6800046972182943
Epoch 64 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:18<00:00, 95.37it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:47<00:00, 215.05it/s]


Train Loss : 0.6319377334627033, Validation Loss: 0.6813432879571424
Best Validation Loss: 0.6800046972182943
Epoch 65 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:55<00:00, 85.25it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 290.70it/s]


Train Loss : 0.6314585093097053, Validation Loss: 0.6838633791562231
Best Validation Loss: 0.6800046972182943
Epoch 66 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:19<00:00, 117.02it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:32<00:00, 312.87it/s]


Train Loss : 0.6311056058219277, Validation Loss: 0.6825077747411528
Best Validation Loss: 0.6800046972182943
Epoch 67 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:30<00:00, 112.32it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:33<00:00, 298.11it/s]


Train Loss : 0.6305898204553854, Validation Loss: 0.681571501244684
Best Validation Loss: 0.6800046972182943
Epoch 68 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:49<00:00, 104.86it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:41<00:00, 242.96it/s]


Train Loss : 0.6300051708534188, Validation Loss: 0.6816953048411949
Best Validation Loss: 0.6800046972182943
Epoch 69 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:41<00:00, 107.65it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 281.68it/s]


Train Loss : 0.6296640376647231, Validation Loss: 0.6838230038730243
Best Validation Loss: 0.6800046972182943
Epoch 70 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:37<00:00, 109.50it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 280.39it/s]


Train Loss : 0.6292041266138805, Validation Loss: 0.6846138259085363
Best Validation Loss: 0.6800046972182943
Epoch 71 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:47<00:00, 105.71it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 285.01it/s]


Train Loss : 0.6287526561116072, Validation Loss: 0.6798167092832603
Best Validation Loss: 0.6798167092832603
Epoch 72 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:06<00:00, 98.91it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:47<00:00, 213.55it/s]


Train Loss : 0.6283147518566304, Validation Loss: 0.6820215313604513
Best Validation Loss: 0.6798167092832603
Epoch 73 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:51<00:00, 104.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 267.06it/s]


Train Loss : 0.6278802368043626, Validation Loss: 0.684571705757467
Best Validation Loss: 0.6798167092832603
Epoch 74 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:40<00:00, 108.05it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:45<00:00, 221.06it/s]


Train Loss : 0.6273813748497153, Validation Loss: 0.6805016870651013
Best Validation Loss: 0.6798167092832603
Epoch 75 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:55<00:00, 102.69it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 277.26it/s]


Train Loss : 0.6269123315220757, Validation Loss: 0.6809859417096845
Best Validation Loss: 0.6798167092832603
Epoch 76 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:30<00:00, 112.19it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:35<00:00, 282.94it/s]


Train Loss : 0.626557840746651, Validation Loss: 0.6806652856051916
Best Validation Loss: 0.6798167092832603
Epoch 77 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:38<00:00, 108.84it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 277.09it/s]


Train Loss : 0.6260912324510257, Validation Loss: 0.6812258473803394
Best Validation Loss: 0.6798167092832603
Epoch 78 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:33<00:00, 111.11it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:36<00:00, 279.52it/s]


Train Loss : 0.6256654512954651, Validation Loss: 0.6807660461716694
Best Validation Loss: 0.6798167092832603
Epoch 79 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:49<00:00, 104.90it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:34<00:00, 289.07it/s]


Train Loss : 0.6252065666550172, Validation Loss: 0.6804287784442996
Best Validation Loss: 0.6798167092832603
Epoch 80 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [05:02<00:00, 100.22it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:38<00:00, 260.79it/s]


Train Loss : 0.6248881161392128, Validation Loss: 0.6804431149344076
Best Validation Loss: 0.6798167092832603
Epoch 81 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [05:08<00:00, 98.36it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:50<00:00, 200.78it/s]


Train Loss : 0.6244312489101482, Validation Loss: 0.6832748574454305
Best Validation Loss: 0.6798167092832603
Epoch 82 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [05:01<00:00, 100.63it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:41<00:00, 243.21it/s]


Train Loss : 0.6240035112490616, Validation Loss: 0.6811884383211538
Best Validation Loss: 0.6798167092832603
Epoch 83 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:58<00:00, 101.67it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 268.98it/s]


Train Loss : 0.6235922005055764, Validation Loss: 0.6810899533097943
Best Validation Loss: 0.6798167092832603
Epoch 84 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:27<00:00, 113.41it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 329.59it/s]


Train Loss : 0.6233037644889838, Validation Loss: 0.6802590655930119
Best Validation Loss: 0.6798167092832603
Epoch 85 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:50<00:00, 131.72it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 359.31it/s]


Train Loss : 0.6229429915362027, Validation Loss: 0.6807141442386143
Best Validation Loss: 0.6798167092832603
Epoch 86 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:34<00:00, 141.79it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 362.40it/s]


Train Loss : 0.622538707330332, Validation Loss: 0.6841881656020459
Best Validation Loss: 0.6798167092832603
Epoch 87 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:08<00:00, 122.33it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 366.50it/s]


Train Loss : 0.6220152197471364, Validation Loss: 0.6821745502071807
Best Validation Loss: 0.6798167092832603
Epoch 88 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:31<00:00, 143.65it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:27<00:00, 361.59it/s]


Train Loss : 0.6218497476844604, Validation Loss: 0.6800396215559831
Best Validation Loss: 0.6798167092832603
Epoch 89 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:03<00:00, 124.41it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 331.19it/s]


Train Loss : 0.6216197366892211, Validation Loss: 0.6812136495504129
Best Validation Loss: 0.6798167092832603
Epoch 90 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:07<00:00, 122.58it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:33<00:00, 298.64it/s]


Train Loss : 0.6210892416534353, Validation Loss: 0.6799411580627134
Best Validation Loss: 0.6798167092832603
Epoch 91 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [04:13<00:00, 119.89it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [01:10<00:00, 143.65it/s]


Train Loss : 0.6207598743667516, Validation Loss: 0.6824846681779265
Best Validation Loss: 0.6798167092832603
Epoch 92 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:12<00:00, 81.50it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:52<00:00, 191.43it/s]


Train Loss : 0.6203130463045551, Validation Loss: 0.6815276915074762
Best Validation Loss: 0.6798167092832603
Epoch 93 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:25<00:00, 78.67it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:54<00:00, 186.45it/s]


Train Loss : 0.6199838191662382, Validation Loss: 0.6818998566773159
Best Validation Loss: 0.6798167092832603
Epoch 94 of 100


100%|████████████████████████████████████████████████████████████████████████████| 30350/30350 [06:34<00:00, 76.93it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:37<00:00, 271.07it/s]


Train Loss : 0.6199197624865582, Validation Loss: 0.68084600418946
Best Validation Loss: 0.6798167092832603
Epoch 95 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:48<00:00, 132.86it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:30<00:00, 336.11it/s]


Train Loss : 0.6195171416920335, Validation Loss: 0.682098717947475
Best Validation Loss: 0.6798167092832603
Epoch 96 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:43<00:00, 135.59it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 356.08it/s]


Train Loss : 0.61921168204354, Validation Loss: 0.6810636038090078
Best Validation Loss: 0.6798167092832603
Epoch 97 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:32<00:00, 142.91it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 355.48it/s]


Train Loss : 0.6187804337347899, Validation Loss: 0.6826145546749238
Best Validation Loss: 0.6798167092832603
Epoch 98 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:33<00:00, 142.02it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 357.37it/s]


Train Loss : 0.6185685955793205, Validation Loss: 0.6832681337729195
Best Validation Loss: 0.6798167092832603
Epoch 99 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:34<00:00, 141.53it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:28<00:00, 357.35it/s]


Train Loss : 0.6182946378710684, Validation Loss: 0.6845364154233543
Best Validation Loss: 0.6798167092832603
Epoch 100 of 100


100%|███████████████████████████████████████████████████████████████████████████| 30350/30350 [03:40<00:00, 137.71it/s]
100%|███████████████████████████████████████████████████████████████████████████| 10117/10117 [00:46<00:00, 217.93it/s]

Train Loss : 0.6180214131380473, Validation Loss: 0.6823255994847915
Best Validation Loss: 0.6798167092832603





## Predict on new text

In [96]:
input_text = '''I am a victim of Identity Theft & currently have an Experian account that 
I can view my Experian Credit Report and getting notified when there is activity on 
my Experian Credit Report. For the past 3 days I've spent a total of approximately 9 
hours on the phone with Experian. Every time I call I get transferred repeatedly and 
then my last transfer and automated message states to press 1 and leave a message and 
someone would call me. Every time I press 1 I get an automatic message stating than you 
before I even leave a message and get disconnected. I call Experian again, explain what 
is happening and the process begins again with the same end result. I was trying to have 
this issue attended and resolved informally but I give up after 9 hours. There are hard 
hit inquiries on my Experian Credit Report that are fraud, I didn't authorize, or recall 
and I respectfully request that Experian remove the hard hit inquiries immediately just 
like they've done in the past when I was able to speak to a live Experian representative 
in the United States. The following are the hard hit inquiries : BK OF XXXX XX/XX/XXXX 
XXXX XXXX XXXX  XX/XX/XXXX XXXX  XXXX XXXX  XX/XX/XXXX XXXX  XX/XX/XXXX XXXX  XXXX 
XX/XX/XXXX'''

## process input text

In [97]:
input_text = input_text.lower()
input_text = re.sub(r"[^\w\d'\s]+", " ", input_text)
input_text = re.sub("\d+", "", input_text)
input_text = re.sub(r'[x]{2,}', "", input_text)
input_text = re.sub(' +', ' ', input_text)
tokens = word_tokenize(input_text)

## Add padding if the length of token is less than 20 

In [98]:
tokens = ['<pad>']*(20-len(tokens))+tokens

## Tokenize the input text

In [99]:
idx_token = []
for token in tokens:
    if token in vocabulary:
        idx_token.append(vocabulary.index(token))
    else:
        idx_token.append(vocabulary.index('<unk>'))
        

## Get Embeddings for tokens

In [100]:
token_emb = embeddings[idx_token,:]

## convert to torch tensor

In [101]:
inp = torch.from_numpy(token_emb)

## CReate a bacth of one record

In [102]:
inp = torch.unsqueeze(inp,0)

## Load label encoder

In [103]:
label_encoder = load_file(label_encoder_path)
num_classes = len(label_encoder.classes_)

# RNN prediction

In [104]:
# Create model object
model = RNNNetwork(input_size, hidden_size, num_classes)

# Load trained weights
model.load_state_dict(torch.load(rnn_model_path))

# Move the model to GPU if available
if torch.cuda.is_available():
    model = model.cuda()
    
# Forward pass
out = torch.squeeze(model(inp))

# Find predicted class
prediction = label_encoder.classes_[torch.argmax(out)]
print(f"Predicted  Class: {prediction}")

Predicted  Class: credit_report


## LSTM Prediction

In [105]:
# Create model object
model = LSTMNetwork(input_size, hidden_size, num_classes)

# Load trained weights
model.load_state_dict(torch.load(lstm_model_path))

# Move the model to GPU if available
if torch.cuda.is_available():
    model = model.cuda()
    
# Forward pass
out = torch.squeeze(model(inp))

# Find predicted class
prediction = label_encoder.classes_[torch.argmax(out)]
print(f"Predicted  Class: {prediction}")

Predicted  Class: credit_report
