# 1. Downloading data, clean and preprocess



In [1]:
import os
import re
import nltk
import numpy as np
import pandas as pd
from zipfile import ZipFile
import zipfile
from nltk.stem import WordNetLemmatizer
nltk.download('punkt')
nltk.download('omw-1.4')
nltk.download('wordnet')
nltk.download('stopwords')
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
import torch
import torchvision
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision.transforms as transforms
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split


[nltk_data] Downloading package punkt to /home/bptran/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package omw-1.4 to /home/bptran/nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!
[nltk_data] Downloading package wordnet to /home/bptran/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package stopwords to /home/bptran/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
  from .autonotebook import tqdm as notebook_tqdm


In [2]:
!pip install torchinfo
import torchinfo

[0m

## 1.1 Loading data 

In [3]:
# Fetch the data
path = "data_full3.zip"

df = pd.DataFrame()
with zipfile.ZipFile(path) as z:
  for name in z.namelist():
    if name.endswith(".csv"):
      print(f'Loading data from {name}...')
      x = pd.read_csv(z.open(name))
      print(f'Loading completed from {name}...')
      df = pd.concat([df, x[['genre','plot']]],axis=0,ignore_index=True)
  print("Dataframe (df) ready to be used!")

df

Loading data from content/gdrive/MyDrive/CS5242_Project_Data/action/action_films.csv...
Loading completed from content/gdrive/MyDrive/CS5242_Project_Data/action/action_films.csv...
Loading data from content/gdrive/MyDrive/CS5242_Project_Data/adventure/adventure_films.csv...
Loading completed from content/gdrive/MyDrive/CS5242_Project_Data/adventure/adventure_films.csv...
Loading data from content/gdrive/MyDrive/CS5242_Project_Data/comedy/comedy_films.csv...
Loading completed from content/gdrive/MyDrive/CS5242_Project_Data/comedy/comedy_films.csv...
Loading data from content/gdrive/MyDrive/CS5242_Project_Data/drama/drama_films.csv...
Loading completed from content/gdrive/MyDrive/CS5242_Project_Data/drama/drama_films.csv...
Loading data from content/gdrive/MyDrive/CS5242_Project_Data/horror/horror_films.csv...
Loading completed from content/gdrive/MyDrive/CS5242_Project_Data/horror/horror_films.csv...
Loading data from content/gdrive/MyDrive/CS5242_Project_Data/romance/romance_films.csv.

Unnamed: 0,genre,plot
0,action,frank vega is a decorated vietnam war veteran ...
1,action,journalist matt nashs dylan walsh investigatio...
2,action,in the midtolate 1960s three young men leave t...
3,action,po sing the youngest son of chinese triad boss...
4,action,clay santell audie murphy has his horse stolen...
...,...,...
2677,crime,a mexican newspaperman wages a oneman war agai...
2678,crime,larry crain peter cookson a medical student on...
2679,crime,a texas ranger samantha payne opens up a fifte...
2680,crime,billy dempsey is a well dressed bank robber wh...


In [353]:
# # Fetch the data, clip to 200 each for experiments
# path = "data_full3.zip"

# df = pd.DataFrame()
# with zipfile.ZipFile(path) as z:
#   for name in z.namelist():
#     if name.endswith(".csv"):
#       print(f'Loading data from {name}...')
#       x = pd.read_csv(z.open(name)).head(200)
#       print(f'Loading completed from {name}...')
#       df = pd.concat([df, x[['genre','plot']]],axis=0,ignore_index=True)
#   print("Dataframe (df) ready to be used!")

# df

# # Clip to 1000 length of each plot
# df.loc[:, 'plot'] = df['plot'].apply(lambda x: ' '.join(x.split()[0:1000]))

In [4]:
df.groupby('genre').count()

Unnamed: 0_level_0,plot
genre,Unnamed: 1_level_1
action,299
adventure,286
comedy,276
crime,271
drama,279
fantasy,209
historical,249
horror,342
romance,160
scifi,311


## 1.2. Clean data

In [5]:
import re

from nltk import word_tokenize, PorterStemmer
from nltk.corpus import stopwords
import nltk
nltk.download('punkt')
nltk.download('stopwords')


class SentCleaner:
    def __init__(self, sent, conf):
        self.sent = sent
        self.sent_tokenized = None
        self.conf = conf

    def lower_case(self):
        if self.conf['lower']:
            self.sent = self.sent.lower()
        return self

    def tokenize(self):
        if self.conf['token']:
            self.sent_tokenized = word_tokenize(self.sent)
        return self

    def remove_stopwords(self, stop_words):
        if self.conf['remove_stop']:
            self.sent_tokenized = [word for word in self.sent_tokenized if word not in stop_words]
        return self

    def remove_punct(self):
        if self.conf['remove_punc']:
            self.sent_tokenized = [word for word in self.sent_tokenized if re.search('[a-z]', word)]
        return self

    def stem_words(self):
        if self.conf['stem']:
            stemmer = PorterStemmer()
            self.sent_tokenized = [stemmer.stem(word) for word in self.sent_tokenized]
        return self

    def remove_escapes(self):
        if self.conf['remove_esc']:
            stripped = [word.replace('\n', '') for word in self.sent_tokenized]
            self.sent_tokenized = [word for word in stripped if word != '']
        return self

    def clean_sent(self):
        self.lower_case() \
            .tokenize() \
            .remove_punct() \
            .remove_escapes() \
            .stem_words() \
            .remove_stopwords(stopwords.words('english'))

        return ' '.join(self.sent_tokenized)
    
    
# Sentence cleaner conf
sent_cleaner_conf = dict()
sent_cleaner_conf['token']  = True
sent_cleaner_conf['lower']  = True
sent_cleaner_conf['encode'] = True
sent_cleaner_conf['remove_stop'] = False
sent_cleaner_conf['remove_punc'] = False
sent_cleaner_conf['remove_esc'] = False
sent_cleaner_conf['stem'] = True

# Transform plots into vectors using lookup
#df.loc[:, 'plot'] = df['plot'].apply(lambda x: SentCleaner(x, sent_cleaner_conf).clean_sent())

[nltk_data] Downloading package punkt to /home/bptran/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to /home/bptran/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [6]:
df

Unnamed: 0,genre,plot
0,action,frank vega is a decorated vietnam war veteran ...
1,action,journalist matt nashs dylan walsh investigatio...
2,action,in the midtolate 1960s three young men leave t...
3,action,po sing the youngest son of chinese triad boss...
4,action,clay santell audie murphy has his horse stolen...
...,...,...
2677,crime,a mexican newspaperman wages a oneman war agai...
2678,crime,larry crain peter cookson a medical student on...
2679,crime,a texas ranger samantha payne opens up a fifte...
2680,crime,billy dempsey is a well dressed bank robber wh...


In [7]:
#Commence data cleaning, split data into X and Y
plot_list, genre_list = df['plot'] , df['genre']

#Load, pre-process and clean data before splitting into train and test set
lemma = WordNetLemmatizer()


## 1.3. Tokenization, embeddings

In [8]:
def tokenize(texts):
    """Tokenize texts, build vocabulary and find maximum sentence length.
    
    Args:
        texts (List[str]): List of text data
    
    Returns:
        tokenized_texts (List[List[str]]): List of list of tokens
        word2idx (Dict): Vocabulary built from the corpus
        max_len (int): Maximum sentence length
    """

    max_len = 0
    tokenized_texts = []
    word2idx = {}

    # Add <pad> and <unk> tokens to the vocabulary
    word2idx['<pad>'] = 0
    word2idx['<unk>'] = 1

    # Building our vocab from the corpus starting from index 2
    idx = 2
    for sent in texts:
        tokenized_sent = word_tokenize(sent)

        # Add `tokenized_sent` to `tokenized_texts`
        tokenized_texts.append(tokenized_sent)

        # Add new token to `word2idx`
        for token in tokenized_sent:
            if token not in word2idx:
                word2idx[token] = idx
                idx += 1

        # Update `max_len`
        max_len = max(max_len, len(tokenized_sent))

    return tokenized_texts, word2idx, max_len

def encode(tokenized_texts, word2idx, max_len):
    """Pad each sentence to the maximum sentence length and encode tokens to
    their index in the vocabulary.

    Returns:
        input_ids (np.array): Array of token indexes in the vocabulary with
            shape (N, max_len). It will the input of our CNN model.
    """

    input_ids = []
    for tokenized_sent in tokenized_texts:
        # Pad sentences to max_len
        padd_tokenized_sent = tokenized_sent + ['<pad>'] * (max_len - len(tokenized_sent))

        # Encode tokens to input_ids
        input_id = [word2idx.get(token) for token in padd_tokenized_sent]
        input_ids.append(input_id)
    
    return np.array(input_ids)

def encode_no_pad(tokenized_texts, word2idx):
    """Pad each sentence to the maximum sentence length and encode tokens to
    their index in the vocabulary.

    Returns:
        input_ids (np.array): Array of token indexes in the vocabulary with
            shape (N, max_len). It will the input of our CNN model.
    """

    input_ids = []
    for tokenized_sent in tokenized_texts:
        # Pad sentences to max_len

        # Encode tokens to input_ids
        input_id = [word2idx.get(token) for token in tokenized_sent]
        input_ids.append(input_id)
    
    return input_ids

In [9]:
from tqdm import tqdm

def load_pretrained_vectors(word2idx, fname):
    """Load pretrained vectors and create embedding layers.
    
    Args:
        word2idx (Dict): Vocabulary built from the corpus
        fname (str): Path to pretrained vector file

    Returns:
        embeddings (np.array): Embedding matrix with shape (N, d) where N is
            the size of word2idx and d is embedding dimension
    """

    print("Loading pretrained vectors...")
    fin = open(fname, 'r', encoding='utf-8', newline='\n', errors='ignore')
    if "glove" in fname:
        d = len(fin.readline().split()) - 1
    elif "crawl" in fname:
        n, d = map(int, fin.readline().split())

    # Initilize random embeddings
    embeddings = np.random.uniform(-0.25, 0.25, (len(word2idx), d))
    embeddings[word2idx['<pad>']] = np.zeros((d,))

    # Load pretrained vectors
    count = 0
    for line in tqdm(fin):
        tokens = line.rstrip().split(' ')
        word = tokens[0]
        if word in word2idx:
            count += 1
            embeddings[word2idx[word]] = np.array(tokens[1:], dtype=np.float32)

    print(f"There are {count} / {len(word2idx)} pretrained vectors found.")

    return embeddings

In [10]:
# Tokenize, build vocabulary, encode tokens
print("Tokenizing...\n")
tokenized_texts, word2idx, max_len = tokenize(plot_list)

# Load pretrained vectors, please put 'glove.6B.300d.txt' in current folder to be run.
# 'glove.6B.300d.txt' is downloaded at https://www.kaggle.com/datasets/thanakomsn/glove6b300dtxt
embeddings = load_pretrained_vectors(word2idx, "glove.6B.300d.txt")
embeddings = torch.tensor(embeddings)

Tokenizing...

Loading pretrained vectors...


399999it [00:08, 47237.62it/s]


There are 34162 / 41299 pretrained vectors found.


## 1.4. Preparing dataset and dataloader

In [11]:
from torch.utils.data import (TensorDataset, DataLoader, RandomSampler, Dataset,
                              SequentialSampler)

from typing import List

class FilmGenres(Dataset):
    def __init__(self, inputs: List, labels: np.ndarray):
        '''
        train: True if dataset for training, otherwise False is for testing
        zip_file_path is path containing the plot films
        '''
        self.list_of_plot = inputs
        self.array_of_labels = labels


    def __len__(self):
        return len(self.list_of_plot)

    def __getitem__(self, idx):
        if torch.is_tensor(idx):
            idx = idx.tolist()

        if idx >= len(self):
            raise IndexError

        sample = torch.tensor(self.list_of_plot[idx]), torch.tensor(self.array_of_labels[idx])

        return sample

def data_loader(train_inputs, val_inputs, train_labels, val_labels,batch_size=1):
    """Convert train and validation sets to torch.Tensors and load them to
    DataLoader.
    """


    # Create DataLoader for training data
    train_data = FilmGenres(train_inputs, train_labels)
    train_sampler = RandomSampler(train_data)
    train_dataloader = DataLoader(train_data, sampler=train_sampler, batch_size=batch_size)

    # Create DataLoader for validation data
    val_data = FilmGenres(val_inputs, val_labels)
    val_sampler = SequentialSampler(val_data)
    val_dataloader = DataLoader(val_data, sampler=val_sampler, batch_size=batch_size)

    return train_dataloader, val_dataloader

In [12]:
from sklearn.model_selection import train_test_split

# Train Test Split

# 1. Noting here, if use batch_size > 1, then must use encode
# 2. If use batch_size = 1, then can use encode or encode_no_pad

# train_inputs is list of list of integer number where number is encoded of token, and train_labels is numpy array
# encode tokens

input_ids = encode_no_pad(tokenized_texts, word2idx) # For batch_size = 1
#input_ids = encode(tokenized_texts, word2idx, max_len) # For batch_size > 1

#Transformation for Y#
#create dictionary to retain information on different classes
#action, adventure, comedy, crime, drama, fantasy, historical, horror, romance, scifi
y_info = {'action': 0, 'adventure':1,'comedy':2,'crime':3, 'drama':4,'fantasy':5,'historical':6,'horror':7,'romance':8,'scifi':9}
Y = genre_list.apply(lambda y: y_info[y.lower()])

#Transformation for Y, one hot encode for multiclass
Y = Y.to_numpy() #In order to use reshape below

train_inputs, val_inputs, train_labels, val_labels = train_test_split(
    input_ids, Y, test_size=0.1, random_state=42)

In [13]:
# Load data to PyTorch DataLoader
train_dataloader, val_dataloader = data_loader(train_inputs, val_inputs, train_labels, val_labels, batch_size=1)

# 2. Common train / test procedure for training

In [14]:
if torch.cuda.is_available():       
    device = torch.device("cuda")
    print(f'There are {torch.cuda.device_count()} GPU(s) available.')
    print('Device name:', torch.cuda.get_device_name(0))

else:
    print('No GPU available, using the CPU instead.')
    device = torch.device("cpu")

There are 1 GPU(s) available.
Device name: NVIDIA GeForce RTX 3060 Ti


In [15]:
import random
import time
from tqdm import tqdm

# Specify loss function
loss_fn = nn.CrossEntropyLoss() 


def set_seed(seed_value=42):
    """Set seed for reproducibility."""

    random.seed(seed_value)
    np.random.seed(seed_value)
    torch.manual_seed(seed_value)
    torch.cuda.manual_seed_all(seed_value)

def train(model, optimizer, train_dataloader, val_dataloader=None, epochs=10):
    """Train the CNN model."""
    
    # Tracking best validation accuracy
    best_accuracy = 0

    # Start training loop
    print("Start training...\n")
    print(f"{'Epoch':^7} | {'Train Loss':^12} | {'Val Loss':^10} | {'Val Acc':^9} | {'Elapsed':^9}")
    print("-"*60)

    for epoch_i in range(epochs):
        # =======================================
        #               Training
        # =======================================

        # Tracking time and loss
        t0_epoch = time.time()
        running_loss = 0

        # Put the model into the training mode
        model.train()

        for step, batch in enumerate(tqdm(train_dataloader)):
            # Load batch to GPU
            b_input_ids, b_labels = tuple(t.to(device) for t in batch)
            # Perform a forward pass. This will return logits.
            model_outputs = model(b_input_ids) #added by myself

            # compute loss
            loss = loss_fn(model_outputs,b_labels) #added by myself

            # Zero out any previously calculated gradients
            optimizer.zero_grad() #added by myself

            # Perform a backward pass to calculate gradients
            loss.backward() #added by myself

            # Update parameters
            optimizer.step()

            # Compute loss and accumulate the loss values
            running_loss += loss.item()
            

        # Calculate the average loss over the entire training data
        avg_train_loss = running_loss / len(train_dataloader)

        # =======================================
        #               Evaluation
        # =======================================
        if val_dataloader is not None:
            # After the completion of each training epoch, measure the model's
            # performance on our validation set.
            val_loss, val_accuracy = evaluate(model, val_dataloader)

            # Track the best accuracy
            if val_accuracy > best_accuracy:
                best_accuracy = val_accuracy
                torch.save({
                    'model_state_dict': model.state_dict(),
                    'optimizer_state_dict': optimizer.state_dict(),
                }, f'{PATH}/cnn.pt')

            # Print performance over the entire training data
            time_elapsed = time.time() - t0_epoch
            print(f"{epoch_i + 1:^7} | {avg_train_loss:^12.6f} | {val_loss:^10.6f} | {val_accuracy:^9.2f} | {time_elapsed:^9.2f}")
            
            with open(f'{PATH}/log.txt', 'a') as f:
                f.write(f"{epoch_i + 1:^7} | {avg_train_loss:^12.6f} | {val_loss:^10.6f} | {val_accuracy:^9.2f} | {time_elapsed:^9.2f}\n")
            
    print("\n")
    print(f"Training complete! Best accuracy: {best_accuracy:.2f}%.")

def evaluate(model, val_dataloader):
    """After the completion of each training epoch, measure the model's
    performance on our validation set.
    """
    # Put the model into the evaluation mode. The dropout layers are disabled
    # during the test time.
    model.eval()

    # Tracking variables
    val_accuracy = []
    val_loss = []

    # For each batch in our validation set...
    for batch in val_dataloader:
        # Load batch to GPU
        b_input_ids, b_labels = tuple(t.to(device) for t in batch)

        # Compute logits
        with torch.no_grad():
            logits = model(b_input_ids)

        # Compute loss
        loss = loss_fn(logits, b_labels)
        val_loss.append(loss.item())

        # Get the predictions
        preds = torch.argmax(logits, dim=1).flatten()

        # Calculate the accuracy rate
        accuracy = (preds == b_labels).cpu().numpy().mean() * 100
        val_accuracy.append(accuracy)

    # Compute the average accuracy and loss over the validation set.
    val_loss = np.mean(val_loss)
    val_accuracy = np.mean(val_accuracy)

    return val_loss, val_accuracy

# 2. CNN

In [133]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class CNN_NLP(nn.Module):
    """An 1D Convulational Neural Network for Sentence Classification."""
    def __init__(self,
                 pretrained_embedding=None,
                 freeze_embedding=False,
                 vocab_size=None,
                 embed_dim=300,
                 filter_sizes=[3, 4, 5],
                 num_filters=[100, 100, 100],
                 num_classes=2,
                 dropout=0.5):
        """
        The constructor for CNN_NLP class.

        Args:
            pretrained_embedding (torch.Tensor): Pretrained embeddings with
                shape (vocab_size, embed_dim)
            freeze_embedding (bool): Set to False to fine-tune pretraiend
                vectors. Default: False
            vocab_size (int): Need to be specified when not pretrained word
                embeddings are not used.
            embed_dim (int): Dimension of word vectors. Need to be specified
                when pretrained word embeddings are not used. Default: 300
            filter_sizes (List[int]): List of filter sizes. Default: [3, 4, 5]
            num_filters (List[int]): List of number of filters, has the same
                length as `filter_sizes`. Default: [100, 100, 100]
            n_classes (int): Number of classes. Default: 2
            dropout (float): Dropout rate. Default: 0.5
        """

        super(CNN_NLP, self).__init__()
        # Embedding layer
        if pretrained_embedding is not None:
            self.vocab_size, self.embed_dim = pretrained_embedding.shape
            self.embedding = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.embed_dim = embed_dim
            self.embedding = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=self.embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)
        # Conv Network
        self.conv1d_list = nn.ModuleList([
            nn.Conv1d(in_channels=self.embed_dim,
                      out_channels=num_filters[i],
                      kernel_size=filter_sizes[i])
            for i in range(len(filter_sizes))
        ])
        # Fully-connected layer and Dropout
        self.fc = nn.Linear(np.sum(num_filters), num_classes)
        self.dropout = nn.Dropout(p=dropout)

    def forward(self, input_ids):
        """Perform a forward pass through the network.

        Args:
            input_ids (torch.Tensor): A tensor of token ids with shape
                (batch_size, max_sent_length)

        Returns:
            logits (torch.Tensor): Output logits with shape (batch_size,
                n_classes)
        """

        # Get embeddings from `input_ids`. Output shape: (b, max_len, embed_dim)
        x_embed = self.embedding(input_ids).float()

        # Permute `x_embed` to match input shape requirement of `nn.Conv1d`.
        # Output shape: (b, embed_dim, max_len)
        x_reshaped = x_embed.permute(0, 2, 1)

        # Apply CNN and ReLU. Output shape: (b, num_filters[i], L_out)
        x_conv_list = [F.relu(conv1d(x_reshaped)) for conv1d in self.conv1d_list]

        # Max pooling. Output shape: (b, num_filters[i], 1)
        x_pool_list = [F.max_pool1d(x_conv, kernel_size=x_conv.shape[2])
            for x_conv in x_conv_list]
        
        # Concatenate x_pool_list to feed the fully connected layer.
        # Output shape: (b, sum(num_filters))
        x_fc = torch.cat([x_pool.squeeze(dim=2) for x_pool in x_pool_list],
                         dim=1)
        
        # Compute logits. Output shape: (b, n_classes)
        logits = self.fc(x_fc)

        return logits

In [175]:
import torch.optim as optim

def initilize_cnn_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim=300,
                    filter_sizes=[3, 4, 5],
                    num_filters=[100, 100, 100],
                    num_classes=2,
                    dropout=0.5,
                    learning_rate=0.01):
    """Instantiate a CNN model and an optimizer."""

    assert (len(filter_sizes) == len(num_filters)), "filter_sizes and \
    num_filters need to be of the same length."

    # Instantiate CNN model
    cnn_model = CNN_NLP(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        filter_sizes=filter_sizes,
                        num_filters=num_filters,
                        num_classes=num_classes,
                        dropout=dropout)
    
    # Send model to `device` (GPU/CPU)
    cnn_model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(cnn_model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    # For cnn4
#     optimizer = optim.Adam(cnn_model.parameters(),
#                                lr=learning_rate)

    return cnn_model, optimizer

In [66]:
# 1. CNN model: default params, no pretrained word embeddings.
# Accurcy for this model is 43.12%
set_seed(42)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]
PATH = "cnn1"
os.makedirs(PATH, exist_ok=True)

model, optimizer = initilize_cnn_model(pretrained_embedding=None,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.01)
train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.12it/s]


   1    |   2.293282   |  2.268148  |   19.33   |   18.70  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.01it/s]


   2    |   2.220484   |  2.253192  |   17.10   |   15.54  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.31it/s]


   3    |   2.165154   |  2.231167  |   19.33   |   15.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.49it/s]


   4    |   2.109144   |  2.219299  |   18.96   |   15.21  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 160.89it/s]


   5    |   2.056400   |  2.185814  |   23.79   |   16.34  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.72it/s]


   6    |   1.999704   |  2.168422  |   21.93   |   15.28  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.58it/s]


   7    |   1.942019   |  2.144993  |   26.02   |   16.28  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.19it/s]


   8    |   1.881460   |  2.103863  |   27.88   |   16.78  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.97it/s]


   9    |   1.818709   |  2.083996  |   25.65   |   15.09  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.55it/s]


  10    |   1.752471   |  2.054317  |   28.62   |   16.47  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.89it/s]


  11    |   1.687537   |  2.010256  |   32.34   |   18.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 150.72it/s]


  12    |   1.619893   |  1.996189  |   29.37   |   16.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.81it/s]


  13    |   1.558193   |  1.963698  |   32.71   |   16.36  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.61it/s]


  14    |   1.494256   |  1.931699  |   32.71   |   15.39  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.75it/s]


  15    |   1.432812   |  1.925872  |   34.20   |   16.48  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.95it/s]


  16    |   1.372375   |  1.905156  |   36.43   |   16.25  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.60it/s]


  17    |   1.312309   |  1.872551  |   37.17   |   19.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.42it/s]


  18    |   1.255484   |  1.872791  |   36.06   |   15.41  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.08it/s]


  19    |   1.198083   |  1.850540  |   36.06   |   15.16  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.81it/s]


  20    |   1.143025   |  1.837044  |   36.43   |   15.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.23it/s]


  21    |   1.089340   |  1.827224  |   40.15   |   17.65  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.23it/s]


  22    |   1.034472   |  1.818445  |   38.66   |   15.54  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.70it/s]


  23    |   0.983762   |  1.802272  |   37.55   |   15.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.45it/s]


  24    |   0.934286   |  1.788116  |   40.89   |   17.02  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.87it/s]


  25    |   0.884722   |  1.779114  |   41.64   |   27.49  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 160.99it/s]


  26    |   0.837811   |  1.773255  |   42.75   |   18.54  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.22it/s]


  27    |   0.790269   |  1.764202  |   42.01   |   15.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.13it/s]


  28    |   0.744131   |  1.768785  |   40.52   |   14.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.39it/s]


  29    |   0.701549   |  1.758410  |   41.64   |   15.13  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.76it/s]


  30    |   0.659890   |  1.763848  |   41.64   |   15.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.69it/s]


  31    |   0.619166   |  1.774173  |   40.89   |   15.47  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.62it/s]


  32    |   0.581408   |  1.730550  |   42.38   |   15.59  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.69it/s]


  33    |   0.544703   |  1.743660  |   40.89   |   15.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.31it/s]


  34    |   0.508890   |  1.752039  |   40.89   |   15.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.06it/s]


  35    |   0.475026   |  1.730530  |   40.15   |   15.27  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.87it/s]


  36    |   0.442207   |  1.729662  |   42.75   |   15.56  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.93it/s]


  37    |   0.411979   |  1.742150  |   40.89   |   15.26  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.54it/s]


  38    |   0.382851   |  1.711348  |   43.12   |   16.59  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.27it/s]


  39    |   0.355474   |  1.729051  |   40.15   |   15.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.11it/s]


  40    |   0.328872   |  1.711933  |   41.26   |   15.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.62it/s]


  41    |   0.304747   |  1.713141  |   41.64   |   15.11  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.31it/s]


  42    |   0.280761   |  1.706126  |   41.26   |   14.95  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.33it/s]


  43    |   0.259318   |  1.721127  |   40.15   |   15.13  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.65it/s]


  44    |   0.238914   |  1.702829  |   40.52   |   15.50  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.17it/s]


  45    |   0.219943   |  1.724578  |   40.89   |   15.95  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 147.48it/s]


  46    |   0.202764   |  1.722884  |   40.52   |   16.55  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 145.44it/s]


  47    |   0.185892   |  1.710952  |   39.78   |   16.79  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 147.84it/s]


  48    |   0.170477   |  1.717312  |   39.41   |   16.55  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 150.55it/s]


  49    |   0.156093   |  1.719970  |   40.89   |   16.25  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 148.10it/s]


  50    |   0.142968   |  1.723674  |   40.15   |   16.48  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.60it/s]


  51    |   0.131188   |  1.729650  |   40.89   |   15.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.67it/s]


  52    |   0.120155   |  1.727825  |   39.41   |   15.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.23it/s]


  53    |   0.109654   |  1.728206  |   39.78   |   15.96  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 155.76it/s]


  54    |   0.099909   |  1.733612  |   40.15   |   15.68  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.92it/s]


  55    |   0.091474   |  1.734894  |   40.52   |   16.00  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.43it/s]


  56    |   0.083488   |  1.733776  |   42.01   |   16.02  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 150.22it/s]


  57    |   0.076096   |  1.728545  |   40.15   |   16.24  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.91it/s]


  58    |   0.069825   |  1.738589  |   38.66   |   15.86  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 151.94it/s]


  59    |   0.063679   |  1.738073  |   39.03   |   16.07  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.04it/s]


  60    |   0.057932   |  1.734222  |   39.78   |   15.94  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.76it/s]


  61    |   0.053254   |  1.755561  |   38.66   |   15.98  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.82it/s]


  62    |   0.048805   |  1.742145  |   40.15   |   15.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 154.83it/s]


  63    |   0.044647   |  1.757702  |   39.78   |   15.77  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 154.29it/s]


  64    |   0.040761   |  1.759626  |   38.66   |   15.83  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.00it/s]


  65    |   0.037578   |  1.772580  |   41.64   |   16.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 151.88it/s]


  66    |   0.034282   |  1.773588  |   38.29   |   16.07  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.75it/s]


  67    |   0.031693   |  1.773503  |   40.89   |   14.92  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.08it/s]


  68    |   0.029483   |  1.771065  |   39.78   |   15.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.45it/s]


  69    |   0.027099   |  1.771545  |   38.66   |   15.03  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.64it/s]


  70    |   0.024950   |  1.782578  |   39.03   |   15.12  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 165.61it/s]


  71    |   0.023097   |  1.781915  |   39.03   |   14.75  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.03it/s]


  72    |   0.021206   |  1.776586  |   40.15   |   14.98  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.15it/s]


  73    |   0.019854   |  1.790475  |   39.78   |   15.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.62it/s]


  74    |   0.018389   |  1.793792  |   40.52   |   15.02  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 164.34it/s]


  75    |   0.017203   |  1.796769  |   39.03   |   14.86  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.76it/s]


  76    |   0.016038   |  1.798081  |   39.41   |   14.91  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.60it/s]


  77    |   0.014681   |  1.802942  |   39.41   |   15.39  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 165.78it/s]


  78    |   0.014003   |  1.809171  |   39.41   |   14.73  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 164.51it/s]


  79    |   0.013100   |  1.817970  |   39.03   |   14.84  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.36it/s]


  80    |   0.012235   |  1.813716  |   39.41   |   15.44  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.31it/s]


  81    |   0.011636   |  1.820860  |   39.03   |   15.35  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.93it/s]


  82    |   0.010886   |  1.821392  |   40.15   |   15.58  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.09it/s]


  83    |   0.010276   |  1.828703  |   39.78   |   15.55  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.51it/s]


  84    |   0.009699   |  1.833995  |   38.29   |   15.11  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.28it/s]


  85    |   0.009129   |  1.830969  |   39.78   |   14.96  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 165.63it/s]


  86    |   0.008616   |  1.844593  |   40.52   |   14.74  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.90it/s]


  87    |   0.008479   |  1.848663  |   39.41   |   14.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.95it/s]


  88    |   0.007875   |  1.855515  |   40.15   |   14.89  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.75it/s]


  89    |   0.007601   |  1.851249  |   39.78   |   15.28  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 164.24it/s]


  90    |   0.007190   |  1.859634  |   39.41   |   14.87  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.24it/s]


  91    |   0.006829   |  1.866971  |   39.03   |   15.44  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.16it/s]


  92    |   0.006641   |  1.856753  |   39.78   |   15.34  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.44it/s]


  93    |   0.006290   |  1.864260  |   39.78   |   15.62  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.71it/s]


  94    |   0.006018   |  1.876440  |   38.66   |   15.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 155.73it/s]


  95    |   0.005737   |  1.887922  |   40.15   |   15.70  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.75it/s]


  96    |   0.005468   |  1.890758  |   39.41   |   15.57  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.21it/s]


  97    |   0.005297   |  1.889444  |   37.92   |   15.39  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.28it/s]


  98    |   0.005268   |  1.886382  |   39.41   |   15.62  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.38it/s]


  99    |   0.005042   |  1.891585  |   37.92   |   15.32  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 164.07it/s]


  100   |   0.004969   |  1.899401  |   38.66   |   14.91  


Training complete! Best accuracy: 43.12%.


In [69]:
# 2. CNN model: golve.6b.100d pretrained word vectors are fine-tuned during training.
# Accurcy for this model is 57.99%
PATH = "cnn2"
os.makedirs(PATH, exist_ok=True)

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.01)
train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 691.41it/s]


   1    |   2.262419   |  2.215146  |   19.70   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.31it/s]


   2    |   2.132618   |  2.128111  |   32.71   |   5.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 650.14it/s]


   3    |   2.010236   |  2.048283  |   38.29   |   4.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 601.91it/s]


   4    |   1.882439   |  1.955983  |   41.26   |   5.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 688.38it/s]


   5    |   1.754592   |  1.881234  |   42.38   |   4.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.96it/s]


   6    |   1.635396   |  1.791174  |   45.72   |   4.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 707.86it/s]


   7    |   1.522987   |  1.741618  |   42.75   |   3.57   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 712.14it/s]


   8    |   1.425601   |  1.664994  |   49.44   |   4.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 693.98it/s]


   9    |   1.332618   |  1.619487  |   49.07   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 710.46it/s]


  10    |   1.250328   |  1.575430  |   49.81   |   4.40   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 685.32it/s]


  11    |   1.173043   |  1.557952  |   48.70   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 682.29it/s]


  12    |   1.101914   |  1.522977  |   49.81   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 686.51it/s]


  13    |   1.037401   |  1.504259  |   52.04   |   4.49   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 684.40it/s]


  14    |   0.976041   |  1.487326  |   52.79   |   4.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 676.70it/s]


  15    |   0.918038   |  1.454151  |   52.42   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.47it/s]


  16    |   0.863372   |  1.445732  |   52.42   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 692.44it/s]


  17    |   0.813482   |  1.432040  |   52.42   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 701.81it/s]


  18    |   0.765668   |  1.425066  |   51.30   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 680.95it/s]


  19    |   0.721077   |  1.409029  |   53.90   |   4.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 703.38it/s]


  20    |   0.676353   |  1.397603  |   54.28   |   4.40   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 721.30it/s]


  21    |   0.634814   |  1.386831  |   54.28   |   3.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 666.53it/s]


  22    |   0.596299   |  1.375050  |   54.65   |   4.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 587.96it/s]


  23    |   0.559621   |  1.377080  |   52.79   |   4.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.82it/s]


  24    |   0.523752   |  1.368919  |   56.51   |   5.10   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.44it/s]


  25    |   0.489814   |  1.363990  |   54.28   |   3.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 650.31it/s]


  26    |   0.459669   |  1.359948  |   53.90   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 670.33it/s]


  27    |   0.429518   |  1.350603  |   55.02   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 618.00it/s]


  28    |   0.401706   |  1.357191  |   55.02   |   4.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 675.71it/s]


  29    |   0.373668   |  1.350314  |   56.51   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 536.45it/s]


  30    |   0.348765   |  1.344493  |   56.13   |   4.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 632.95it/s]


  31    |   0.325079   |  1.355716  |   55.76   |   3.98   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 579.39it/s]


  32    |   0.301300   |  1.353260  |   54.65   |   4.57   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.55it/s]


  33    |   0.280309   |  1.359482  |   54.28   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 672.10it/s]


  34    |   0.260041   |  1.359844  |   57.25   |   4.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 606.34it/s]


  35    |   0.241107   |  1.350933  |   55.76   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 508.09it/s]


  36    |   0.222616   |  1.344380  |   56.88   |   4.94   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 500.96it/s]


  37    |   0.205722   |  1.356285  |   55.02   |   5.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 443.80it/s]


  38    |   0.190331   |  1.346815  |   56.51   |   5.63   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 533.15it/s]


  39    |   0.176263   |  1.360944  |   55.02   |   4.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 468.51it/s]


  40    |   0.162137   |  1.364831  |   55.76   |   5.32   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 544.72it/s]


  41    |   0.148627   |  1.353072  |   56.13   |   4.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 536.17it/s]


  42    |   0.137198   |  1.363098  |   54.65   |   4.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 590.31it/s]


  43    |   0.126521   |  1.369204  |   55.39   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 579.58it/s]


  44    |   0.116099   |  1.367330  |   55.02   |   4.33   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 553.26it/s]


  45    |   0.106367   |  1.369703  |   56.51   |   4.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 548.01it/s]


  46    |   0.097836   |  1.379181  |   56.88   |   4.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 564.64it/s]


  47    |   0.089918   |  1.392635  |   53.90   |   4.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 586.06it/s]


  48    |   0.082474   |  1.393073  |   55.02   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.20it/s]


  49    |   0.075319   |  1.396200  |   56.51   |   4.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 627.46it/s]


  50    |   0.068905   |  1.398845  |   55.76   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 501.45it/s]


  51    |   0.063549   |  1.394773  |   55.39   |   4.98   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 482.66it/s]


  52    |   0.058413   |  1.400952  |   57.62   |   7.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 501.15it/s]


  53    |   0.053306   |  1.412647  |   55.39   |   5.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 592.44it/s]


  54    |   0.049277   |  1.417112  |   57.62   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 666.27it/s]


  55    |   0.044952   |  1.420571  |   56.13   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 713.86it/s]


  56    |   0.041384   |  1.420681  |   56.13   |   3.54   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 706.06it/s]


  57    |   0.038052   |  1.443981  |   55.02   |   3.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 714.65it/s]


  58    |   0.034800   |  1.439858  |   56.13   |   3.54   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 721.64it/s]


  59    |   0.032283   |  1.453446  |   55.39   |   3.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 717.77it/s]


  60    |   0.029537   |  1.462102  |   55.76   |   3.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 686.09it/s]


  61    |   0.027187   |  1.458991  |   55.02   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 699.41it/s]


  62    |   0.025171   |  1.476758  |   54.65   |   3.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 711.45it/s]


  63    |   0.023001   |  1.485464  |   56.88   |   3.55   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.18it/s]


  64    |   0.021422   |  1.487547  |   56.13   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 659.30it/s]


  65    |   0.020001   |  1.491377  |   56.13   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 626.74it/s]


  66    |   0.018142   |  1.503266  |   55.76   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.85it/s]


  67    |   0.017034   |  1.509085  |   55.39   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 630.52it/s]


  68    |   0.015723   |  1.514784  |   55.76   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 726.66it/s]


  69    |   0.014844   |  1.524353  |   55.76   |   3.48   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.80it/s]


  70    |   0.013832   |  1.537670  |   55.39   |   3.63   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.90it/s]


  71    |   0.012944   |  1.537258  |   55.76   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 659.26it/s]


  72    |   0.012124   |  1.544264  |   56.13   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 689.17it/s]


  73    |   0.011390   |  1.556145  |   55.76   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 707.15it/s]


  74    |   0.010615   |  1.558473  |   56.13   |   3.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 680.99it/s]


  75    |   0.010051   |  1.560707  |   55.02   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 724.79it/s]


  76    |   0.009274   |  1.565623  |   56.13   |   3.49   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 691.25it/s]


  77    |   0.008959   |  1.575203  |   56.13   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 697.82it/s]


  78    |   0.008312   |  1.574821  |   57.25   |   3.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.45it/s]


  79    |   0.008070   |  1.586724  |   56.88   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 699.80it/s]


  80    |   0.007634   |  1.598430  |   56.88   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 687.15it/s]


  81    |   0.007321   |  1.597461  |   56.51   |   3.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 701.62it/s]


  82    |   0.006750   |  1.618469  |   56.51   |   3.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 697.46it/s]


  83    |   0.006618   |  1.618758  |   56.13   |   3.63   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.94it/s]


  84    |   0.006092   |  1.617753  |   56.13   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 656.56it/s]


  85    |   0.006028   |  1.623977  |   56.51   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 692.38it/s]


  86    |   0.005751   |  1.628727  |   56.51   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 710.38it/s]


  87    |   0.005529   |  1.643622  |   57.25   |   3.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 709.05it/s]


  88    |   0.005283   |  1.646302  |   56.88   |   3.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 650.68it/s]


  89    |   0.005012   |  1.648614  |   56.88   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 587.00it/s]


  90    |   0.004922   |  1.653039  |   57.25   |   4.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 453.86it/s]


  91    |   0.004868   |  1.657956  |   56.51   |   5.48   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 730.60it/s]


  92    |   0.004484   |  1.664589  |   57.62   |   3.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 533.32it/s]


  93    |   0.004465   |  1.664662  |   55.76   |   4.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.27it/s]


  94    |   0.004329   |  1.664946  |   57.62   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 714.31it/s]


  95    |   0.004098   |  1.674927  |   57.25   |   3.54   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 669.67it/s]


  96    |   0.004100   |  1.688478  |   56.51   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.00it/s]


  97    |   0.003750   |  1.685731  |   57.99   |   5.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 675.65it/s]


  98    |   0.003786   |  1.686759  |   55.76   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 633.05it/s]


  99    |   0.003709   |  1.701209  |   57.25   |   4.14   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 532.88it/s]


  100   |   0.003569   |  1.700915  |   56.88   |   4.70   


Training complete! Best accuracy: 57.99%.


In [71]:
# 3. Higher learning rate [0.05, 0.1], with pre-trained embeddings
# Accurcy for this model is 
# 0.05 : 57.99%
# 0.1: 58.36%
PATH = "cnn3"
os.makedirs(PATH, exist_ok=True)

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.1)

# To save time, loading only model from 'cnn2'
checkpoint = torch.load('cnn2/cnn_begin_pretrained.pt')
model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.12it/s]


   1    |   0.007076   |  1.746131  |   58.36   |   4.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 686.45it/s]


   2    |   0.006998   |  1.770568  |   57.62   |   3.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 665.34it/s]


   3    |   0.006931   |  1.788841  |   57.25   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 643.14it/s]


   4    |   0.006744   |  1.821224  |   56.88   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 655.61it/s]


   5    |   0.006045   |  1.856232  |   56.13   |   3.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 689.36it/s]


   6    |   0.006320   |  1.871527  |   56.51   |   3.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 684.14it/s]


   7    |   0.005772   |  1.897759  |   56.51   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 632.01it/s]


   8    |   0.006672   |  1.904018  |   56.88   |   3.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.44it/s]


   9    |   0.006525   |  1.909046  |   55.76   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 614.31it/s]


  10    |   0.007042   |  1.921163  |   57.62   |   4.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 647.78it/s]


  11    |   0.006191   |  1.944497  |   56.51   |   3.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.25it/s]


  12    |   0.005790   |  1.950116  |   56.13   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 679.23it/s]


  13    |   0.006836   |  1.978245  |   57.25   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 635.72it/s]


  14    |   0.007241   |  1.973913  |   56.88   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 608.17it/s]


  15    |   0.006757   |  1.980122  |   57.25   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.75it/s]


  16    |   0.005757   |  1.993319  |   56.88   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 672.00it/s]


  17    |   0.006687   |  2.003813  |   56.88   |   3.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.53it/s]


  18    |   0.005790   |  2.077991  |   56.13   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 626.34it/s]


  19    |   0.007238   |  2.022503  |   56.51   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.99it/s]


  20    |   0.006828   |  2.028250  |   56.13   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.79it/s]


  21    |   0.004859   |  2.029175  |   57.62   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 659.02it/s]


  22    |   0.006443   |  2.021641  |   56.13   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 662.19it/s]


  23    |   0.005641   |  2.040498  |   56.13   |   3.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.12it/s]


  24    |   0.007856   |  2.043886  |   56.51   |   4.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 629.83it/s]


  25    |   0.006952   |  2.074992  |   57.25   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 592.76it/s]


  26    |   0.006589   |  2.056713  |   56.13   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 612.77it/s]


  27    |   0.006935   |  2.062561  |   56.88   |   4.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.80it/s]


  28    |   0.007094   |  2.091054  |   57.62   |   3.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.25it/s]


  29    |   0.007073   |  2.063773  |   56.13   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 627.03it/s]


  30    |   0.007726   |  2.081324  |   56.88   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 627.43it/s]


  31    |   0.006862   |  2.089195  |   56.88   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 641.81it/s]


  32    |   0.006516   |  2.113324  |   56.88   |   3.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.30it/s]


  33    |   0.006833   |  2.103098  |   56.51   |   4.26   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 444.81it/s]


  34    |   0.007217   |  2.096284  |   56.13   |   5.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 692.03it/s]


  35    |   0.007497   |  2.103228  |   56.88   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.28it/s]


  36    |   0.006712   |  2.103571  |   56.51   |   4.22   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 703.24it/s]


  37    |   0.007290   |  2.114613  |   56.51   |   3.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 669.59it/s]


  38    |   0.006887   |  2.119816  |   56.51   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 664.99it/s]


  39    |   0.006669   |  2.120465  |   56.51   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 630.14it/s]


  40    |   0.007585   |  2.122240  |   56.51   |   3.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.66it/s]


  41    |   0.005458   |  2.131325  |   55.39   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 667.67it/s]


  42    |   0.006745   |  2.146051  |   55.39   |   3.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 681.35it/s]


  43    |   0.007847   |  2.143001  |   57.25   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 642.35it/s]


  44    |   0.007636   |  2.148420  |   56.88   |   3.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 681.15it/s]


  45    |   0.006730   |  2.141425  |   55.76   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 633.37it/s]


  46    |   0.007344   |  2.139522  |   55.76   |   3.98   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.38it/s]


  47    |   0.007738   |  2.142797  |   56.13   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 659.36it/s]


  48    |   0.007375   |  2.147985  |   56.13   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 601.45it/s]


  49    |   0.006836   |  2.155402  |   56.88   |   4.18   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 686.55it/s]


  50    |   0.006787   |  2.169912  |   56.13   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 711.41it/s]


  51    |   0.007320   |  2.155166  |   57.99   |   3.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.68it/s]


  52    |   0.007379   |  2.158018  |   56.51   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 667.70it/s]


  53    |   0.006895   |  2.164039  |   55.76   |   3.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 592.48it/s]


  54    |   0.007412   |  2.165062  |   57.62   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 693.15it/s]


  55    |   0.007545   |  2.166045  |   57.25   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 684.93it/s]


  56    |   0.007314   |  2.191320  |   57.25   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 606.73it/s]


  57    |   0.007571   |  2.180587  |   56.13   |   4.18   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.07it/s]


  58    |   0.006657   |  2.174898  |   57.25   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 672.38it/s]


  59    |   0.007073   |  2.173101  |   56.88   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 586.87it/s]


  60    |   0.007203   |  2.196849  |   57.25   |   4.29   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 656.72it/s]


  61    |   0.007231   |  2.177077  |   56.88   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.51it/s]


  62    |   0.007254   |  2.182494  |   56.51   |   3.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 680.68it/s]


  63    |   0.006772   |  2.183945  |   56.51   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 707.31it/s]


  64    |   0.008056   |  2.184931  |   56.51   |   3.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.56it/s]


  65    |   0.007247   |  2.190574  |   56.13   |   4.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 671.28it/s]


  66    |   0.006977   |  2.196994  |   56.13   |   3.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 704.04it/s]


  67    |   0.007148   |  2.193057  |   56.51   |   3.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.56it/s]


  68    |   0.007530   |  2.194299  |   56.13   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.45it/s]


  69    |   0.006738   |  2.211658  |   55.76   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 698.10it/s]


  70    |   0.007754   |  2.214479  |   56.51   |   3.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.89it/s]


  71    |   0.007919   |  2.202568  |   56.13   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 667.26it/s]


  72    |   0.007395   |  2.204583  |   56.51   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.90it/s]


  73    |   0.007048   |  2.212454  |   56.13   |   3.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 606.45it/s]


  74    |   0.007267   |  2.211386  |   56.88   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 528.11it/s]


  75    |   0.006225   |  2.249929  |   57.62   |   4.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 670.76it/s]


  76    |   0.007978   |  2.210308  |   56.88   |   3.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.42it/s]


  77    |   0.007469   |  2.226187  |   57.62   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.29it/s]


  78    |   0.007470   |  2.214926  |   56.51   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.21it/s]


  79    |   0.007611   |  2.232965  |   57.25   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 652.72it/s]


  80    |   0.007887   |  2.234218  |   56.13   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 641.27it/s]


  81    |   0.007606   |  2.243752  |   56.88   |   3.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 605.97it/s]


  82    |   0.006745   |  2.230735  |   56.51   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 687.16it/s]


  83    |   0.008260   |  2.230614  |   56.88   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 699.60it/s]


  84    |   0.007114   |  2.225148  |   56.13   |   3.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 620.67it/s]


  85    |   0.007574   |  2.229854  |   56.13   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 701.68it/s]


  86    |   0.007781   |  2.233307  |   55.76   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 703.03it/s]


  87    |   0.007710   |  2.244884  |   56.13   |   3.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 674.30it/s]


  88    |   0.007354   |  2.236613  |   56.88   |   3.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 690.00it/s]


  89    |   0.007684   |  2.235167  |   56.13   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 690.46it/s]


  90    |   0.007725   |  2.237878  |   56.51   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 627.02it/s]


  91    |   0.008156   |  2.238804  |   56.88   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 723.95it/s]


  92    |   0.006807   |  2.254377  |   56.88   |   3.50   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 669.07it/s]


  93    |   0.007807   |  2.249125  |   57.25   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 699.96it/s]


  94    |   0.007652   |  2.251557  |   57.62   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 694.37it/s]


  95    |   0.007221   |  2.241162  |   55.76   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.76it/s]


  96    |   0.007582   |  2.254964  |   56.88   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 635.44it/s]


  97    |   0.007208   |  2.249812  |   55.76   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 665.10it/s]


  98    |   0.007198   |  2.262463  |   56.51   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 638.90it/s]


  99    |   0.007443   |  2.255573  |   56.51   |   3.94   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 619.03it/s]


  100   |   0.007017   |  2.253099  |   56.51   |   4.10   


Training complete! Best accuracy: 58.36%.


In [77]:
# 4. Using Adam, 
# Best accuracy 43.87%, it is too bad. Stop here
PATH = "cnn4"
os.makedirs(PATH, exist_ok=True)

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.01)

# To save time, loading only model from 'cnn2'
checkpoint = torch.load('cnn2/cnn_begin_pretrained.pt')
model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 565.59it/s]


   1    |  27.018479   | 33.889943  |   22.68   |   5.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 612.49it/s]


   2    |  31.284025   | 42.353149  |   36.43   |   4.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 599.85it/s]


   3    |  22.980801   | 74.935372  |   30.86   |   4.19   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 598.29it/s]


   4    |  23.243506   | 102.959464 |   31.23   |   4.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 611.04it/s]


   5    |  20.806998   | 130.539193 |   29.00   |   4.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 585.46it/s]


   6    |  21.075761   | 148.589776 |   27.51   |   4.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.85it/s]


   7    |  17.247260   | 124.199948 |   35.32   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.59it/s]


   8    |  19.474221   | 210.294230 |   30.48   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 619.28it/s]


   9    |  17.916807   | 238.021215 |   29.37   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 540.77it/s]


  10    |  18.794444   | 236.705219 |   35.32   |   4.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 642.09it/s]


  11    |  17.848900   | 246.089316 |   37.55   |   4.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 608.61it/s]


  12    |  16.713186   | 311.846423 |   38.29   |   4.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 603.67it/s]


  13    |  18.703774   | 302.044197 |   37.17   |   4.17   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 669.95it/s]


  14    |  17.676210   | 281.614913 |   38.29   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 647.87it/s]


  15    |  15.723513   | 355.617684 |   37.92   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 507.09it/s]


  16    |  16.685225   | 488.061031 |   30.48   |   4.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.65it/s]


  17    |  19.237874   | 403.052557 |   34.94   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 626.48it/s]


  18    |  16.942305   | 396.384552 |   39.41   |   4.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.47it/s]


  19    |  19.944880   | 381.719602 |   39.03   |   3.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 631.00it/s]


  20    |  13.038404   | 470.757783 |   36.80   |   3.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 671.74it/s]


  21    |  16.304903   | 604.716828 |   32.34   |   3.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 666.32it/s]


  22    |  17.010283   | 435.686105 |   43.87   |   4.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 690.48it/s]


  23    |  16.607232   | 507.296936 |   39.03   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.30it/s]


  24    |  18.863703   | 497.053925 |   40.52   |   4.22   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 620.65it/s]


  25    |  20.426626   | 544.206381 |   37.92   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 701.60it/s]


  26    |  16.205273   | 734.148306 |   31.97   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 638.20it/s]


  27    |  12.057096   | 574.097553 |   39.78   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 666.91it/s]


  28    |  12.081119   | 601.918675 |   38.66   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 640.92it/s]


  29    |  20.934586   | 609.170839 |   43.12   |   3.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 665.73it/s]


  30    |  13.114630   | 582.108942 |   40.89   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 624.48it/s]


  31    |  15.867928   | 593.313972 |   40.89   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 701.02it/s]


  32    |  16.899607   | 951.488544 |   35.32   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.12it/s]


  33    |  15.272174   | 751.173448 |   38.66   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 683.33it/s]


  34    |  21.624205   | 646.835432 |   42.75   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 647.88it/s]


  35    |  15.181312   | 718.443371 |   40.52   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 660.06it/s]


  36    |  14.650580   | 799.387511 |   39.41   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 631.38it/s]


  37    |  22.785996   | 843.426440 |   37.55   |   3.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 670.97it/s]


  38    |  18.713702   | 822.742793 |   37.17   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.36it/s]


  39    |  20.650486   | 783.641839 |   39.41   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.71it/s]


  40    |  12.825110   | 896.485031 |   34.20   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 621.46it/s]


  41    |  17.583631   | 857.476551 |   35.69   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.63it/s]


  42    |  16.530893   | 816.517238 |   36.43   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 686.02it/s]


  43    |  12.015706   | 880.010033 |   39.41   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.75it/s]


  44    |  22.194392   | 935.832266 |   34.57   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 619.63it/s]


  45    |  17.476034   | 908.646533 |   40.15   |   4.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 638.75it/s]


  46    |  15.201142   | 904.320486 |   40.89   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 653.63it/s]


  47    |  16.874724   | 958.002772 |   36.06   |   3.86   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 642.16it/s]


  48    |  21.240061   | 1002.426422 |   40.52   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.07it/s]


  49    |  17.526299   | 1061.163218 |   36.80   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 661.43it/s]


  50    |  19.322858   | 1020.162029 |   39.78   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 702.31it/s]


  51    |   8.542361   | 968.422705 |   42.75   |   3.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 642.90it/s]


  52    |  22.968258   | 967.649332 |   41.64   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 620.30it/s]


  53    |  16.825992   | 1131.214108 |   41.26   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 630.98it/s]


  54    |  19.455487   | 1092.376592 |   40.15   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.68it/s]


  55    |  11.353025   | 1128.062704 |   39.03   |   4.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 621.63it/s]


  56    |  17.320942   | 1233.260424 |   39.41   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 624.89it/s]


  57    |  17.534728   | 1133.459106 |   37.17   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.78it/s]


  58    |  13.265301   | 1048.856275 |   39.41   |   4.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 611.78it/s]


  59    |  18.440462   | 1145.032256 |   40.89   |   4.13   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 589.76it/s]


  60    |  15.829720   | 1073.144655 |   38.29   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 594.15it/s]


  61    |  18.802443   | 1190.940852 |   35.69   |   4.23   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 652.69it/s]


  62    |  13.967916   | 1129.953954 |   38.29   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.37it/s]


  63    |  17.947217   | 1040.303427 |   39.41   |   4.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 719.19it/s]


  64    |  15.881592   | 1099.333290 |   39.41   |   3.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 616.40it/s]


  65    |  13.865711   | 1190.783008 |   40.52   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 661.25it/s]


  66    |  14.044727   | 1868.126724 |   30.11   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 616.02it/s]


  67    |  19.845808   | 1390.986129 |   37.17   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.06it/s]


  68    |  11.928941   | 1083.421707 |   43.49   |   4.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 621.97it/s]


  69    |  19.490838   | 1244.550759 |   40.52   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.35it/s]


  70    |  13.916882   | 1182.193565 |   41.64   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 591.70it/s]


  71    |  19.212589   | 1187.268794 |   38.66   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 619.41it/s]


  72    |   8.396166   | 1159.878996 |   41.26   |   4.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.55it/s]


  73    |  14.079412   | 1096.541058 |   41.26   |   3.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 607.43it/s]


  74    |   7.477272   | 1171.381154 |   43.87   |   4.14   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.20it/s]


  75    |  21.250630   | 1450.964308 |   37.17   |   4.39   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 606.39it/s]


  76    |   9.817531   | 1162.819581 |   43.12   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 585.14it/s]


  77    |  10.932573   | 1261.410596 |   40.52   |   4.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.90it/s]


  78    |  17.485103   | 1335.040869 |   41.26   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 603.80it/s]


  79    |   8.024812   | 1432.739219 |   38.66   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.34it/s]


  80    |  21.081717   | 1425.166532 |   37.17   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 647.50it/s]


  81    |  18.384877   | 1318.730592 |   42.01   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 655.80it/s]


  82    |  14.044006   | 1323.990439 |   41.64   |   3.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 608.08it/s]


  83    |  13.089703   | 1554.473224 |   39.41   |   4.14   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 624.53it/s]


  84    |  13.047815   | 1485.226902 |   38.29   |   4.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 566.93it/s]


  85    |  15.726193   | 1628.631350 |   38.29   |   4.42   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 645.58it/s]


  86    |  12.716285   | 1486.598874 |   37.92   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 575.30it/s]


  87    |   6.751392   | 1474.520517 |   40.15   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 620.44it/s]


  88    |  18.361865   | 1494.861811 |   39.41   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 607.16it/s]


  89    |  15.048809   | 1477.646686 |   37.92   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 611.93it/s]


  90    |  20.055193   | 1458.636467 |   41.26   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.01it/s]


  91    |  15.086430   | 1523.102138 |   38.66   |   4.17   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 616.66it/s]


  92    |  12.712999   | 1536.131434 |   41.64   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 612.12it/s]


  93    |  17.641946   | 1489.833124 |   36.80   |   4.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 618.59it/s]


  94    |  15.895577   | 1450.734940 |   40.15   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 566.17it/s]


  95    |  13.893105   | 1435.569189 |   40.89   |   4.43   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 637.64it/s]


  96    |  15.670653   | 1385.466311 |   42.38   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 660.21it/s]


  97    |   4.919410   | 1415.094139 |   38.29   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.92it/s]


  98    |  18.826278   | 1559.134138 |   40.15   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 587.21it/s]


  99    |  13.397267   | 1650.620328 |   35.32   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 693.07it/s]


  100   |  12.579413   | 1568.379871 |   36.43   |   3.65   


Training complete! Best accuracy: 43.87%.


In [81]:
# 5. Change kernel and filter size
# Best accuracy 56.51%. We can keep previous settings
PATH = "cnn5"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 4, 5]
num_filters = [128, 256, 512]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.01)


train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 493.41it/s]


   1    |   2.248771   |  2.175104  |   22.30   |   6.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 548.68it/s]


   2    |   2.045843   |  2.073203  |   30.11   |   5.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 569.63it/s]


   3    |   1.857475   |  1.963427  |   42.01   |   5.31   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 556.77it/s]


   4    |   1.673797   |  1.849696  |   46.10   |   5.43   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 530.90it/s]


   5    |   1.501148   |  1.754105  |   44.98   |   4.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 521.39it/s]


   6    |   1.344772   |  1.670467  |   51.30   |   5.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 497.29it/s]


   7    |   1.200639   |  1.631024  |   46.10   |   5.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.18it/s]


   8    |   1.074278   |  1.561736  |   50.19   |   4.40   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 566.20it/s]


   9    |   0.957073   |  1.525137  |   49.07   |   4.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 468.09it/s]


  10    |   0.851900   |  1.480262  |   52.79   |   6.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 544.68it/s]


  11    |   0.757107   |  1.452365  |   51.30   |   4.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 564.11it/s]


  12    |   0.670167   |  1.434715  |   52.42   |   4.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 534.40it/s]


  13    |   0.592099   |  1.421611  |   50.93   |   4.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.00it/s]


  14    |   0.519605   |  1.404279  |   52.42   |   4.40   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.48it/s]


  15    |   0.455545   |  1.377920  |   55.76   |   5.29   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 607.33it/s]


  16    |   0.396487   |  1.386244  |   53.53   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 522.20it/s]


  17    |   0.343916   |  1.366130  |   52.42   |   4.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 570.76it/s]


  18    |   0.298281   |  1.347204  |   53.90   |   4.41   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 587.60it/s]


  19    |   0.256913   |  1.338016  |   54.65   |   4.29   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 557.05it/s]


  20    |   0.218985   |  1.346934  |   53.90   |   4.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 561.99it/s]


  21    |   0.188620   |  1.327853  |   52.79   |   4.48   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 587.09it/s]


  22    |   0.160727   |  1.330392  |   52.42   |   4.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 584.67it/s]


  23    |   0.136896   |  1.351007  |   55.39   |   4.31   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 594.82it/s]


  24    |   0.116365   |  1.334059  |   52.79   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 555.18it/s]


  25    |   0.098450   |  1.328914  |   53.53   |   4.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 560.60it/s]


  26    |   0.083697   |  1.317587  |   54.65   |   4.50   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 574.94it/s]


  27    |   0.071108   |  1.338919  |   54.28   |   4.42   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 563.60it/s]


  28    |   0.060223   |  1.323169  |   53.90   |   4.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 618.05it/s]


  29    |   0.051458   |  1.340281  |   53.90   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 575.08it/s]


  30    |   0.043962   |  1.330914  |   55.02   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 614.17it/s]


  31    |   0.037393   |  1.357118  |   53.16   |   4.11   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 599.99it/s]


  32    |   0.032074   |  1.350923  |   54.65   |   4.20   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 601.95it/s]


  33    |   0.027842   |  1.363628  |   53.16   |   4.19   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 601.88it/s]


  34    |   0.023841   |  1.346816  |   53.16   |   4.19   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.11it/s]


  35    |   0.020672   |  1.352575  |   53.16   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 555.80it/s]


  36    |   0.017966   |  1.365352  |   53.53   |   4.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 433.31it/s]


  37    |   0.016005   |  1.363480  |   54.28   |   5.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 549.53it/s]


  38    |   0.014349   |  1.390664  |   53.53   |   4.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 568.13it/s]


  39    |   0.013014   |  1.379438  |   54.65   |   4.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 600.12it/s]


  40    |   0.011514   |  1.392321  |   54.65   |   4.20   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 577.44it/s]


  41    |   0.010163   |  1.407967  |   54.28   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 607.25it/s]


  42    |   0.009225   |  1.411030  |   54.28   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.77it/s]


  43    |   0.008547   |  1.407682  |   53.16   |   4.28   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 581.81it/s]


  44    |   0.007994   |  1.409773  |   54.28   |   4.33   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 562.75it/s]


  45    |   0.007328   |  1.422695  |   53.90   |   4.47   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 537.13it/s]


  46    |   0.006688   |  1.419555  |   53.90   |   4.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:05<00:00, 478.49it/s]


  47    |   0.006058   |  1.430934  |   54.65   |   5.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 545.80it/s]


  48    |   0.006048   |  1.429040  |   55.02   |   4.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 583.01it/s]


  49    |   0.005803   |  1.434360  |   53.53   |   4.32   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 575.34it/s]


  50    |   0.005261   |  1.441059  |   53.90   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 597.39it/s]


  51    |   0.005099   |  1.448251  |   55.02   |   4.22   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 593.54it/s]


  52    |   0.004963   |  1.452876  |   53.90   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.82it/s]


  53    |   0.004839   |  1.460050  |   55.39   |   4.23   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 618.92it/s]


  54    |   0.004441   |  1.457783  |   53.90   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 546.59it/s]


  55    |   0.004223   |  1.458395  |   56.51   |   5.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 578.77it/s]


  56    |   0.004066   |  1.470534  |   53.53   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 556.19it/s]


  57    |   0.004054   |  1.469347  |   54.65   |   4.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 578.88it/s]


  58    |   0.003847   |  1.475319  |   55.02   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 592.21it/s]


  59    |   0.003812   |  1.468903  |   55.39   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 565.67it/s]


  60    |   0.003680   |  1.474576  |   55.02   |   4.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 584.04it/s]


  61    |   0.003493   |  1.478635  |   53.90   |   4.31   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 531.73it/s]


  62    |   0.003696   |  1.480516  |   55.02   |   4.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 557.67it/s]


  63    |   0.003424   |  1.489484  |   53.90   |   4.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 565.23it/s]


  64    |   0.003415   |  1.488958  |   55.02   |   4.45   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 579.06it/s]


  65    |   0.003354   |  1.494247  |   53.90   |   4.35   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.95it/s]


  66    |   0.003240   |  1.497588  |   55.02   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 558.41it/s]


  67    |   0.003248   |  1.498694  |   55.02   |   4.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 594.81it/s]


  68    |   0.003186   |  1.500009  |   55.02   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 544.94it/s]


  69    |   0.003133   |  1.497387  |   55.76   |   4.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 544.35it/s]


  70    |   0.003072   |  1.502707  |   54.65   |   4.63   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 568.70it/s]


  71    |   0.003064   |  1.511253  |   56.51   |   4.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 572.23it/s]


  72    |   0.002944   |  1.504119  |   55.76   |   4.40   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 569.23it/s]


  73    |   0.002908   |  1.512807  |   53.90   |   4.42   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.25it/s]


  74    |   0.002855   |  1.516236  |   56.13   |   4.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 545.10it/s]


  75    |   0.002827   |  1.519569  |   56.13   |   4.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 600.95it/s]


  76    |   0.002891   |  1.521279  |   55.02   |   4.20   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 590.85it/s]


  77    |   0.002742   |  1.524116  |   56.13   |   4.26   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 492.66it/s]


  78    |   0.002822   |  1.521316  |   54.65   |   5.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 543.38it/s]


  79    |   0.002769   |  1.523415  |   55.39   |   4.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 571.23it/s]


  80    |   0.002759   |  1.530312  |   55.02   |   4.41   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 573.38it/s]


  81    |   0.002673   |  1.530381  |   55.39   |   4.39   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 614.15it/s]


  82    |   0.002449   |  1.529649  |   55.39   |   4.11   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 545.21it/s]


  83    |   0.002565   |  1.532039  |   55.39   |   4.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 549.19it/s]


  84    |   0.002611   |  1.535472  |   55.76   |   4.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 596.00it/s]


  85    |   0.002486   |  1.536463  |   55.39   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 573.42it/s]


  86    |   0.002616   |  1.538731  |   55.39   |   4.39   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 505.36it/s]


  87    |   0.002629   |  1.538934  |   55.02   |   4.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 564.89it/s]


  88    |   0.002527   |  1.537787  |   56.13   |   4.45   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.06it/s]


  89    |   0.002621   |  1.545432  |   55.39   |   4.17   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 616.72it/s]


  90    |   0.002487   |  1.546174  |   55.39   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 610.08it/s]


  91    |   0.002526   |  1.552145  |   55.76   |   4.14   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 618.17it/s]


  92    |   0.002505   |  1.550033  |   55.02   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.32it/s]


  93    |   0.002423   |  1.556594  |   55.39   |   4.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 534.02it/s]


  94    |   0.002438   |  1.551030  |   55.02   |   4.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 540.48it/s]


  95    |   0.002533   |  1.554351  |   56.51   |   4.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 586.32it/s]


  96    |   0.002340   |  1.555198  |   55.02   |   4.32   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 582.02it/s]


  97    |   0.002405   |  1.558838  |   54.65   |   4.33   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 574.69it/s]


  98    |   0.002498   |  1.558725  |   55.39   |   4.39   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 598.92it/s]


  99    |   0.002313   |  1.560645  |   55.39   |   4.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 612.28it/s]


  100   |   0.002431   |  1.557722  |   55.76   |   4.12   


Training complete! Best accuracy: 56.51%.


In [83]:
# 6. Adding dropout
# best accuracy 58.36%

PATH = "cnn6"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0.5,
                                            learning_rate=0.01)

# To save time, loading only model from 'cnn2'
checkpoint = torch.load('cnn2/cnn_begin_pretrained.pt')
model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)


Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.71it/s]


   1    |   0.003874   |  1.691713  |   57.62   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 609.75it/s]


   2    |   0.003915   |  1.692497  |   57.62   |   4.13   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 626.59it/s]


   3    |   0.003866   |  1.695700  |   56.51   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 584.09it/s]


   4    |   0.003587   |  1.701362  |   57.62   |   4.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 626.36it/s]


   5    |   0.003492   |  1.713169  |   57.25   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 681.97it/s]


   6    |   0.003436   |  1.710364  |   56.88   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 644.09it/s]


   7    |   0.003304   |  1.719021  |   57.99   |   4.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 657.40it/s]


   8    |   0.003535   |  1.717021  |   57.25   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 609.45it/s]


   9    |   0.003202   |  1.717945  |   56.88   |   4.13   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.98it/s]


  10    |   0.003225   |  1.724222  |   56.13   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 658.32it/s]


  11    |   0.003154   |  1.732970  |   56.88   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 615.49it/s]


  12    |   0.002946   |  1.732605  |   57.25   |   4.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.90it/s]


  13    |   0.003112   |  1.741588  |   56.88   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 623.90it/s]


  14    |   0.003006   |  1.744822  |   57.99   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 532.73it/s]


  15    |   0.002985   |  1.741008  |   57.99   |   4.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 589.73it/s]


  16    |   0.002794   |  1.747812  |   58.36   |   5.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 641.23it/s]


  17    |   0.002895   |  1.752370  |   57.62   |   3.94   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.65it/s]


  18    |   0.002724   |  1.759851  |   56.51   |   4.22   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 628.50it/s]


  19    |   0.002868   |  1.759341  |   56.88   |   4.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.75it/s]


  20    |   0.002711   |  1.762925  |   57.62   |   4.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 637.57it/s]


  21    |   0.002755   |  1.765603  |   57.99   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 574.39it/s]


  22    |   0.002668   |  1.759157  |   57.62   |   4.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 537.62it/s]


  23    |   0.002533   |  1.768924  |   57.25   |   4.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.52it/s]


  24    |   0.002736   |  1.772559  |   57.25   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 580.49it/s]


  25    |   0.002585   |  1.776629  |   56.51   |   4.33   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 593.17it/s]


  26    |   0.002584   |  1.778307  |   57.25   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 592.53it/s]


  27    |   0.002562   |  1.781916  |   57.25   |   4.25   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 665.86it/s]


  28    |   0.002610   |  1.784326  |   57.25   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 588.75it/s]


  29    |   0.002623   |  1.781280  |   57.25   |   4.26   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 625.73it/s]


  30    |   0.002594   |  1.792993  |   57.25   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.86it/s]


  31    |   0.002528   |  1.797289  |   58.36   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 629.60it/s]


  32    |   0.002382   |  1.796958  |   57.99   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 661.82it/s]


  33    |   0.002460   |  1.803368  |   57.99   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 639.11it/s]


  34    |   0.002487   |  1.798904  |   57.62   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.09it/s]


  35    |   0.002376   |  1.805245  |   57.99   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 597.83it/s]


  36    |   0.002306   |  1.803947  |   57.99   |   4.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 661.11it/s]


  37    |   0.002311   |  1.809730  |   57.99   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.34it/s]


  38    |   0.002287   |  1.810038  |   56.88   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 681.16it/s]


  39    |   0.002287   |  1.815377  |   57.99   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 691.52it/s]


  40    |   0.002283   |  1.814654  |   57.25   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 655.16it/s]


  41    |   0.002118   |  1.815161  |   57.25   |   3.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 683.09it/s]


  42    |   0.002238   |  1.820303  |   57.25   |   3.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.74it/s]


  43    |   0.002350   |  1.825157  |   56.88   |   3.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 687.07it/s]


  44    |   0.002264   |  1.826368  |   57.25   |   3.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 603.87it/s]


  45    |   0.002107   |  1.826506  |   57.25   |   4.18   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 630.14it/s]


  46    |   0.002208   |  1.828581  |   56.88   |   3.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 595.23it/s]


  47    |   0.002199   |  1.831405  |   57.25   |   4.23   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 612.57it/s]


  48    |   0.002216   |  1.834846  |   57.62   |   4.11   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.04it/s]


  49    |   0.002150   |  1.838122  |   57.99   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 615.70it/s]


  50    |   0.002106   |  1.840814  |   57.25   |   4.10   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.52it/s]


  51    |   0.002237   |  1.838190  |   56.13   |   4.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 594.59it/s]


  52    |   0.002164   |  1.842026  |   57.99   |   4.23   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 629.22it/s]


  53    |   0.002084   |  1.843809  |   56.88   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 604.26it/s]


  54    |   0.002111   |  1.845162  |   57.62   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 653.85it/s]


  55    |   0.002133   |  1.849267  |   57.62   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 580.45it/s]


  56    |   0.002081   |  1.848179  |   56.88   |   4.34   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 581.61it/s]


  57    |   0.002099   |  1.854588  |   56.88   |   4.32   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 642.96it/s]


  58    |   0.002093   |  1.855480  |   56.88   |   4.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 597.66it/s]


  59    |   0.002092   |  1.854793  |   57.99   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 593.08it/s]


  60    |   0.002084   |  1.861699  |   57.62   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 519.16it/s]


  61    |   0.002113   |  1.857331  |   56.13   |   4.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 643.75it/s]


  62    |   0.002122   |  1.862748  |   57.62   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 634.04it/s]


  63    |   0.001988   |  1.863797  |   57.99   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 653.46it/s]


  64    |   0.002042   |  1.864273  |   57.62   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 645.84it/s]


  65    |   0.002105   |  1.865456  |   56.88   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 675.84it/s]


  66    |   0.001992   |  1.870100  |   57.62   |   3.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 644.14it/s]


  67    |   0.001936   |  1.870763  |   57.62   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 511.29it/s]


  68    |   0.001944   |  1.872037  |   57.99   |   4.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 653.88it/s]


  69    |   0.002007   |  1.874580  |   57.25   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 658.22it/s]


  70    |   0.002032   |  1.879482  |   56.51   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 576.87it/s]


  71    |   0.002062   |  1.876754  |   57.25   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 631.26it/s]


  72    |   0.002013   |  1.879730  |   57.25   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 641.49it/s]


  73    |   0.001972   |  1.882348  |   57.25   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 634.00it/s]


  74    |   0.001999   |  1.882442  |   57.62   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 594.00it/s]


  75    |   0.001933   |  1.886208  |   55.76   |   4.47   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.62it/s]


  76    |   0.001953   |  1.883972  |   57.25   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 569.13it/s]


  77    |   0.001997   |  1.884119  |   57.62   |   4.41   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 651.13it/s]


  78    |   0.001920   |  1.885845  |   56.88   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 648.48it/s]


  79    |   0.001961   |  1.891501  |   57.25   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 605.15it/s]


  80    |   0.001967   |  1.892676  |   57.25   |   4.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 681.12it/s]


  81    |   0.002009   |  1.891918  |   56.51   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 637.82it/s]


  82    |   0.001891   |  1.899597  |   57.25   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 605.46it/s]


  83    |   0.001950   |  1.899086  |   56.13   |   4.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 637.09it/s]


  84    |   0.001896   |  1.896412  |   56.51   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 581.01it/s]


  85    |   0.001877   |  1.899068  |   56.51   |   4.33   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.70it/s]


  86    |   0.001884   |  1.900182  |   57.25   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 596.76it/s]


  87    |   0.001931   |  1.905298  |   55.76   |   4.23   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 562.17it/s]


  88    |   0.001920   |  1.905018  |   56.88   |   4.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 579.45it/s]


  89    |   0.001857   |  1.905693  |   56.51   |   4.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 601.27it/s]


  90    |   0.001882   |  1.906624  |   57.62   |   4.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.16it/s]


  91    |   0.001937   |  1.908504  |   56.13   |   4.11   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 647.39it/s]


  92    |   0.001789   |  1.908538  |   57.25   |   3.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 663.10it/s]


  93    |   0.001899   |  1.912854  |   56.13   |   3.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 611.06it/s]


  94    |   0.001909   |  1.911889  |   56.88   |   4.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 596.76it/s]


  95    |   0.001811   |  1.912130  |   57.25   |   4.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 671.15it/s]


  96    |   0.001875   |  1.919230  |   55.76   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 637.22it/s]


  97    |   0.001777   |  1.915542  |   57.62   |   3.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 602.41it/s]


  98    |   0.001823   |  1.916051  |   56.13   |   4.17   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 643.78it/s]


  99    |   0.001799   |  1.922180  |   56.88   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 608.89it/s]


  100   |   0.001779   |  1.920510  |   56.51   |   4.15   


Training complete! Best accuracy: 58.36%.


In [85]:
# 7. Using embeddings but also training embeddings. Using dropout=0.5 for best performance
# Accuracy 58.36%

PATH = "cnn7"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=False,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0.5,
                                            learning_rate=0.01)

# To save time, loading only model from 'cnn6'
checkpoint = torch.load('cnn6/cnn.pt')
model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:28<00:00, 83.26it/s]


   1    |   0.002889   |  1.751330  |   57.99   |   29.68  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.16it/s]


   2    |   0.002948   |  1.752914  |   57.99   |   25.62  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.53it/s]


   3    |   0.002950   |  1.754512  |   56.88   |   25.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.29it/s]


   4    |   0.002745   |  1.759011  |   57.62   |   25.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 91.64it/s]


   5    |   0.002679   |  1.768429  |   57.25   |   26.54  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.59it/s]


   6    |   0.002682   |  1.765772  |   56.88   |   25.40  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 92.54it/s]


   7    |   0.002592   |  1.773478  |   57.62   |   26.25  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.11it/s]


   8    |   0.002829   |  1.771187  |   57.62   |   25.29  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.27it/s]


   9    |   0.002554   |  1.771617  |   57.25   |   25.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.92it/s]


  10    |   0.002609   |  1.776357  |   56.88   |   25.86  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.93it/s]


  11    |   0.002579   |  1.784691  |   57.25   |   25.67  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.00it/s]


  12    |   0.002397   |  1.783912  |   57.62   |   25.31  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 91.50it/s]


  13    |   0.002578   |  1.790558  |   57.25   |   26.84  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.07it/s]


  14    |   0.002498   |  1.793666  |   57.99   |   26.10  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.73it/s]


  15    |   0.002494   |  1.789800  |   57.99   |   25.93  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.25it/s]


  16    |   0.002338   |  1.795880  |   58.36   |   27.76  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.18it/s]


  17    |   0.002436   |  1.799329  |   57.62   |   25.26  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.70it/s]


  18    |   0.002303   |  1.805671  |   56.88   |   25.39  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.76it/s]


  19    |   0.002463   |  1.804859  |   56.88   |   25.36  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.89it/s]


  20    |   0.002326   |  1.807381  |   57.62   |   24.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.29it/s]


  21    |   0.002382   |  1.810320  |   57.62   |   25.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.35it/s]


  22    |   0.002318   |  1.804136  |   57.25   |   24.95  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.30it/s]


  23    |   0.002196   |  1.812464  |   57.25   |   24.71  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.41it/s]


  24    |   0.002396   |  1.815468  |   57.25   |   24.45  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.12it/s]


  25    |   0.002274   |  1.819212  |   56.88   |   24.51  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.21it/s]


  26    |   0.002285   |  1.820740  |   56.88   |   24.49  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.41it/s]


  27    |   0.002269   |  1.823632  |   56.88   |   24.44  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.27it/s]


  28    |   0.002318   |  1.825241  |   57.25   |   24.47  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.59it/s]


  29    |   0.002338   |  1.822285  |   56.88   |   25.96  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 90.91it/s]


  30    |   0.002322   |  1.832770  |   56.88   |   26.72  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.91it/s]


  31    |   0.002266   |  1.836106  |   57.62   |   25.88  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 90.06it/s]


  32    |   0.002147   |  1.835712  |   57.62   |   26.97  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.59it/s]


  33    |   0.002219   |  1.840841  |   57.62   |   25.14  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.96it/s]


  34    |   0.002245   |  1.836766  |   57.62   |   25.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 92.93it/s]


  35    |   0.002173   |  1.842743  |   57.62   |   26.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.42it/s]


  36    |   0.002107   |  1.841068  |   57.62   |   24.94  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.19it/s]


  37    |   0.002107   |  1.845987  |   57.62   |   24.99  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 91.32it/s]


  38    |   0.002095   |  1.846355  |   56.88   |   26.58  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.81it/s]


  39    |   0.002096   |  1.850470  |   57.62   |   25.62  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.71it/s]


  40    |   0.002114   |  1.849898  |   57.25   |   25.64  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.01it/s]


  41    |   0.001948   |  1.850268  |   57.25   |   25.29  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.74it/s]


  42    |   0.002069   |  1.854572  |   57.25   |   25.64  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.57it/s]


  43    |   0.002179   |  1.859028  |   56.88   |   25.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.04it/s]


  44    |   0.002110   |  1.860178  |   56.13   |   25.03  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.45it/s]


  45    |   0.001962   |  1.859844  |   57.25   |   24.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.63it/s]


  46    |   0.002058   |  1.861612  |   56.88   |   23.90  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.52it/s]


  47    |   0.002062   |  1.863753  |   57.25   |   24.41  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.04it/s]


  48    |   0.002080   |  1.866933  |   57.62   |   24.28  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.23it/s]


  49    |   0.002015   |  1.869155  |   57.62   |   24.48  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.72it/s]


  50    |   0.001981   |  1.871776  |   56.13   |   25.37  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.76it/s]


  51    |   0.002100   |  1.869740  |   55.39   |   25.63  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:26<00:00, 91.52it/s]


  52    |   0.002041   |  1.873005  |   57.99   |   26.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.24it/s]


  53    |   0.001972   |  1.874572  |   56.88   |   25.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.25it/s]


  54    |   0.001998   |  1.875534  |   57.25   |   24.72  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.93it/s]


  55    |   0.002022   |  1.879185  |   57.25   |   25.07  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.05it/s]


  56    |   0.001974   |  1.878329  |   56.51   |   25.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.45it/s]


  57    |   0.001990   |  1.883393  |   56.51   |   24.67  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.87it/s]


  58    |   0.001995   |  1.884494  |   56.51   |   25.07  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.37it/s]


  59    |   0.001990   |  1.883655  |   57.25   |   24.44  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.86it/s]


  60    |   0.001981   |  1.889516  |   57.25   |   24.33  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.93it/s]


  61    |   0.002009   |  1.885586  |   56.13   |   24.55  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 100.88it/s]


  62    |   0.002027   |  1.890245  |   57.25   |   24.08  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.32it/s]


  63    |   0.001910   |  1.890714  |   57.62   |   24.70  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.86it/s]


  64    |   0.001959   |  1.891483  |   57.62   |   23.85  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.35it/s]


  65    |   0.002007   |  1.892623  |   56.88   |   23.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.62it/s]


  66    |   0.001918   |  1.896605  |   56.88   |   23.67  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.68it/s]


  67    |   0.001865   |  1.897128  |   56.88   |   23.66  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.30it/s]


  68    |   0.001883   |  1.898074  |   57.62   |   24.71  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.47it/s]


  69    |   0.001926   |  1.900431  |   57.25   |   24.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.03it/s]


  70    |   0.001953   |  1.904683  |   56.51   |   23.81  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.84it/s]


  71    |   0.001981   |  1.902236  |   57.25   |   23.85  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.07it/s]


  72    |   0.001934   |  1.904686  |   57.25   |   23.80  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.87it/s]


  73    |   0.001905   |  1.907050  |   56.13   |   23.84  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.69it/s]


  74    |   0.001921   |  1.906861  |   57.62   |   23.89  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.35it/s]


  75    |   0.001858   |  1.910750  |   55.76   |   23.74  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.07it/s]


  76    |   0.001908   |  1.908360  |   56.88   |   23.80  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.09it/s]


  77    |   0.001932   |  1.908188  |   57.25   |   23.79  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.18it/s]


  78    |   0.001874   |  1.909911  |   56.88   |   23.77  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.98it/s]


  79    |   0.001899   |  1.914925  |   56.51   |   23.82  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.42it/s]


  80    |   0.001909   |  1.915859  |   56.88   |   23.72  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.71it/s]


  81    |   0.001941   |  1.915344  |   56.13   |   23.88  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.85it/s]


  82    |   0.001843   |  1.921929  |   57.62   |   24.33  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.65it/s]


  83    |   0.001901   |  1.921639  |   56.13   |   24.87  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.66it/s]


  84    |   0.001859   |  1.919027  |   56.51   |   23.66  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.94it/s]


  85    |   0.001831   |  1.921383  |   56.51   |   23.60  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.20it/s]


  86    |   0.001841   |  1.922471  |   56.51   |   23.54  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.29it/s]


  87    |   0.001882   |  1.926705  |   55.76   |   23.52  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.91it/s]


  88    |   0.001876   |  1.926549  |   56.88   |   23.61  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.93it/s]


  89    |   0.001828   |  1.927279  |   56.51   |   23.60  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.69it/s]


  90    |   0.001846   |  1.928053  |   57.25   |   23.65  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.64it/s]


  91    |   0.001897   |  1.929770  |   56.51   |   23.67  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.07it/s]


  92    |   0.001756   |  1.929865  |   56.88   |   23.57  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.32it/s]


  93    |   0.001860   |  1.933760  |   56.13   |   23.74  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.06it/s]


  94    |   0.001868   |  1.932986  |   55.76   |   23.57  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.24it/s]


  95    |   0.001784   |  1.932761  |   57.25   |   23.53  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.12it/s]


  96    |   0.001837   |  1.938962  |   55.76   |   23.55  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 102.92it/s]


  97    |   0.001763   |  1.935620  |   57.25   |   23.61  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.06it/s]


  98    |   0.001791   |  1.936126  |   55.76   |   23.57  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.36it/s]


  99    |   0.001779   |  1.941386  |   56.88   |   23.50  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 103.31it/s]


  100   |   0.001759   |  1.940019  |   56.51   |   23.52  


Training complete! Best accuracy: 58.36%.


In [100]:
# 8. Clip to 200 to make balance of dataset. Using pretrained, dropout = 0.5 and free training embeddings

# Accuracy 57.14%

PATH = "cnn8"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0.1,
                                            learning_rate=0.005)

# To save time, loading only model from 'cnn6'
#checkpoint = torch.load('cnn6/cnn.pt')
#model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 584.55it/s]


   1    |   2.299594   |  2.286966  |   13.78   |   3.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 600.81it/s]


   2    |   2.238713   |  2.258997  |   28.57   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 576.98it/s]


   3    |   2.188349   |  2.240099  |   23.98   |   3.19   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 563.77it/s]


   4    |   2.141394   |  2.214634  |   36.73   |   3.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 565.73it/s]


   5    |   2.093966   |  2.192097  |   34.69   |   3.26   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 655.17it/s]


   6    |   2.049247   |  2.167140  |   39.29   |   3.59   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 638.89it/s]


   7    |   2.003312   |  2.147462  |   40.31   |   3.55   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.26it/s]


   8    |   1.956889   |  2.121911  |   44.39   |   4.26   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 640.53it/s]


   9    |   1.910895   |  2.101845  |   43.88   |   2.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 646.26it/s]


  10    |   1.865040   |  2.069977  |   44.90   |   3.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 623.27it/s]


  11    |   1.816610   |  2.038376  |   43.37   |   2.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 630.38it/s]


  12    |   1.770249   |  2.011494  |   41.33   |   2.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 614.95it/s]


  13    |   1.722240   |  1.982905  |   44.90   |   3.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 624.41it/s]


  14    |   1.674969   |  1.950785  |   42.35   |   2.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 634.09it/s]


  15    |   1.629235   |  1.929508  |   45.92   |   3.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 604.01it/s]


  16    |   1.582573   |  1.891921  |   52.04   |   3.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 708.06it/s]


  17    |   1.537362   |  1.868981  |   48.98   |   2.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 636.16it/s]


  18    |   1.491412   |  1.832046  |   48.98   |   2.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 627.40it/s]


  19    |   1.448930   |  1.811606  |   46.43   |   2.94   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 634.33it/s]


  20    |   1.405193   |  1.785015  |   54.08   |   3.57   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 632.53it/s]


  21    |   1.362436   |  1.779032  |   48.98   |   2.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 582.15it/s]


  22    |   1.323842   |  1.746838  |   48.98   |   3.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 600.58it/s]


  23    |   1.284025   |  1.725333  |   51.02   |   3.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 632.88it/s]


  24    |   1.243231   |  1.709881  |   47.96   |   2.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 652.03it/s]


  25    |   1.207441   |  1.688430  |   50.51   |   2.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 653.82it/s]


  26    |   1.171551   |  1.667713  |   51.53   |   2.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 634.52it/s]


  27    |   1.135295   |  1.640997  |   51.53   |   2.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 630.32it/s]


  28    |   1.101345   |  1.627313  |   48.98   |   2.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 573.58it/s]


  29    |   1.067600   |  1.618736  |   48.47   |   3.21   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 631.14it/s]


  30    |   1.035327   |  1.598644  |   54.08   |   2.93   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 661.82it/s]


  31    |   1.002283   |  1.586220  |   52.55   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 642.49it/s]


  32    |   0.972054   |  1.573936  |   52.55   |   2.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 649.81it/s]


  33    |   0.941957   |  1.565593  |   54.59   |   3.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 576.51it/s]


  34    |   0.912213   |  1.548813  |   53.06   |   3.20   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 661.29it/s]


  35    |   0.883481   |  1.534437  |   55.10   |   3.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 612.20it/s]


  36    |   0.855026   |  1.530361  |   54.08   |   3.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 650.64it/s]


  37    |   0.827621   |  1.515397  |   55.10   |   2.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 673.38it/s]


  38    |   0.802173   |  1.508806  |   54.08   |   2.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 659.70it/s]


  39    |   0.775514   |  1.492377  |   53.57   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 563.10it/s]


  40    |   0.751967   |  1.490611  |   54.08   |   3.27   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 646.72it/s]


  41    |   0.726760   |  1.478391  |   56.63   |   3.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 599.33it/s]


  42    |   0.703377   |  1.468814  |   55.10   |   3.09   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 617.03it/s]


  43    |   0.678693   |  1.481461  |   54.59   |   3.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 598.51it/s]


  44    |   0.658099   |  1.462458  |   54.08   |   3.13   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 606.25it/s]


  45    |   0.635506   |  1.454610  |   54.59   |   3.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 613.76it/s]


  46    |   0.614693   |  1.440434  |   54.08   |   3.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.46it/s]


  47    |   0.593868   |  1.445222  |   55.10   |   3.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 522.93it/s]


  48    |   0.573273   |  1.438516  |   54.59   |   3.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 669.21it/s]


  49    |   0.553922   |  1.431679  |   57.14   |   4.22   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 620.53it/s]


  50    |   0.535049   |  1.423321  |   54.08   |   2.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 626.32it/s]


  51    |   0.515992   |  1.418512  |   56.63   |   2.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 664.51it/s]


  52    |   0.497792   |  1.421459  |   53.06   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 628.62it/s]


  53    |   0.480770   |  1.407953  |   55.10   |   2.94   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 636.62it/s]


  54    |   0.463599   |  1.403984  |   56.12   |   2.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 600.74it/s]


  55    |   0.447418   |  1.397892  |   55.10   |   3.08   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 604.59it/s]


  56    |   0.431615   |  1.394242  |   53.57   |   3.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 621.48it/s]


  57    |   0.415428   |  1.399688  |   53.57   |   2.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 624.97it/s]


  58    |   0.400599   |  1.394790  |   53.06   |   2.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 613.52it/s]


  59    |   0.386257   |  1.381425  |   55.10   |   3.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 613.06it/s]


  60    |   0.371625   |  1.384932  |   53.57   |   3.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 612.38it/s]


  61    |   0.357898   |  1.382950  |   54.59   |   3.02   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 655.35it/s]


  62    |   0.344615   |  1.382533  |   53.57   |   2.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 644.66it/s]


  63    |   0.331233   |  1.384639  |   54.59   |   2.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 737.82it/s]


  64    |   0.318730   |  1.372570  |   56.63   |   2.52   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 719.09it/s]


  65    |   0.306631   |  1.374139  |   55.10   |   2.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 692.40it/s]


  66    |   0.294997   |  1.367303  |   54.59   |   2.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 711.55it/s]


  67    |   0.283530   |  1.367584  |   53.06   |   2.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 683.77it/s]


  68    |   0.272547   |  1.372834  |   55.61   |   2.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 724.20it/s]


  69    |   0.261540   |  1.364196  |   55.10   |   2.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 679.25it/s]


  70    |   0.251315   |  1.373935  |   53.57   |   2.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 694.52it/s]


  71    |   0.241413   |  1.362424  |   54.59   |   2.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 683.96it/s]


  72    |   0.231433   |  1.368605  |   55.10   |   2.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 724.29it/s]


  73    |   0.222339   |  1.353240  |   55.10   |   2.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 716.15it/s]


  74    |   0.213421   |  1.359918  |   54.08   |   2.59   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 721.51it/s]


  75    |   0.204899   |  1.354200  |   55.10   |   2.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 699.86it/s]


  76    |   0.196443   |  1.355458  |   53.06   |   2.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 697.71it/s]


  77    |   0.188354   |  1.350211  |   53.57   |   2.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 660.51it/s]


  78    |   0.180278   |  1.360092  |   54.59   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 705.04it/s]


  79    |   0.172928   |  1.354855  |   55.61   |   2.63   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 694.72it/s]


  80    |   0.165764   |  1.357529  |   55.10   |   2.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 701.29it/s]


  81    |   0.158963   |  1.349842  |   55.10   |   2.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 727.92it/s]


  82    |   0.151956   |  1.361785  |   52.04   |   2.55   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 663.98it/s]


  83    |   0.145456   |  1.348823  |   55.10   |   2.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 689.62it/s]


  84    |   0.139181   |  1.350199  |   56.12   |   2.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 673.27it/s]


  85    |   0.133502   |  1.349238  |   55.61   |   2.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 675.86it/s]


  86    |   0.127379   |  1.347191  |   55.10   |   2.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 662.12it/s]


  87    |   0.122417   |  1.356978  |   54.08   |   2.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 685.91it/s]


  88    |   0.116742   |  1.348208  |   56.12   |   2.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 694.78it/s]


  89    |   0.111594   |  1.362856  |   54.08   |   2.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 696.12it/s]


  90    |   0.107185   |  1.361599  |   54.59   |   2.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 700.78it/s]


  91    |   0.102420   |  1.356775  |   55.61   |   2.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 659.80it/s]


  92    |   0.097971   |  1.347167  |   54.08   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 730.06it/s]


  93    |   0.093584   |  1.346606  |   53.06   |   2.54   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 719.94it/s]


  94    |   0.089611   |  1.358451  |   53.57   |   2.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 697.75it/s]


  95    |   0.085737   |  1.356858  |   54.08   |   2.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 716.08it/s]


  96    |   0.081986   |  1.350435  |   55.10   |   2.59   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 711.60it/s]


  97    |   0.078252   |  1.362642  |   54.59   |   2.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 700.91it/s]


  98    |   0.074922   |  1.361479  |   56.12   |   2.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 695.25it/s]


  99    |   0.071717   |  1.363690  |   55.10   |   2.66   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 722.89it/s]


  100   |   0.068592   |  1.356034  |   56.12   |   2.57   


Training complete! Best accuracy: 57.14%.


In [103]:
# 9. Clip to 200 to make balance of dataset. Using pretrained, dropout = 0.5 and free training embeddings.
# Using batch

# Accuracy 56.63%

PATH = "cnn9"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0.1,
                                            learning_rate=0.005)

# To save time, loading only model from 'cnn6'
#checkpoint = torch.load('cnn6/cnn.pt')
#model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:03<00:00, 138.42it/s]


   1    |   2.305943   |  2.294619  |   8.67    |   3.53   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.25it/s]


   2    |   2.267723   |  2.279502  |   17.86   |   3.52   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.34it/s]


   3    |   2.238812   |  2.269204  |   23.47   |   3.60   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.48it/s]


   4    |   2.211913   |  2.255791  |   29.59   |   3.49   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.68it/s]


   5    |   2.184964   |  2.243660  |   31.63   |   3.63   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.33it/s]


   6    |   2.159493   |  2.230788  |   37.76   |   3.56   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.13it/s]


   7    |   2.133958   |  2.221424  |   36.22   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.30it/s]


   8    |   2.108573   |  2.208602  |   34.18   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.23it/s]


   9    |   2.084032   |  2.198529  |   37.76   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.22it/s]


  10    |   2.059019   |  2.184924  |   39.80   |   3.57   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.34it/s]


  11    |   2.033368   |  2.169486  |   37.76   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.49it/s]


  12    |   2.008370   |  2.155901  |   38.27   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.94it/s]


  13    |   1.982334   |  2.142128  |   41.33   |   3.53   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.76it/s]


  14    |   1.956328   |  2.124916  |   40.31   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.44it/s]


  15    |   1.930563   |  2.113857  |   39.80   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.96it/s]


  16    |   1.903929   |  2.093583  |   46.43   |   3.52   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.56it/s]


  17    |   1.877513   |  2.080710  |   44.90   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.67it/s]


  18    |   1.849922   |  2.059194  |   44.39   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.72it/s]


  19    |   1.823384   |  2.045541  |   44.39   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.16it/s]


  20    |   1.795597   |  2.027456  |   45.41   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.01it/s]


  21    |   1.767592   |  2.018425  |   44.39   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.52it/s]


  22    |   1.740732   |  1.999076  |   45.41   |   2.91   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.91it/s]


  23    |   1.712785   |  1.981511  |   45.41   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.52it/s]


  24    |   1.684051   |  1.964953  |   41.33   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.97it/s]


  25    |   1.657044   |  1.948500  |   46.43   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.10it/s]


  26    |   1.629725   |  1.929746  |   45.41   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.44it/s]


  27    |   1.601819   |  1.908111  |   44.90   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.84it/s]


  28    |   1.575058   |  1.891922  |   45.92   |   2.87   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.70it/s]


  29    |   1.547936   |  1.879432  |   45.92   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.37it/s]


  30    |   1.521188   |  1.861699  |   47.96   |   3.55   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.76it/s]


  31    |   1.494073   |  1.845570  |   47.45   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.92it/s]


  32    |   1.467880   |  1.830678  |   48.47   |   3.59   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.82it/s]


  33    |   1.441573   |  1.818486  |   47.96   |   2.91   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.93it/s]


  34    |   1.415505   |  1.803277  |   48.98   |   3.64   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.14it/s]


  35    |   1.390463   |  1.785574  |   50.51   |   3.54   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.45it/s]


  36    |   1.364928   |  1.774628  |   51.02   |   3.77   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.25it/s]


  37    |   1.339784   |  1.757356  |   50.51   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 158.71it/s]


  38    |   1.315959   |  1.745386  |   50.00   |   2.98   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.39it/s]


  39    |   1.291212   |  1.730710  |   49.49   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 157.87it/s]


  40    |   1.268020   |  1.720842  |   50.51   |   3.00   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 159.96it/s]


  41    |   1.243650   |  1.706326  |   52.55   |   3.59   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.80it/s]


  42    |   1.220922   |  1.693164  |   55.10   |   3.53   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.05it/s]


  43    |   1.196797   |  1.691725  |   52.55   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.11it/s]


  44    |   1.175791   |  1.674629  |   53.57   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.86it/s]


  45    |   1.153449   |  1.663603  |   53.57   |   2.86   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.98it/s]


  46    |   1.131667   |  1.649500  |   53.57   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.40it/s]


  47    |   1.110356   |  1.643031  |   54.08   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 158.33it/s]


  48    |   1.088951   |  1.634580  |   54.08   |   2.98   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.99it/s]


  49    |   1.068266   |  1.625487  |   52.04   |   2.84   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.72it/s]


  50    |   1.048086   |  1.615422  |   55.61   |   3.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 156.86it/s]


  51    |   1.027575   |  1.604436  |   52.55   |   3.01   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.42it/s]


  52    |   1.007586   |  1.599504  |   50.00   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 159.22it/s]


  53    |   0.988258   |  1.586403  |   54.08   |   2.98   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.16it/s]


  54    |   0.968600   |  1.577805  |   53.06   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.60it/s]


  55    |   0.949583   |  1.569329  |   54.08   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.86it/s]


  56    |   0.930654   |  1.560466  |   55.10   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.21it/s]


  57    |   0.911662   |  1.555962  |   52.55   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.33it/s]


  58    |   0.893863   |  1.547942  |   53.06   |   2.86   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.15it/s]


  59    |   0.875878   |  1.537641  |   53.57   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.64it/s]


  60    |   0.858023   |  1.534582  |   55.10   |   2.86   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 160.67it/s]


  61    |   0.840743   |  1.528794  |   55.61   |   2.96   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.08it/s]


  62    |   0.823540   |  1.520730  |   56.63   |   3.62   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.43it/s]


  63    |   0.806538   |  1.518106  |   55.61   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.76it/s]


  64    |   0.789516   |  1.507346  |   54.59   |   2.93   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.44it/s]


  65    |   0.773496   |  1.503433  |   54.59   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.89it/s]


  66    |   0.757266   |  1.496338  |   54.08   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.56it/s]


  67    |   0.741276   |  1.490256  |   53.57   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.95it/s]


  68    |   0.725423   |  1.489397  |   56.63   |   2.87   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 157.85it/s]


  69    |   0.710071   |  1.480984  |   56.63   |   3.01   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 155.03it/s]


  70    |   0.694456   |  1.481795  |   55.61   |   3.04   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.01it/s]


  71    |   0.680266   |  1.469636  |   56.12   |   2.93   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.22it/s]


  72    |   0.665061   |  1.470332  |   56.12   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.45it/s]


  73    |   0.650362   |  1.456791  |   53.06   |   2.91   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.95it/s]


  74    |   0.636361   |  1.456410  |   55.61   |   2.91   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.08it/s]


  75    |   0.622530   |  1.448886  |   55.61   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.69it/s]


  76    |   0.609017   |  1.447727  |   56.12   |   2.95   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.37it/s]


  77    |   0.595607   |  1.440782  |   55.61   |   2.90   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 156.12it/s]


  78    |   0.582147   |  1.443462  |   56.63   |   3.04   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 158.90it/s]


  79    |   0.569350   |  1.436197  |   56.12   |   2.99   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.90it/s]


  80    |   0.556559   |  1.432779  |   56.12   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 168.83it/s]


  81    |   0.543979   |  1.426408  |   55.61   |   2.81   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.46it/s]


  82    |   0.531484   |  1.427553  |   54.08   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.52it/s]


  83    |   0.519241   |  1.421189  |   56.12   |   2.84   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.26it/s]


  84    |   0.507274   |  1.418695  |   56.63   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.29it/s]


  85    |   0.495932   |  1.413862  |   56.63   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.83it/s]


  86    |   0.484118   |  1.408134  |   56.12   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 165.47it/s]


  87    |   0.472951   |  1.412849  |   56.12   |   2.86   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.20it/s]


  88    |   0.461513   |  1.405544  |   55.61   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 158.43it/s]


  89    |   0.450594   |  1.406116  |   55.61   |   2.99   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 154.63it/s]


  90    |   0.440420   |  1.407500  |   56.12   |   3.07   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 153.92it/s]


  91    |   0.430019   |  1.400327  |   56.12   |   3.08   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.60it/s]


  92    |   0.419615   |  1.392170  |   54.59   |   2.94   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 161.42it/s]


  93    |   0.409253   |  1.390406  |   55.61   |   2.93   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.31it/s]


  94    |   0.399591   |  1.391951  |   54.59   |   2.88   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 166.18it/s]


  95    |   0.389911   |  1.388719  |   55.10   |   2.85   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 164.40it/s]


  96    |   0.380070   |  1.385301  |   56.63   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 162.39it/s]


  97    |   0.370841   |  1.387970  |   55.61   |   2.92   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 158.02it/s]


  98    |   0.361667   |  1.385420  |   56.12   |   2.99   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 163.73it/s]


  99    |   0.352450   |  1.381488  |   56.12   |   2.89   


100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 441/441 [00:02<00:00, 160.47it/s]


  100   |   0.343705   |  1.379291  |   56.63   |   2.96   


Training complete! Best accuracy: 56.63%.


In [139]:
# 10. Clip to 200 to make balance of dataset. Using pretrained, dropout = 0.5 and free training embeddings.
# Clip length to 1000

# Accuracy 58.16%

PATH = "cnn10"
os.makedirs(PATH, exist_ok=True)
filter_sizes = [3, 3, 3]
num_filters = [64, 128, 256]

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0.1,
                                            learning_rate=0.005)

# To save time, loading only model from 'cnn6'
#checkpoint = torch.load('cnn6/cnn.pt')
#model.load_state_dict(checkpoint['model_state_dict'])

train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 483.94it/s]


   1    |   2.299335   |  2.286443  |   13.78   |   4.44   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 619.92it/s]


   2    |   2.238577   |  2.259026  |   27.55   |   3.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 606.28it/s]


   3    |   2.188294   |  2.240204  |   23.98   |   3.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 596.73it/s]


   4    |   2.141460   |  2.214845  |   34.69   |   4.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.19it/s]


   5    |   2.094078   |  2.192137  |   34.69   |   3.04   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 636.04it/s]


   6    |   2.049487   |  2.167653  |   39.29   |   3.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 645.83it/s]


   7    |   2.003481   |  2.147987  |   40.31   |   3.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 697.08it/s]


   8    |   1.957022   |  2.122160  |   44.39   |   3.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 668.73it/s]


   9    |   1.910968   |  2.102070  |   43.88   |   2.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 708.03it/s]


  10    |   1.865059   |  2.070588  |   43.88   |   2.62   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 639.98it/s]


  11    |   1.816599   |  2.039248  |   42.35   |   2.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 664.59it/s]


  12    |   1.770106   |  2.011959  |   41.84   |   2.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 622.31it/s]


  13    |   1.721978   |  1.983003  |   44.39   |   2.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 657.95it/s]


  14    |   1.674728   |  1.951012  |   41.84   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 635.62it/s]


  15    |   1.628886   |  1.929577  |   45.92   |   3.56   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 625.73it/s]


  16    |   1.582041   |  1.892115  |   52.04   |   3.64   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 621.14it/s]


  17    |   1.536764   |  1.869262  |   48.47   |   2.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 647.15it/s]


  18    |   1.490631   |  1.832373  |   47.45   |   2.86   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 645.61it/s]


  19    |   1.448093   |  1.811744  |   47.45   |   2.86   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 632.42it/s]


  20    |   1.404286   |  1.785062  |   51.53   |   2.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 686.55it/s]


  21    |   1.361494   |  1.779444  |   48.47   |   2.70   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 686.66it/s]


  22    |   1.322969   |  1.747601  |   48.47   |   2.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 680.68it/s]


  23    |   1.283162   |  1.726421  |   51.02   |   2.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 666.44it/s]


  24    |   1.242488   |  1.710678  |   46.94   |   2.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 660.31it/s]


  25    |   1.206752   |  1.689781  |   49.49   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 673.52it/s]


  26    |   1.170894   |  1.669430  |   50.00   |   2.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 634.70it/s]


  27    |   1.134631   |  1.642757  |   50.00   |   2.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 599.41it/s]


  28    |   1.100690   |  1.629392  |   50.00   |   3.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 638.36it/s]


  29    |   1.066962   |  1.621103  |   48.98   |   2.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 659.93it/s]


  30    |   1.034632   |  1.601485  |   51.53   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 662.44it/s]


  31    |   1.001622   |  1.589125  |   52.55   |   3.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 585.03it/s]


  32    |   0.971324   |  1.577161  |   53.06   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 593.78it/s]


  33    |   0.941249   |  1.569082  |   52.55   |   3.10   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 662.23it/s]


  34    |   0.911556   |  1.552814  |   54.59   |   3.46   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 584.47it/s]


  35    |   0.882816   |  1.537916  |   54.59   |   3.15   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 688.84it/s]


  36    |   0.854376   |  1.534404  |   53.06   |   2.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 632.04it/s]


  37    |   0.827019   |  1.519486  |   54.08   |   2.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 621.58it/s]


  38    |   0.801560   |  1.513389  |   53.57   |   2.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 665.12it/s]


  39    |   0.774942   |  1.496720  |   54.08   |   2.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 660.18it/s]


  40    |   0.751501   |  1.495363  |   54.59   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 654.18it/s]


  41    |   0.726290   |  1.483587  |   56.12   |   3.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 583.59it/s]


  42    |   0.702998   |  1.473419  |   55.10   |   3.16   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 661.67it/s]


  43    |   0.678355   |  1.485337  |   53.06   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 660.34it/s]


  44    |   0.657735   |  1.467148  |   55.10   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 664.89it/s]


  45    |   0.635196   |  1.458916  |   54.59   |   2.78   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 676.76it/s]


  46    |   0.614446   |  1.445165  |   55.10   |   2.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 677.18it/s]


  47    |   0.593642   |  1.449871  |   54.59   |   2.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 636.40it/s]


  48    |   0.573075   |  1.442605  |   55.10   |   2.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 612.67it/s]


  49    |   0.553754   |  1.436336  |   55.61   |   3.01   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 679.07it/s]


  50    |   0.534979   |  1.428034  |   55.61   |   2.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 674.16it/s]


  51    |   0.515868   |  1.423357  |   56.12   |   2.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 648.34it/s]


  52    |   0.497750   |  1.425812  |   53.06   |   2.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 651.85it/s]


  53    |   0.480697   |  1.411977  |   55.61   |   2.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 626.43it/s]


  54    |   0.463591   |  1.408145  |   56.63   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 658.12it/s]


  55    |   0.447433   |  1.402206  |   54.59   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 674.61it/s]


  56    |   0.431628   |  1.398572  |   55.61   |   2.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 688.96it/s]


  57    |   0.415397   |  1.403746  |   54.08   |   2.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 644.09it/s]


  58    |   0.400547   |  1.398150  |   53.57   |   2.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 652.03it/s]


  59    |   0.386204   |  1.385401  |   55.10   |   2.84   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 639.30it/s]


  60    |   0.371517   |  1.388981  |   54.59   |   2.89   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 616.63it/s]


  61    |   0.357751   |  1.387284  |   56.12   |   2.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 636.60it/s]


  62    |   0.344437   |  1.386740  |   55.61   |   2.90   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 654.63it/s]


  63    |   0.331075   |  1.388067  |   54.08   |   2.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 695.93it/s]


  64    |   0.318533   |  1.376826  |   56.63   |   2.68   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 644.32it/s]


  65    |   0.306431   |  1.377766  |   55.61   |   2.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 658.76it/s]


  66    |   0.294803   |  1.370513  |   55.10   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 642.69it/s]


  67    |   0.283372   |  1.370592  |   53.57   |   2.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 655.75it/s]


  68    |   0.272324   |  1.376917  |   55.10   |   2.82   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 663.47it/s]


  69    |   0.261378   |  1.368119  |   55.10   |   2.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 643.17it/s]


  70    |   0.251154   |  1.377883  |   54.59   |   2.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 715.79it/s]


  71    |   0.241219   |  1.366569  |   55.61   |   2.60   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 659.40it/s]


  72    |   0.231276   |  1.372159  |   55.10   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 660.10it/s]


  73    |   0.222212   |  1.357051  |   55.10   |   2.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 626.25it/s]


  74    |   0.213364   |  1.363898  |   53.57   |   2.95   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 646.09it/s]


  75    |   0.204809   |  1.357459  |   56.63   |   2.86   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 615.44it/s]


  76    |   0.196329   |  1.359382  |   54.59   |   3.00   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 617.16it/s]


  77    |   0.188293   |  1.353858  |   53.57   |   2.99   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.99it/s]


  78    |   0.180214   |  1.363786  |   53.57   |   3.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 608.94it/s]


  79    |   0.172880   |  1.358254  |   55.10   |   3.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.33it/s]


  80    |   0.165724   |  1.361221  |   56.12   |   3.05   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 602.56it/s]


  81    |   0.158901   |  1.352942  |   55.10   |   3.06   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 607.41it/s]


  82    |   0.151924   |  1.363923  |   54.59   |   3.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 554.68it/s]


  83    |   0.145415   |  1.352972  |   56.63   |   3.31   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 552.65it/s]


  84    |   0.139140   |  1.353713  |   56.12   |   3.32   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 593.61it/s]


  85    |   0.133478   |  1.353482  |   58.16   |   3.87   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 635.90it/s]


  86    |   0.127336   |  1.350802  |   55.61   |   2.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 547.20it/s]


  87    |   0.122311   |  1.360249  |   54.59   |   3.36   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 588.98it/s]


  88    |   0.116661   |  1.352294  |   56.63   |   3.12   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 657.33it/s]


  89    |   0.111468   |  1.366482  |   54.08   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 600.67it/s]


  90    |   0.107111   |  1.365337  |   55.61   |   3.30   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 541.86it/s]


  91    |   0.102322   |  1.361077  |   56.12   |   3.38   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:03<00:00, 465.68it/s]


  92    |   0.097894   |  1.350574  |   55.61   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 622.73it/s]


  93    |   0.093430   |  1.350967  |   55.10   |   2.96   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 658.51it/s]


  94    |   0.089498   |  1.361232  |   54.08   |   2.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 718.05it/s]


  95    |   0.085636   |  1.361000  |   55.61   |   2.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 651.69it/s]


  96    |   0.081841   |  1.355201  |   57.65   |   2.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 669.11it/s]


  97    |   0.078115   |  1.367454  |   55.61   |   2.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 648.37it/s]


  98    |   0.074784   |  1.366038  |   55.10   |   2.85   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 599.89it/s]


  99    |   0.071581   |  1.367566  |   55.61   |   3.07   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1764/1764 [00:02<00:00, 678.03it/s]


  100   |   0.068440   |  1.361240  |   55.10   |   2.73   


Training complete! Best accuracy: 58.16%.


In [350]:
# 2. CNN model: golve.6b.100d pretrained word vectors are fine-tuned during training.
# Accurcy for this model is 50.56% all True, 51.65% no stop and escp., remove some is 51.67%i f
PATH = "cnn22"
os.makedirs(PATH, exist_ok=True)

set_seed(42)
model, optimizer = initilize_cnn_model(pretrained_embedding=embeddings,
                                            freeze_embedding=True,
                                            filter_sizes=filter_sizes,
                                            num_filters=num_filters,
                                            num_classes=len(y_info),
                                            vocab_size = len(word2idx),
                                            dropout=0,
                                            learning_rate=0.01)
train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 615.31it/s]


   1    |   2.272877   |  2.236840  |   18.96   |   4.65   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 625.28it/s]


   2    |   2.160587   |  2.165110  |   32.71   |   4.59   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 635.46it/s]


   3    |   2.053868   |  2.101615  |   33.09   |   4.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 636.39it/s]


   4    |   1.941103   |  2.025000  |   37.17   |   4.51   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 659.96it/s]


   5    |   1.826635   |  1.962212  |   35.32   |   3.83   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 614.81it/s]


   6    |   1.718532   |  1.881301  |   39.41   |   4.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 644.19it/s]


   7    |   1.615500   |  1.840962  |   36.06   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 625.62it/s]


   8    |   1.526210   |  1.768583  |   45.72   |   4.58   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 555.22it/s]


   9    |   1.439295   |  1.727581  |   43.49   |   4.53   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 635.72it/s]


  10    |   1.361487   |  1.683202  |   44.24   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 675.49it/s]


  11    |   1.287900   |  1.667006  |   42.38   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:04<00:00, 596.56it/s]


  12    |   1.218434   |  1.632670  |   43.87   |   4.24   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 664.96it/s]


  13    |   1.154727   |  1.609110  |   42.38   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 662.74it/s]


  14    |   1.093359   |  1.593988  |   43.87   |   3.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 709.92it/s]


  15    |   1.035672   |  1.555696  |   48.33   |   4.14   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 635.27it/s]


  16    |   0.980565   |  1.549857  |   46.10   |   3.97   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 683.70it/s]


  17    |   0.928750   |  1.534834  |   46.47   |   3.71   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 667.02it/s]


  18    |   0.879803   |  1.523825  |   47.21   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 662.00it/s]


  19    |   0.833277   |  1.511949  |   49.07   |   4.37   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 673.48it/s]


  20    |   0.786058   |  1.498824  |   48.70   |   3.75   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 624.48it/s]


  21    |   0.742299   |  1.486565  |   46.10   |   4.03   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 643.08it/s]


  22    |   0.701139   |  1.477373  |   48.33   |   3.92   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 622.95it/s]


  23    |   0.662221   |  1.479147  |   49.81   |   4.61   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 678.11it/s]


  24    |   0.623202   |  1.465530  |   49.07   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 690.04it/s]


  25    |   0.586862   |  1.464798  |   47.96   |   3.67   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 662.40it/s]


  26    |   0.553714   |  1.460178  |   48.33   |   3.81   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 665.64it/s]


  27    |   0.520447   |  1.446295  |   49.07   |   3.80   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 669.08it/s]


  28    |   0.489957   |  1.455017  |   48.70   |   3.77   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 685.49it/s]


  29    |   0.458355   |  1.450380  |   49.44   |   3.69   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 677.54it/s]


  30    |   0.430664   |  1.439591  |   49.81   |   3.73   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 638.47it/s]


  31    |   0.404100   |  1.449770  |   50.56   |   4.50   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 668.73it/s]


  32    |   0.377126   |  1.444316  |   48.70   |   3.79   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 646.26it/s]


  33    |   0.352923   |  1.454452  |   50.19   |   3.91   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 678.90it/s]


  34    |   0.329896   |  1.450141  |   50.56   |   3.72   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 649.62it/s]


  35    |   0.307737   |  1.448905  |   49.07   |   3.88   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 671.29it/s]


  36    |   0.286137   |  1.443190  |   49.81   |   3.76   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 676.45it/s]


  37    |   0.266233   |  1.450174  |   49.44   |   3.74   


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:03<00:00, 617.68it/s]


  38    |   0.248400   |  1.438226  |   50.19   |   4.07   


 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                    | 1948/2413 [00:03<00:00, 628.10it/s]


KeyboardInterrupt: 

In [381]:
from torchinfo import summary
summary(model, (1, 100), batch_dim=None, dtypes = [torch.int])

Layer (type:depth-idx)                   Output Shape              Param #
LSTMClassification                       [1, 10]                   --
├─Embedding: 1-1                         [1, 100, 300]             (12,389,700)
├─LSTM: 1-2                              [1, 100, 300]             722,400
├─Linear: 1-3                            [1, 1, 150]               45,150
├─Linear: 1-4                            [1, 1, 10]                1,510
Total params: 13,158,760
Trainable params: 769,060
Non-trainable params: 12,389,700
Total mult-adds (M): 84.68
Input size (MB): 0.00
Forward/backward pass size (MB): 0.48
Params size (MB): 52.64
Estimated Total Size (MB): 53.12

In [None]:
# just a bit analysis


# 2. RNN

In [389]:
class RNNClassification(nn.Module):

    def __init__(self, vocab_size = None,
                 embed_dim = 128,
                 pretrained_embedding = None,
                 freeze_embedding = True,
                 num_classes = 10):
        super(RNNClassification, self).__init__()

        # Embedding layer
        if pretrained_embedding is not None:
            self.vocab_size, self.embed_dim = pretrained_embedding.shape
            self.embedding = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.embed_dim = embed_dim
            self.embedding = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=self.embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)
        
        self.layer1 = self.embedding
        self.layer2 = nn.RNN(       embed_dim , embed_dim*2  , batch_first=True)
        self.layer3 = nn.RNN(       embed_dim*2 , embed_dim*2  , batch_first=True)

        self.layer4 = nn.Linear(    embed_dim*2 , embed_dim  )
        self.layer5 = nn.Linear(    embed_dim , num_classes)

        
    def forward(self, word_seq ):
        g_seq               =   self.layer1( word_seq )
        h_seq, h_final     =   self.layer2( g_seq  )
        h_seq, h_final     =   self.layer3( h_seq  )

        linear1 = F.relu(self.layer4(h_final))
        score_seq           =   self.layer5( linear1 )
        score_seq = score_seq.squeeze(1) # Unsequeeze the seq dimension
        return score_seq 

In [427]:
def initilize_rnn_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim=300,
                    num_classes=2,
                    learning_rate=0.01):
    """Instantiate a RNN model and an optimizer."""

    # Instantiate RNN model
    rnn_model = RNNClassification(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        num_classes=num_classes)
    
    # Send model to `device` (GPU/CPU)
    rnn_model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(rnn_model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    return rnn_model, optimizer

In [428]:
# Best 34.57%
set_seed(42)
PATH = "rnn1"
os.makedirs(PATH, exist_ok=True)
rnn_model, optimizer = initilize_rnn_model(pretrained_embedding=embeddings.float(),
                                            freeze_embedding=True,
                                            vocab_size=len(word2idx),
                                            embed_dim=300,
                                            num_classes=len(y_info),
                                            learning_rate=0.05)
train(rnn_model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.58it/s]


   1    |   2.260403   |  2.237740  |   16.36   |   35.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.93it/s]


   2    |   2.104199   |  2.190195  |   17.84   |   34.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.20it/s]


   3    |   1.933813   |  2.367722  |   20.45   |   34.40  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.18it/s]


   4    |   2.078600   |  2.326385  |   17.47   |   33.89  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.77it/s]


   5    |   2.237669   |  2.279081  |   17.10   |   35.07  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.53it/s]


   6    |   2.220164   |  2.258833  |   18.96   |   34.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.22it/s]


   7    |   2.185287   |  2.192067  |   20.82   |   36.44  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.16it/s]


   8    |   2.199869   |  2.193976  |   20.07   |   33.90  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.37it/s]


   9    |   2.164041   |  2.324805  |   15.24   |   33.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.45it/s]


  10    |   2.157754   |  2.358897  |   15.61   |   33.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.20it/s]


  11    |   2.154673   |  2.158835  |   21.56   |   35.49  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.96it/s]


  12    |   2.131392   |  2.172270  |   21.93   |   36.44  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.55it/s]


  13    |   2.177044   |  2.123536  |   21.56   |   34.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 73.10it/s]


  14    |   2.118130   |  2.123903  |   27.51   |   34.94  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.26it/s]


  15    |   2.123660   |  2.142916  |   23.79   |   34.88  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.62it/s]


  16    |   2.064111   |  2.168588  |   18.59   |   35.56  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.50it/s]


  17    |   2.094564   |  2.136687  |   19.70   |   34.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.47it/s]


  18    |   2.159704   |  2.101619  |   24.91   |   34.66  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.15it/s]


  19    |   2.024799   |  2.200532  |   26.39   |   33.91  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.24it/s]


  20    |   2.023059   |  2.223135  |   21.19   |   33.87  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 73.11it/s]


  21    |   2.035090   |  2.113873  |   23.05   |   34.42  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.53it/s]


  22    |   2.025159   |  2.154514  |   27.88   |   35.28  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.86it/s]


  23    |   2.034510   |  2.182967  |   22.68   |   35.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.38it/s]


  24    |   2.010778   |  2.092408  |   24.16   |   36.25  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.52it/s]


  25    |   2.009596   |  2.243438  |   21.19   |   34.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 70.99it/s]


  26    |   2.010600   |  2.042149  |   25.28   |   35.36  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.78it/s]


  27    |   2.002687   |  2.231570  |   27.51   |   34.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.57it/s]


  28    |   2.002004   |  2.053728  |   27.88   |   35.08  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.37it/s]


  29    |   2.015466   |  2.111137  |   23.05   |   33.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.72it/s]


  30    |   1.995719   |  2.035280  |   30.48   |   35.32  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.94it/s]


  31    |   1.970338   |  1.999153  |   34.57   |   34.97  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.05it/s]


  32    |   1.956415   |  2.033759  |   29.74   |   35.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.90it/s]


  33    |   1.960163   |  2.379384  |   23.42   |   34.01  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.03it/s]


  34    |   1.980069   |  2.021397  |   30.11   |   33.99  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.15it/s]


  35    |   1.929460   |  2.092664  |   30.86   |   34.81  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.92it/s]


  36    |   1.938903   |  2.046751  |   23.42   |   35.46  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.03it/s]


  37    |   1.940576   |  2.228892  |   24.54   |   34.96  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.49it/s]


  38    |   1.946812   |  2.112719  |   26.77   |   34.66  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.08it/s]


  39    |   1.924487   |  2.139008  |   27.14   |   35.32  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:37<00:00, 64.66it/s]


  40    |   1.902972   |  2.116534  |   27.14   |   38.95  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.06it/s]


  41    |   1.870059   |  2.240078  |   27.14   |   36.31  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.47it/s]


  42    |   1.871863   |  2.195543  |   23.05   |   35.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.03it/s]


  43    |   1.962920   |  2.097326  |   24.54   |   34.88  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.24it/s]


  44    |   1.941569   |  2.206328  |   23.42   |   35.30  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.30it/s]


  45    |   1.921043   |  2.133501  |   29.37   |   36.31  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.09it/s]


  46    |   1.891721   |  2.282438  |   26.02   |   36.35  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.23it/s]


  47    |   1.897685   |  2.075388  |   30.86   |   34.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 70.99it/s]


  48    |   1.911718   |  2.123996  |   30.11   |   35.51  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.74it/s]


  49    |   2.000779   |  2.140163  |   19.70   |   35.78  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.31it/s]


  50    |   1.917840   |  2.285768  |   19.33   |   35.69  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.39it/s]


  51    |   1.983770   |  2.093183  |   31.23   |   34.72  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.67it/s]


  52    |   1.952180   |  2.335206  |   21.19   |   35.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.56it/s]


  53    |   1.920332   |  2.238263  |   21.56   |   36.25  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.90it/s]


  54    |   1.910819   |  2.187925  |   18.22   |   34.47  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.48it/s]


  55    |   1.911207   |  2.140202  |   30.86   |   35.61  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.71it/s]


  56    |   1.882382   |  2.234156  |   26.39   |   35.02  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.89it/s]


  57    |   1.871002   |  2.219947  |   27.14   |   35.01  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.44it/s]


  58    |   1.826138   |  2.258228  |   24.16   |   35.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.99it/s]


  59    |   1.821503   |  2.244011  |   22.68   |   34.43  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.49it/s]


  60    |   1.855422   |  2.143929  |   25.28   |   35.25  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 71.56it/s]


  61    |   1.806911   |  2.285545  |   24.16   |   35.83  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.19it/s]


  62    |   1.774415   |  2.266422  |   26.39   |   36.28  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 69.98it/s]


  63    |   1.757945   |  2.340964  |   27.51   |   35.97  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:33<00:00, 72.04it/s]


  64    |   1.823012   |  2.337866  |   21.93   |   34.91  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:35<00:00, 68.87it/s]


  65    |   1.904677   |  2.334200  |   27.88   |   36.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.33it/s]


  66    |   1.800610   |  2.193342  |   28.62   |   35.69  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:34<00:00, 70.69it/s]


  67    |   1.870089   |  2.259777  |   28.25   |   35.61  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 73.59it/s]


  68    |   1.785603   |  2.401963  |   27.14   |   34.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.54it/s]


  69    |   1.741268   |  2.444151  |   27.51   |   33.72  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.69it/s]


  70    |   1.726621   |  2.475894  |   31.23   |   33.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.52it/s]


  71    |   1.705172   |  2.321535  |   24.16   |   33.73  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.39it/s]


  72    |   1.700604   |  2.444140  |   23.05   |   33.78  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 75.00it/s]


  73    |   1.724144   |  2.450035  |   27.88   |   33.51  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.70it/s]


  74    |   1.724216   |  2.229373  |   29.00   |   33.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.84it/s]


  75    |   1.681893   |  2.385627  |   26.39   |   33.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.69it/s]


  76    |   1.700939   |  2.610032  |   29.00   |   33.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 75.01it/s]


  77    |   1.704389   |  2.406587  |   24.16   |   33.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.81it/s]


  78    |   1.790380   |  2.414454  |   24.91   |   33.60  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.89it/s]


  79    |   1.750858   |  2.826639  |   27.88   |   33.57  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.84it/s]


  80    |   1.735099   |  2.417118  |   24.54   |   33.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.75it/s]


  81    |   1.757402   |  2.394335  |   28.62   |   33.63  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.98it/s]


  82    |   1.663699   |  2.678297  |   18.59   |   33.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.84it/s]


  83    |   1.630631   |  2.426883  |   29.37   |   33.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.74it/s]


  84    |   1.596115   |  2.544270  |   27.88   |   33.63  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.74it/s]


  85    |   1.581704   |  3.446000  |   25.65   |   33.63  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.94it/s]


  86    |   1.525216   |  2.869336  |   22.68   |   33.54  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.80it/s]


  87    |   1.515690   |  2.665028  |   22.30   |   33.60  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.87it/s]


  88    |   1.428810   |  3.199214  |   23.79   |   33.64  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.91it/s]


  89    |   1.434175   |  3.202907  |   26.77   |   33.56  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.75it/s]


  90    |   1.388486   |  3.211920  |   22.30   |   33.62  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.98it/s]


  91    |   1.323127   |  3.417773  |   26.02   |   33.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.74it/s]


  92    |   1.198514   |  3.213372  |   23.79   |   33.63  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.89it/s]


  93    |   1.106101   |  3.817589  |   24.91   |   33.57  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.65it/s]


  94    |   1.160034   |  3.648956  |   24.54   |   33.67  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.81it/s]


  95    |   1.040218   |  4.184599  |   24.91   |   33.60  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.70it/s]


  96    |   0.887913   |  4.237421  |   26.02   |   33.65  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.83it/s]


  97    |   0.798563   |  4.252423  |   26.77   |   33.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.90it/s]


  98    |   0.754871   |  4.796848  |   25.28   |   33.56  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.92it/s]


  99    |   0.642498   |  5.302235  |   27.14   |   33.56  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:32<00:00, 74.90it/s]


  100   |   0.551917   |  5.188927  |   23.42   |   33.56  


Training complete! Best accuracy: 34.57%.


In [392]:
from torchinfo import summary
summary(rnn_model, (1, 100), batch_dim=None, dtypes = [torch.int])

Layer (type:depth-idx)                   Output Shape              Param #
RNNClassification                        [1, 10]                   --
├─Embedding: 1-1                         [1, 100, 300]             (12,389,700)
├─RNN: 1-2                               [1, 100, 600]             541,200
├─RNN: 1-3                               [1, 100, 600]             721,200
├─Linear: 1-4                            [1, 1, 300]               180,300
├─Linear: 1-5                            [1, 1, 10]                3,010
Total params: 13,835,410
Trainable params: 1,445,710
Non-trainable params: 12,389,700
Total mult-adds (M): 138.81
Input size (MB): 0.00
Forward/backward pass size (MB): 1.20
Params size (MB): 55.34
Estimated Total Size (MB): 56.54

# 3. LSTM

In [394]:
class LSTMClassification(nn.Module):

    def __init__(self, vocab_size = None,
                 embed_dim = 128,
                 pretrained_embedding = None,
                 freeze_embedding = True,
                 num_classes = 10):
        super(LSTMClassification, self).__init__()

        # Embedding layer
        if pretrained_embedding is not None:
            self.vocab_size, self.embed_dim = pretrained_embedding.shape
            self.embedding = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.embed_dim = embed_dim
            self.embedding = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=self.embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)
        
        self.layer1 = self.embedding
        self.layer2 = nn.LSTM(       embed_dim , embed_dim *2 , batch_first=True)
        self.layer3 = nn.LSTM(       embed_dim *2, embed_dim *2 , batch_first=True)

        self.layer4 = nn.Linear(    embed_dim *2, embed_dim   )
        self.layer5 = nn.Linear(    embed_dim, num_classes)

        
    def forward(self, word_seq ):
        g_seq               =   self.layer1( word_seq )
        h_seq, (h_final,  c_final)     =   self.layer2( g_seq  )
        h_seq, (h_final,  c_final)     =   self.layer3( h_seq  )

        linear1 = F.relu(self.layer4(h_final))
        score_seq           =   self.layer5( linear1 )
        score_seq = score_seq.squeeze(1) # Unsequeeze the seq dimension
        return score_seq 
        

In [395]:
def initilize_lstm_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim=300,
                    num_classes=2,
                    learning_rate=0.01):
    """Instantiate a RNN model and an optimizer."""

    # Instantiate RNN model
    model = LSTMClassification(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        num_classes=num_classes)
    
    # Send model to `device` (GPU/CPU)
    model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    return model, optimizer

In [396]:
set_seed(42)
PATH = "lstm1"
os.makedirs(PATH, exist_ok=True)
model, optimizer = initilize_lstm_model(pretrained_embedding=embeddings.float(),
                                            freeze_embedding=True,
                                            vocab_size=len(word2idx),
                                            embed_dim=300,
                                            num_classes=len(y_info),
                                            learning_rate=0.01)
train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


   1    |   2.299730   |  2.291595  |   12.27   |   81.97  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.18it/s]


   2    |   2.293428   |  2.283350  |   13.01   |   81.96  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.19it/s]


   3    |   2.288061   |  2.278234  |   13.01   |   81.04  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


   4    |   2.285240   |  2.274463  |   13.01   |   81.06  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.18it/s]


   5    |   2.283267   |  2.275230  |   13.01   |   81.04  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


   6    |   2.281481   |  2.271821  |   13.01   |   81.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


   7    |   2.278269   |  2.267755  |   13.01   |   81.07  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.20it/s]


   8    |   2.272426   |  2.259961  |   13.01   |   81.01  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.18it/s]


   9    |   2.259891   |  2.245070  |   14.50   |   81.87  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.21it/s]


  10    |   2.230713   |  2.203253  |   14.13   |   80.98  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.21it/s]


  11    |   2.190236   |  2.141077  |   18.59   |   81.79  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


  12    |   2.139022   |  2.087087  |   18.59   |   81.06  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  13    |   2.068972   |  2.119074  |   19.70   |   82.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  14    |   2.028679   |  2.002793  |   27.51   |   82.05  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  15    |   1.976286   |  1.939025  |   28.25   |   81.92  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  16    |   1.944937   |  1.929872  |   28.62   |   82.05  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  17    |   1.914824   |  1.956335  |   29.74   |   82.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  18    |   1.892577   |  1.918008  |   31.23   |   82.18  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  19    |   1.875940   |  1.880638  |   31.60   |   82.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.06it/s]


  20    |   1.848148   |  1.901449  |   31.97   |   82.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  21    |   1.812378   |  1.869582  |   29.74   |   81.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.08it/s]


  22    |   1.779035   |  1.807806  |   35.69   |   82.06  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  23    |   1.755050   |  1.799614  |   36.06   |   81.95  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  24    |   1.735417   |  1.821128  |   30.48   |   81.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  25    |   1.721394   |  1.754993  |   34.94   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  26    |   1.706580   |  1.861492  |   34.57   |   81.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.06it/s]


  27    |   1.675550   |  1.787746  |   36.80   |   82.11  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  28    |   1.661307   |  1.724033  |   36.80   |   81.11  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  29    |   1.631912   |  1.811395  |   37.55   |   82.08  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  30    |   1.627044   |  1.750652  |   39.41   |   82.06  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  31    |   1.608878   |  1.779096  |   37.92   |   81.12  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  32    |   1.579713   |  1.763056  |   39.03   |   81.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  33    |   1.568618   |  1.738421  |   38.29   |   81.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  34    |   1.542570   |  1.712265  |   44.24   |   82.44  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  35    |   1.535256   |  1.741901  |   42.38   |   81.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  36    |   1.506286   |  1.749998  |   43.49   |   81.24  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  37    |   1.497632   |  1.790807  |   42.01   |   81.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  38    |   1.476124   |  1.717119  |   43.87   |   81.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.16it/s]


  39    |   1.453181   |  1.765704  |   42.38   |   81.12  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  40    |   1.449292   |  1.847746  |   37.92   |   81.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  41    |   1.419261   |  1.729084  |   42.75   |   81.24  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.08it/s]


  42    |   1.405786   |  1.709944  |   39.78   |   81.29  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.06it/s]


  43    |   1.383634   |  1.709913  |   42.75   |   81.34  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  44    |   1.375016   |  1.885891  |   40.89   |   81.25  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  45    |   1.354503   |  1.728985  |   45.35   |   82.04  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  46    |   1.334956   |  1.748094  |   43.87   |   81.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.05it/s]


  47    |   1.307431   |  1.702844  |   43.49   |   81.36  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.09it/s]


  48    |   1.291928   |  1.868278  |   41.64   |   81.27  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  49    |   1.274854   |  1.921373  |   42.75   |   81.26  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  50    |   1.254586   |  1.871729  |   42.01   |   81.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.07it/s]


  51    |   1.229497   |  1.798337  |   44.98   |   81.33  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  52    |   1.208929   |  1.922189  |   37.55   |   81.21  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.07it/s]


  53    |   1.187054   |  1.838921  |   42.75   |   81.31  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  54    |   1.159091   |  1.910127  |   43.12   |   81.23  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.07it/s]


  55    |   1.151161   |  1.982723  |   41.64   |   81.32  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.08it/s]


  56    |   1.117276   |  1.922760  |   42.75   |   81.29  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  57    |   1.099011   |  2.112264  |   40.89   |   81.21  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  58    |   1.073094   |  2.042390  |   43.87   |   81.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  59    |   1.056685   |  2.099123  |   41.26   |   81.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.09it/s]


  60    |   1.035263   |  2.102670  |   42.01   |   81.26  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  61    |   0.994125   |  2.012940  |   40.89   |   81.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  62    |   0.976576   |  2.063424  |   42.01   |   81.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  63    |   0.952877   |  2.246289  |   42.01   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.09it/s]


  64    |   0.920675   |  2.226357  |   43.49   |   81.26  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.16it/s]


  65    |   0.902201   |  2.421894  |   40.52   |   81.10  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  66    |   0.890566   |  2.435267  |   38.29   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  67    |   0.871173   |  2.339767  |   40.15   |   81.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


  68    |   0.818216   |  2.344220  |   42.01   |   81.06  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  69    |   0.802925   |  2.580608  |   39.78   |   81.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  70    |   0.771747   |  2.697257  |   38.29   |   81.14  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  71    |   0.748487   |  2.667109  |   38.66   |   81.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  72    |   0.721196   |  2.572831  |   40.89   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  73    |   0.693800   |  2.625707  |   43.12   |   81.11  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.16it/s]


  74    |   0.673285   |  2.946733  |   37.55   |   81.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.16it/s]


  75    |   0.628804   |  2.930518  |   37.17   |   81.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  76    |   0.600245   |  2.833887  |   39.78   |   81.12  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  77    |   0.568665   |  3.048251  |   39.78   |   81.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  78    |   0.540868   |  3.053381  |   40.89   |   81.15  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  79    |   0.512255   |  3.161236  |   40.15   |   81.11  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  80    |   0.477255   |  3.618650  |   36.43   |   81.16  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  81    |   0.443239   |  3.572180  |   38.66   |   81.11  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.17it/s]


  82    |   0.420713   |  3.762627  |   36.43   |   81.05  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  83    |   0.388052   |  4.117663  |   35.69   |   81.12  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  84    |   0.374535   |  4.043295  |   38.66   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  85    |   0.348253   |  4.302459  |   38.29   |   81.14  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.09it/s]


  86    |   0.326186   |  4.251727  |   39.03   |   81.31  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.10it/s]


  87    |   0.289825   |  4.330535  |   39.41   |   81.24  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.14it/s]


  88    |   0.282393   |  4.558006  |   38.29   |   81.18  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  89    |   0.260956   |  4.634356  |   39.03   |   81.24  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.11it/s]


  90    |   0.247447   |  5.062915  |   39.03   |   81.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  91    |   0.199966   |  4.961502  |   37.55   |   81.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.15it/s]


  92    |   0.196943   |  5.112861  |   35.69   |   81.12  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  93    |   0.171557   |  5.710640  |   35.69   |   81.20  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  94    |   0.166253   |  5.619364  |   36.06   |   81.21  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.13it/s]


  95    |   0.162212   |  5.978985  |   33.09   |   81.17  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  96    |   0.146160   |  6.291325  |   34.94   |   81.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  97    |   0.132360   |  5.419415  |   39.78   |   81.22  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.16it/s]


  98    |   0.112009   |  6.059499  |   37.55   |   81.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.09it/s]


  99    |   0.109974   |  6.669463  |   34.94   |   81.27  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [01:17<00:00, 31.12it/s]


  100   |   0.099459   |  6.304997  |   34.94   |   81.20  


Training complete! Best accuracy: 45.35%.


# 4. RNN with attention-based model

In [420]:
class RNNAttentionClassification(nn.Module):

    def __init__(self, vocab_size = None,
                 embed_dim = 128,
                 pretrained_embedding = None,
                 freeze_embedding = True,
                 num_classes = 10):
        super(RNNAttentionClassification, self).__init__()

        # Embedding layer
        if pretrained_embedding is not None:
            self.vocab_size, self.embed_dim = pretrained_embedding.shape
            self.embedding = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.embed_dim = embed_dim
            self.embedding = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=self.embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)
        
        self.encoder = nn.RNN(       embed_dim , embed_dim  , batch_first=True)

        self.linear1 = nn.Linear(embed_dim, embed_dim)
        
        self.adaptivePool1d = nn.AdaptiveAvgPool1d(1)

        self.linear2 = nn.Linear(    embed_dim *2, embed_dim)
        self.linear3 = nn.Linear(    embed_dim, num_classes)

        
    def forward(self, word_seq ):
        embed_out               =   self.embedding( word_seq )
        h_seq, h_final     =   self.encoder( embed_out  )

        vprime = self.linear1(h_final) # Squeeze the len axis to have V'
        alpha = torch.bmm(h_seq, torch.swapaxes(vprime, 1, 2))
        score = torch.nn.functional.softmax(alpha, dim=1) 
        c_w = torch.mul(h_seq, score)
        c_concat = torch.concat([c_w, h_seq], dim=-1) # batch_size, seq, dims
        
        #linear1 = F.relu(self.linear2(c_concat.mean(dim=1)))
        z = F.relu(self.adaptivePool1d(torch.swapaxes(c_concat, 1, 2)))

        score_seq           =   F.relu(self.linear2( z.squeeze(-1) ))
        score_seq = F.relu(self.linear3(score_seq))
        return score_seq 

In [421]:
model = RNNAttentionClassification(len(word2idx), 300, embeddings.float(), True, 10)
from torchinfo import summary
summary(model, [(1,3)], batch_dim=None, dtypes=[torch.int])

Layer (type:depth-idx)                   Output Shape              Param #
RNNAttentionClassification               [1, 10]                   --
├─Embedding: 1-1                         [1, 3, 300]               (12,389,700)
├─RNN: 1-2                               [1, 3, 300]               180,600
├─Linear: 1-3                            [1, 1, 300]               90,300
├─AdaptiveAvgPool1d: 1-4                 [1, 600, 1]               --
├─Linear: 1-5                            [1, 300]                  180,300
├─Linear: 1-6                            [1, 10]                   3,010
Total params: 12,843,910
Trainable params: 454,210
Non-trainable params: 12,389,700
Total mult-adds (M): 13.21
Input size (MB): 0.00
Forward/backward pass size (MB): 0.02
Params size (MB): 51.38
Estimated Total Size (MB): 51.39

In [422]:
def initilize_rnnattention_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim=300,
                    num_classes=2,
                    learning_rate=0.01):
    """Instantiate a RNN model and an optimizer."""

    # Instantiate RNN model
    model = RNNAttentionClassification(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        num_classes=num_classes)
    
    # Send model to `device` (GPU/CPU)
    model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    return model, optimizer

In [423]:
# Best accuracy49.07%.
set_seed(42)
rnn_model, optimizer = initilize_rnnattention_model(pretrained_embedding=embeddings.float(),
                                            freeze_embedding=True,
                                            vocab_size=len(word2idx),
                                            embed_dim=300,
                                            num_classes=len(y_info),
                                            learning_rate=0.05)
train(rnn_model, optimizer, train_dataloader, val_dataloader, epochs=50)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.41it/s]


   1    |   2.280712   |  2.194203  |   25.65   |   18.29  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 149.26it/s]


   2    |   2.175416   |  2.097893  |   23.05   |   16.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.34it/s]


   3    |   2.079675   |  2.081426  |   27.88   |   16.34  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 166.31it/s]


   4    |   2.013954   |  1.978111  |   33.46   |   15.83  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 167.37it/s]


   5    |   1.918177   |  1.861081  |   39.78   |   16.08  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 166.81it/s]


   6    |   1.851514   |  1.869515  |   37.17   |   15.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.72it/s]


   7    |   1.807654   |  1.816430  |   35.32   |   15.73  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 167.42it/s]


   8    |   1.773855   |  1.783691  |   42.01   |   15.59  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.64it/s]


   9    |   1.747738   |  1.786266  |   43.49   |   15.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 149.33it/s]


  10    |   1.711900   |  1.728597  |   44.98   |   17.32  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.62it/s]


  11    |   1.678622   |  1.754490  |   40.89   |   16.40  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.75it/s]


  12    |   1.647652   |  1.835659  |   38.66   |   15.47  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.72it/s]


  13    |   1.625470   |  1.714899  |   46.47   |   16.27  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 167.15it/s]


  14    |   1.608416   |  1.804339  |   44.61   |   15.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.59it/s]


  15    |   1.587508   |  1.862763  |   43.49   |   15.96  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.76it/s]


  16    |   1.568045   |  1.773535  |   43.87   |   16.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.34it/s]


  17    |   1.545178   |  1.770899  |   44.98   |   15.77  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.81it/s]


  18    |   1.528948   |  1.714312  |   45.35   |   15.70  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 153.26it/s]


  19    |   1.513045   |  1.756683  |   46.84   |   17.05  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 168.04it/s]


  20    |   1.494001   |  1.727979  |   46.84   |   15.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 167.97it/s]


  21    |   1.472236   |  1.726955  |   46.47   |   15.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 168.21it/s]


  22    |   1.450334   |  1.729572  |   47.58   |   15.49  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 167.16it/s]


  23    |   1.427252   |  1.814860  |   46.84   |   15.13  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 155.70it/s]


  24    |   1.417080   |  1.779799  |   45.72   |   16.23  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 154.87it/s]


  25    |   1.399623   |  1.766802  |   47.58   |   16.29  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 146.57it/s]


  26    |   1.368626   |  1.897103  |   47.21   |   17.20  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.26it/s]


  27    |   1.361462   |  1.787916  |   47.96   |   17.00  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.86it/s]


  28    |   1.343121   |  1.863096  |   43.87   |   15.61  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.75it/s]


  29    |   1.326327   |  1.820647  |   49.07   |   15.86  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.79it/s]


  30    |   1.303093   |  1.776313  |   46.84   |   15.43  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.51it/s]


  31    |   1.279590   |  1.914912  |   44.98   |   15.95  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 166.73it/s]


  32    |   1.256375   |  1.888146  |   45.35   |   15.20  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.62it/s]


  33    |   1.228218   |  2.090381  |   44.98   |   16.04  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.45it/s]


  34    |   1.215044   |  1.908150  |   46.84   |   15.85  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 160.45it/s]


  35    |   1.192942   |  1.915620  |   46.10   |   15.74  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.98it/s]


  36    |   1.179065   |  1.972888  |   43.87   |   15.61  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.87it/s]


  37    |   1.148047   |  2.058828  |   44.61   |   16.05  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.58it/s]


  38    |   1.138140   |  2.079309  |   44.24   |   15.64  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 161.65it/s]


  39    |   1.113077   |  2.086973  |   46.84   |   15.68  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 146.98it/s]


  40    |   1.105955   |  2.082172  |   44.61   |   17.23  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 155.21it/s]


  41    |   1.083962   |  2.270435  |   41.26   |   16.29  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 159.39it/s]


  42    |   1.066376   |  2.207500  |   41.64   |   15.88  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 158.51it/s]


  43    |   1.044323   |  2.126619  |   44.24   |   15.92  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 165.63it/s]


  44    |   1.033484   |  2.095661  |   41.26   |   15.27  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 163.61it/s]


  45    |   1.011995   |  2.152436  |   43.49   |   15.47  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 164.30it/s]


  46    |   1.002794   |  2.448980  |   43.12   |   15.42  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.99it/s]


  47    |   0.979274   |  2.278738  |   42.75   |   15.51  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 165.04it/s]


  48    |   0.967535   |  2.243055  |   43.12   |   15.32  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:14<00:00, 162.26it/s]


  49    |   0.942749   |  2.255225  |   43.49   |   15.58  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.51it/s]


  50    |   0.939520   |  2.300923  |   42.38   |   16.14  


Training complete! Best accuracy: 49.07%.


# 5. LSTM with Attention



In [19]:
class LSTMAttentionClassification(nn.Module):

    def __init__(self, vocab_size = None,
                 embed_dim = 128,
                 pretrained_embedding = None,
                 freeze_embedding = True,
                 num_classes = 10):
        super(LSTMAttentionClassification, self).__init__()

        # Embedding layer
        if pretrained_embedding is not None:
            self.vocab_size, self.embed_dim = pretrained_embedding.shape
            self.embedding = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.embed_dim = embed_dim
            self.embedding = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=self.embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)
        
        self.encoder = nn.LSTM(       embed_dim , embed_dim  , batch_first=True)

        self.linear1 = nn.Linear(embed_dim, embed_dim)
        
        self.adaptivePool1d = nn.AdaptiveAvgPool1d(1)

        self.linear2 = nn.Linear(    embed_dim *2, embed_dim)
        self.linear3 = nn.Linear(    embed_dim, num_classes)

        
    def forward(self, word_seq ):
        embed_out               =   self.embedding( word_seq )
        h_seq, (h_final, c_final)     =   self.encoder( embed_out  )

        vprime = self.linear1(h_final) # Squeeze the len axis to have V'
        alpha = torch.bmm(h_seq, torch.swapaxes(vprime, 1, 2))
        score = torch.nn.functional.softmax(alpha, dim=1) 
        c_w = torch.mul(h_seq, score)
        c_concat = torch.concat([c_w, h_seq], dim=-1) # batch_size, seq, dims
        
        #linear1 = F.relu(self.linear2(c_concat.mean(dim=1)))
        z = F.relu(self.adaptivePool1d(torch.swapaxes(c_concat, 1, 2)))

        score_seq           =   F.relu(self.linear2( z.squeeze(-1) ))
        score_seq = self.linear3(score_seq)
        return score_seq 

In [20]:
def initilize_lstmattention_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim=300,
                    num_classes=2,
                    learning_rate=0.01):
    """Instantiate a RNN model and an optimizer."""

    # Instantiate RNN model
    model = LSTMAttentionClassification(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        num_classes=num_classes)
    
    # Send model to `device` (GPU/CPU)
    model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    return model, optimizer

In [21]:
# 49.07%.
PATH = 'lstmattention'
os.makedirs(PATH, exist_ok=True)
set_seed(42)
model, optimizer = initilize_lstmattention_model(pretrained_embedding=embeddings.float(),
                                            freeze_embedding=True,
                                            vocab_size=len(word2idx),
                                            embed_dim=300,
                                            num_classes=len(y_info),
                                            learning_rate=0.1)
train(model, optimizer, train_dataloader, val_dataloader, epochs=50)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.08it/s]


   1    |   2.284548   |  2.248345  |   13.01   |   26.78  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.82it/s]


   2    |   2.119614   |  1.907035  |   30.86   |   26.49  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.25it/s]


   3    |   1.873406   |  1.722912  |   40.15   |   26.34  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.45it/s]


   4    |   1.713524   |  1.656140  |   37.17   |   25.71  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.89it/s]


   5    |   1.598899   |  1.735105  |   32.34   |   26.13  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.09it/s]


   6    |   1.505626   |  1.569876  |   44.98   |   26.41  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.76it/s]


   7    |   1.433425   |  1.486041  |   47.96   |   26.75  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.98it/s]


   8    |   1.342871   |  1.487185  |   50.19   |   26.90  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.30it/s]


   9    |   1.284517   |  1.579828  |   49.81   |   25.73  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.69it/s]


  10    |   1.225235   |  1.392909  |   55.76   |   29.19  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.55it/s]


  11    |   1.150538   |  1.453647  |   53.90   |   26.62  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.63it/s]


  12    |   1.096366   |  1.568564  |   54.28   |   26.41  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.05it/s]


  13    |   1.031210   |  1.604950  |   52.79   |   26.69  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.80it/s]


  14    |   0.958389   |  1.691927  |   53.16   |   26.41  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.66it/s]


  15    |   0.898209   |  1.779401  |   51.30   |   26.54  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.05it/s]


  16    |   0.823224   |  1.696673  |   55.76   |   26.93  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.25it/s]


  17    |   0.744949   |  2.114856  |   48.33   |   25.77  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.90it/s]


  18    |   0.669044   |  2.124514  |   52.42   |   25.85  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.89it/s]


  19    |   0.594094   |  2.507324  |   50.19   |   26.09  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.36it/s]


  20    |   0.533747   |  2.359422  |   49.44   |   25.70  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.73it/s]


  21    |   0.450064   |  2.800915  |   45.72   |   25.86  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.28it/s]


  22    |   0.396246   |  3.652870  |   48.33   |   25.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.53it/s]


  23    |   0.349024   |  3.694048  |   47.58   |   25.17  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 100.66it/s]


  24    |   0.296460   |  3.521930  |   46.84   |   25.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 101.17it/s]


  25    |   0.259861   |  3.365372  |   49.81   |   25.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 100.61it/s]


  26    |   0.216975   |  4.562603  |   48.33   |   25.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:23<00:00, 100.90it/s]


  27    |   0.179353   |  4.161543  |   47.96   |   25.08  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.94it/s]


  28    |   0.156623   |  4.539419  |   47.58   |   25.35  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.84it/s]


  29    |   0.130202   |  4.688530  |   45.72   |   25.87  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.26it/s]


  30    |   0.106236   |  5.155412  |   47.21   |   25.83  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 95.61it/s]


  31    |   0.100627   |  5.388863  |   45.35   |   26.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 93.50it/s]


  32    |   0.074644   |  6.147574  |   46.10   |   27.10  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.52it/s]


  33    |   0.058964   |  6.216469  |   47.58   |   26.83  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 96.37it/s]


  34    |   0.059281   |  5.921940  |   44.98   |   26.24  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.28it/s]


  35    |   0.054151   |  5.915412  |   44.24   |   26.79  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.56it/s]


  36    |   0.044708   |  6.358436  |   46.84   |   25.68  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:25<00:00, 94.35it/s]


  37    |   0.037706   |  6.734801  |   45.35   |   26.78  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.23it/s]


  38    |   0.049869   |  6.722538  |   44.61   |   26.05  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.24it/s]


  39    |   0.038578   |  6.685742  |   46.84   |   25.75  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.89it/s]


  40    |   0.035883   |  7.105857  |   43.12   |   25.59  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 99.18it/s]


  41    |   0.032951   |  6.951291  |   45.35   |   25.52  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.93it/s]


  42    |   0.033465   |  6.687276  |   44.24   |   25.86  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 97.70it/s]


  43    |   0.018723   |  7.020775  |   46.84   |   25.93  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 96.87it/s]


  44    |   0.019807   |  6.975646  |   47.58   |   26.09  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.21it/s]


  45    |   0.026313   |  7.305875  |   44.61   |   25.26  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.32it/s]


  46    |   0.018189   |  7.716969  |   47.21   |   25.23  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 100.12it/s]


  47    |   0.014532   |  7.707721  |   45.72   |   25.32  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.88it/s]


  48    |   0.021439   |  7.743779  |   47.21   |   25.68  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.52it/s]


  49    |   0.008540   |  8.200143  |   44.61   |   25.70  


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:24<00:00, 98.65it/s]


  50    |   0.005210   |  8.062489  |   46.10   |   25.68  


Training complete! Best accuracy: 55.76%.


# 6. Transformer

In [435]:
class TransformerBlock(nn.Module):
    def __init__(self, embed_dim, num_heads, ff_dim, rate=0.1):
        super(TransformerBlock, self).__init__()
        self.att = nn.MultiheadAttention(num_heads=num_heads, embed_dim=embed_dim, batch_first=True)
        self.ffn = nn.Sequential(
            nn.Linear(embed_dim, ff_dim),
            nn.ReLU(),
            nn.Linear(ff_dim ,embed_dim)
        )
        self.layernorm1 = nn.LayerNorm(normalized_shape = [embed_dim], eps=1e-6)
        self.layernorm2 = nn.LayerNorm(normalized_shape = [embed_dim], eps=1e-6)
        self.dropout1 = nn.Dropout(rate)
        self.dropout2 = nn.Dropout(rate)

    def forward(self, inputs):
        attn_output, _ = self.att(inputs, inputs, inputs)
        attn_output = self.dropout1(attn_output)
        out1 = self.layernorm1(inputs + attn_output)
        ffn_output = self.ffn(out1)
        ffn_output = self.dropout2(ffn_output)
        return self.layernorm2(out1 + ffn_output)

In [444]:
class TokenAndPositionEmbedding(nn.Module):
    def __init__(self, maxlen, vocab_size, embed_dim, pretrained_embedding, freeze_embedding):
        super(TokenAndPositionEmbedding, self).__init__()

        if pretrained_embedding is not None:
            self.token_emb = nn.Embedding.from_pretrained(pretrained_embedding,
                                                          freeze=freeze_embedding)
        else:
            self.token_emb = nn.Embedding(num_embeddings=vocab_size,
                                          embedding_dim=embed_dim,
                                          padding_idx=0,
                                          max_norm=5.0)


        self.pos_emb = nn.Embedding(num_embeddings=maxlen, embedding_dim=embed_dim)

    def forward(self, x):
        maxlen = x.size()[-1]
        positions = torch.arange(start=0, end=maxlen, step=1).to(device)
        positions = self.pos_emb(positions)
        x = self.token_emb(x)
        return x + positions

In [460]:
class TransformerClassification(nn.Module):
  def __init__(self, maxlen, vocab_size, embed_dim, pretrained_embedding, freeze_embedding, num_heads, ff_dim, num_classes):
    super(TransformerClassification, self).__init__()

    self.embedding_layer = TokenAndPositionEmbedding(maxlen, vocab_size, embed_dim, pretrained_embedding, freeze_embedding)
    self.transformer_block = TransformerBlock(embed_dim, num_heads, ff_dim)
    self.averagePool = nn.AdaptiveAvgPool1d(output_size=1)
    self.sequential = nn.Sequential(
        nn.Dropout(0.1),
        nn.Linear(embed_dim, 20),
        nn.ReLU(),
        nn.Dropout(0.1),
        nn.Linear(20, num_classes)
    )
    

  def forward(self, x):
    x = self.embedding_layer(x)
    #print(x.size())
    x = self.transformer_block(x)
    #print(x.size())

    # Swap from (N, L, features) to (N, features, L)
    x = torch.swapaxes(x, 1, 2)
    x = self.averagePool(x)
    x = x.squeeze(-1)
    #print(x.size())

    x = self.sequential(x)
    return x



In [461]:
#!pip install torchinfo
model = TransformerClassification(pretrained_embedding=embeddings.float(),
                        freeze_embedding=True,
                        vocab_size=len(word2idx),
                        embed_dim=300,
                        maxlen = max_len,
                        num_classes=10,
                        num_heads = 2,
                        ff_dim = 300)
from torchinfo import summary
summary(model.to(device), [(1,100)], batch_dim=None, dtypes=[torch.int])

Layer (type:depth-idx)                   Output Shape              Param #
TransformerClassification                [1, 10]                   --
├─TokenAndPositionEmbedding: 1-1         [1, 100, 300]             --
│    └─Embedding: 2-1                    [100, 300]                696,300
│    └─Embedding: 2-2                    [1, 100, 300]             (12,389,700)
├─TransformerBlock: 1-2                  [1, 100, 300]             --
│    └─MultiheadAttention: 2-3           [1, 100, 300]             361,200
│    └─Dropout: 2-4                      [1, 100, 300]             --
│    └─LayerNorm: 2-5                    [1, 100, 300]             600
│    └─Sequential: 2-6                   [1, 100, 300]             --
│    │    └─Linear: 3-1                  [1, 100, 300]             90,300
│    │    └─ReLU: 3-2                    [1, 100, 300]             --
│    │    └─Linear: 3-3                  [1, 100, 300]             90,300
│    └─Dropout: 2-7                      [1, 100, 300]  

In [462]:
def initilize_transformer_model(pretrained_embedding=None,
                    freeze_embedding=False,
                    vocab_size=None,
                    embed_dim = 300,
                    num_classes=2,
                    maxlen = 10000,
                    learning_rate=0.01,
                    num_heads = 2,
                    ff_dim = 300
                    ):
    """Instantiate a RNN model and an optimizer."""

    # Instantiate transformer model
    model = TransformerClassification(pretrained_embedding=pretrained_embedding,
                        freeze_embedding=freeze_embedding,
                        vocab_size=vocab_size,
                        embed_dim=embed_dim,
                        maxlen = maxlen,
                        num_classes=num_classes,
                        num_heads = num_heads,
                        ff_dim = ff_dim)
    
    # Send model to `device` (GPU/CPU)
    model.to(device)

    # Instantiate Adadelta optimizer
    optimizer = optim.Adadelta(model.parameters(),
                               lr=learning_rate,
                               rho=0.95)

    return model, optimizer

In [463]:
# 44.98% accuracy
set_seed(42)
model, optimizer = initilize_transformer_model(pretrained_embedding=embeddings.float(),
                                            freeze_embedding=False,
                                            vocab_size=len(word2idx),
                                            embed_dim=300,
                                            num_classes=len(y_info),
                                            maxlen = max_len,
                                            learning_rate=0.1,
                                            num_heads = 10,
                                            ff_dim = 300)
train(model, optimizer, train_dataloader, val_dataloader, epochs=100)

Start training...

 Epoch  |  Train Loss  |  Val Loss  |  Val Acc  |  Elapsed 
------------------------------------------------------------


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 145.66it/s]


   1    |   2.293620   |  2.269196  |   17.10   |   19.05  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.66it/s]


   2    |   2.168927   |  1.988105  |   29.00   |   18.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.29it/s]


   3    |   1.944231   |  1.764324  |   41.26   |   19.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 137.52it/s]


   4    |   1.746067   |  1.679740  |   41.26   |   17.70  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 145.21it/s]


   5    |   1.582937   |  1.641298  |   39.41   |   16.76  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 147.78it/s]


   6    |   1.416215   |  1.674649  |   41.26   |   16.48  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 138.05it/s]


   7    |   1.270237   |  1.725099  |   43.49   |   19.29  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:19<00:00, 124.51it/s]


   8    |   1.118999   |  1.940272  |   40.52   |   19.53  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.03it/s]


   9    |   0.961091   |  1.949061  |   43.87   |   18.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 150.25it/s]


  10    |   0.788754   |  2.241319  |   42.38   |   16.22  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.08it/s]


  11    |   0.646147   |  2.428444  |   41.64   |   17.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 156.39it/s]


  12    |   0.488675   |  2.658780  |   43.49   |   15.58  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 151.22it/s]


  13    |   0.372413   |  3.371326  |   40.15   |   16.12  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.34it/s]


  14    |   0.276135   |  3.461663  |   44.61   |   18.76  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 138.35it/s]


  15    |   0.203357   |  4.027441  |   40.15   |   17.62  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 147.53it/s]


  16    |   0.158135   |  4.151788  |   44.24   |   16.50  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 151.31it/s]


  17    |   0.115131   |  4.743019  |   40.15   |   16.12  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 148.08it/s]


  18    |   0.097049   |  4.868174  |   42.01   |   16.45  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.10it/s]


  19    |   0.065552   |  5.394457  |   41.64   |   17.50  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 137.10it/s]


  20    |   0.049476   |  5.758748  |   44.24   |   17.76  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.05it/s]


  21    |   0.053300   |  5.906890  |   40.52   |   17.26  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.09it/s]


  22    |   0.050599   |  6.028206  |   43.87   |   17.39  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.73it/s]


  23    |   0.050038   |  6.203497  |   42.38   |   17.42  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.71it/s]


  24    |   0.039342   |  6.130241  |   44.98   |   18.53  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.38it/s]


  25    |   0.041278   |  6.985406  |   41.64   |   17.47  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.85it/s]


  26    |   0.032008   |  7.029817  |   39.78   |   17.20  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.77it/s]


  27    |   0.030212   |  6.793241  |   40.52   |   17.21  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 152.25it/s]


  28    |   0.025566   |  7.282004  |   39.03   |   15.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:15<00:00, 157.60it/s]


  29    |   0.025071   |  7.393396  |   40.15   |   15.46  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 146.67it/s]


  30    |   0.024073   |  7.201181  |   42.01   |   16.61  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 138.96it/s]


  31    |   0.019929   |  7.346906  |   41.26   |   17.52  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.96it/s]


  32    |   0.022443   |  7.717684  |   40.52   |   17.27  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 138.39it/s]


  33    |   0.024723   |  8.279359  |   36.06   |   17.59  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.16it/s]


  34    |   0.013799   |  7.907272  |   40.15   |   17.12  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.06it/s]


  35    |   0.023255   |  8.066831  |   42.75   |   16.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.41it/s]


  36    |   0.013285   |  8.015209  |   40.15   |   17.09  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.41it/s]


  37    |   0.022778   |  8.428995  |   39.78   |   17.22  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.58it/s]


  38    |   0.017820   |  8.006908  |   43.12   |   17.19  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.71it/s]


  39    |   0.015361   |  8.533560  |   41.64   |   17.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.84it/s]


  40    |   0.026551   |  8.350728  |   40.15   |   17.30  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.15it/s]


  41    |   0.016347   |  8.575632  |   41.26   |   17.25  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.45it/s]


  42    |   0.020860   |  8.556098  |   40.89   |   17.09  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.66it/s]


  43    |   0.020328   |  8.648162  |   43.12   |   17.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.98it/s]


  44    |   0.016368   |  8.264762  |   42.75   |   17.03  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.76it/s]


  45    |   0.015671   |  8.392967  |   42.75   |   17.44  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.71it/s]


  46    |   0.013987   |  9.086018  |   37.92   |   17.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.03it/s]


  47    |   0.006968   |  9.015554  |   40.52   |   17.02  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 141.95it/s]


  48    |   0.017344   |  8.663584  |   42.01   |   17.15  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.34it/s]


  49    |   0.013542   |  9.209269  |   40.89   |   17.35  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 134.75it/s]


  50    |   0.010950   |  8.726627  |   41.64   |   18.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 145.28it/s]


  51    |   0.013534   |  9.165201  |   40.52   |   16.76  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.58it/s]


  52    |   0.008059   |  9.255023  |   40.52   |   17.31  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.67it/s]


  53    |   0.013791   |  9.002202  |   39.03   |   17.18  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.48it/s]


  54    |   0.009243   |  9.166490  |   40.89   |   17.34  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:18<00:00, 132.36it/s]


  55    |   0.015093   |  8.966067  |   43.49   |   18.52  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.78it/s]


  56    |   0.015593   |  9.668539  |   41.26   |   17.45  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.73it/s]


  57    |   0.010526   |  9.564220  |   43.12   |   17.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.07it/s]


  58    |   0.018047   |  9.356649  |   40.89   |   16.90  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.29it/s]


  59    |   0.008471   |  9.408814  |   42.75   |   17.23  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.86it/s]


  60    |   0.014710   |  9.399364  |   42.38   |   17.28  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.63it/s]


  61    |   0.010411   |  9.269999  |   42.38   |   17.31  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.87it/s]


  62    |   0.012905   | 10.125027  |   38.29   |   17.28  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.82it/s]


  63    |   0.007643   | 10.046680  |   40.89   |   17.41  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.27it/s]


  64    |   0.005610   |  9.915601  |   41.64   |   16.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.02it/s]


  65    |   0.011626   |  9.838171  |   43.12   |   17.14  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.58it/s]


  66    |   0.005475   |  9.901486  |   42.38   |   17.07  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.33it/s]


  67    |   0.011598   |  9.769668  |   43.49   |   16.86  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 139.69it/s]


  68    |   0.012436   |  9.673603  |   43.87   |   17.43  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.86it/s]


  69    |   0.007662   | 10.106911  |   44.98   |   17.04  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 145.32it/s]


  70    |   0.015974   | 10.376885  |   42.38   |   16.75  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.64it/s]


  71    |   0.009927   | 10.302720  |   40.89   |   17.06  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.31it/s]


  72    |   0.009084   | 10.590452  |   40.15   |   16.87  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.62it/s]


  73    |   0.006407   | 10.991719  |   37.92   |   17.07  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.46it/s]


  74    |   0.011608   | 10.174418  |   41.64   |   16.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.02it/s]


  75    |   0.008447   | 10.070346  |   42.01   |   17.02  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.69it/s]


  76    |   0.008085   |  9.892259  |   41.26   |   16.94  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.38it/s]


  77    |   0.006107   | 10.348758  |   43.12   |   16.98  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.21it/s]


  78    |   0.008457   | 10.564878  |   42.38   |   17.11  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.15it/s]


  79    |   0.008135   | 11.260825  |   39.78   |   17.24  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.12it/s]


  80    |   0.014155   | 10.545794  |   42.01   |   17.13  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.21it/s]


  81    |   0.006807   | 10.677604  |   39.41   |   17.00  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.23it/s]


  82    |   0.005339   | 10.427014  |   42.75   |   17.24  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.36it/s]


  83    |   0.005035   | 10.481554  |   42.75   |   16.98  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.72it/s]


  84    |   0.006225   | 10.579160  |   41.64   |   16.94  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.95it/s]


  85    |   0.011596   | 11.026975  |   39.78   |   17.03  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 142.78it/s]


  86    |   0.008149   | 10.611356  |   42.01   |   17.05  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.42it/s]


  87    |   0.005242   | 11.116021  |   38.66   |   17.22  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.11it/s]


  88    |   0.008443   | 11.014947  |   40.15   |   17.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.40it/s]


  89    |   0.003400   | 10.589848  |   40.15   |   16.86  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.72it/s]


  90    |   0.007021   | 10.606139  |   41.26   |   16.94  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.42it/s]


  91    |   0.013849   | 10.963261  |   39.03   |   17.21  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 137.08it/s]


  92    |   0.007580   | 10.594657  |   41.64   |   17.75  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 140.42it/s]


  93    |   0.005762   | 10.636586  |   41.64   |   17.33  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.28it/s]


  94    |   0.005743   | 10.417619  |   40.89   |   17.00  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 135.11it/s]


  95    |   0.014328   | 10.267023  |   41.26   |   18.01  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.84it/s]


  96    |   0.006117   | 10.790361  |   39.78   |   17.16  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 144.25it/s]


  97    |   0.005846   | 10.546780  |   40.52   |   16.88  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.48it/s]


  98    |   0.009990   | 10.893432  |   39.41   |   16.97  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:16<00:00, 143.25it/s]


  99    |   0.006492   | 10.291065  |   39.41   |   16.99  


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2413/2413 [00:17<00:00, 141.71it/s]


  100   |   0.005614   | 10.667309  |   40.15   |   17.17  


Training complete! Best accuracy: 44.98%.
