In [1]:
! pip install -U accelerate
! pip install -U transformers



In [2]:
!pip install evaluate



In [3]:
import torch
import json
from tqdm import tqdm
import torch.nn as nn
from torch.optim import Adam
import nltk
import spacy
import string
import evaluate  # Bleu
from torch.utils.data import Dataset, DataLoader, RandomSampler
import pandas as pd
import numpy as np
import transformers
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from transformers import T5Tokenizer, T5Model, T5ForConditionalGeneration, T5TokenizerFast

import warnings
warnings.filterwarnings("ignore")

In [4]:
DEVICE = "cuda:0"

In [5]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer = AutoTokenizer.from_pretrained("Salesforce/dialogstudio-t5-base-v1.0")
model = AutoModelForSeq2SeqLM.from_pretrained("Salesforce/dialogstudio-t5-base-v1.0")

input_text = "Answer the following yes/no question by reasoning step-by-step. Can you write 200 words in a single tweet?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids

outputs = model.generate(input_ids, max_new_tokens=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

It is not possible to write 200 words in a tweet. Therefore, the final answer is no.


In [6]:
OPTIMIZER = Adam(model.parameters(), lr=0.00001)
Q_LEN = 256   # Question Length
T_LEN = 32    # Target Length
BATCH_SIZE = 4

In [7]:
from datasets import load_dataset
dataset = load_dataset("amaydle/npc-dialogue")

In [8]:
def prepare_data(data):
    articles = []
    for i in range(len(dataset['train']['Query'])):
      context = dataset['train']["Name"][i] + ":" + dataset['train']["Biography"][i]
      question = dataset['train']["Query"][i]
      answer = dataset['train']["Response"][i]
      #context = dataset['context']
      #question = dataset['question']
      #answers = dataset['answers']
      inputs = {"context": context, "question": question, "answer": answer}

      articles.append(inputs)

    return articles

In [9]:
data = prepare_data(dataset)

In [10]:
data = pd.DataFrame(data)

In [11]:
data.head(1)

Unnamed: 0,context,question,answer
0,Bikram:Bikram is a rough and tough smuggler fr...,What is your opinion on friendship?,Friendship is a bond stronger than blood.


In [12]:
class QA_Dataset(Dataset):
    def __init__(self, tokenizer, dataframe, q_len, t_len):
        self.tokenizer = tokenizer
        self.q_len = q_len
        self.t_len = t_len
        self.data = dataframe
        self.questions = self.data["question"]
        self.context = self.data["context"]
        self.answer = self.data['answer']

    def __len__(self):
        return len(self.questions)

    def __getitem__(self, idx):
        question = self.questions[idx]
        context = self.context[idx]
        answer = self.answer[idx]

        question_tokenized = self.tokenizer(question, context, max_length=self.q_len, padding="max_length",
                                                    truncation=True, pad_to_max_length=True, add_special_tokens=True)
        answer_tokenized = self.tokenizer(answer, max_length=self.t_len, padding="max_length",
                                          truncation=True, pad_to_max_length=True, add_special_tokens=True)

        labels = torch.tensor(answer_tokenized["input_ids"], dtype=torch.long)
        labels[labels == 0] = -100

        return {
            "input_ids": torch.tensor(question_tokenized["input_ids"], dtype=torch.long),
            "attention_mask": torch.tensor(question_tokenized["attention_mask"], dtype=torch.long),
            "labels": labels,
            "decoder_attention_mask": torch.tensor(answer_tokenized["attention_mask"], dtype=torch.long)
        }

In [13]:
# Dataloader

train_data, val_data = train_test_split(data, test_size=0.2, random_state=42)

#train_sampler = RandomSampler(train_data.index)
#val_sampler = RandomSampler(val_data.index)

train_sampler = train_data.index
val_sampler = val_data.index

qa_dataset = QA_Dataset(tokenizer, data, Q_LEN, T_LEN)

train_loader = DataLoader(qa_dataset, batch_size=BATCH_SIZE, sampler=train_sampler)
val_loader = DataLoader(qa_dataset, batch_size=BATCH_SIZE, sampler=val_sampler)

In [14]:
train_loss = 0
val_loss = 0
train_batch_count = 0
val_batch_count = 0

for epoch in range(500):
    model.train()
    for batch in tqdm(train_loader, desc="Training batches"):
        input_ids = batch["input_ids"].to(DEVICE)
        attention_mask = batch["attention_mask"].to(DEVICE)
        labels = batch["labels"].to(DEVICE)
        decoder_attention_mask = batch["decoder_attention_mask"].to(DEVICE)
        model.to('cuda')
        outputs = model(
                          input_ids=input_ids,
                          attention_mask=attention_mask,
                          labels=labels,
                          decoder_attention_mask=decoder_attention_mask
                        )

        OPTIMIZER.zero_grad()
        outputs.loss.backward()
        OPTIMIZER.step()
        train_loss += outputs.loss.item()
        train_batch_count += 1

    #Evaluation
    model.eval()
    for batch in tqdm(val_loader, desc="Validation batches"):
        input_ids = batch["input_ids"].to(DEVICE)
        attention_mask = batch["attention_mask"].to(DEVICE)
        labels = batch["labels"].to(DEVICE)
        decoder_attention_mask = batch["decoder_attention_mask"].to(DEVICE)

        outputs = model(
                          input_ids=input_ids,
                          attention_mask=attention_mask,
                          labels=labels,
                          decoder_attention_mask=decoder_attention_mask
                        )

        OPTIMIZER.zero_grad()
        outputs.loss.backward()
        OPTIMIZER.step()
        val_loss += outputs.loss.item()
        val_batch_count += 1

    print(f"\n{epoch+1}/{2} -> Train loss: {train_loss / train_batch_count}\tValidation loss: {val_loss/val_batch_count}")

Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:52<00:00,  6.59it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



1/2 -> Train loss: 2.7310888553011243	Validation loss: 2.3547704315733635


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



2/2 -> Train loss: 2.6128623988317408	Validation loss: 2.2500726217511056


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



3/2 -> Train loss: 2.5261465430835597	Validation loss: 2.159116081807805


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



4/2 -> Train loss: 2.45727800493655	Validation loss: 2.0777363506541855


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



5/2 -> Train loss: 2.399112464103146	Validation loss: 2.0026875072512134


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



6/2 -> Train loss: 2.346206003398711	Validation loss: 1.9328626853296127


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



7/2 -> Train loss: 2.2977843065439543	Validation loss: 1.8669024207713374


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



8/2 -> Train loss: 2.2528095802103265	Validation loss: 1.805131350097985


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



9/2 -> Train loss: 2.2109059855173943	Validation loss: 1.747043968883663


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



10/2 -> Train loss: 2.1704769216758617	Validation loss: 1.6912362654318756


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



11/2 -> Train loss: 2.1336155892360824	Validation loss: 1.6378526482088813


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



12/2 -> Train loss: 2.099084125135256	Validation loss: 1.5862979192672104


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



13/2 -> Train loss: 2.066539722023202	Validation loss: 1.5367937898913862


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



14/2 -> Train loss: 2.035797380784037	Validation loss: 1.4887521277672697


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



15/2 -> Train loss: 2.005415075389659	Validation loss: 1.4417487263972104


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



16/2 -> Train loss: 1.9771444425526736	Validation loss: 1.3963128598176087


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



17/2 -> Train loss: 1.9493001274237345	Validation loss: 1.3520048643069429


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



18/2 -> Train loss: 1.9225167708216466	Validation loss: 1.3091620117405698


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



19/2 -> Train loss: 1.896784109781936	Validation loss: 1.2671591297318259


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



20/2 -> Train loss: 1.8722504267398863	Validation loss: 1.226344364963943


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



21/2 -> Train loss: 1.847904089954987	Validation loss: 1.18679238012347


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



22/2 -> Train loss: 1.8237121333011055	Validation loss: 1.1482952261657933


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



23/2 -> Train loss: 1.80098046239773	Validation loss: 1.1112191434330616


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



24/2 -> Train loss: 1.778678872540665	Validation loss: 1.0757164954363059


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



25/2 -> Train loss: 1.75708398189752	Validation loss: 1.0417037898670325


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



26/2 -> Train loss: 1.735829377732548	Validation loss: 1.0091924548818574


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



27/2 -> Train loss: 1.7155476137699777	Validation loss: 0.9782474885400101


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



28/2 -> Train loss: 1.6950655188743124	Validation loss: 0.9487465125789991


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



29/2 -> Train loss: 1.6751799249100958	Validation loss: 0.9206731362311518


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



30/2 -> Train loss: 1.655856943792767	Validation loss: 0.8938719357119452


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



31/2 -> Train loss: 1.6368143537212834	Validation loss: 0.8683906913925588


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



32/2 -> Train loss: 1.6182410457616916	Validation loss: 0.8441124646947853


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



33/2 -> Train loss: 1.6001525498347478	Validation loss: 0.8210433156695703


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



34/2 -> Train loss: 1.5822780697724805	Validation loss: 0.7990553528139717


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



35/2 -> Train loss: 1.5645969010633465	Validation loss: 0.7780757739115354


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



36/2 -> Train loss: 1.5474249323713032	Validation loss: 0.758146563672733


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



37/2 -> Train loss: 1.5301481752712214	Validation loss: 0.7391888624108962


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



38/2 -> Train loss: 1.5135287569984963	Validation loss: 0.7210524398037692


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



39/2 -> Train loss: 1.497183991931531	Validation loss: 0.7037631177172288


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



40/2 -> Train loss: 1.480764558173824	Validation loss: 0.6872292048948142


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



41/2 -> Train loss: 1.4648780557493222	Validation loss: 0.6714282678858616


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



42/2 -> Train loss: 1.4491849987341503	Validation loss: 0.656334385035555


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



43/2 -> Train loss: 1.4337014068235723	Validation loss: 0.641872639989329


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



44/2 -> Train loss: 1.418547063633034	Validation loss: 0.6279938087512543


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



45/2 -> Train loss: 1.4039128384123678	Validation loss: 0.6146958659663511


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



46/2 -> Train loss: 1.3892471120709808	Validation loss: 0.6019488870474472


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



47/2 -> Train loss: 1.375006328366474	Validation loss: 0.5896947592602554


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



48/2 -> Train loss: 1.3610728706327686	Validation loss: 0.5779284701841081


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



49/2 -> Train loss: 1.3472638458665818	Validation loss: 0.5666087795515488


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



50/2 -> Train loss: 1.3334617585060389	Validation loss: 0.555708307258667


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



51/2 -> Train loss: 1.3200337246149296	Validation loss: 0.545200787136633


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



52/2 -> Train loss: 1.3068320195789687	Validation loss: 0.5350855458278967


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



53/2 -> Train loss: 1.293897647529816	Validation loss: 0.525334827662074


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



54/2 -> Train loss: 1.2810786630652378	Validation loss: 0.5159460454270045


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



55/2 -> Train loss: 1.2685468273860192	Validation loss: 0.5068665432784358


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



56/2 -> Train loss: 1.2560402684688845	Validation loss: 0.49810453203488797


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



57/2 -> Train loss: 1.2437578177140651	Validation loss: 0.48964117885747355


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



58/2 -> Train loss: 1.2316493638008759	Validation loss: 0.48145579094428226


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



59/2 -> Train loss: 1.2198886528731974	Validation loss: 0.47354178354580456


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



60/2 -> Train loss: 1.20804613535027	Validation loss: 0.4658928282103962


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



61/2 -> Train loss: 1.1964582040537761	Validation loss: 0.45847708857702507


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



62/2 -> Train loss: 1.1851442072202651	Validation loss: 0.45129937751541205


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



63/2 -> Train loss: 1.1740341880044458	Validation loss: 0.4443353860661295


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



64/2 -> Train loss: 1.1630087465167627	Validation loss: 0.43759797782373405


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



65/2 -> Train loss: 1.1520680812114192	Validation loss: 0.43106163354217103


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



66/2 -> Train loss: 1.1413253008880844	Validation loss: 0.42471940407733594


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



67/2 -> Train loss: 1.130692360483927	Validation loss: 0.4185613467132612


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



68/2 -> Train loss: 1.1201951994461412	Validation loss: 0.4125717238355134


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



69/2 -> Train loss: 1.1098683145600654	Validation loss: 0.40677054963614057


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



70/2 -> Train loss: 1.0996229839656602	Validation loss: 0.40110903604438586


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



71/2 -> Train loss: 1.0894959091472551	Validation loss: 0.39561645338475454


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



72/2 -> Train loss: 1.0797965601415054	Validation loss: 0.3902658153177793


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



73/2 -> Train loss: 1.0700418039650488	Validation loss: 0.3850555682297924


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



74/2 -> Train loss: 1.0604457832182674	Validation loss: 0.3799839083031151


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



75/2 -> Train loss: 1.0510618215348697	Validation loss: 0.37504915961713825


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



76/2 -> Train loss: 1.0417721854504354	Validation loss: 0.37024473569907557


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



77/2 -> Train loss: 1.0325984912712192	Validation loss: 0.36556755452945683


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



78/2 -> Train loss: 1.0235728653080676	Validation loss: 0.3609975987766288


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



79/2 -> Train loss: 1.0146138119870611	Validation loss: 0.3565480910657535


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



80/2 -> Train loss: 1.0058299548540641	Validation loss: 0.3521972476062666


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.73it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



81/2 -> Train loss: 0.997265151271183	Validation loss: 0.34796365487317044


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



82/2 -> Train loss: 0.9887064113215497	Validation loss: 0.3438292103021254


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



83/2 -> Train loss: 0.9804088743225648	Validation loss: 0.33978627662040206


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



84/2 -> Train loss: 0.9722343678043074	Validation loss: 0.33584875226261734


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



85/2 -> Train loss: 0.9641852134631316	Validation loss: 0.33199309257247644


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



86/2 -> Train loss: 0.9561690111982002	Validation loss: 0.3282204789300255


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



87/2 -> Train loss: 0.9482595126748249	Validation loss: 0.3245400953221967


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



88/2 -> Train loss: 0.9405558730333882	Validation loss: 0.3209424049816364


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



89/2 -> Train loss: 0.9328074411791017	Validation loss: 0.3174205743514668


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



90/2 -> Train loss: 0.9251772269730467	Validation loss: 0.313984989772502


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



91/2 -> Train loss: 0.9177110170635233	Validation loss: 0.31061834966437063


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



92/2 -> Train loss: 0.9102969771918031	Validation loss: 0.30731809270896726


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



93/2 -> Train loss: 0.9029975374733157	Validation loss: 0.3040931549669515


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



94/2 -> Train loss: 0.8958026444426422	Validation loss: 0.3009300321110179


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.18it/s]



95/2 -> Train loss: 0.888748886156742	Validation loss: 0.29783705630582935


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



96/2 -> Train loss: 0.8817626238939636	Validation loss: 0.294805115860288


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



97/2 -> Train loss: 0.8748501153520173	Validation loss: 0.29183747347407796


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



98/2 -> Train loss: 0.8680800292719016	Validation loss: 0.28893165853785496


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



99/2 -> Train loss: 0.8613694637930265	Validation loss: 0.28609536217997883


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



100/2 -> Train loss: 0.8548060291000655	Validation loss: 0.2832987254421125


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



101/2 -> Train loss: 0.8483451585737596	Validation loss: 0.2805529988267139


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



102/2 -> Train loss: 0.8419603814576965	Validation loss: 0.27786435000536774


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



103/2 -> Train loss: 0.8356027967645246	Validation loss: 0.27522788760646716


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



104/2 -> Train loss: 0.8294035609319148	Validation loss: 0.2726407751529034


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



105/2 -> Train loss: 0.8231824274347637	Validation loss: 0.27010120693988643


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



106/2 -> Train loss: 0.8170669169996304	Validation loss: 0.2676079962312134


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



107/2 -> Train loss: 0.8110602650069988	Validation loss: 0.26515744521979007


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



108/2 -> Train loss: 0.8051272196691834	Validation loss: 0.2627528791831942


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



109/2 -> Train loss: 0.7992456641954502	Validation loss: 0.26040090890591333


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



110/2 -> Train loss: 0.7934569720234182	Validation loss: 0.2580786842021197


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



111/2 -> Train loss: 0.7877267629455958	Validation loss: 0.2558013385955062


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



112/2 -> Train loss: 0.7821074472465644	Validation loss: 0.25356335257245294


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



113/2 -> Train loss: 0.7765468716263418	Validation loss: 0.25136485654158075


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



114/2 -> Train loss: 0.7710518638793182	Validation loss: 0.24920267431632798


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



115/2 -> Train loss: 0.7656319976622437	Validation loss: 0.24707442707843383


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



116/2 -> Train loss: 0.7602818608428745	Validation loss: 0.24498597074118506


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



117/2 -> Train loss: 0.7549724082899137	Validation loss: 0.24293301671923112


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



118/2 -> Train loss: 0.7497927176402582	Validation loss: 0.240916823242113


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



119/2 -> Train loss: 0.7446192645690922	Validation loss: 0.23894696691019324


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



120/2 -> Train loss: 0.7395064726229903	Validation loss: 0.2369943840991192


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



121/2 -> Train loss: 0.7344690781481399	Validation loss: 0.23507192601754168


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



122/2 -> Train loss: 0.7295259517201703	Validation loss: 0.2331782628267679


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



123/2 -> Train loss: 0.7246049271383963	Validation loss: 0.23131489482432255


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



124/2 -> Train loss: 0.7197492835238699	Validation loss: 0.229489401070001


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



125/2 -> Train loss: 0.7149890909344039	Validation loss: 0.22769959726919495


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



126/2 -> Train loss: 0.7102776014030061	Validation loss: 0.2259275190870568


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



127/2 -> Train loss: 0.7055698020088446	Validation loss: 0.2241790828212806


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.14it/s]



128/2 -> Train loss: 0.7009578789480972	Validation loss: 0.22245691953626245


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



129/2 -> Train loss: 0.696395429196611	Validation loss: 0.22076521513238292


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



130/2 -> Train loss: 0.6919149781771522	Validation loss: 0.21909938309208168


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



131/2 -> Train loss: 0.6874579046369839	Validation loss: 0.21745535241263747


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



132/2 -> Train loss: 0.683035073654362	Validation loss: 0.2158417809554862


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



133/2 -> Train loss: 0.6786918580766681	Validation loss: 0.21425203493617234


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



134/2 -> Train loss: 0.674364045859263	Validation loss: 0.21268058284095404


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



135/2 -> Train loss: 0.6700960670847579	Validation loss: 0.21113383266408


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



136/2 -> Train loss: 0.6659215274303496	Validation loss: 0.20961721553588136


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



137/2 -> Train loss: 0.6617871526275312	Validation loss: 0.20811249094965162


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



138/2 -> Train loss: 0.6576857876161183	Validation loss: 0.20662769261054906


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



139/2 -> Train loss: 0.6536148396907839	Validation loss: 0.2051649821912407


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



140/2 -> Train loss: 0.6496138447748151	Validation loss: 0.20372350885636165


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



141/2 -> Train loss: 0.6456647085658574	Validation loss: 0.20229958324730998


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



142/2 -> Train loss: 0.6417201206646866	Validation loss: 0.20089723057630898


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



143/2 -> Train loss: 0.6378584118911916	Validation loss: 0.1995157290495353


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



144/2 -> Train loss: 0.6340399005162679	Validation loss: 0.19815184438885083


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



145/2 -> Train loss: 0.6302446715965639	Validation loss: 0.196807638986458


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



146/2 -> Train loss: 0.6264739076982164	Validation loss: 0.19547847807446928


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



147/2 -> Train loss: 0.6227792031790844	Validation loss: 0.1941707323465645


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



148/2 -> Train loss: 0.6191217929858379	Validation loss: 0.19287611353551418


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



149/2 -> Train loss: 0.6155238425546452	Validation loss: 0.1916026364425377


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



150/2 -> Train loss: 0.6119534962156209	Validation loss: 0.19034842014187184


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



151/2 -> Train loss: 0.6083983009107274	Validation loss: 0.18910643951370926


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



152/2 -> Train loss: 0.6049013231564118	Validation loss: 0.18787853687991324


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



153/2 -> Train loss: 0.601487252256302	Validation loss: 0.18667419189814713


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



154/2 -> Train loss: 0.5980711210456398	Validation loss: 0.18548051785242317


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



155/2 -> Train loss: 0.5946694928815541	Validation loss: 0.18429994296409563


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



156/2 -> Train loss: 0.5913307122811675	Validation loss: 0.18313372069668443


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



157/2 -> Train loss: 0.5880078528813514	Validation loss: 0.1819843671173681


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.18it/s]



158/2 -> Train loss: 0.5847292136432877	Validation loss: 0.18085192849178314


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



159/2 -> Train loss: 0.5814993462529202	Validation loss: 0.1797305228956859


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



160/2 -> Train loss: 0.5782669059133004	Validation loss: 0.1786204116622831


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



161/2 -> Train loss: 0.575076016533927	Validation loss: 0.17752504325420082


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



162/2 -> Train loss: 0.5719379242377389	Validation loss: 0.17644225227095528


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



163/2 -> Train loss: 0.5688298909576859	Validation loss: 0.1753806280449711


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



164/2 -> Train loss: 0.5657409140474744	Validation loss: 0.17432647961042227


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



165/2 -> Train loss: 0.5626912372541466	Validation loss: 0.17328372915730028


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



166/2 -> Train loss: 0.5596812174453717	Validation loss: 0.17225495463834897


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



167/2 -> Train loss: 0.5566821110867385	Validation loss: 0.17123655162105889


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



168/2 -> Train loss: 0.5537140053538205	Validation loss: 0.17023046964062302


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



169/2 -> Train loss: 0.5507704094355078	Validation loss: 0.16923576544160862


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



170/2 -> Train loss: 0.5478728184545798	Validation loss: 0.1682515134860099


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



171/2 -> Train loss: 0.545017601352266	Validation loss: 0.16728358965435447


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



172/2 -> Train loss: 0.5421746295946888	Validation loss: 0.16632156806711515


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



173/2 -> Train loss: 0.539351193740161	Validation loss: 0.16537088958974475


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



174/2 -> Train loss: 0.5365712714845616	Validation loss: 0.16443180988076414


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



175/2 -> Train loss: 0.5338312034233315	Validation loss: 0.16350496246897514


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



176/2 -> Train loss: 0.5311045370319488	Validation loss: 0.16258765831114197


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



177/2 -> Train loss: 0.5283938677179971	Validation loss: 0.16167863114309067


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



178/2 -> Train loss: 0.5257038101849543	Validation loss: 0.16077954799513952


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



179/2 -> Train loss: 0.5230466804061851	Validation loss: 0.15989089120366065


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



180/2 -> Train loss: 0.5204185013373838	Validation loss: 0.15901174564602083


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



181/2 -> Train loss: 0.5178063332906374	Validation loss: 0.15814553978190915


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



182/2 -> Train loss: 0.5152261984383911	Validation loss: 0.15728602182073034


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



183/2 -> Train loss: 0.5126731768731975	Validation loss: 0.1564380415936034


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



184/2 -> Train loss: 0.5101374242862047	Validation loss: 0.15559753458000977


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



185/2 -> Train loss: 0.5076444198785135	Validation loss: 0.15476531808813773


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



186/2 -> Train loss: 0.5051528017033777	Validation loss: 0.15394314738652873


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



187/2 -> Train loss: 0.5026850945385501	Validation loss: 0.15312946586961174


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



188/2 -> Train loss: 0.5002600399769683	Validation loss: 0.15232423993358019


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



189/2 -> Train loss: 0.4978661453820932	Validation loss: 0.15153016555476126


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



190/2 -> Train loss: 0.49547569284443604	Validation loss: 0.15074064373769563


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



191/2 -> Train loss: 0.4931220153800438	Validation loss: 0.14995947871181128


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



192/2 -> Train loss: 0.49075907750778236	Validation loss: 0.14918863294272663


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



193/2 -> Train loss: 0.4884335887340809	Validation loss: 0.14843089568921466


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



194/2 -> Train loss: 0.4861294356791796	Validation loss: 0.14767321964574603


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



195/2 -> Train loss: 0.48384613170642377	Validation loss: 0.14692285728378404


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



196/2 -> Train loss: 0.4815807603758169	Validation loss: 0.14618006630855934


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



197/2 -> Train loss: 0.4793514806498349	Validation loss: 0.14544563055870188


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



198/2 -> Train loss: 0.4771342044371217	Validation loss: 0.14472077265345648


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



199/2 -> Train loss: 0.4749326194043947	Validation loss: 0.1440054288706212


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



200/2 -> Train loss: 0.47277578961311384	Validation loss: 0.14330842936557814


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



201/2 -> Train loss: 0.4706147947541551	Validation loss: 0.14260322784119714


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



202/2 -> Train loss: 0.46847084296697505	Validation loss: 0.14190838629590857


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



203/2 -> Train loss: 0.46634288027548026	Validation loss: 0.14121524172498678


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



204/2 -> Train loss: 0.4642459043937092	Validation loss: 0.14053530449033708


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



205/2 -> Train loss: 0.46217735124199477	Validation loss: 0.13985664499704145


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



206/2 -> Train loss: 0.46011814861678324	Validation loss: 0.13918433716373704


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



207/2 -> Train loss: 0.45807148438647755	Validation loss: 0.1385236767520457


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



208/2 -> Train loss: 0.4560449161352056	Validation loss: 0.13787086556009898


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



209/2 -> Train loss: 0.4540255256589288	Validation loss: 0.13721906685249396


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



210/2 -> Train loss: 0.45201683675496346	Validation loss: 0.13657920782563598


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



211/2 -> Train loss: 0.45003136956991713	Validation loss: 0.1359399684730444


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



212/2 -> Train loss: 0.4480682602601137	Validation loss: 0.1353039916930808


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



213/2 -> Train loss: 0.44611883100499755	Validation loss: 0.1346749835047862


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



214/2 -> Train loss: 0.44420005368842214	Validation loss: 0.13405532763372172


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



215/2 -> Train loss: 0.44228770792524735	Validation loss: 0.13344182795815604


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



216/2 -> Train loss: 0.44038976561808746	Validation loss: 0.1328358583043326


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



217/2 -> Train loss: 0.43852565227843954	Validation loss: 0.13223490981726727


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



218/2 -> Train loss: 0.4366650577187057	Validation loss: 0.1316338371227517


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



219/2 -> Train loss: 0.434819112676639	Validation loss: 0.13104091607413598


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



220/2 -> Train loss: 0.43298507333764324	Validation loss: 0.1304616090317673


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



221/2 -> Train loss: 0.43116925469555	Validation loss: 0.1298764686703931


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



222/2 -> Train loss: 0.4293741126161508	Validation loss: 0.12929683942433678


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



223/2 -> Train loss: 0.42758943940244126	Validation loss: 0.12872201715740716


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



224/2 -> Train loss: 0.4258104412015053	Validation loss: 0.12816091694962561


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



225/2 -> Train loss: 0.4240600140443671	Validation loss: 0.12759718278799406


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



226/2 -> Train loss: 0.42230957224128357	Validation loss: 0.12703942751182537


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.73it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



227/2 -> Train loss: 0.4205857161485333	Validation loss: 0.12649843070402741


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



228/2 -> Train loss: 0.4188706406972323	Validation loss: 0.12594882654279177


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



229/2 -> Train loss: 0.41717944523516093	Validation loss: 0.12540371261612845


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



230/2 -> Train loss: 0.4154958821109292	Validation loss: 0.12486290804577117


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



231/2 -> Train loss: 0.4138119141520371	Validation loss: 0.12432593117152729


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



232/2 -> Train loss: 0.41215357863616664	Validation loss: 0.12379488591692575


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



233/2 -> Train loss: 0.410496731080866	Validation loss: 0.1232679518899681


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.17it/s]



234/2 -> Train loss: 0.40885495557654417	Validation loss: 0.12274558628344345


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



235/2 -> Train loss: 0.40722789728923975	Validation loss: 0.12222947355832159


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



236/2 -> Train loss: 0.40560767806119113	Validation loss: 0.12171683185207371


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



237/2 -> Train loss: 0.40400852805876564	Validation loss: 0.12120812945283843


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



238/2 -> Train loss: 0.4024216184862603	Validation loss: 0.12070306918890136


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



239/2 -> Train loss: 0.40085264360161726	Validation loss: 0.12020161324954595


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



240/2 -> Train loss: 0.39929870723849126	Validation loss: 0.11970905838138518


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



241/2 -> Train loss: 0.39775801743058603	Validation loss: 0.11921700298926698


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



242/2 -> Train loss: 0.3962087127201236	Validation loss: 0.11872773660062673


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



243/2 -> Train loss: 0.39468026212139456	Validation loss: 0.1182424690741364


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



244/2 -> Train loss: 0.39316647718513387	Validation loss: 0.1177609544990549


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.14it/s]



245/2 -> Train loss: 0.391662060307217	Validation loss: 0.11728418252298807


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



246/2 -> Train loss: 0.3901632442079098	Validation loss: 0.11681315243423974


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



247/2 -> Train loss: 0.3886849572621461	Validation loss: 0.11634311643604808


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



248/2 -> Train loss: 0.3872094988354675	Validation loss: 0.11587754797582918


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



249/2 -> Train loss: 0.385752303027387	Validation loss: 0.11541710979902373


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



250/2 -> Train loss: 0.38430964014751423	Validation loss: 0.11496612506610476


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



251/2 -> Train loss: 0.3828802086214023	Validation loss: 0.11452357499295059


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



252/2 -> Train loss: 0.3814501737787135	Validation loss: 0.11407453424272454


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



253/2 -> Train loss: 0.3800364806007979	Validation loss: 0.11362735504378886


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



254/2 -> Train loss: 0.3786289792003906	Validation loss: 0.1131832139363163


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



255/2 -> Train loss: 0.3772339335092382	Validation loss: 0.1127425339454723


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.14it/s]



256/2 -> Train loss: 0.3758608665777621	Validation loss: 0.1123062555741072


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



257/2 -> Train loss: 0.3744911134174071	Validation loss: 0.11187836457155813


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



258/2 -> Train loss: 0.37311516342356654	Validation loss: 0.11144910624305987


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



259/2 -> Train loss: 0.3717549202563579	Validation loss: 0.11102257523098445


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



260/2 -> Train loss: 0.37040712120291336	Validation loss: 0.11061032621485326


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



261/2 -> Train loss: 0.3690709059387639	Validation loss: 0.11018980452994995


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.73it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.17it/s]



262/2 -> Train loss: 0.3677480328070174	Validation loss: 0.1097715786580028


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



263/2 -> Train loss: 0.36643039089558954	Validation loss: 0.10935654429973336


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



264/2 -> Train loss: 0.365124300725766	Validation loss: 0.10894486641836715


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



265/2 -> Train loss: 0.36383004528899	Validation loss: 0.10853669765711246


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



266/2 -> Train loss: 0.36254017410908035	Validation loss: 0.10813415061299954


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



267/2 -> Train loss: 0.36125957083092386	Validation loss: 0.10773399432091352


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



268/2 -> Train loss: 0.3599952444797053	Validation loss: 0.1073351336070458


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



269/2 -> Train loss: 0.3587440622937181	Validation loss: 0.10694207133243108


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



270/2 -> Train loss: 0.35748801624077264	Validation loss: 0.10654919135549004


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



271/2 -> Train loss: 0.35624430043505867	Validation loss: 0.10615880343151074


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



272/2 -> Train loss: 0.35500434274087234	Validation loss: 0.10577221262859834


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



273/2 -> Train loss: 0.35377467480958597	Validation loss: 0.10538717354911221


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



274/2 -> Train loss: 0.3525557854569548	Validation loss: 0.10500536768072989


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



275/2 -> Train loss: 0.3513400512385978	Validation loss: 0.10462558984381952


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



276/2 -> Train loss: 0.35013934786056883	Validation loss: 0.10426246543220685


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



277/2 -> Train loss: 0.3489415309410999	Validation loss: 0.1038894223407083


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



278/2 -> Train loss: 0.3477543628047548	Validation loss: 0.10351793049850189


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



279/2 -> Train loss: 0.34657355590538486	Validation loss: 0.10314905302846161


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



280/2 -> Train loss: 0.3454011715421886	Validation loss: 0.10278263110181776


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



281/2 -> Train loss: 0.3442342832405087	Validation loss: 0.10241921550923729


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



282/2 -> Train loss: 0.34307741737669945	Validation loss: 0.10205924178749684


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



283/2 -> Train loss: 0.34192321603944004	Validation loss: 0.10170051929967308


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



284/2 -> Train loss: 0.34078386448057585	Validation loss: 0.1013452791081781


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



285/2 -> Train loss: 0.33965224875927774	Validation loss: 0.10100168640903556


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



286/2 -> Train loss: 0.3385307160184833	Validation loss: 0.10065315462535508


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



287/2 -> Train loss: 0.33741979656274695	Validation loss: 0.1003051995642446


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



288/2 -> Train loss: 0.3363162398155038	Validation loss: 0.09995893100598566


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



289/2 -> Train loss: 0.33521739687592456	Validation loss: 0.09961506552586724


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



290/2 -> Train loss: 0.3341245688621462	Validation loss: 0.09927352402840349


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



291/2 -> Train loss: 0.333032386181634	Validation loss: 0.09893509563005531


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



292/2 -> Train loss: 0.3319535011046876	Validation loss: 0.0985996329527257


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



293/2 -> Train loss: 0.330881477723348	Validation loss: 0.09826504331267827


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



294/2 -> Train loss: 0.3298091513375195	Validation loss: 0.09793329111455955


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.18it/s]



295/2 -> Train loss: 0.3287422243588152	Validation loss: 0.097607568554808


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



296/2 -> Train loss: 0.3276918630971543	Validation loss: 0.09728234426530429


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



297/2 -> Train loss: 0.3266413716900839	Validation loss: 0.09695759216500104


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



298/2 -> Train loss: 0.32559886973738805	Validation loss: 0.09663411346017947


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



299/2 -> Train loss: 0.32455972969682867	Validation loss: 0.09631241463565521


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



300/2 -> Train loss: 0.32352159190371	Validation loss: 0.09599301223875398


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



301/2 -> Train loss: 0.32249802887563145	Validation loss: 0.09567657509197872


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



302/2 -> Train loss: 0.32148156521322807	Validation loss: 0.0953618187704642


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



303/2 -> Train loss: 0.32047494883142086	Validation loss: 0.09504858271186721


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



304/2 -> Train loss: 0.3194676653654853	Validation loss: 0.09476408556899486


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



305/2 -> Train loss: 0.3184739383301124	Validation loss: 0.09446343028773535


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



306/2 -> Train loss: 0.3174803853803559	Validation loss: 0.09416917698253739


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



307/2 -> Train loss: 0.3164907055398248	Validation loss: 0.09386920606831008


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



308/2 -> Train loss: 0.3155066349822888	Validation loss: 0.09356634837291393


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



309/2 -> Train loss: 0.3145286983218055	Validation loss: 0.093265902745036


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



310/2 -> Train loss: 0.31356255019339896	Validation loss: 0.09296750829512636


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



311/2 -> Train loss: 0.31260383069762043	Validation loss: 0.09267310296493177


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



312/2 -> Train loss: 0.31165065373715184	Validation loss: 0.09237938036966768


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



313/2 -> Train loss: 0.310703133046045	Validation loss: 0.09208666922588504


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



314/2 -> Train loss: 0.3097632946549596	Validation loss: 0.09179812948526572


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



315/2 -> Train loss: 0.30882688930788443	Validation loss: 0.09150817346633253


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



316/2 -> Train loss: 0.30789529986944536	Validation loss: 0.0912203343149539


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



317/2 -> Train loss: 0.30696777716606033	Validation loss: 0.09093423921508484


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



318/2 -> Train loss: 0.30604563239614074	Validation loss: 0.09065287759520774


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



319/2 -> Train loss: 0.305130041602354	Validation loss: 0.0903707626622361


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



320/2 -> Train loss: 0.3042168962131759	Validation loss: 0.09008999754209406


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



321/2 -> Train loss: 0.30332092366845037	Validation loss: 0.08981183022066075


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



322/2 -> Train loss: 0.30242709106916427	Validation loss: 0.089535894169903


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



323/2 -> Train loss: 0.3015334684666674	Validation loss: 0.08925996281125168


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



324/2 -> Train loss: 0.3006412939878708	Validation loss: 0.08898580242648053


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



325/2 -> Train loss: 0.29975822153117065	Validation loss: 0.08871317470800673


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



326/2 -> Train loss: 0.29887802572006	Validation loss: 0.08844327517018864


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



327/2 -> Train loss: 0.2980039257546214	Validation loss: 0.08817398847407733


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



328/2 -> Train loss: 0.2971362101425091	Validation loss: 0.08791039138983153


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.13it/s]



329/2 -> Train loss: 0.29627754167874293	Validation loss: 0.08764848173980834


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



330/2 -> Train loss: 0.2954228184041076	Validation loss: 0.08738503752767159


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



331/2 -> Train loss: 0.29457308737579957	Validation loss: 0.0871231776000506


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



332/2 -> Train loss: 0.2937234800361838	Validation loss: 0.08687112316799615


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



333/2 -> Train loss: 0.29288146535981174	Validation loss: 0.08661148229851867


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



334/2 -> Train loss: 0.2920367689214595	Validation loss: 0.0863542357345466


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



335/2 -> Train loss: 0.29119840813723785	Validation loss: 0.0860987826783645


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



336/2 -> Train loss: 0.2903723636051763	Validation loss: 0.08584763499676383


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



337/2 -> Train loss: 0.2895466261355554	Validation loss: 0.08559408252735684


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



338/2 -> Train loss: 0.2887301301026318	Validation loss: 0.08534286928493155


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



339/2 -> Train loss: 0.28791296327947774	Validation loss: 0.08509217978048833


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.12it/s]



340/2 -> Train loss: 0.28710276703456683	Validation loss: 0.08484495004022355


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



341/2 -> Train loss: 0.286292829586388	Validation loss: 0.08459912905941316


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



342/2 -> Train loss: 0.2854898876662606	Validation loss: 0.08435338987221935


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



343/2 -> Train loss: 0.28469150598455883	Validation loss: 0.08411038881778442


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



344/2 -> Train loss: 0.2839028274053364	Validation loss: 0.08387751207973228


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



345/2 -> Train loss: 0.2831155072059808	Validation loss: 0.08363841722554959


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



346/2 -> Train loss: 0.2823385358587062	Validation loss: 0.08339831064786846


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



347/2 -> Train loss: 0.28155778615344695	Validation loss: 0.0831605433482517


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



348/2 -> Train loss: 0.2807807020841025	Validation loss: 0.08292256188044303


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



349/2 -> Train loss: 0.2800127865504438	Validation loss: 0.0826865943126564


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



350/2 -> Train loss: 0.2792433214474881	Validation loss: 0.08245148090326974


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



351/2 -> Train loss: 0.27848033991338145	Validation loss: 0.08221954424734383


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



352/2 -> Train loss: 0.2777216719837161	Validation loss: 0.08198734289618076


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



353/2 -> Train loss: 0.2769667353030969	Validation loss: 0.08175638346290938


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



354/2 -> Train loss: 0.2762210832284432	Validation loss: 0.08152680295464795


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



355/2 -> Train loss: 0.27547409546336554	Validation loss: 0.08129820292251723


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



356/2 -> Train loss: 0.27472909598864087	Validation loss: 0.08107168123772247


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



357/2 -> Train loss: 0.2739913272169843	Validation loss: 0.08084967407772019


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



358/2 -> Train loss: 0.2732568545072491	Validation loss: 0.08062649514303688


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



359/2 -> Train loss: 0.272529779892886	Validation loss: 0.08041530883474447


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



360/2 -> Train loss: 0.2717986495308793	Validation loss: 0.08019796836885165


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



361/2 -> Train loss: 0.2710781702539565	Validation loss: 0.07998552871695562


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



362/2 -> Train loss: 0.2703559274049857	Validation loss: 0.0797689261144041


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



363/2 -> Train loss: 0.2696413767769415	Validation loss: 0.07955011925355326


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



364/2 -> Train loss: 0.268933476276412	Validation loss: 0.07933250171917108


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



365/2 -> Train loss: 0.26822626638933245	Validation loss: 0.07911634147606232


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



366/2 -> Train loss: 0.2675214394745301	Validation loss: 0.07890124632747472


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



367/2 -> Train loss: 0.26682277856730835	Validation loss: 0.0786872985168484


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



368/2 -> Train loss: 0.2661295587133242	Validation loss: 0.07847456646034802


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



369/2 -> Train loss: 0.2654334257262205	Validation loss: 0.07826274333941723


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.73it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



370/2 -> Train loss: 0.2647380228018419	Validation loss: 0.07805188533526916


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



371/2 -> Train loss: 0.2640506783145638	Validation loss: 0.07784230422357098


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



372/2 -> Train loss: 0.2633660826481736	Validation loss: 0.07763386589264433


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



373/2 -> Train loss: 0.26268490636304764	Validation loss: 0.07742710446363654


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



374/2 -> Train loss: 0.26201325691090305	Validation loss: 0.07722109394981728


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



375/2 -> Train loss: 0.26134425330181466	Validation loss: 0.07701735202580856


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



376/2 -> Train loss: 0.2606795159264883	Validation loss: 0.07682788941954838


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.73it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



377/2 -> Train loss: 0.26001614673172885	Validation loss: 0.0766527737340856


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



378/2 -> Train loss: 0.2593546698641888	Validation loss: 0.07646064134080703


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



379/2 -> Train loss: 0.25869639826584795	Validation loss: 0.0762611458913566


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



380/2 -> Train loss: 0.2580400896554657	Validation loss: 0.07606155137526968


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



381/2 -> Train loss: 0.25738924252450035	Validation loss: 0.0758628064945507


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



382/2 -> Train loss: 0.2567404157215022	Validation loss: 0.0756655101208346


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



383/2 -> Train loss: 0.2560979566018696	Validation loss: 0.07546933832116129


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.14it/s]



384/2 -> Train loss: 0.25545753100082036	Validation loss: 0.0752737950250418


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



385/2 -> Train loss: 0.2548146289564305	Validation loss: 0.07507971566389565


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



386/2 -> Train loss: 0.25417763692460343	Validation loss: 0.07488628747164108


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



387/2 -> Train loss: 0.25354510945639624	Validation loss: 0.07469365905237882


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



388/2 -> Train loss: 0.25291642984745066	Validation loss: 0.0745019502676248


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



389/2 -> Train loss: 0.2522941495648702	Validation loss: 0.0743110358999148


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



390/2 -> Train loss: 0.25167458802020576	Validation loss: 0.07412121833151725


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



391/2 -> Train loss: 0.2510551101910801	Validation loss: 0.07393290013592593


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



392/2 -> Train loss: 0.25044134451526945	Validation loss: 0.07374540907950265


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



393/2 -> Train loss: 0.24982543023294773	Validation loss: 0.07355842494994101


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



394/2 -> Train loss: 0.2492181495511467	Validation loss: 0.07337228116419216


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.17it/s]



395/2 -> Train loss: 0.2486124444428903	Validation loss: 0.07318789075760641


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



396/2 -> Train loss: 0.24800800674395285	Validation loss: 0.07300394905972594


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



397/2 -> Train loss: 0.24740583081062456	Validation loss: 0.07282111728878601


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



398/2 -> Train loss: 0.24680515199600297	Validation loss: 0.07264075926014144


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



399/2 -> Train loss: 0.24620963666171605	Validation loss: 0.07245963534941875


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



400/2 -> Train loss: 0.24561764824832374	Validation loss: 0.07227920590937294


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



401/2 -> Train loss: 0.2450324983475921	Validation loss: 0.0721002158997138


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



402/2 -> Train loss: 0.24444662524091726	Validation loss: 0.07192254780391771


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



403/2 -> Train loss: 0.24386628623610768	Validation loss: 0.0717502996281351


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



404/2 -> Train loss: 0.24328125569806155	Validation loss: 0.07157327372487465


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



405/2 -> Train loss: 0.24270089480746607	Validation loss: 0.0713990342684119


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.17it/s]



406/2 -> Train loss: 0.24212558170587348	Validation loss: 0.07122420668730577


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



407/2 -> Train loss: 0.24154939353941723	Validation loss: 0.0710520746170383


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



408/2 -> Train loss: 0.24097995472126663	Validation loss: 0.07087885930613609


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



409/2 -> Train loss: 0.24041253872684834	Validation loss: 0.07070621528767461


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



410/2 -> Train loss: 0.23984578027941444	Validation loss: 0.07053422864991722


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



411/2 -> Train loss: 0.23928280830259532	Validation loss: 0.07036319906920141


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



412/2 -> Train loss: 0.2387237564300004	Validation loss: 0.0701929896353191


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



413/2 -> Train loss: 0.2381683346274975	Validation loss: 0.07002376598961269


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



414/2 -> Train loss: 0.2376106339136734	Validation loss: 0.06985525883219303


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



415/2 -> Train loss: 0.2370556295836258	Validation loss: 0.06968869615069004


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



416/2 -> Train loss: 0.2365056428261823	Validation loss: 0.06952340344676411


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



417/2 -> Train loss: 0.2359560392581984	Validation loss: 0.06935733963491848


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



418/2 -> Train loss: 0.2354084211421433	Validation loss: 0.06919203235210451


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



419/2 -> Train loss: 0.2348660869645472	Validation loss: 0.0690278028327675


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



420/2 -> Train loss: 0.23432329043699732	Validation loss: 0.06886465828716573


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



421/2 -> Train loss: 0.2337841107015612	Validation loss: 0.06870184209044612


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



422/2 -> Train loss: 0.23324748228406686	Validation loss: 0.06854126278741116


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



423/2 -> Train loss: 0.23271697859814844	Validation loss: 0.06838161672691984


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



424/2 -> Train loss: 0.23218520885331567	Validation loss: 0.06822707156215191


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



425/2 -> Train loss: 0.23165598066657622	Validation loss: 0.06806838237907895


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



426/2 -> Train loss: 0.23113217404909267	Validation loss: 0.06790917674203359


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



427/2 -> Train loss: 0.2306095636050037	Validation loss: 0.06775062959798274


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



428/2 -> Train loss: 0.23008863059283244	Validation loss: 0.06759323473532636


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



429/2 -> Train loss: 0.22956877719271465	Validation loss: 0.06743621952311507


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



430/2 -> Train loss: 0.22905095674532452	Validation loss: 0.06727998501331356


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



431/2 -> Train loss: 0.228537504590731	Validation loss: 0.06712468296289104


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



432/2 -> Train loss: 0.22802696700098807	Validation loss: 0.06697355620608979


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.19it/s]



433/2 -> Train loss: 0.2275181437924378	Validation loss: 0.06681966300415917


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



434/2 -> Train loss: 0.2270123277546116	Validation loss: 0.06666638760297218


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



435/2 -> Train loss: 0.22650721822847525	Validation loss: 0.06651362862236249


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



436/2 -> Train loss: 0.22600271043034864	Validation loss: 0.0663616032429312


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



437/2 -> Train loss: 0.22550213377194203	Validation loss: 0.06621319076061767


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.18it/s]



438/2 -> Train loss: 0.2250031497336592	Validation loss: 0.06606325687142468


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



439/2 -> Train loss: 0.22450561333572344	Validation loss: 0.06591443119989741


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



440/2 -> Train loss: 0.2240096131000001	Validation loss: 0.06576585893869774


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



441/2 -> Train loss: 0.22351749109529556	Validation loss: 0.06561934609796671


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



442/2 -> Train loss: 0.22302587792830855	Validation loss: 0.06548130237047825


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



443/2 -> Train loss: 0.2225386787625398	Validation loss: 0.06534771710279301


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



444/2 -> Train loss: 0.22205379249523005	Validation loss: 0.06520105870198616


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



445/2 -> Train loss: 0.22157099406544215	Validation loss: 0.06505512059594326


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



446/2 -> Train loss: 0.22109177509607683	Validation loss: 0.0649117568360768


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



447/2 -> Train loss: 0.22061428873716746	Validation loss: 0.06476844790432731


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.24it/s]



448/2 -> Train loss: 0.22013553866892682	Validation loss: 0.06462467600221766


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



449/2 -> Train loss: 0.2196572516352868	Validation loss: 0.06448134037180285


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



450/2 -> Train loss: 0.2191846933506952	Validation loss: 0.06433855685937902


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



451/2 -> Train loss: 0.2187162078305521	Validation loss: 0.0641968455715129


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



452/2 -> Train loss: 0.21824779281702317	Validation loss: 0.06405529811653124


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



453/2 -> Train loss: 0.21777977221967407	Validation loss: 0.06391425020264702


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



454/2 -> Train loss: 0.21731488287522652	Validation loss: 0.06377431230387241


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



455/2 -> Train loss: 0.21685176940204176	Validation loss: 0.06363478871053424


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



456/2 -> Train loss: 0.2163879546340221	Validation loss: 0.06349559946069229


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



457/2 -> Train loss: 0.21592676181322193	Validation loss: 0.06335727414299024


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



458/2 -> Train loss: 0.21546756347926477	Validation loss: 0.06322002355887671


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



459/2 -> Train loss: 0.2150120449566342	Validation loss: 0.06308581739367211


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



460/2 -> Train loss: 0.21456063259535682	Validation loss: 0.0629492353173976


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



461/2 -> Train loss: 0.2141090612854876	Validation loss: 0.06281323879031879


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



462/2 -> Train loss: 0.21366154788830424	Validation loss: 0.06267800172537921


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



463/2 -> Train loss: 0.21321457865551868	Validation loss: 0.06254315484176909


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



464/2 -> Train loss: 0.2127675448150855	Validation loss: 0.06240887256729118


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



465/2 -> Train loss: 0.21232578813314312	Validation loss: 0.06227701711471119


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



466/2 -> Train loss: 0.21188150439084874	Validation loss: 0.062153024976122136


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



467/2 -> Train loss: 0.21144118045583335	Validation loss: 0.06203125083419211


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.16it/s]



468/2 -> Train loss: 0.21100332637612193	Validation loss: 0.06190100660717977


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.75it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



469/2 -> Train loss: 0.21056505064180542	Validation loss: 0.06177263987815085


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



470/2 -> Train loss: 0.21012990429732745	Validation loss: 0.0616420414529784


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



471/2 -> Train loss: 0.2096981732560496	Validation loss: 0.06151228048020998


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



472/2 -> Train loss: 0.2092680364053446	Validation loss: 0.061382517144053565


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



473/2 -> Train loss: 0.20884034296206688	Validation loss: 0.06125337872717661


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



474/2 -> Train loss: 0.20841242344081032	Validation loss: 0.06112461617344742


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



475/2 -> Train loss: 0.20798805008218768	Validation loss: 0.060996452223249356


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.74it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.18it/s]



476/2 -> Train loss: 0.20756732297992733	Validation loss: 0.060868897818987334


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



477/2 -> Train loss: 0.20714868392024366	Validation loss: 0.06074164991972222


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.20it/s]



478/2 -> Train loss: 0.20672730332876052	Validation loss: 0.06061638836377336


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



479/2 -> Train loss: 0.2063075465208802	Validation loss: 0.060491894847115056


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



480/2 -> Train loss: 0.205888272990612	Validation loss: 0.06036660731912634


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



481/2 -> Train loss: 0.20547144491961844	Validation loss: 0.06024152292435768


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



482/2 -> Train loss: 0.20505814311439052	Validation loss: 0.06011711342467685


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



483/2 -> Train loss: 0.20464542773053832	Validation loss: 0.05999725992254713


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



484/2 -> Train loss: 0.2042344836863051	Validation loss: 0.05987794969291392


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



485/2 -> Train loss: 0.20382581152561313	Validation loss: 0.0597556934942089


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



486/2 -> Train loss: 0.20341635657879836	Validation loss: 0.05963425993451423


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



487/2 -> Train loss: 0.20301432656952598	Validation loss: 0.05951228704899463


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



488/2 -> Train loss: 0.20260940440473038	Validation loss: 0.05939082686585269


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.79it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



489/2 -> Train loss: 0.20220636017604934	Validation loss: 0.05926970631416259


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.15it/s]



490/2 -> Train loss: 0.20180734307261874	Validation loss: 0.05914950387309224


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



491/2 -> Train loss: 0.20140634368852023	Validation loss: 0.05902937682033394


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



492/2 -> Train loss: 0.20100908945271215	Validation loss: 0.05890974914708126


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



493/2 -> Train loss: 0.20061243063477235	Validation loss: 0.05879061557124958


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:51<00:00,  6.76it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



494/2 -> Train loss: 0.20021831474124216	Validation loss: 0.05867193609567196


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]



495/2 -> Train loss: 0.19982752037870033	Validation loss: 0.058553911346052916


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



496/2 -> Train loss: 0.19943584472227122	Validation loss: 0.0584361405883779


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



497/2 -> Train loss: 0.19904551922078753	Validation loss: 0.0583189173059075


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.77it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.22it/s]



498/2 -> Train loss: 0.19865781877507213	Validation loss: 0.058205067715794034


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.21it/s]



499/2 -> Train loss: 0.19827028746079328	Validation loss: 0.05808909019631567


Training batches: 100%|█████████████████████████████████████████████████████████████████████████| 345/345 [00:50<00:00,  6.78it/s]
Validation batches: 100%|█████████████████████████████████████████████████████████████████████████| 87/87 [00:12<00:00,  7.23it/s]


500/2 -> Train loss: 0.197882811320639	Validation loss: 0.057973286566180664





In [15]:
def predict_answer(context, question, ref_answer=None, metric=None):
    inputs = tokenizer(question, context, max_length=Q_LEN, padding="max_length", truncation=True, add_special_tokens=True)

    input_ids = torch.tensor(inputs["input_ids"], dtype=torch.long).to(DEVICE).unsqueeze(0)
    attention_mask = torch.tensor(inputs["attention_mask"], dtype=torch.long).to(DEVICE).unsqueeze(0)

    outputs = model.generate(input_ids=input_ids, attention_mask=attention_mask)

    predicted_answer = tokenizer.decode(outputs.flatten(), skip_special_tokens=True)

    if ref_answer:
      if metric == "bleu":
        # Load the Bleu metric
        bleu = evaluate.load("google_bleu")
        score = bleu.compute(predictions=[predicted_answer],
                            references=[ref_answer])

        print("\nContext: \n", context)
        #print("\n")
        print("Question: \n", question)
        return {
            "Reference Answer: ": ref_answer,
            "Predicted Answer: ": predicted_answer,
            "BLEU Score: ": score
        }
      elif metric == "rouge":
        rouge = evaluate.load("rouge")
        score = rouge.compute(predictions=[predicted_answer],
                            references=[ref_answer])

        print("\nContext: \n", context)
        #print("\n")
        print("Question: \n", question)
        return {
            "Reference Answer: ": ref_answer,
            "Predicted Answer: ": predicted_answer,
            "BLEU Score: ": score
        }
    else:
        return predicted_answer

In [16]:
ref_answers = []
predictions = []
for i in range(len(dataset['test']['Biography'])):
  context = dataset['test']["Name"][i] + ":" + dataset['test']['Biography'][i]
  question = dataset['test']['Query'][i]
  ref_answers.append(dataset['test']['Response'][i])

  #print("\n--context--", context)
  #print(predict_answer(context, question, ref_answer=ref_answer))
  predictions.append(predict_answer(context, question))

In [17]:
import locale
locale.getpreferredencoding = lambda: "UTF-8"
!pip install rouge_score

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting rouge_score
  Downloading rouge_score-0.1.2.tar.gz (17 kB)
  Preparing metadata (setup.py) ... [?25ldone
Building wheels for collected packages: rouge_score
  Building wheel for rouge_score (setup.py) ... [?25ldone
[?25h  Created wheel for rouge_score: filename=rouge_score-0.1.2-py3-none-any.whl size=24932 sha256=a96d640b8159dab6a3b0a49fd65fc7beadbadadd33c4e7a1a02fcfc1bf67cc10
  Stored in directory: /home/ubuntu/.cache/pip/wheels/5f/dd/89/461065a73be61a532ff8599a28e9beef17985c9e9c31e541b4
Successfully built rouge_score
Installing collected packages: rouge_score
Successfully installed rouge_score-0.1.2


In [18]:
rouge = evaluate.load('rouge')
results = rouge.compute(predictions=predictions, references=ref_answers)
print(results)

Downloading builder script:   0%|          | 0.00/6.27k [00:00<?, ?B/s]

{'rouge1': 0.275134202609655, 'rouge2': 0.11065895909797585, 'rougeL': 0.24712275364973701, 'rougeLsum': 0.24791197282094923}


In [20]:
model.save_pretrained("/home/ubuntu/ML/datasci-210-capstone-fall23/DialogStudio/dialogstudio_torch_model", from_pt=True)

In [22]:
from transformers import T5ForConditionalGeneration

model_test = T5ForConditionalGeneration.from_pretrained("/home/ubuntu/ML/datasci-210-capstone-fall23/DialogStudio/dialogstudio_torch_model")

In [24]:
!pip install torchsummary

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting torchsummary
  Downloading torchsummary-1.5.1-py3-none-any.whl (2.8 kB)
Installing collected packages: torchsummary
Successfully installed torchsummary-1.5.1


In [25]:
from torchsummary import summary

In [30]:
!pip install torchinfo

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting torchinfo
  Obtaining dependency information for torchinfo from https://files.pythonhosted.org/packages/72/25/973bd6128381951b23cdcd8a9870c6dcfc5606cb864df8eabd82e529f9c1/torchinfo-1.8.0-py3-none-any.whl.metadata
  Downloading torchinfo-1.8.0-py3-none-any.whl.metadata (21 kB)
Downloading torchinfo-1.8.0-py3-none-any.whl (23 kB)
Installing collected packages: torchinfo
Successfully installed torchinfo-1.8.0


In [33]:
total_params = sum(
	param.numel() for param in model_test.parameters()
)


In [34]:
total_params

247539456

In [38]:
!pip install prettytable

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Collecting prettytable
  Obtaining dependency information for prettytable from https://files.pythonhosted.org/packages/4d/81/316b6a55a0d1f327d04cc7b0ba9d04058cb62de6c3a4d4b0df280cbe3b0b/prettytable-3.9.0-py3-none-any.whl.metadata
  Downloading prettytable-3.9.0-py3-none-any.whl.metadata (26 kB)
Downloading prettytable-3.9.0-py3-none-any.whl (27 kB)
Installing collected packages: prettytable
Successfully installed prettytable-3.9.0


In [39]:
from prettytable import PrettyTable
def count_parameters(model):
    table = PrettyTable(["Modules", "Parameters"])
    total_params = 0
    for name, parameter in model.named_parameters():
        if not parameter.requires_grad: continue
        params = parameter.numel()
        table.add_row([name, params])
        total_params+=params
    print(table)
    print(f"Total Trainable Params: {total_params}")
    return total_params

count_parameters(model_test)

+----------------------------------------------------------------------+------------+
|                               Modules                                | Parameters |
+----------------------------------------------------------------------+------------+
|                            shared.weight                             |  24655104  |
|            encoder.block.0.layer.0.SelfAttention.q.weight            |   589824   |
|            encoder.block.0.layer.0.SelfAttention.k.weight            |   589824   |
|            encoder.block.0.layer.0.SelfAttention.v.weight            |   589824   |
|            encoder.block.0.layer.0.SelfAttention.o.weight            |   589824   |
| encoder.block.0.layer.0.SelfAttention.relative_attention_bias.weight |    384     |
|              encoder.block.0.layer.0.layer_norm.weight               |    768     |
|          encoder.block.0.layer.1.DenseReluDense.wi_0.weight          |  1572864   |
|          encoder.block.0.layer.1.DenseReluDense.wi_1

247539456