In [24]:
# Code largely inspired by https://www.kdnuggets.com/2020/07/pytorch-lstm-text-generation-tutorial.html

import torch
import pandas as pd
import numpy as np
import random
from collections import Counter
from nltk.tokenize import wordpunct_tokenize

SEED = 42
torch.manual_seed(SEED)
np.random.seed(SEED)
random.seed(SEED)

if torch.backends.cudnn.enabled:
    torch.backends.cudnn.benchmark = False
    torch.cuda.manual_seed_all(SEED)
    
def remove_multiple_strings(cur_string, replace_list):
    for cur_word in replace_list:
        cur_string = cur_string.replace(cur_word, '')
    return cur_string

rempunc = '(),.:[]'
def clean(sentence):
    without_some_punc = remove_multiple_strings(sentence, rempunc)
    sentence = without_some_punc.lower()
    '''sentence  = sentence.replace('\n', ' nnnnnn ')
    sentence = wordpunct_tokenize(sentence)
    postagged = nltk.pos_tag(sentence)
    replace_newline = []
    for word in postagged:
        w,t = word
        if w == 'nnnnnn':
            t = 'NEWLINE'
        replace_word = w + '-' + t
        replace_newline.append(replace_word)
    return replace_newline'''
    return sentence

class Dataset(torch.utils.data.Dataset):
    def __init__(
        self,
        max_epochs, batch_size, sequence_length, genre, sentiment
    ):
        self.max_epochs = max_epochs
        self.batch_size = batch_size
        self.sequence_length = sequence_length
        self.genre = genre
        self.sentiment = sentiment
        self.words = self.load_words()
        self.uniq_words = self.get_uniq_words()

        self.index_to_word = {index: word for index, word in enumerate(self.uniq_words)}
        self.word_to_index = {word: index for index, word in enumerate(self.uniq_words)}

        self.words_indexes = [self.word_to_index[w] for w in self.words]

    def load_words(self):
        train_df = pd.read_csv('data/lyrics_sentiments.csv')
        
        lyrics = list()
        
        i=0
        while i < len(train_df.index):
            if train_df['genre'][i] == self.genre and train_df['sentiment'][i] == self.sentiment and type(train_df['lyrics'][i]) == str:
                lyrics.append(clean(train_df['lyrics'][i]))
            i += 1
         
        print(len(lyrics))
        #return ' '.join(string for string in lyrics[:100]).split(' ')
        return ' '.join(string for string in lyrics[:5000]).split(' ')

    def get_uniq_words(self):
        word_counts = Counter(self.words)
        return sorted(word_counts, key=word_counts.get, reverse=True)

    def __len__(self):
        return len(self.words_indexes) - self.sequence_length

    def __getitem__(self, index):
        return (
            torch.tensor(self.words_indexes[index:index+self.sequence_length]),
            torch.tensor(self.words_indexes[index+1:index+self.sequence_length+1]),
        )     

In [25]:
import torch
import numpy as np
from torch import nn, optim
from torch.utils.data import DataLoader
from architecture import lstm

def train(dataset, model, max_epochs, batch_size, sequence_length):
    model.train().cuda()

    dataloader = DataLoader(dataset, batch_size=batch_size)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    
    print(len(dataloader))

    for epoch in range(max_epochs):
        state_h, state_c = model.init_state(sequence_length)

        for batch, (x, y) in enumerate(dataloader):
            optimizer.zero_grad()

            y_pred, (state_h, state_c) = model(x.cuda(), (state_h.cuda(), state_c.cuda()))
            loss = criterion(y_pred.transpose(1, 2), y.cuda())

            state_h = state_h.detach()
            state_c = state_c.detach()

            loss.backward()
            optimizer.step()

            print({ 'epoch': epoch, 'batch': batch, 'loss': loss.item() })
            


In [26]:
max_epochs=10
batch_size=256
sequence_length=2
genre="Pop"
sentiment='Positive'

dataset = Dataset(max_epochs, batch_size, sequence_length, genre, sentiment)
model = lstm.Model(dataset)

16192


In [27]:
train(dataset, model, max_epochs, batch_size, sequence_length)

3774
{'epoch': 0, 'batch': 0, 'loss': 11.616735458374023}
{'epoch': 0, 'batch': 1, 'loss': 11.613432884216309}
{'epoch': 0, 'batch': 2, 'loss': 11.593783378601074}
{'epoch': 0, 'batch': 3, 'loss': 11.588079452514648}
{'epoch': 0, 'batch': 4, 'loss': 11.579544067382812}
{'epoch': 0, 'batch': 5, 'loss': 11.583211898803711}
{'epoch': 0, 'batch': 6, 'loss': 11.588349342346191}
{'epoch': 0, 'batch': 7, 'loss': 11.558064460754395}
{'epoch': 0, 'batch': 8, 'loss': 11.53449535369873}
{'epoch': 0, 'batch': 9, 'loss': 11.47711181640625}
{'epoch': 0, 'batch': 10, 'loss': 11.382307052612305}
{'epoch': 0, 'batch': 11, 'loss': 11.422560691833496}
{'epoch': 0, 'batch': 12, 'loss': 11.148287773132324}
{'epoch': 0, 'batch': 13, 'loss': 11.025195121765137}
{'epoch': 0, 'batch': 14, 'loss': 10.716794967651367}
{'epoch': 0, 'batch': 15, 'loss': 10.645244598388672}
{'epoch': 0, 'batch': 16, 'loss': 11.104520797729492}
{'epoch': 0, 'batch': 17, 'loss': 10.614532470703125}
{'epoch': 0, 'batch': 18, 'loss': 1

{'epoch': 0, 'batch': 156, 'loss': 8.731302261352539}
{'epoch': 0, 'batch': 157, 'loss': 7.999475479125977}
{'epoch': 0, 'batch': 158, 'loss': 8.018243789672852}
{'epoch': 0, 'batch': 159, 'loss': 8.300727844238281}
{'epoch': 0, 'batch': 160, 'loss': 8.512747764587402}
{'epoch': 0, 'batch': 161, 'loss': 7.467521667480469}
{'epoch': 0, 'batch': 162, 'loss': 8.053237915039062}
{'epoch': 0, 'batch': 163, 'loss': 8.239377975463867}
{'epoch': 0, 'batch': 164, 'loss': 9.07723331451416}
{'epoch': 0, 'batch': 165, 'loss': 8.321393013000488}
{'epoch': 0, 'batch': 166, 'loss': 8.445294380187988}
{'epoch': 0, 'batch': 167, 'loss': 7.8002142906188965}
{'epoch': 0, 'batch': 168, 'loss': 7.893520355224609}
{'epoch': 0, 'batch': 169, 'loss': 7.329616069793701}
{'epoch': 0, 'batch': 170, 'loss': 8.245375633239746}
{'epoch': 0, 'batch': 171, 'loss': 7.620623588562012}
{'epoch': 0, 'batch': 172, 'loss': 8.056083679199219}
{'epoch': 0, 'batch': 173, 'loss': 8.122392654418945}
{'epoch': 0, 'batch': 174, '

{'epoch': 0, 'batch': 308, 'loss': 7.686069488525391}
{'epoch': 0, 'batch': 309, 'loss': 7.488681316375732}
{'epoch': 0, 'batch': 310, 'loss': 7.1529693603515625}
{'epoch': 0, 'batch': 311, 'loss': 7.465029716491699}
{'epoch': 0, 'batch': 312, 'loss': 7.3404693603515625}
{'epoch': 0, 'batch': 313, 'loss': 7.592648983001709}
{'epoch': 0, 'batch': 314, 'loss': 7.047884464263916}
{'epoch': 0, 'batch': 315, 'loss': 6.8052077293396}
{'epoch': 0, 'batch': 316, 'loss': 6.937641620635986}
{'epoch': 0, 'batch': 317, 'loss': 8.288851737976074}
{'epoch': 0, 'batch': 318, 'loss': 7.501698970794678}
{'epoch': 0, 'batch': 319, 'loss': 7.468894004821777}
{'epoch': 0, 'batch': 320, 'loss': 7.521732330322266}
{'epoch': 0, 'batch': 321, 'loss': 7.791903972625732}
{'epoch': 0, 'batch': 322, 'loss': 7.319432258605957}
{'epoch': 0, 'batch': 323, 'loss': 7.382997512817383}
{'epoch': 0, 'batch': 324, 'loss': 7.6074395179748535}
{'epoch': 0, 'batch': 325, 'loss': 8.383562088012695}
{'epoch': 0, 'batch': 326, 

{'epoch': 0, 'batch': 460, 'loss': 7.336180686950684}
{'epoch': 0, 'batch': 461, 'loss': 7.785130977630615}
{'epoch': 0, 'batch': 462, 'loss': 8.212084770202637}
{'epoch': 0, 'batch': 463, 'loss': 6.432024955749512}
{'epoch': 0, 'batch': 464, 'loss': 10.450422286987305}
{'epoch': 0, 'batch': 465, 'loss': 8.445252418518066}
{'epoch': 0, 'batch': 466, 'loss': 7.7923903465271}
{'epoch': 0, 'batch': 467, 'loss': 9.006341934204102}
{'epoch': 0, 'batch': 468, 'loss': 8.589201927185059}
{'epoch': 0, 'batch': 469, 'loss': 8.576547622680664}
{'epoch': 0, 'batch': 470, 'loss': 7.355023384094238}
{'epoch': 0, 'batch': 471, 'loss': 7.396852016448975}
{'epoch': 0, 'batch': 472, 'loss': 7.969126224517822}
{'epoch': 0, 'batch': 473, 'loss': 8.72292709350586}
{'epoch': 0, 'batch': 474, 'loss': 7.290877819061279}
{'epoch': 0, 'batch': 475, 'loss': 7.321722030639648}
{'epoch': 0, 'batch': 476, 'loss': 7.55642032623291}
{'epoch': 0, 'batch': 477, 'loss': 7.691765785217285}
{'epoch': 0, 'batch': 478, 'los

{'epoch': 0, 'batch': 612, 'loss': 8.562941551208496}
{'epoch': 0, 'batch': 613, 'loss': 8.038656234741211}
{'epoch': 0, 'batch': 614, 'loss': 8.228861808776855}
{'epoch': 0, 'batch': 615, 'loss': 7.340128421783447}
{'epoch': 0, 'batch': 616, 'loss': 7.018761157989502}
{'epoch': 0, 'batch': 617, 'loss': 7.746171951293945}
{'epoch': 0, 'batch': 618, 'loss': 7.870079517364502}
{'epoch': 0, 'batch': 619, 'loss': 8.172679901123047}
{'epoch': 0, 'batch': 620, 'loss': 7.202449798583984}
{'epoch': 0, 'batch': 621, 'loss': 6.987987518310547}
{'epoch': 0, 'batch': 622, 'loss': 7.33712911605835}
{'epoch': 0, 'batch': 623, 'loss': 7.4231343269348145}
{'epoch': 0, 'batch': 624, 'loss': 6.904286861419678}
{'epoch': 0, 'batch': 625, 'loss': 6.724356651306152}
{'epoch': 0, 'batch': 626, 'loss': 8.21926212310791}
{'epoch': 0, 'batch': 627, 'loss': 6.960730075836182}
{'epoch': 0, 'batch': 628, 'loss': 6.873683929443359}
{'epoch': 0, 'batch': 629, 'loss': 6.575850009918213}
{'epoch': 0, 'batch': 630, 'l

{'epoch': 0, 'batch': 764, 'loss': 7.750338077545166}
{'epoch': 0, 'batch': 765, 'loss': 7.940570831298828}
{'epoch': 0, 'batch': 766, 'loss': 8.065850257873535}
{'epoch': 0, 'batch': 767, 'loss': 9.860865592956543}
{'epoch': 0, 'batch': 768, 'loss': 10.489237785339355}
{'epoch': 0, 'batch': 769, 'loss': 10.28707218170166}
{'epoch': 0, 'batch': 770, 'loss': 10.286869049072266}
{'epoch': 0, 'batch': 771, 'loss': 10.884992599487305}
{'epoch': 0, 'batch': 772, 'loss': 9.097780227661133}
{'epoch': 0, 'batch': 773, 'loss': 7.906609535217285}
{'epoch': 0, 'batch': 774, 'loss': 8.14996337890625}
{'epoch': 0, 'batch': 775, 'loss': 7.615983009338379}
{'epoch': 0, 'batch': 776, 'loss': 7.686126708984375}
{'epoch': 0, 'batch': 777, 'loss': 7.888025760650635}
{'epoch': 0, 'batch': 778, 'loss': 8.078703880310059}
{'epoch': 0, 'batch': 779, 'loss': 7.884735107421875}
{'epoch': 0, 'batch': 780, 'loss': 8.400127410888672}
{'epoch': 0, 'batch': 781, 'loss': 7.793703556060791}
{'epoch': 0, 'batch': 782,

{'epoch': 0, 'batch': 917, 'loss': 6.285097122192383}
{'epoch': 0, 'batch': 918, 'loss': 7.37999153137207}
{'epoch': 0, 'batch': 919, 'loss': 7.440377235412598}
{'epoch': 0, 'batch': 920, 'loss': 7.473691463470459}
{'epoch': 0, 'batch': 921, 'loss': 8.332338333129883}
{'epoch': 0, 'batch': 922, 'loss': 7.983171463012695}
{'epoch': 0, 'batch': 923, 'loss': 8.253278732299805}
{'epoch': 0, 'batch': 924, 'loss': 8.450342178344727}
{'epoch': 0, 'batch': 925, 'loss': 8.211084365844727}
{'epoch': 0, 'batch': 926, 'loss': 7.4751386642456055}
{'epoch': 0, 'batch': 927, 'loss': 7.490592956542969}
{'epoch': 0, 'batch': 928, 'loss': 7.8792724609375}
{'epoch': 0, 'batch': 929, 'loss': 7.509760856628418}
{'epoch': 0, 'batch': 930, 'loss': 7.3019866943359375}
{'epoch': 0, 'batch': 931, 'loss': 7.441758632659912}
{'epoch': 0, 'batch': 932, 'loss': 7.863661766052246}
{'epoch': 0, 'batch': 933, 'loss': 8.589990615844727}
{'epoch': 0, 'batch': 934, 'loss': 7.798579216003418}
{'epoch': 0, 'batch': 935, 'l

{'epoch': 0, 'batch': 1068, 'loss': 7.617213249206543}
{'epoch': 0, 'batch': 1069, 'loss': 7.078425884246826}
{'epoch': 0, 'batch': 1070, 'loss': 7.74066162109375}
{'epoch': 0, 'batch': 1071, 'loss': 7.86854887008667}
{'epoch': 0, 'batch': 1072, 'loss': 7.110430717468262}
{'epoch': 0, 'batch': 1073, 'loss': 6.733609199523926}
{'epoch': 0, 'batch': 1074, 'loss': 6.7459635734558105}
{'epoch': 0, 'batch': 1075, 'loss': 6.738092422485352}
{'epoch': 0, 'batch': 1076, 'loss': 6.878327369689941}
{'epoch': 0, 'batch': 1077, 'loss': 7.374856948852539}
{'epoch': 0, 'batch': 1078, 'loss': 7.91959285736084}
{'epoch': 0, 'batch': 1079, 'loss': 7.957201957702637}
{'epoch': 0, 'batch': 1080, 'loss': 7.579444885253906}
{'epoch': 0, 'batch': 1081, 'loss': 7.405759334564209}
{'epoch': 0, 'batch': 1082, 'loss': 7.477145671844482}
{'epoch': 0, 'batch': 1083, 'loss': 7.055319786071777}
{'epoch': 0, 'batch': 1084, 'loss': 7.220974445343018}
{'epoch': 0, 'batch': 1085, 'loss': 7.4117231369018555}
{'epoch': 0

{'epoch': 0, 'batch': 1217, 'loss': 7.146341323852539}
{'epoch': 0, 'batch': 1218, 'loss': 7.075528621673584}
{'epoch': 0, 'batch': 1219, 'loss': 7.327425479888916}
{'epoch': 0, 'batch': 1220, 'loss': 6.905937671661377}
{'epoch': 0, 'batch': 1221, 'loss': 7.470560550689697}
{'epoch': 0, 'batch': 1222, 'loss': 10.657037734985352}
{'epoch': 0, 'batch': 1223, 'loss': 8.014104843139648}
{'epoch': 0, 'batch': 1224, 'loss': 7.758800983428955}
{'epoch': 0, 'batch': 1225, 'loss': 7.504227638244629}
{'epoch': 0, 'batch': 1226, 'loss': 7.591666221618652}
{'epoch': 0, 'batch': 1227, 'loss': 7.403627395629883}
{'epoch': 0, 'batch': 1228, 'loss': 7.077216625213623}
{'epoch': 0, 'batch': 1229, 'loss': 8.199395179748535}
{'epoch': 0, 'batch': 1230, 'loss': 8.121413230895996}
{'epoch': 0, 'batch': 1231, 'loss': 7.8188042640686035}
{'epoch': 0, 'batch': 1232, 'loss': 7.457392692565918}
{'epoch': 0, 'batch': 1233, 'loss': 7.41930627822876}
{'epoch': 0, 'batch': 1234, 'loss': 7.236899375915527}
{'epoch':

{'epoch': 0, 'batch': 1367, 'loss': 7.640949726104736}
{'epoch': 0, 'batch': 1368, 'loss': 7.708305835723877}
{'epoch': 0, 'batch': 1369, 'loss': 7.38748025894165}
{'epoch': 0, 'batch': 1370, 'loss': 6.948987007141113}
{'epoch': 0, 'batch': 1371, 'loss': 7.794917106628418}
{'epoch': 0, 'batch': 1372, 'loss': 7.83695125579834}
{'epoch': 0, 'batch': 1373, 'loss': 7.633296489715576}
{'epoch': 0, 'batch': 1374, 'loss': 8.34231948852539}
{'epoch': 0, 'batch': 1375, 'loss': 7.389923572540283}
{'epoch': 0, 'batch': 1376, 'loss': 8.9701509475708}
{'epoch': 0, 'batch': 1377, 'loss': 7.796680927276611}
{'epoch': 0, 'batch': 1378, 'loss': 8.365242004394531}
{'epoch': 0, 'batch': 1379, 'loss': 7.948227882385254}
{'epoch': 0, 'batch': 1380, 'loss': 8.133766174316406}
{'epoch': 0, 'batch': 1381, 'loss': 8.698084831237793}
{'epoch': 0, 'batch': 1382, 'loss': 7.721353530883789}
{'epoch': 0, 'batch': 1383, 'loss': 8.177282333374023}
{'epoch': 0, 'batch': 1384, 'loss': 7.6490912437438965}
{'epoch': 0, '

{'epoch': 0, 'batch': 1520, 'loss': 11.2660551071167}
{'epoch': 0, 'batch': 1521, 'loss': 11.320713996887207}
{'epoch': 0, 'batch': 1522, 'loss': 11.406791687011719}
{'epoch': 0, 'batch': 1523, 'loss': 11.335001945495605}
{'epoch': 0, 'batch': 1524, 'loss': 11.096447944641113}
{'epoch': 0, 'batch': 1525, 'loss': 11.299163818359375}
{'epoch': 0, 'batch': 1526, 'loss': 10.779574394226074}
{'epoch': 0, 'batch': 1527, 'loss': 11.144400596618652}
{'epoch': 0, 'batch': 1528, 'loss': 8.315196990966797}
{'epoch': 0, 'batch': 1529, 'loss': 10.097999572753906}
{'epoch': 0, 'batch': 1530, 'loss': 11.699060440063477}
{'epoch': 0, 'batch': 1531, 'loss': 8.631866455078125}
{'epoch': 0, 'batch': 1532, 'loss': 7.808653831481934}
{'epoch': 0, 'batch': 1533, 'loss': 8.089001655578613}
{'epoch': 0, 'batch': 1534, 'loss': 7.542505264282227}
{'epoch': 0, 'batch': 1535, 'loss': 7.68259859085083}
{'epoch': 0, 'batch': 1536, 'loss': 7.180855751037598}
{'epoch': 0, 'batch': 1537, 'loss': 6.893094539642334}
{'e

{'epoch': 0, 'batch': 1670, 'loss': 7.619597911834717}
{'epoch': 0, 'batch': 1671, 'loss': 8.152766227722168}
{'epoch': 0, 'batch': 1672, 'loss': 7.852817535400391}
{'epoch': 0, 'batch': 1673, 'loss': 9.732540130615234}
{'epoch': 0, 'batch': 1674, 'loss': 8.237359046936035}
{'epoch': 0, 'batch': 1675, 'loss': 10.230507850646973}
{'epoch': 0, 'batch': 1676, 'loss': 7.378250598907471}
{'epoch': 0, 'batch': 1677, 'loss': 8.6519775390625}
{'epoch': 0, 'batch': 1678, 'loss': 8.430898666381836}
{'epoch': 0, 'batch': 1679, 'loss': 7.987321853637695}
{'epoch': 0, 'batch': 1680, 'loss': 7.404031276702881}
{'epoch': 0, 'batch': 1681, 'loss': 7.165736675262451}
{'epoch': 0, 'batch': 1682, 'loss': 8.082884788513184}
{'epoch': 0, 'batch': 1683, 'loss': 7.247550964355469}
{'epoch': 0, 'batch': 1684, 'loss': 7.482819080352783}
{'epoch': 0, 'batch': 1685, 'loss': 8.682650566101074}
{'epoch': 0, 'batch': 1686, 'loss': 7.684044361114502}
{'epoch': 0, 'batch': 1687, 'loss': 8.398853302001953}
{'epoch': 0

{'epoch': 0, 'batch': 1820, 'loss': 7.541813373565674}
{'epoch': 0, 'batch': 1821, 'loss': 6.900263786315918}
{'epoch': 0, 'batch': 1822, 'loss': 8.186576843261719}
{'epoch': 0, 'batch': 1823, 'loss': 7.807553291320801}
{'epoch': 0, 'batch': 1824, 'loss': 7.644014358520508}
{'epoch': 0, 'batch': 1825, 'loss': 7.531460285186768}
{'epoch': 0, 'batch': 1826, 'loss': 7.558805465698242}
{'epoch': 0, 'batch': 1827, 'loss': 8.052491188049316}
{'epoch': 0, 'batch': 1828, 'loss': 8.059907913208008}
{'epoch': 0, 'batch': 1829, 'loss': 7.982333183288574}
{'epoch': 0, 'batch': 1830, 'loss': 7.887315273284912}
{'epoch': 0, 'batch': 1831, 'loss': 7.764334678649902}
{'epoch': 0, 'batch': 1832, 'loss': 7.155256748199463}
{'epoch': 0, 'batch': 1833, 'loss': 7.670562744140625}
{'epoch': 0, 'batch': 1834, 'loss': 6.880092144012451}
{'epoch': 0, 'batch': 1835, 'loss': 7.073267936706543}
{'epoch': 0, 'batch': 1836, 'loss': 7.000205039978027}
{'epoch': 0, 'batch': 1837, 'loss': 7.1007256507873535}
{'epoch':

{'epoch': 0, 'batch': 1970, 'loss': 8.068807601928711}
{'epoch': 0, 'batch': 1971, 'loss': 7.583165168762207}
{'epoch': 0, 'batch': 1972, 'loss': 8.431171417236328}
{'epoch': 0, 'batch': 1973, 'loss': 7.972563743591309}
{'epoch': 0, 'batch': 1974, 'loss': 9.373709678649902}
{'epoch': 0, 'batch': 1975, 'loss': 11.099466323852539}
{'epoch': 0, 'batch': 1976, 'loss': 11.492026329040527}
{'epoch': 0, 'batch': 1977, 'loss': 11.347073554992676}
{'epoch': 0, 'batch': 1978, 'loss': 11.62823486328125}
{'epoch': 0, 'batch': 1979, 'loss': 11.378986358642578}
{'epoch': 0, 'batch': 1980, 'loss': 11.661245346069336}
{'epoch': 0, 'batch': 1981, 'loss': 11.512158393859863}
{'epoch': 0, 'batch': 1982, 'loss': 9.09080982208252}
{'epoch': 0, 'batch': 1983, 'loss': 7.243915557861328}
{'epoch': 0, 'batch': 1984, 'loss': 7.078526020050049}
{'epoch': 0, 'batch': 1985, 'loss': 8.47459602355957}
{'epoch': 0, 'batch': 1986, 'loss': 7.715911865234375}
{'epoch': 0, 'batch': 1987, 'loss': 7.0194830894470215}
{'epo

{'epoch': 0, 'batch': 2119, 'loss': 8.523698806762695}
{'epoch': 0, 'batch': 2120, 'loss': 8.354655265808105}
{'epoch': 0, 'batch': 2121, 'loss': 8.651835441589355}
{'epoch': 0, 'batch': 2122, 'loss': 8.559453010559082}
{'epoch': 0, 'batch': 2123, 'loss': 7.871487617492676}
{'epoch': 0, 'batch': 2124, 'loss': 7.822030544281006}
{'epoch': 0, 'batch': 2125, 'loss': 7.949546813964844}
{'epoch': 0, 'batch': 2126, 'loss': 7.926120758056641}
{'epoch': 0, 'batch': 2127, 'loss': 7.533324718475342}
{'epoch': 0, 'batch': 2128, 'loss': 8.60735034942627}
{'epoch': 0, 'batch': 2129, 'loss': 8.560599327087402}
{'epoch': 0, 'batch': 2130, 'loss': 8.204785346984863}
{'epoch': 0, 'batch': 2131, 'loss': 8.409795761108398}
{'epoch': 0, 'batch': 2132, 'loss': 7.924382209777832}
{'epoch': 0, 'batch': 2133, 'loss': 8.594720840454102}
{'epoch': 0, 'batch': 2134, 'loss': 9.012977600097656}
{'epoch': 0, 'batch': 2135, 'loss': 8.819093704223633}
{'epoch': 0, 'batch': 2136, 'loss': 8.858866691589355}
{'epoch': 0

{'epoch': 0, 'batch': 2268, 'loss': 7.634403705596924}
{'epoch': 0, 'batch': 2269, 'loss': 7.530783176422119}
{'epoch': 0, 'batch': 2270, 'loss': 7.845749378204346}
{'epoch': 0, 'batch': 2271, 'loss': 8.148086547851562}
{'epoch': 0, 'batch': 2272, 'loss': 8.70118522644043}
{'epoch': 0, 'batch': 2273, 'loss': 7.27546501159668}
{'epoch': 0, 'batch': 2274, 'loss': 6.696580410003662}
{'epoch': 0, 'batch': 2275, 'loss': 7.311425685882568}
{'epoch': 0, 'batch': 2276, 'loss': 8.484222412109375}
{'epoch': 0, 'batch': 2277, 'loss': 8.327417373657227}
{'epoch': 0, 'batch': 2278, 'loss': 8.1323823928833}
{'epoch': 0, 'batch': 2279, 'loss': 8.556062698364258}
{'epoch': 0, 'batch': 2280, 'loss': 7.6704254150390625}
{'epoch': 0, 'batch': 2281, 'loss': 6.707528591156006}
{'epoch': 0, 'batch': 2282, 'loss': 7.404531955718994}
{'epoch': 0, 'batch': 2283, 'loss': 7.776623725891113}
{'epoch': 0, 'batch': 2284, 'loss': 8.130165100097656}
{'epoch': 0, 'batch': 2285, 'loss': 8.15861701965332}
{'epoch': 0, '

{'epoch': 0, 'batch': 2418, 'loss': 8.099076271057129}
{'epoch': 0, 'batch': 2419, 'loss': 7.077183723449707}
{'epoch': 0, 'batch': 2420, 'loss': 7.192839622497559}
{'epoch': 0, 'batch': 2421, 'loss': 7.461294174194336}
{'epoch': 0, 'batch': 2422, 'loss': 8.38138198852539}
{'epoch': 0, 'batch': 2423, 'loss': 7.632096767425537}
{'epoch': 0, 'batch': 2424, 'loss': 7.490162372589111}
{'epoch': 0, 'batch': 2425, 'loss': 7.632156848907471}
{'epoch': 0, 'batch': 2426, 'loss': 7.076438903808594}
{'epoch': 0, 'batch': 2427, 'loss': 7.130321502685547}
{'epoch': 0, 'batch': 2428, 'loss': 7.773121356964111}
{'epoch': 0, 'batch': 2429, 'loss': 8.419825553894043}
{'epoch': 0, 'batch': 2430, 'loss': 7.751718997955322}
{'epoch': 0, 'batch': 2431, 'loss': 7.318999767303467}
{'epoch': 0, 'batch': 2432, 'loss': 7.550233840942383}
{'epoch': 0, 'batch': 2433, 'loss': 7.730367183685303}
{'epoch': 0, 'batch': 2434, 'loss': 7.310850620269775}
{'epoch': 0, 'batch': 2435, 'loss': 7.6538543701171875}
{'epoch': 

{'epoch': 0, 'batch': 2567, 'loss': 8.407032012939453}
{'epoch': 0, 'batch': 2568, 'loss': 8.334115982055664}
{'epoch': 0, 'batch': 2569, 'loss': 8.061335563659668}
{'epoch': 0, 'batch': 2570, 'loss': 8.16465950012207}
{'epoch': 0, 'batch': 2571, 'loss': 8.15284252166748}
{'epoch': 0, 'batch': 2572, 'loss': 8.659811973571777}
{'epoch': 0, 'batch': 2573, 'loss': 8.376982688903809}
{'epoch': 0, 'batch': 2574, 'loss': 8.262308120727539}
{'epoch': 0, 'batch': 2575, 'loss': 8.13925552368164}
{'epoch': 0, 'batch': 2576, 'loss': 8.123238563537598}
{'epoch': 0, 'batch': 2577, 'loss': 7.435899257659912}
{'epoch': 0, 'batch': 2578, 'loss': 7.948584079742432}
{'epoch': 0, 'batch': 2579, 'loss': 7.1778998374938965}
{'epoch': 0, 'batch': 2580, 'loss': 7.677469730377197}
{'epoch': 0, 'batch': 2581, 'loss': 7.342223167419434}
{'epoch': 0, 'batch': 2582, 'loss': 7.3320441246032715}
{'epoch': 0, 'batch': 2583, 'loss': 6.227463722229004}
{'epoch': 0, 'batch': 2584, 'loss': 6.845077991485596}
{'epoch': 0

{'epoch': 0, 'batch': 2718, 'loss': 7.847656726837158}
{'epoch': 0, 'batch': 2719, 'loss': 7.427076816558838}
{'epoch': 0, 'batch': 2720, 'loss': 7.240840911865234}
{'epoch': 0, 'batch': 2721, 'loss': 7.506123065948486}
{'epoch': 0, 'batch': 2722, 'loss': 7.788151741027832}
{'epoch': 0, 'batch': 2723, 'loss': 7.279916286468506}
{'epoch': 0, 'batch': 2724, 'loss': 6.490446090698242}
{'epoch': 0, 'batch': 2725, 'loss': 6.778029918670654}
{'epoch': 0, 'batch': 2726, 'loss': 6.600019931793213}
{'epoch': 0, 'batch': 2727, 'loss': 7.094531059265137}
{'epoch': 0, 'batch': 2728, 'loss': 7.083800792694092}
{'epoch': 0, 'batch': 2729, 'loss': 7.354349613189697}
{'epoch': 0, 'batch': 2730, 'loss': 6.448042869567871}
{'epoch': 0, 'batch': 2731, 'loss': 6.166515827178955}
{'epoch': 0, 'batch': 2732, 'loss': 7.218122959136963}
{'epoch': 0, 'batch': 2733, 'loss': 7.654878616333008}
{'epoch': 0, 'batch': 2734, 'loss': 8.162273406982422}
{'epoch': 0, 'batch': 2735, 'loss': 7.855189323425293}
{'epoch': 

{'epoch': 0, 'batch': 2868, 'loss': 7.088591575622559}
{'epoch': 0, 'batch': 2869, 'loss': 8.488570213317871}
{'epoch': 0, 'batch': 2870, 'loss': 7.923723220825195}
{'epoch': 0, 'batch': 2871, 'loss': 7.576837539672852}
{'epoch': 0, 'batch': 2872, 'loss': 8.162381172180176}
{'epoch': 0, 'batch': 2873, 'loss': 7.143531322479248}
{'epoch': 0, 'batch': 2874, 'loss': 9.73007583618164}
{'epoch': 0, 'batch': 2875, 'loss': 7.872661590576172}
{'epoch': 0, 'batch': 2876, 'loss': 8.013617515563965}
{'epoch': 0, 'batch': 2877, 'loss': 8.4967622756958}
{'epoch': 0, 'batch': 2878, 'loss': 8.198423385620117}
{'epoch': 0, 'batch': 2879, 'loss': 8.209437370300293}
{'epoch': 0, 'batch': 2880, 'loss': 8.617895126342773}
{'epoch': 0, 'batch': 2881, 'loss': 8.761591911315918}
{'epoch': 0, 'batch': 2882, 'loss': 8.382737159729004}
{'epoch': 0, 'batch': 2883, 'loss': 6.929571151733398}
{'epoch': 0, 'batch': 2884, 'loss': 7.214937210083008}
{'epoch': 0, 'batch': 2885, 'loss': 7.389915943145752}
{'epoch': 0, 

{'epoch': 0, 'batch': 3020, 'loss': 7.2193708419799805}
{'epoch': 0, 'batch': 3021, 'loss': 6.775659561157227}
{'epoch': 0, 'batch': 3022, 'loss': 7.031128406524658}
{'epoch': 0, 'batch': 3023, 'loss': 7.138412952423096}
{'epoch': 0, 'batch': 3024, 'loss': 7.206197738647461}
{'epoch': 0, 'batch': 3025, 'loss': 7.653055667877197}
{'epoch': 0, 'batch': 3026, 'loss': 8.059886932373047}
{'epoch': 0, 'batch': 3027, 'loss': 9.500173568725586}
{'epoch': 0, 'batch': 3028, 'loss': 8.34382438659668}
{'epoch': 0, 'batch': 3029, 'loss': 7.60168981552124}
{'epoch': 0, 'batch': 3030, 'loss': 7.817243576049805}
{'epoch': 0, 'batch': 3031, 'loss': 7.522738456726074}
{'epoch': 0, 'batch': 3032, 'loss': 6.5476274490356445}
{'epoch': 0, 'batch': 3033, 'loss': 7.214365482330322}
{'epoch': 0, 'batch': 3034, 'loss': 7.473349094390869}
{'epoch': 0, 'batch': 3035, 'loss': 7.5664544105529785}
{'epoch': 0, 'batch': 3036, 'loss': 8.323226928710938}
{'epoch': 0, 'batch': 3037, 'loss': 7.884146213531494}
{'epoch':

{'epoch': 0, 'batch': 3171, 'loss': 7.792061805725098}
{'epoch': 0, 'batch': 3172, 'loss': 6.811130046844482}
{'epoch': 0, 'batch': 3173, 'loss': 7.580946445465088}
{'epoch': 0, 'batch': 3174, 'loss': 7.605055332183838}
{'epoch': 0, 'batch': 3175, 'loss': 7.711162567138672}
{'epoch': 0, 'batch': 3176, 'loss': 7.968723773956299}
{'epoch': 0, 'batch': 3177, 'loss': 8.060714721679688}
{'epoch': 0, 'batch': 3178, 'loss': 7.162038326263428}
{'epoch': 0, 'batch': 3179, 'loss': 7.181256294250488}
{'epoch': 0, 'batch': 3180, 'loss': 8.219386100769043}
{'epoch': 0, 'batch': 3181, 'loss': 8.154794692993164}
{'epoch': 0, 'batch': 3182, 'loss': 8.446455001831055}
{'epoch': 0, 'batch': 3183, 'loss': 8.191557884216309}
{'epoch': 0, 'batch': 3184, 'loss': 7.260852336883545}
{'epoch': 0, 'batch': 3185, 'loss': 9.566802024841309}
{'epoch': 0, 'batch': 3186, 'loss': 9.255391120910645}
{'epoch': 0, 'batch': 3187, 'loss': 7.061997413635254}
{'epoch': 0, 'batch': 3188, 'loss': 7.071979522705078}
{'epoch': 

{'epoch': 0, 'batch': 3324, 'loss': 6.835999965667725}
{'epoch': 0, 'batch': 3325, 'loss': 6.827070236206055}
{'epoch': 0, 'batch': 3326, 'loss': 6.869998455047607}
{'epoch': 0, 'batch': 3327, 'loss': 6.32277774810791}
{'epoch': 0, 'batch': 3328, 'loss': 6.918778419494629}
{'epoch': 0, 'batch': 3329, 'loss': 7.581696510314941}
{'epoch': 0, 'batch': 3330, 'loss': 6.921660423278809}
{'epoch': 0, 'batch': 3331, 'loss': 7.595707416534424}
{'epoch': 0, 'batch': 3332, 'loss': 7.280324935913086}
{'epoch': 0, 'batch': 3333, 'loss': 7.511317729949951}
{'epoch': 0, 'batch': 3334, 'loss': 7.184408187866211}
{'epoch': 0, 'batch': 3335, 'loss': 7.121528148651123}
{'epoch': 0, 'batch': 3336, 'loss': 8.03555679321289}
{'epoch': 0, 'batch': 3337, 'loss': 9.7069091796875}
{'epoch': 0, 'batch': 3338, 'loss': 9.376662254333496}
{'epoch': 0, 'batch': 3339, 'loss': 7.078488826751709}
{'epoch': 0, 'batch': 3340, 'loss': 7.712640762329102}
{'epoch': 0, 'batch': 3341, 'loss': 9.061872482299805}
{'epoch': 0, '

{'epoch': 0, 'batch': 3476, 'loss': 7.617288589477539}
{'epoch': 0, 'batch': 3477, 'loss': 7.098299026489258}
{'epoch': 0, 'batch': 3478, 'loss': 6.92608118057251}
{'epoch': 0, 'batch': 3479, 'loss': 8.759537696838379}
{'epoch': 0, 'batch': 3480, 'loss': 6.815118312835693}
{'epoch': 0, 'batch': 3481, 'loss': 7.323531150817871}
{'epoch': 0, 'batch': 3482, 'loss': 7.953249454498291}
{'epoch': 0, 'batch': 3483, 'loss': 9.517820358276367}
{'epoch': 0, 'batch': 3484, 'loss': 8.545049667358398}
{'epoch': 0, 'batch': 3485, 'loss': 8.703904151916504}
{'epoch': 0, 'batch': 3486, 'loss': 8.967876434326172}
{'epoch': 0, 'batch': 3487, 'loss': 7.941450595855713}
{'epoch': 0, 'batch': 3488, 'loss': 7.906965732574463}
{'epoch': 0, 'batch': 3489, 'loss': 7.582719802856445}
{'epoch': 0, 'batch': 3490, 'loss': 7.269281387329102}
{'epoch': 0, 'batch': 3491, 'loss': 6.754355430603027}
{'epoch': 0, 'batch': 3492, 'loss': 6.57816743850708}
{'epoch': 0, 'batch': 3493, 'loss': 6.790740489959717}
{'epoch': 0,

{'epoch': 0, 'batch': 3629, 'loss': 8.65613079071045}
{'epoch': 0, 'batch': 3630, 'loss': 8.528057098388672}
{'epoch': 0, 'batch': 3631, 'loss': 7.8850836753845215}
{'epoch': 0, 'batch': 3632, 'loss': 7.8110785484313965}
{'epoch': 0, 'batch': 3633, 'loss': 10.28091812133789}
{'epoch': 0, 'batch': 3634, 'loss': 8.46327018737793}
{'epoch': 0, 'batch': 3635, 'loss': 8.042095184326172}
{'epoch': 0, 'batch': 3636, 'loss': 8.367551803588867}
{'epoch': 0, 'batch': 3637, 'loss': 8.511381149291992}
{'epoch': 0, 'batch': 3638, 'loss': 8.708370208740234}
{'epoch': 0, 'batch': 3639, 'loss': 7.935731410980225}
{'epoch': 0, 'batch': 3640, 'loss': 8.458632469177246}
{'epoch': 0, 'batch': 3641, 'loss': 8.42081069946289}
{'epoch': 0, 'batch': 3642, 'loss': 8.053739547729492}
{'epoch': 0, 'batch': 3643, 'loss': 7.719773769378662}
{'epoch': 0, 'batch': 3644, 'loss': 7.44479513168335}
{'epoch': 0, 'batch': 3645, 'loss': 7.334575653076172}
{'epoch': 0, 'batch': 3646, 'loss': 7.261992454528809}
{'epoch': 0,

{'epoch': 1, 'batch': 7, 'loss': 6.804175853729248}
{'epoch': 1, 'batch': 8, 'loss': 6.656998634338379}
{'epoch': 1, 'batch': 9, 'loss': 6.26444149017334}
{'epoch': 1, 'batch': 10, 'loss': 6.214677810668945}
{'epoch': 1, 'batch': 11, 'loss': 8.074256896972656}
{'epoch': 1, 'batch': 12, 'loss': 6.465939044952393}
{'epoch': 1, 'batch': 13, 'loss': 6.099358558654785}
{'epoch': 1, 'batch': 14, 'loss': 6.065636157989502}
{'epoch': 1, 'batch': 15, 'loss': 6.420263290405273}
{'epoch': 1, 'batch': 16, 'loss': 7.329296588897705}
{'epoch': 1, 'batch': 17, 'loss': 7.077042579650879}
{'epoch': 1, 'batch': 18, 'loss': 7.011690616607666}
{'epoch': 1, 'batch': 19, 'loss': 7.431397914886475}
{'epoch': 1, 'batch': 20, 'loss': 7.554716110229492}
{'epoch': 1, 'batch': 21, 'loss': 7.133396148681641}
{'epoch': 1, 'batch': 22, 'loss': 6.822286605834961}
{'epoch': 1, 'batch': 23, 'loss': 7.42767858505249}
{'epoch': 1, 'batch': 24, 'loss': 6.566823482513428}
{'epoch': 1, 'batch': 25, 'loss': 7.362112045288086

{'epoch': 1, 'batch': 163, 'loss': 7.127453327178955}
{'epoch': 1, 'batch': 164, 'loss': 7.526481628417969}
{'epoch': 1, 'batch': 165, 'loss': 7.061825275421143}
{'epoch': 1, 'batch': 166, 'loss': 7.232777118682861}
{'epoch': 1, 'batch': 167, 'loss': 6.65546178817749}
{'epoch': 1, 'batch': 168, 'loss': 6.873589515686035}
{'epoch': 1, 'batch': 169, 'loss': 6.366982460021973}
{'epoch': 1, 'batch': 170, 'loss': 7.10820198059082}
{'epoch': 1, 'batch': 171, 'loss': 6.422976016998291}
{'epoch': 1, 'batch': 172, 'loss': 6.890928268432617}
{'epoch': 1, 'batch': 173, 'loss': 6.807748794555664}
{'epoch': 1, 'batch': 174, 'loss': 7.3597612380981445}
{'epoch': 1, 'batch': 175, 'loss': 7.037750720977783}
{'epoch': 1, 'batch': 176, 'loss': 7.005350589752197}
{'epoch': 1, 'batch': 177, 'loss': 7.3875932693481445}
{'epoch': 1, 'batch': 178, 'loss': 7.1397247314453125}
{'epoch': 1, 'batch': 179, 'loss': 7.365433216094971}
{'epoch': 1, 'batch': 180, 'loss': 6.502197265625}
{'epoch': 1, 'batch': 181, 'lo

{'epoch': 1, 'batch': 316, 'loss': 5.998520374298096}
{'epoch': 1, 'batch': 317, 'loss': 7.097781658172607}
{'epoch': 1, 'batch': 318, 'loss': 6.500877857208252}
{'epoch': 1, 'batch': 319, 'loss': 6.467268466949463}
{'epoch': 1, 'batch': 320, 'loss': 6.503474712371826}
{'epoch': 1, 'batch': 321, 'loss': 6.800943374633789}
{'epoch': 1, 'batch': 322, 'loss': 6.312380790710449}
{'epoch': 1, 'batch': 323, 'loss': 6.410444736480713}
{'epoch': 1, 'batch': 324, 'loss': 6.663396835327148}
{'epoch': 1, 'batch': 325, 'loss': 7.276782035827637}
{'epoch': 1, 'batch': 326, 'loss': 7.181599140167236}
{'epoch': 1, 'batch': 327, 'loss': 6.46804666519165}
{'epoch': 1, 'batch': 328, 'loss': 7.073602199554443}
{'epoch': 1, 'batch': 329, 'loss': 7.349273204803467}
{'epoch': 1, 'batch': 330, 'loss': 5.973848819732666}
{'epoch': 1, 'batch': 331, 'loss': 6.787017822265625}
{'epoch': 1, 'batch': 332, 'loss': 7.5748724937438965}
{'epoch': 1, 'batch': 333, 'loss': 9.089990615844727}
{'epoch': 1, 'batch': 334, '

{'epoch': 1, 'batch': 471, 'loss': 6.505355358123779}
{'epoch': 1, 'batch': 472, 'loss': 7.153257846832275}
{'epoch': 1, 'batch': 473, 'loss': 7.827035427093506}
{'epoch': 1, 'batch': 474, 'loss': 6.4524664878845215}
{'epoch': 1, 'batch': 475, 'loss': 6.379253387451172}
{'epoch': 1, 'batch': 476, 'loss': 6.707276344299316}
{'epoch': 1, 'batch': 477, 'loss': 6.724895477294922}
{'epoch': 1, 'batch': 478, 'loss': 7.04154109954834}
{'epoch': 1, 'batch': 479, 'loss': 6.789421558380127}
{'epoch': 1, 'batch': 480, 'loss': 6.903827667236328}
{'epoch': 1, 'batch': 481, 'loss': 6.758009910583496}
{'epoch': 1, 'batch': 482, 'loss': 6.99892520904541}
{'epoch': 1, 'batch': 483, 'loss': 7.602654457092285}
{'epoch': 1, 'batch': 484, 'loss': 7.025715351104736}
{'epoch': 1, 'batch': 485, 'loss': 7.2028608322143555}
{'epoch': 1, 'batch': 486, 'loss': 6.7670512199401855}
{'epoch': 1, 'batch': 487, 'loss': 6.864049434661865}
{'epoch': 1, 'batch': 488, 'loss': 6.808077335357666}
{'epoch': 1, 'batch': 489, 

{'epoch': 1, 'batch': 625, 'loss': 5.814323902130127}
{'epoch': 1, 'batch': 626, 'loss': 6.725048542022705}
{'epoch': 1, 'batch': 627, 'loss': 6.092311382293701}
{'epoch': 1, 'batch': 628, 'loss': 6.131514549255371}
{'epoch': 1, 'batch': 629, 'loss': 5.871056079864502}
{'epoch': 1, 'batch': 630, 'loss': 6.095161437988281}
{'epoch': 1, 'batch': 631, 'loss': 6.1584882736206055}
{'epoch': 1, 'batch': 632, 'loss': 6.890830039978027}
{'epoch': 1, 'batch': 633, 'loss': 7.49015998840332}
{'epoch': 1, 'batch': 634, 'loss': 7.211318016052246}
{'epoch': 1, 'batch': 635, 'loss': 6.562620639801025}
{'epoch': 1, 'batch': 636, 'loss': 5.883439064025879}
{'epoch': 1, 'batch': 637, 'loss': 6.164681434631348}
{'epoch': 1, 'batch': 638, 'loss': 6.5105299949646}
{'epoch': 1, 'batch': 639, 'loss': 6.373711109161377}
{'epoch': 1, 'batch': 640, 'loss': 6.066868782043457}
{'epoch': 1, 'batch': 641, 'loss': 6.922178268432617}
{'epoch': 1, 'batch': 642, 'loss': 6.168550491333008}
{'epoch': 1, 'batch': 643, 'lo

{'epoch': 1, 'batch': 780, 'loss': 7.374192714691162}
{'epoch': 1, 'batch': 781, 'loss': 6.781785011291504}
{'epoch': 1, 'batch': 782, 'loss': 6.819962024688721}
{'epoch': 1, 'batch': 783, 'loss': 7.52097749710083}
{'epoch': 1, 'batch': 784, 'loss': 7.5787506103515625}
{'epoch': 1, 'batch': 785, 'loss': 7.125986576080322}
{'epoch': 1, 'batch': 786, 'loss': 6.554846286773682}
{'epoch': 1, 'batch': 787, 'loss': 6.684652328491211}
{'epoch': 1, 'batch': 788, 'loss': 6.853919506072998}
{'epoch': 1, 'batch': 789, 'loss': 6.672022819519043}
{'epoch': 1, 'batch': 790, 'loss': 7.1091694831848145}
{'epoch': 1, 'batch': 791, 'loss': 7.890416622161865}
{'epoch': 1, 'batch': 792, 'loss': 8.099969863891602}
{'epoch': 1, 'batch': 793, 'loss': 8.099711418151855}
{'epoch': 1, 'batch': 794, 'loss': 7.872796535491943}
{'epoch': 1, 'batch': 795, 'loss': 8.191838264465332}
{'epoch': 1, 'batch': 796, 'loss': 7.903359413146973}
{'epoch': 1, 'batch': 797, 'loss': 8.071869850158691}
{'epoch': 1, 'batch': 798, 

{'epoch': 1, 'batch': 932, 'loss': 7.077381610870361}
{'epoch': 1, 'batch': 933, 'loss': 7.2414727210998535}
{'epoch': 1, 'batch': 934, 'loss': 6.867659091949463}
{'epoch': 1, 'batch': 935, 'loss': 7.781951427459717}
{'epoch': 1, 'batch': 936, 'loss': 6.810488224029541}
{'epoch': 1, 'batch': 937, 'loss': 6.9327263832092285}
{'epoch': 1, 'batch': 938, 'loss': 7.167300701141357}
{'epoch': 1, 'batch': 939, 'loss': 7.078551292419434}
{'epoch': 1, 'batch': 940, 'loss': 6.728517532348633}
{'epoch': 1, 'batch': 941, 'loss': 7.0585036277771}
{'epoch': 1, 'batch': 942, 'loss': 6.84380578994751}
{'epoch': 1, 'batch': 943, 'loss': 6.870858669281006}
{'epoch': 1, 'batch': 944, 'loss': 6.3637471199035645}
{'epoch': 1, 'batch': 945, 'loss': 7.163136005401611}
{'epoch': 1, 'batch': 946, 'loss': 6.789422988891602}
{'epoch': 1, 'batch': 947, 'loss': 6.521371364593506}
{'epoch': 1, 'batch': 948, 'loss': 6.382778644561768}
{'epoch': 1, 'batch': 949, 'loss': 6.7072882652282715}
{'epoch': 1, 'batch': 950, 

{'epoch': 1, 'batch': 1083, 'loss': 6.233068466186523}
{'epoch': 1, 'batch': 1084, 'loss': 6.5105366706848145}
{'epoch': 1, 'batch': 1085, 'loss': 6.571608066558838}
{'epoch': 1, 'batch': 1086, 'loss': 6.1569647789001465}
{'epoch': 1, 'batch': 1087, 'loss': 6.671709060668945}
{'epoch': 1, 'batch': 1088, 'loss': 6.50051212310791}
{'epoch': 1, 'batch': 1089, 'loss': 7.166011333465576}
{'epoch': 1, 'batch': 1090, 'loss': 6.189848899841309}
{'epoch': 1, 'batch': 1091, 'loss': 6.363219261169434}
{'epoch': 1, 'batch': 1092, 'loss': 6.557070255279541}
{'epoch': 1, 'batch': 1093, 'loss': 6.805009841918945}
{'epoch': 1, 'batch': 1094, 'loss': 6.429172992706299}
{'epoch': 1, 'batch': 1095, 'loss': 5.988531112670898}
{'epoch': 1, 'batch': 1096, 'loss': 6.415613174438477}
{'epoch': 1, 'batch': 1097, 'loss': 6.708392143249512}
{'epoch': 1, 'batch': 1098, 'loss': 6.358720302581787}
{'epoch': 1, 'batch': 1099, 'loss': 7.0240349769592285}
{'epoch': 1, 'batch': 1100, 'loss': 6.627292633056641}
{'epoch'

{'epoch': 1, 'batch': 1233, 'loss': 6.7100725173950195}
{'epoch': 1, 'batch': 1234, 'loss': 6.516615390777588}
{'epoch': 1, 'batch': 1235, 'loss': 6.807280540466309}
{'epoch': 1, 'batch': 1236, 'loss': 6.789674758911133}
{'epoch': 1, 'batch': 1237, 'loss': 8.718363761901855}
{'epoch': 1, 'batch': 1238, 'loss': 8.105056762695312}
{'epoch': 1, 'batch': 1239, 'loss': 7.693903923034668}
{'epoch': 1, 'batch': 1240, 'loss': 6.554403781890869}
{'epoch': 1, 'batch': 1241, 'loss': 6.597516059875488}
{'epoch': 1, 'batch': 1242, 'loss': 7.69733190536499}
{'epoch': 1, 'batch': 1243, 'loss': 6.761167049407959}
{'epoch': 1, 'batch': 1244, 'loss': 6.596794128417969}
{'epoch': 1, 'batch': 1245, 'loss': 6.818996429443359}
{'epoch': 1, 'batch': 1246, 'loss': 7.185294151306152}
{'epoch': 1, 'batch': 1247, 'loss': 7.1623148918151855}
{'epoch': 1, 'batch': 1248, 'loss': 7.017608165740967}
{'epoch': 1, 'batch': 1249, 'loss': 7.179947376251221}
{'epoch': 1, 'batch': 1250, 'loss': 7.266079902648926}
{'epoch':

{'epoch': 1, 'batch': 1384, 'loss': 6.862913131713867}
{'epoch': 1, 'batch': 1385, 'loss': 6.464698791503906}
{'epoch': 1, 'batch': 1386, 'loss': 6.261140823364258}
{'epoch': 1, 'batch': 1387, 'loss': 6.510188102722168}
{'epoch': 1, 'batch': 1388, 'loss': 5.972670555114746}
{'epoch': 1, 'batch': 1389, 'loss': 7.603426933288574}
{'epoch': 1, 'batch': 1390, 'loss': 6.456340312957764}
{'epoch': 1, 'batch': 1391, 'loss': 6.846050262451172}
{'epoch': 1, 'batch': 1392, 'loss': 7.03348445892334}
{'epoch': 1, 'batch': 1393, 'loss': 6.645718097686768}
{'epoch': 1, 'batch': 1394, 'loss': 6.959084987640381}
{'epoch': 1, 'batch': 1395, 'loss': 6.551645278930664}
{'epoch': 1, 'batch': 1396, 'loss': 6.169579029083252}
{'epoch': 1, 'batch': 1397, 'loss': 7.1622490882873535}
{'epoch': 1, 'batch': 1398, 'loss': 6.943253517150879}
{'epoch': 1, 'batch': 1399, 'loss': 8.015878677368164}
{'epoch': 1, 'batch': 1400, 'loss': 6.757697582244873}
{'epoch': 1, 'batch': 1401, 'loss': 7.046567916870117}
{'epoch': 

{'epoch': 1, 'batch': 1534, 'loss': 6.767749309539795}
{'epoch': 1, 'batch': 1535, 'loss': 6.768294811248779}
{'epoch': 1, 'batch': 1536, 'loss': 6.496718406677246}
{'epoch': 1, 'batch': 1537, 'loss': 6.208469867706299}
{'epoch': 1, 'batch': 1538, 'loss': 6.850915908813477}
{'epoch': 1, 'batch': 1539, 'loss': 7.104480743408203}
{'epoch': 1, 'batch': 1540, 'loss': 6.9509968757629395}
{'epoch': 1, 'batch': 1541, 'loss': 8.713748931884766}
{'epoch': 1, 'batch': 1542, 'loss': 8.461199760437012}
{'epoch': 1, 'batch': 1543, 'loss': 6.778242111206055}
{'epoch': 1, 'batch': 1544, 'loss': 7.113841533660889}
{'epoch': 1, 'batch': 1545, 'loss': 7.3351826667785645}
{'epoch': 1, 'batch': 1546, 'loss': 7.2395453453063965}
{'epoch': 1, 'batch': 1547, 'loss': 8.29815673828125}
{'epoch': 1, 'batch': 1548, 'loss': 8.233379364013672}
{'epoch': 1, 'batch': 1549, 'loss': 6.615313529968262}
{'epoch': 1, 'batch': 1550, 'loss': 6.768928050994873}
{'epoch': 1, 'batch': 1551, 'loss': 6.870682716369629}
{'epoch'

{'epoch': 1, 'batch': 1683, 'loss': 6.510782241821289}
{'epoch': 1, 'batch': 1684, 'loss': 6.6635026931762695}
{'epoch': 1, 'batch': 1685, 'loss': 7.8337531089782715}
{'epoch': 1, 'batch': 1686, 'loss': 6.866217136383057}
{'epoch': 1, 'batch': 1687, 'loss': 7.617193222045898}
{'epoch': 1, 'batch': 1688, 'loss': 7.050966262817383}
{'epoch': 1, 'batch': 1689, 'loss': 6.567163467407227}
{'epoch': 1, 'batch': 1690, 'loss': 6.078352451324463}
{'epoch': 1, 'batch': 1691, 'loss': 6.720273017883301}
{'epoch': 1, 'batch': 1692, 'loss': 6.4648284912109375}
{'epoch': 1, 'batch': 1693, 'loss': 6.933228492736816}
{'epoch': 1, 'batch': 1694, 'loss': 6.85912561416626}
{'epoch': 1, 'batch': 1695, 'loss': 6.864816188812256}
{'epoch': 1, 'batch': 1696, 'loss': 6.3899054527282715}
{'epoch': 1, 'batch': 1697, 'loss': 7.195168495178223}
{'epoch': 1, 'batch': 1698, 'loss': 7.086532115936279}
{'epoch': 1, 'batch': 1699, 'loss': 6.852909564971924}
{'epoch': 1, 'batch': 1700, 'loss': 7.229715347290039}
{'epoch

{'epoch': 1, 'batch': 1832, 'loss': 6.486272811889648}
{'epoch': 1, 'batch': 1833, 'loss': 6.851555347442627}
{'epoch': 1, 'batch': 1834, 'loss': 6.219848155975342}
{'epoch': 1, 'batch': 1835, 'loss': 6.523606777191162}
{'epoch': 1, 'batch': 1836, 'loss': 6.305667877197266}
{'epoch': 1, 'batch': 1837, 'loss': 6.491505146026611}
{'epoch': 1, 'batch': 1838, 'loss': 6.462372779846191}
{'epoch': 1, 'batch': 1839, 'loss': 5.975588798522949}
{'epoch': 1, 'batch': 1840, 'loss': 6.426436424255371}
{'epoch': 1, 'batch': 1841, 'loss': 6.62504243850708}
{'epoch': 1, 'batch': 1842, 'loss': 8.624545097351074}
{'epoch': 1, 'batch': 1843, 'loss': 8.148004531860352}
{'epoch': 1, 'batch': 1844, 'loss': 7.573487758636475}
{'epoch': 1, 'batch': 1845, 'loss': 7.478506565093994}
{'epoch': 1, 'batch': 1846, 'loss': 7.172688007354736}
{'epoch': 1, 'batch': 1847, 'loss': 7.165191173553467}
{'epoch': 1, 'batch': 1848, 'loss': 6.639921188354492}
{'epoch': 1, 'batch': 1849, 'loss': 7.007661819458008}
{'epoch': 1

{'epoch': 1, 'batch': 1982, 'loss': 8.036779403686523}
{'epoch': 1, 'batch': 1983, 'loss': 6.549636363983154}
{'epoch': 1, 'batch': 1984, 'loss': 6.3615312576293945}
{'epoch': 1, 'batch': 1985, 'loss': 7.491053581237793}
{'epoch': 1, 'batch': 1986, 'loss': 6.807773590087891}
{'epoch': 1, 'batch': 1987, 'loss': 6.3828959465026855}
{'epoch': 1, 'batch': 1988, 'loss': 6.996469974517822}
{'epoch': 1, 'batch': 1989, 'loss': 7.365194797515869}
{'epoch': 1, 'batch': 1990, 'loss': 7.20191764831543}
{'epoch': 1, 'batch': 1991, 'loss': 7.081365585327148}
{'epoch': 1, 'batch': 1992, 'loss': 7.38238525390625}
{'epoch': 1, 'batch': 1993, 'loss': 6.583125591278076}
{'epoch': 1, 'batch': 1994, 'loss': 6.506608009338379}
{'epoch': 1, 'batch': 1995, 'loss': 6.749648571014404}
{'epoch': 1, 'batch': 1996, 'loss': 6.580286502838135}
{'epoch': 1, 'batch': 1997, 'loss': 6.896999359130859}
{'epoch': 1, 'batch': 1998, 'loss': 6.370583534240723}
{'epoch': 1, 'batch': 1999, 'loss': 6.5503034591674805}
{'epoch':

{'epoch': 1, 'batch': 2132, 'loss': 6.998859405517578}
{'epoch': 1, 'batch': 2133, 'loss': 7.617936134338379}
{'epoch': 1, 'batch': 2134, 'loss': 7.855920314788818}
{'epoch': 1, 'batch': 2135, 'loss': 7.710344314575195}
{'epoch': 1, 'batch': 2136, 'loss': 7.727171421051025}
{'epoch': 1, 'batch': 2137, 'loss': 6.979959964752197}
{'epoch': 1, 'batch': 2138, 'loss': 6.6522650718688965}
{'epoch': 1, 'batch': 2139, 'loss': 6.650927543640137}
{'epoch': 1, 'batch': 2140, 'loss': 7.265523910522461}
{'epoch': 1, 'batch': 2141, 'loss': 6.731849670410156}
{'epoch': 1, 'batch': 2142, 'loss': 7.547679424285889}
{'epoch': 1, 'batch': 2143, 'loss': 7.228663444519043}
{'epoch': 1, 'batch': 2144, 'loss': 7.576648235321045}
{'epoch': 1, 'batch': 2145, 'loss': 6.94145393371582}
{'epoch': 1, 'batch': 2146, 'loss': 6.801973819732666}
{'epoch': 1, 'batch': 2147, 'loss': 7.222281455993652}
{'epoch': 1, 'batch': 2148, 'loss': 7.287134170532227}
{'epoch': 1, 'batch': 2149, 'loss': 7.154091835021973}
{'epoch': 

{'epoch': 1, 'batch': 2282, 'loss': 6.917014122009277}
{'epoch': 1, 'batch': 2283, 'loss': 7.130451202392578}
{'epoch': 1, 'batch': 2284, 'loss': 7.268834114074707}
{'epoch': 1, 'batch': 2285, 'loss': 7.324289321899414}
{'epoch': 1, 'batch': 2286, 'loss': 6.630878925323486}
{'epoch': 1, 'batch': 2287, 'loss': 6.684417247772217}
{'epoch': 1, 'batch': 2288, 'loss': 6.921063423156738}
{'epoch': 1, 'batch': 2289, 'loss': 6.6849470138549805}
{'epoch': 1, 'batch': 2290, 'loss': 7.0652875900268555}
{'epoch': 1, 'batch': 2291, 'loss': 7.610169887542725}
{'epoch': 1, 'batch': 2292, 'loss': 7.428539752960205}
{'epoch': 1, 'batch': 2293, 'loss': 6.518403053283691}
{'epoch': 1, 'batch': 2294, 'loss': 6.2644362449646}
{'epoch': 1, 'batch': 2295, 'loss': 6.434520244598389}
{'epoch': 1, 'batch': 2296, 'loss': 6.689304351806641}
{'epoch': 1, 'batch': 2297, 'loss': 7.466329097747803}
{'epoch': 1, 'batch': 2298, 'loss': 6.810375690460205}
{'epoch': 1, 'batch': 2299, 'loss': 7.109658241271973}
{'epoch': 

{'epoch': 1, 'batch': 2433, 'loss': 7.015807151794434}
{'epoch': 1, 'batch': 2434, 'loss': 6.512619972229004}
{'epoch': 1, 'batch': 2435, 'loss': 6.636415958404541}
{'epoch': 1, 'batch': 2436, 'loss': 7.17083215713501}
{'epoch': 1, 'batch': 2437, 'loss': 6.228849411010742}
{'epoch': 1, 'batch': 2438, 'loss': 6.243853569030762}
{'epoch': 1, 'batch': 2439, 'loss': 6.838797092437744}
{'epoch': 1, 'batch': 2440, 'loss': 6.58652925491333}
{'epoch': 1, 'batch': 2441, 'loss': 6.964428901672363}
{'epoch': 1, 'batch': 2442, 'loss': 6.632467746734619}
{'epoch': 1, 'batch': 2443, 'loss': 6.623078346252441}
{'epoch': 1, 'batch': 2444, 'loss': 6.774288654327393}
{'epoch': 1, 'batch': 2445, 'loss': 6.969487190246582}
{'epoch': 1, 'batch': 2446, 'loss': 6.131516456604004}
{'epoch': 1, 'batch': 2447, 'loss': 6.2368903160095215}
{'epoch': 1, 'batch': 2448, 'loss': 6.245788097381592}
{'epoch': 1, 'batch': 2449, 'loss': 6.378037929534912}
{'epoch': 1, 'batch': 2450, 'loss': 6.827857971191406}
{'epoch': 1

{'epoch': 1, 'batch': 2584, 'loss': 6.131632328033447}
{'epoch': 1, 'batch': 2585, 'loss': 6.066071510314941}
{'epoch': 1, 'batch': 2586, 'loss': 5.992997646331787}
{'epoch': 1, 'batch': 2587, 'loss': 6.002480983734131}
{'epoch': 1, 'batch': 2588, 'loss': 6.379880428314209}
{'epoch': 1, 'batch': 2589, 'loss': 5.729737281799316}
{'epoch': 1, 'batch': 2590, 'loss': 7.59708309173584}
{'epoch': 1, 'batch': 2591, 'loss': 6.151199817657471}
{'epoch': 1, 'batch': 2592, 'loss': 6.115918159484863}
{'epoch': 1, 'batch': 2593, 'loss': 5.920340061187744}
{'epoch': 1, 'batch': 2594, 'loss': 6.374457359313965}
{'epoch': 1, 'batch': 2595, 'loss': 6.576404094696045}
{'epoch': 1, 'batch': 2596, 'loss': 6.483124256134033}
{'epoch': 1, 'batch': 2597, 'loss': 6.277188301086426}
{'epoch': 1, 'batch': 2598, 'loss': 6.200266361236572}
{'epoch': 1, 'batch': 2599, 'loss': 5.930490016937256}
{'epoch': 1, 'batch': 2600, 'loss': 5.927440643310547}
{'epoch': 1, 'batch': 2601, 'loss': 6.292163372039795}
{'epoch': 1

{'epoch': 1, 'batch': 2734, 'loss': 7.194231986999512}
{'epoch': 1, 'batch': 2735, 'loss': 7.019963264465332}
{'epoch': 1, 'batch': 2736, 'loss': 6.702981948852539}
{'epoch': 1, 'batch': 2737, 'loss': 6.104565143585205}
{'epoch': 1, 'batch': 2738, 'loss': 6.555008411407471}
{'epoch': 1, 'batch': 2739, 'loss': 6.453624725341797}
{'epoch': 1, 'batch': 2740, 'loss': 6.491006374359131}
{'epoch': 1, 'batch': 2741, 'loss': 6.4803948402404785}
{'epoch': 1, 'batch': 2742, 'loss': 7.389448165893555}
{'epoch': 1, 'batch': 2743, 'loss': 6.985790729522705}
{'epoch': 1, 'batch': 2744, 'loss': 6.349979400634766}
{'epoch': 1, 'batch': 2745, 'loss': 6.465397834777832}
{'epoch': 1, 'batch': 2746, 'loss': 6.412602424621582}
{'epoch': 1, 'batch': 2747, 'loss': 5.894691467285156}
{'epoch': 1, 'batch': 2748, 'loss': 6.7201056480407715}
{'epoch': 1, 'batch': 2749, 'loss': 6.567387580871582}
{'epoch': 1, 'batch': 2750, 'loss': 6.086445331573486}
{'epoch': 1, 'batch': 2751, 'loss': 6.432351589202881}
{'epoch'

{'epoch': 1, 'batch': 2884, 'loss': 6.380312442779541}
{'epoch': 1, 'batch': 2885, 'loss': 6.5455827713012695}
{'epoch': 1, 'batch': 2886, 'loss': 6.308340549468994}
{'epoch': 1, 'batch': 2887, 'loss': 6.616103649139404}
{'epoch': 1, 'batch': 2888, 'loss': 6.706047058105469}
{'epoch': 1, 'batch': 2889, 'loss': 6.579603672027588}
{'epoch': 1, 'batch': 2890, 'loss': 6.57909631729126}
{'epoch': 1, 'batch': 2891, 'loss': 5.879172325134277}
{'epoch': 1, 'batch': 2892, 'loss': 6.534055709838867}
{'epoch': 1, 'batch': 2893, 'loss': 7.2747602462768555}
{'epoch': 1, 'batch': 2894, 'loss': 6.466834545135498}
{'epoch': 1, 'batch': 2895, 'loss': 6.870423793792725}
{'epoch': 1, 'batch': 2896, 'loss': 6.801262855529785}
{'epoch': 1, 'batch': 2897, 'loss': 6.803600311279297}
{'epoch': 1, 'batch': 2898, 'loss': 5.411153793334961}
{'epoch': 1, 'batch': 2899, 'loss': 5.640013217926025}
{'epoch': 1, 'batch': 2900, 'loss': 6.536807537078857}
{'epoch': 1, 'batch': 2901, 'loss': 7.770546913146973}
{'epoch':

{'epoch': 1, 'batch': 3037, 'loss': 7.125025749206543}
{'epoch': 1, 'batch': 3038, 'loss': 7.160202503204346}
{'epoch': 1, 'batch': 3039, 'loss': 6.863059043884277}
{'epoch': 1, 'batch': 3040, 'loss': 6.402109146118164}
{'epoch': 1, 'batch': 3041, 'loss': 6.5434651374816895}
{'epoch': 1, 'batch': 3042, 'loss': 5.644459247589111}
{'epoch': 1, 'batch': 3043, 'loss': 6.701069355010986}
{'epoch': 1, 'batch': 3044, 'loss': 7.800790786743164}
{'epoch': 1, 'batch': 3045, 'loss': 7.613744735717773}
{'epoch': 1, 'batch': 3046, 'loss': 7.4992241859436035}
{'epoch': 1, 'batch': 3047, 'loss': 7.232650279998779}
{'epoch': 1, 'batch': 3048, 'loss': 6.9579901695251465}
{'epoch': 1, 'batch': 3049, 'loss': 7.1894755363464355}
{'epoch': 1, 'batch': 3050, 'loss': 6.725579738616943}
{'epoch': 1, 'batch': 3051, 'loss': 6.246644020080566}
{'epoch': 1, 'batch': 3052, 'loss': 7.580432891845703}
{'epoch': 1, 'batch': 3053, 'loss': 7.4913010597229}
{'epoch': 1, 'batch': 3054, 'loss': 7.1490254402160645}
{'epoch

{'epoch': 1, 'batch': 3187, 'loss': 6.336609840393066}
{'epoch': 1, 'batch': 3188, 'loss': 6.213565826416016}
{'epoch': 1, 'batch': 3189, 'loss': 6.296587944030762}
{'epoch': 1, 'batch': 3190, 'loss': 6.505103588104248}
{'epoch': 1, 'batch': 3191, 'loss': 6.9927544593811035}
{'epoch': 1, 'batch': 3192, 'loss': 6.842500686645508}
{'epoch': 1, 'batch': 3193, 'loss': 7.8324151039123535}
{'epoch': 1, 'batch': 3194, 'loss': 6.721251010894775}
{'epoch': 1, 'batch': 3195, 'loss': 7.949985980987549}
{'epoch': 1, 'batch': 3196, 'loss': 7.8419671058654785}
{'epoch': 1, 'batch': 3197, 'loss': 7.030917167663574}
{'epoch': 1, 'batch': 3198, 'loss': 6.725069522857666}
{'epoch': 1, 'batch': 3199, 'loss': 6.786441802978516}
{'epoch': 1, 'batch': 3200, 'loss': 6.737313747406006}
{'epoch': 1, 'batch': 3201, 'loss': 7.363760948181152}
{'epoch': 1, 'batch': 3202, 'loss': 6.281061172485352}
{'epoch': 1, 'batch': 3203, 'loss': 6.45585298538208}
{'epoch': 1, 'batch': 3204, 'loss': 6.731028079986572}
{'epoch'

{'epoch': 1, 'batch': 3337, 'loss': 8.24627685546875}
{'epoch': 1, 'batch': 3338, 'loss': 8.160658836364746}
{'epoch': 1, 'batch': 3339, 'loss': 6.457534313201904}
{'epoch': 1, 'batch': 3340, 'loss': 6.873570919036865}
{'epoch': 1, 'batch': 3341, 'loss': 7.607597827911377}
{'epoch': 1, 'batch': 3342, 'loss': 6.162201881408691}
{'epoch': 1, 'batch': 3343, 'loss': 7.273214340209961}
{'epoch': 1, 'batch': 3344, 'loss': 6.768261432647705}
{'epoch': 1, 'batch': 3345, 'loss': 6.614974498748779}
{'epoch': 1, 'batch': 3346, 'loss': 6.849753379821777}
{'epoch': 1, 'batch': 3347, 'loss': 8.088305473327637}
{'epoch': 1, 'batch': 3348, 'loss': 7.855701923370361}
{'epoch': 1, 'batch': 3349, 'loss': 6.593623161315918}
{'epoch': 1, 'batch': 3350, 'loss': 6.364787578582764}
{'epoch': 1, 'batch': 3351, 'loss': 6.010550498962402}
{'epoch': 1, 'batch': 3352, 'loss': 6.728724002838135}
{'epoch': 1, 'batch': 3353, 'loss': 6.591870307922363}
{'epoch': 1, 'batch': 3354, 'loss': 6.358218669891357}
{'epoch': 1

{'epoch': 1, 'batch': 3488, 'loss': 7.35242223739624}
{'epoch': 1, 'batch': 3489, 'loss': 6.954775333404541}
{'epoch': 1, 'batch': 3490, 'loss': 6.698797702789307}
{'epoch': 1, 'batch': 3491, 'loss': 6.281587600708008}
{'epoch': 1, 'batch': 3492, 'loss': 6.056589603424072}
{'epoch': 1, 'batch': 3493, 'loss': 6.253222942352295}
{'epoch': 1, 'batch': 3494, 'loss': 7.2158331871032715}
{'epoch': 1, 'batch': 3495, 'loss': 7.188265323638916}
{'epoch': 1, 'batch': 3496, 'loss': 7.0668416023254395}
{'epoch': 1, 'batch': 3497, 'loss': 6.9338765144348145}
{'epoch': 1, 'batch': 3498, 'loss': 6.87777042388916}
{'epoch': 1, 'batch': 3499, 'loss': 7.15327787399292}
{'epoch': 1, 'batch': 3500, 'loss': 7.381078720092773}
{'epoch': 1, 'batch': 3501, 'loss': 7.0212602615356445}
{'epoch': 1, 'batch': 3502, 'loss': 6.408758640289307}
{'epoch': 1, 'batch': 3503, 'loss': 5.7594499588012695}
{'epoch': 1, 'batch': 3504, 'loss': 6.9402546882629395}
{'epoch': 1, 'batch': 3505, 'loss': 6.860867023468018}
{'epoch

{'epoch': 1, 'batch': 3637, 'loss': 7.529203414916992}
{'epoch': 1, 'batch': 3638, 'loss': 7.555186748504639}
{'epoch': 1, 'batch': 3639, 'loss': 7.272903919219971}
{'epoch': 1, 'batch': 3640, 'loss': 7.415057182312012}
{'epoch': 1, 'batch': 3641, 'loss': 7.4388837814331055}
{'epoch': 1, 'batch': 3642, 'loss': 7.470555782318115}
{'epoch': 1, 'batch': 3643, 'loss': 7.179702281951904}
{'epoch': 1, 'batch': 3644, 'loss': 7.016053676605225}
{'epoch': 1, 'batch': 3645, 'loss': 6.7380266189575195}
{'epoch': 1, 'batch': 3646, 'loss': 6.73886251449585}
{'epoch': 1, 'batch': 3647, 'loss': 6.104592323303223}
{'epoch': 1, 'batch': 3648, 'loss': 7.135732650756836}
{'epoch': 1, 'batch': 3649, 'loss': 7.306702613830566}
{'epoch': 1, 'batch': 3650, 'loss': 7.1878252029418945}
{'epoch': 1, 'batch': 3651, 'loss': 7.198784351348877}
{'epoch': 1, 'batch': 3652, 'loss': 6.359525680541992}
{'epoch': 1, 'batch': 3653, 'loss': 6.9212517738342285}
{'epoch': 1, 'batch': 3654, 'loss': 6.456840991973877}
{'epoch

{'epoch': 2, 'batch': 13, 'loss': 5.779611587524414}
{'epoch': 2, 'batch': 14, 'loss': 5.741028785705566}
{'epoch': 2, 'batch': 15, 'loss': 6.113345623016357}
{'epoch': 2, 'batch': 16, 'loss': 7.177680969238281}
{'epoch': 2, 'batch': 17, 'loss': 6.877201557159424}
{'epoch': 2, 'batch': 18, 'loss': 6.9359259605407715}
{'epoch': 2, 'batch': 19, 'loss': 7.199629306793213}
{'epoch': 2, 'batch': 20, 'loss': 7.437886714935303}
{'epoch': 2, 'batch': 21, 'loss': 6.976447105407715}
{'epoch': 2, 'batch': 22, 'loss': 6.808619499206543}
{'epoch': 2, 'batch': 23, 'loss': 7.298071384429932}
{'epoch': 2, 'batch': 24, 'loss': 6.371898651123047}
{'epoch': 2, 'batch': 25, 'loss': 7.247575759887695}
{'epoch': 2, 'batch': 26, 'loss': 7.056600093841553}
{'epoch': 2, 'batch': 27, 'loss': 6.6590576171875}
{'epoch': 2, 'batch': 28, 'loss': 6.534690856933594}
{'epoch': 2, 'batch': 29, 'loss': 6.586123943328857}
{'epoch': 2, 'batch': 30, 'loss': 6.7041015625}
{'epoch': 2, 'batch': 31, 'loss': 6.784234046936035}

{'epoch': 2, 'batch': 167, 'loss': 6.296518802642822}
{'epoch': 2, 'batch': 168, 'loss': 6.523324489593506}
{'epoch': 2, 'batch': 169, 'loss': 5.863468170166016}
{'epoch': 2, 'batch': 170, 'loss': 6.755333423614502}
{'epoch': 2, 'batch': 171, 'loss': 6.076619625091553}
{'epoch': 2, 'batch': 172, 'loss': 6.427951335906982}
{'epoch': 2, 'batch': 173, 'loss': 6.446990966796875}
{'epoch': 2, 'batch': 174, 'loss': 6.99761438369751}
{'epoch': 2, 'batch': 175, 'loss': 6.612346172332764}
{'epoch': 2, 'batch': 176, 'loss': 6.510828018188477}
{'epoch': 2, 'batch': 177, 'loss': 6.906806468963623}
{'epoch': 2, 'batch': 178, 'loss': 6.733758926391602}
{'epoch': 2, 'batch': 179, 'loss': 7.032374382019043}
{'epoch': 2, 'batch': 180, 'loss': 6.120912551879883}
{'epoch': 2, 'batch': 181, 'loss': 6.131111145019531}
{'epoch': 2, 'batch': 182, 'loss': 6.830679416656494}
{'epoch': 2, 'batch': 183, 'loss': 6.240607261657715}
{'epoch': 2, 'batch': 184, 'loss': 6.174984455108643}
{'epoch': 2, 'batch': 185, 'l

{'epoch': 2, 'batch': 321, 'loss': 6.447145462036133}
{'epoch': 2, 'batch': 322, 'loss': 6.037954330444336}
{'epoch': 2, 'batch': 323, 'loss': 5.92178201675415}
{'epoch': 2, 'batch': 324, 'loss': 6.292557716369629}
{'epoch': 2, 'batch': 325, 'loss': 6.951711654663086}
{'epoch': 2, 'batch': 326, 'loss': 6.707485198974609}
{'epoch': 2, 'batch': 327, 'loss': 6.104325294494629}
{'epoch': 2, 'batch': 328, 'loss': 6.6606950759887695}
{'epoch': 2, 'batch': 329, 'loss': 6.995058536529541}
{'epoch': 2, 'batch': 330, 'loss': 5.670392990112305}
{'epoch': 2, 'batch': 331, 'loss': 6.315512180328369}
{'epoch': 2, 'batch': 332, 'loss': 7.167211055755615}
{'epoch': 2, 'batch': 333, 'loss': 8.81514835357666}
{'epoch': 2, 'batch': 334, 'loss': 7.911738395690918}
{'epoch': 2, 'batch': 335, 'loss': 6.904692649841309}
{'epoch': 2, 'batch': 336, 'loss': 6.753231525421143}
{'epoch': 2, 'batch': 337, 'loss': 6.495120525360107}
{'epoch': 2, 'batch': 338, 'loss': 6.633218288421631}
{'epoch': 2, 'batch': 339, 'l

{'epoch': 2, 'batch': 474, 'loss': 6.133251190185547}
{'epoch': 2, 'batch': 475, 'loss': 6.106441020965576}
{'epoch': 2, 'batch': 476, 'loss': 6.3505330085754395}
{'epoch': 2, 'batch': 477, 'loss': 6.338084697723389}
{'epoch': 2, 'batch': 478, 'loss': 6.679128170013428}
{'epoch': 2, 'batch': 479, 'loss': 6.499857425689697}
{'epoch': 2, 'batch': 480, 'loss': 6.579963684082031}
{'epoch': 2, 'batch': 481, 'loss': 6.495028495788574}
{'epoch': 2, 'batch': 482, 'loss': 6.730704307556152}
{'epoch': 2, 'batch': 483, 'loss': 7.3349409103393555}
{'epoch': 2, 'batch': 484, 'loss': 6.68798828125}
{'epoch': 2, 'batch': 485, 'loss': 6.915945529937744}
{'epoch': 2, 'batch': 486, 'loss': 6.4662275314331055}
{'epoch': 2, 'batch': 487, 'loss': 6.588586807250977}
{'epoch': 2, 'batch': 488, 'loss': 6.495314121246338}
{'epoch': 2, 'batch': 489, 'loss': 7.040590763092041}
{'epoch': 2, 'batch': 490, 'loss': 6.203481197357178}
{'epoch': 2, 'batch': 491, 'loss': 5.631969451904297}
{'epoch': 2, 'batch': 492, 'l

{'epoch': 2, 'batch': 626, 'loss': 5.856574058532715}
{'epoch': 2, 'batch': 627, 'loss': 5.78041410446167}
{'epoch': 2, 'batch': 628, 'loss': 5.726523399353027}
{'epoch': 2, 'batch': 629, 'loss': 5.472607612609863}
{'epoch': 2, 'batch': 630, 'loss': 5.763424873352051}
{'epoch': 2, 'batch': 631, 'loss': 5.965577125549316}
{'epoch': 2, 'batch': 632, 'loss': 6.465197563171387}
{'epoch': 2, 'batch': 633, 'loss': 6.922285556793213}
{'epoch': 2, 'batch': 634, 'loss': 6.816997528076172}
{'epoch': 2, 'batch': 635, 'loss': 6.116321563720703}
{'epoch': 2, 'batch': 636, 'loss': 5.532897472381592}
{'epoch': 2, 'batch': 637, 'loss': 5.910808563232422}
{'epoch': 2, 'batch': 638, 'loss': 6.238535404205322}
{'epoch': 2, 'batch': 639, 'loss': 6.064172267913818}
{'epoch': 2, 'batch': 640, 'loss': 5.761719703674316}
{'epoch': 2, 'batch': 641, 'loss': 6.667596340179443}
{'epoch': 2, 'batch': 642, 'loss': 5.8835248947143555}
{'epoch': 2, 'batch': 643, 'loss': 6.4944071769714355}
{'epoch': 2, 'batch': 644, 

{'epoch': 2, 'batch': 778, 'loss': 6.997867107391357}
{'epoch': 2, 'batch': 779, 'loss': 6.64329195022583}
{'epoch': 2, 'batch': 780, 'loss': 6.914805889129639}
{'epoch': 2, 'batch': 781, 'loss': 6.465847015380859}
{'epoch': 2, 'batch': 782, 'loss': 6.386044979095459}
{'epoch': 2, 'batch': 783, 'loss': 6.981768608093262}
{'epoch': 2, 'batch': 784, 'loss': 7.163047790527344}
{'epoch': 2, 'batch': 785, 'loss': 6.866143226623535}
{'epoch': 2, 'batch': 786, 'loss': 6.18749475479126}
{'epoch': 2, 'batch': 787, 'loss': 6.4395647048950195}
{'epoch': 2, 'batch': 788, 'loss': 6.555169582366943}
{'epoch': 2, 'batch': 789, 'loss': 6.270718574523926}
{'epoch': 2, 'batch': 790, 'loss': 6.8205742835998535}
{'epoch': 2, 'batch': 791, 'loss': 7.5465474128723145}
{'epoch': 2, 'batch': 792, 'loss': 7.288740634918213}
{'epoch': 2, 'batch': 793, 'loss': 7.278109073638916}
{'epoch': 2, 'batch': 794, 'loss': 6.9601874351501465}
{'epoch': 2, 'batch': 795, 'loss': 7.269815921783447}
{'epoch': 2, 'batch': 796,

{'epoch': 2, 'batch': 932, 'loss': 6.635894298553467}
{'epoch': 2, 'batch': 933, 'loss': 7.064630031585693}
{'epoch': 2, 'batch': 934, 'loss': 6.431661128997803}
{'epoch': 2, 'batch': 935, 'loss': 7.188340663909912}
{'epoch': 2, 'batch': 936, 'loss': 6.326596736907959}
{'epoch': 2, 'batch': 937, 'loss': 6.418396949768066}
{'epoch': 2, 'batch': 938, 'loss': 6.616446018218994}
{'epoch': 2, 'batch': 939, 'loss': 6.597431182861328}
{'epoch': 2, 'batch': 940, 'loss': 6.463431358337402}
{'epoch': 2, 'batch': 941, 'loss': 6.634081840515137}
{'epoch': 2, 'batch': 942, 'loss': 6.484711170196533}
{'epoch': 2, 'batch': 943, 'loss': 6.479409694671631}
{'epoch': 2, 'batch': 944, 'loss': 6.06577205657959}
{'epoch': 2, 'batch': 945, 'loss': 6.737026214599609}
{'epoch': 2, 'batch': 946, 'loss': 6.478879451751709}
{'epoch': 2, 'batch': 947, 'loss': 6.193323135375977}
{'epoch': 2, 'batch': 948, 'loss': 5.936889171600342}
{'epoch': 2, 'batch': 949, 'loss': 6.381369113922119}
{'epoch': 2, 'batch': 950, 'l

{'epoch': 2, 'batch': 1083, 'loss': 5.966750621795654}
{'epoch': 2, 'batch': 1084, 'loss': 6.266340255737305}
{'epoch': 2, 'batch': 1085, 'loss': 6.2395524978637695}
{'epoch': 2, 'batch': 1086, 'loss': 5.8681559562683105}
{'epoch': 2, 'batch': 1087, 'loss': 6.4377946853637695}
{'epoch': 2, 'batch': 1088, 'loss': 6.290249824523926}
{'epoch': 2, 'batch': 1089, 'loss': 6.652109622955322}
{'epoch': 2, 'batch': 1090, 'loss': 5.957058906555176}
{'epoch': 2, 'batch': 1091, 'loss': 6.1327009201049805}
{'epoch': 2, 'batch': 1092, 'loss': 6.324175834655762}
{'epoch': 2, 'batch': 1093, 'loss': 6.545593738555908}
{'epoch': 2, 'batch': 1094, 'loss': 6.06812047958374}
{'epoch': 2, 'batch': 1095, 'loss': 5.690202236175537}
{'epoch': 2, 'batch': 1096, 'loss': 6.126312255859375}
{'epoch': 2, 'batch': 1097, 'loss': 6.427641868591309}
{'epoch': 2, 'batch': 1098, 'loss': 5.932487964630127}
{'epoch': 2, 'batch': 1099, 'loss': 6.600822925567627}
{'epoch': 2, 'batch': 1100, 'loss': 6.398836135864258}
{'epoch

{'epoch': 2, 'batch': 1234, 'loss': 6.20747709274292}
{'epoch': 2, 'batch': 1235, 'loss': 6.53108024597168}
{'epoch': 2, 'batch': 1236, 'loss': 6.458806037902832}
{'epoch': 2, 'batch': 1237, 'loss': 8.221966743469238}
{'epoch': 2, 'batch': 1238, 'loss': 7.6774139404296875}
{'epoch': 2, 'batch': 1239, 'loss': 7.216775894165039}
{'epoch': 2, 'batch': 1240, 'loss': 6.196625232696533}
{'epoch': 2, 'batch': 1241, 'loss': 6.231165409088135}
{'epoch': 2, 'batch': 1242, 'loss': 7.250010967254639}
{'epoch': 2, 'batch': 1243, 'loss': 6.4348368644714355}
{'epoch': 2, 'batch': 1244, 'loss': 6.247600078582764}
{'epoch': 2, 'batch': 1245, 'loss': 6.488403797149658}
{'epoch': 2, 'batch': 1246, 'loss': 6.857069492340088}
{'epoch': 2, 'batch': 1247, 'loss': 6.785761833190918}
{'epoch': 2, 'batch': 1248, 'loss': 6.7264790534973145}
{'epoch': 2, 'batch': 1249, 'loss': 6.923296928405762}
{'epoch': 2, 'batch': 1250, 'loss': 7.029284954071045}
{'epoch': 2, 'batch': 1251, 'loss': 6.801701068878174}
{'epoch':

{'epoch': 2, 'batch': 1384, 'loss': 6.538530349731445}
{'epoch': 2, 'batch': 1385, 'loss': 5.917921543121338}
{'epoch': 2, 'batch': 1386, 'loss': 5.863860607147217}
{'epoch': 2, 'batch': 1387, 'loss': 6.086114883422852}
{'epoch': 2, 'batch': 1388, 'loss': 5.567328453063965}
{'epoch': 2, 'batch': 1389, 'loss': 7.185208797454834}
{'epoch': 2, 'batch': 1390, 'loss': 6.070313453674316}
{'epoch': 2, 'batch': 1391, 'loss': 6.422950267791748}
{'epoch': 2, 'batch': 1392, 'loss': 6.562445163726807}
{'epoch': 2, 'batch': 1393, 'loss': 6.186489105224609}
{'epoch': 2, 'batch': 1394, 'loss': 6.500068664550781}
{'epoch': 2, 'batch': 1395, 'loss': 6.12747049331665}
{'epoch': 2, 'batch': 1396, 'loss': 5.662021160125732}
{'epoch': 2, 'batch': 1397, 'loss': 6.643832683563232}
{'epoch': 2, 'batch': 1398, 'loss': 6.520630836486816}
{'epoch': 2, 'batch': 1399, 'loss': 7.316922664642334}
{'epoch': 2, 'batch': 1400, 'loss': 6.281704425811768}
{'epoch': 2, 'batch': 1401, 'loss': 6.5628862380981445}
{'epoch': 

{'epoch': 2, 'batch': 1533, 'loss': 6.88394021987915}
{'epoch': 2, 'batch': 1534, 'loss': 6.415939807891846}
{'epoch': 2, 'batch': 1535, 'loss': 6.337091445922852}
{'epoch': 2, 'batch': 1536, 'loss': 6.125378131866455}
{'epoch': 2, 'batch': 1537, 'loss': 5.894001483917236}
{'epoch': 2, 'batch': 1538, 'loss': 6.404031753540039}
{'epoch': 2, 'batch': 1539, 'loss': 6.789807319641113}
{'epoch': 2, 'batch': 1540, 'loss': 6.528504371643066}
{'epoch': 2, 'batch': 1541, 'loss': 8.029948234558105}
{'epoch': 2, 'batch': 1542, 'loss': 7.787275314331055}
{'epoch': 2, 'batch': 1543, 'loss': 6.317233085632324}
{'epoch': 2, 'batch': 1544, 'loss': 6.654439449310303}
{'epoch': 2, 'batch': 1545, 'loss': 6.778320789337158}
{'epoch': 2, 'batch': 1546, 'loss': 6.868271350860596}
{'epoch': 2, 'batch': 1547, 'loss': 7.676125526428223}
{'epoch': 2, 'batch': 1548, 'loss': 7.617717742919922}
{'epoch': 2, 'batch': 1549, 'loss': 6.197554588317871}
{'epoch': 2, 'batch': 1550, 'loss': 6.366941452026367}
{'epoch': 2

{'epoch': 2, 'batch': 1684, 'loss': 6.361896514892578}
{'epoch': 2, 'batch': 1685, 'loss': 7.259889602661133}
{'epoch': 2, 'batch': 1686, 'loss': 6.502231121063232}
{'epoch': 2, 'batch': 1687, 'loss': 7.117955207824707}
{'epoch': 2, 'batch': 1688, 'loss': 6.537274360656738}
{'epoch': 2, 'batch': 1689, 'loss': 6.042985916137695}
{'epoch': 2, 'batch': 1690, 'loss': 5.496668338775635}
{'epoch': 2, 'batch': 1691, 'loss': 6.151155471801758}
{'epoch': 2, 'batch': 1692, 'loss': 6.002401351928711}
{'epoch': 2, 'batch': 1693, 'loss': 6.495832443237305}
{'epoch': 2, 'batch': 1694, 'loss': 6.488890647888184}
{'epoch': 2, 'batch': 1695, 'loss': 6.442120552062988}
{'epoch': 2, 'batch': 1696, 'loss': 5.9774322509765625}
{'epoch': 2, 'batch': 1697, 'loss': 6.768496513366699}
{'epoch': 2, 'batch': 1698, 'loss': 6.718637943267822}
{'epoch': 2, 'batch': 1699, 'loss': 6.455415725708008}
{'epoch': 2, 'batch': 1700, 'loss': 6.7046990394592285}
{'epoch': 2, 'batch': 1701, 'loss': 6.525835037231445}
{'epoch'

{'epoch': 2, 'batch': 1833, 'loss': 6.525180816650391}
{'epoch': 2, 'batch': 1834, 'loss': 5.951408863067627}
{'epoch': 2, 'batch': 1835, 'loss': 6.304823398590088}
{'epoch': 2, 'batch': 1836, 'loss': 5.9564008712768555}
{'epoch': 2, 'batch': 1837, 'loss': 6.248101711273193}
{'epoch': 2, 'batch': 1838, 'loss': 6.139634609222412}
{'epoch': 2, 'batch': 1839, 'loss': 5.5791754722595215}
{'epoch': 2, 'batch': 1840, 'loss': 6.137692928314209}
{'epoch': 2, 'batch': 1841, 'loss': 6.357655048370361}
{'epoch': 2, 'batch': 1842, 'loss': 8.200089454650879}
{'epoch': 2, 'batch': 1843, 'loss': 7.638551712036133}
{'epoch': 2, 'batch': 1844, 'loss': 7.203521728515625}
{'epoch': 2, 'batch': 1845, 'loss': 7.098682403564453}
{'epoch': 2, 'batch': 1846, 'loss': 6.79459285736084}
{'epoch': 2, 'batch': 1847, 'loss': 6.805590629577637}
{'epoch': 2, 'batch': 1848, 'loss': 6.271893501281738}
{'epoch': 2, 'batch': 1849, 'loss': 6.7003560066223145}
{'epoch': 2, 'batch': 1850, 'loss': 7.3087639808654785}
{'epoch

{'epoch': 2, 'batch': 1983, 'loss': 6.2274675369262695}
{'epoch': 2, 'batch': 1984, 'loss': 6.003047943115234}
{'epoch': 2, 'batch': 1985, 'loss': 6.9397406578063965}
{'epoch': 2, 'batch': 1986, 'loss': 6.302410125732422}
{'epoch': 2, 'batch': 1987, 'loss': 5.867390155792236}
{'epoch': 2, 'batch': 1988, 'loss': 6.587316036224365}
{'epoch': 2, 'batch': 1989, 'loss': 6.922693252563477}
{'epoch': 2, 'batch': 1990, 'loss': 6.607863426208496}
{'epoch': 2, 'batch': 1991, 'loss': 6.591223239898682}
{'epoch': 2, 'batch': 1992, 'loss': 6.805792331695557}
{'epoch': 2, 'batch': 1993, 'loss': 5.987216472625732}
{'epoch': 2, 'batch': 1994, 'loss': 6.1031904220581055}
{'epoch': 2, 'batch': 1995, 'loss': 6.27851676940918}
{'epoch': 2, 'batch': 1996, 'loss': 6.087838649749756}
{'epoch': 2, 'batch': 1997, 'loss': 6.456809997558594}
{'epoch': 2, 'batch': 1998, 'loss': 6.027256965637207}
{'epoch': 2, 'batch': 1999, 'loss': 6.177928447723389}
{'epoch': 2, 'batch': 2000, 'loss': 6.5468645095825195}
{'epoch

{'epoch': 2, 'batch': 2134, 'loss': 7.311534881591797}
{'epoch': 2, 'batch': 2135, 'loss': 7.253983974456787}
{'epoch': 2, 'batch': 2136, 'loss': 7.194714069366455}
{'epoch': 2, 'batch': 2137, 'loss': 6.385844707489014}
{'epoch': 2, 'batch': 2138, 'loss': 6.18638801574707}
{'epoch': 2, 'batch': 2139, 'loss': 6.285592555999756}
{'epoch': 2, 'batch': 2140, 'loss': 6.730016231536865}
{'epoch': 2, 'batch': 2141, 'loss': 6.328901767730713}
{'epoch': 2, 'batch': 2142, 'loss': 7.0529279708862305}
{'epoch': 2, 'batch': 2143, 'loss': 6.827093601226807}
{'epoch': 2, 'batch': 2144, 'loss': 7.035765171051025}
{'epoch': 2, 'batch': 2145, 'loss': 6.559998989105225}
{'epoch': 2, 'batch': 2146, 'loss': 6.414803981781006}
{'epoch': 2, 'batch': 2147, 'loss': 6.733750820159912}
{'epoch': 2, 'batch': 2148, 'loss': 6.787819862365723}
{'epoch': 2, 'batch': 2149, 'loss': 6.562048435211182}
{'epoch': 2, 'batch': 2150, 'loss': 6.329955577850342}
{'epoch': 2, 'batch': 2151, 'loss': 6.41788911819458}
{'epoch': 2

{'epoch': 2, 'batch': 2285, 'loss': 6.946458339691162}
{'epoch': 2, 'batch': 2286, 'loss': 6.315867900848389}
{'epoch': 2, 'batch': 2287, 'loss': 6.2760515213012695}
{'epoch': 2, 'batch': 2288, 'loss': 6.487726211547852}
{'epoch': 2, 'batch': 2289, 'loss': 6.450063228607178}
{'epoch': 2, 'batch': 2290, 'loss': 6.760900974273682}
{'epoch': 2, 'batch': 2291, 'loss': 7.137030601501465}
{'epoch': 2, 'batch': 2292, 'loss': 6.8989739418029785}
{'epoch': 2, 'batch': 2293, 'loss': 6.162286758422852}
{'epoch': 2, 'batch': 2294, 'loss': 5.93080997467041}
{'epoch': 2, 'batch': 2295, 'loss': 6.06146240234375}
{'epoch': 2, 'batch': 2296, 'loss': 6.299356460571289}
{'epoch': 2, 'batch': 2297, 'loss': 7.044588565826416}
{'epoch': 2, 'batch': 2298, 'loss': 6.400520324707031}
{'epoch': 2, 'batch': 2299, 'loss': 6.73824405670166}
{'epoch': 2, 'batch': 2300, 'loss': 7.398283958435059}
{'epoch': 2, 'batch': 2301, 'loss': 6.433272361755371}
{'epoch': 2, 'batch': 2302, 'loss': 6.884796142578125}
{'epoch': 2

{'epoch': 2, 'batch': 2435, 'loss': 6.2030029296875}
{'epoch': 2, 'batch': 2436, 'loss': 6.714064121246338}
{'epoch': 2, 'batch': 2437, 'loss': 5.824091911315918}
{'epoch': 2, 'batch': 2438, 'loss': 5.853667259216309}
{'epoch': 2, 'batch': 2439, 'loss': 6.484765529632568}
{'epoch': 2, 'batch': 2440, 'loss': 6.253324031829834}
{'epoch': 2, 'batch': 2441, 'loss': 6.535628318786621}
{'epoch': 2, 'batch': 2442, 'loss': 6.302706718444824}
{'epoch': 2, 'batch': 2443, 'loss': 6.283234119415283}
{'epoch': 2, 'batch': 2444, 'loss': 6.393807411193848}
{'epoch': 2, 'batch': 2445, 'loss': 6.565783977508545}
{'epoch': 2, 'batch': 2446, 'loss': 5.775321960449219}
{'epoch': 2, 'batch': 2447, 'loss': 5.92592191696167}
{'epoch': 2, 'batch': 2448, 'loss': 5.852522850036621}
{'epoch': 2, 'batch': 2449, 'loss': 5.950471878051758}
{'epoch': 2, 'batch': 2450, 'loss': 6.413579940795898}
{'epoch': 2, 'batch': 2451, 'loss': 6.894569396972656}
{'epoch': 2, 'batch': 2452, 'loss': 5.94884729385376}
{'epoch': 2, '

{'epoch': 2, 'batch': 2586, 'loss': 5.6357197761535645}
{'epoch': 2, 'batch': 2587, 'loss': 5.728772163391113}
{'epoch': 2, 'batch': 2588, 'loss': 6.07094144821167}
{'epoch': 2, 'batch': 2589, 'loss': 5.41262674331665}
{'epoch': 2, 'batch': 2590, 'loss': 7.269016742706299}
{'epoch': 2, 'batch': 2591, 'loss': 5.811023712158203}
{'epoch': 2, 'batch': 2592, 'loss': 5.852331638336182}
{'epoch': 2, 'batch': 2593, 'loss': 5.682918071746826}
{'epoch': 2, 'batch': 2594, 'loss': 6.061277389526367}
{'epoch': 2, 'batch': 2595, 'loss': 6.213272571563721}
{'epoch': 2, 'batch': 2596, 'loss': 6.189846515655518}
{'epoch': 2, 'batch': 2597, 'loss': 6.004619121551514}
{'epoch': 2, 'batch': 2598, 'loss': 5.951063632965088}
{'epoch': 2, 'batch': 2599, 'loss': 5.674615859985352}
{'epoch': 2, 'batch': 2600, 'loss': 5.65393590927124}
{'epoch': 2, 'batch': 2601, 'loss': 6.056697845458984}
{'epoch': 2, 'batch': 2602, 'loss': 6.245067596435547}
{'epoch': 2, 'batch': 2603, 'loss': 5.647761344909668}
{'epoch': 2,

{'epoch': 2, 'batch': 2737, 'loss': 5.776349067687988}
{'epoch': 2, 'batch': 2738, 'loss': 6.231851577758789}
{'epoch': 2, 'batch': 2739, 'loss': 6.073126316070557}
{'epoch': 2, 'batch': 2740, 'loss': 6.23621129989624}
{'epoch': 2, 'batch': 2741, 'loss': 6.178518295288086}
{'epoch': 2, 'batch': 2742, 'loss': 6.965229034423828}
{'epoch': 2, 'batch': 2743, 'loss': 6.688638687133789}
{'epoch': 2, 'batch': 2744, 'loss': 5.937071323394775}
{'epoch': 2, 'batch': 2745, 'loss': 6.255042552947998}
{'epoch': 2, 'batch': 2746, 'loss': 6.175038814544678}
{'epoch': 2, 'batch': 2747, 'loss': 5.598861217498779}
{'epoch': 2, 'batch': 2748, 'loss': 6.258631229400635}
{'epoch': 2, 'batch': 2749, 'loss': 5.938138961791992}
{'epoch': 2, 'batch': 2750, 'loss': 5.7399091720581055}
{'epoch': 2, 'batch': 2751, 'loss': 6.059314250946045}
{'epoch': 2, 'batch': 2752, 'loss': 5.773228168487549}
{'epoch': 2, 'batch': 2753, 'loss': 5.8986592292785645}
{'epoch': 2, 'batch': 2754, 'loss': 5.676382541656494}
{'epoch':

{'epoch': 2, 'batch': 2888, 'loss': 6.224803924560547}
{'epoch': 2, 'batch': 2889, 'loss': 6.082130432128906}
{'epoch': 2, 'batch': 2890, 'loss': 6.155480861663818}
{'epoch': 2, 'batch': 2891, 'loss': 5.424294948577881}
{'epoch': 2, 'batch': 2892, 'loss': 5.981472015380859}
{'epoch': 2, 'batch': 2893, 'loss': 6.820273399353027}
{'epoch': 2, 'batch': 2894, 'loss': 6.056562423706055}
{'epoch': 2, 'batch': 2895, 'loss': 6.386901378631592}
{'epoch': 2, 'batch': 2896, 'loss': 6.238741874694824}
{'epoch': 2, 'batch': 2897, 'loss': 6.461225986480713}
{'epoch': 2, 'batch': 2898, 'loss': 5.133093357086182}
{'epoch': 2, 'batch': 2899, 'loss': 5.249931812286377}
{'epoch': 2, 'batch': 2900, 'loss': 6.092624664306641}
{'epoch': 2, 'batch': 2901, 'loss': 7.300667762756348}
{'epoch': 2, 'batch': 2902, 'loss': 5.962419033050537}
{'epoch': 2, 'batch': 2903, 'loss': 5.815459728240967}
{'epoch': 2, 'batch': 2904, 'loss': 5.9310173988342285}
{'epoch': 2, 'batch': 2905, 'loss': 6.084376811981201}
{'epoch':

{'epoch': 2, 'batch': 3039, 'loss': 6.603938102722168}
{'epoch': 2, 'batch': 3040, 'loss': 6.074837684631348}
{'epoch': 2, 'batch': 3041, 'loss': 6.190656661987305}
{'epoch': 2, 'batch': 3042, 'loss': 5.321133136749268}
{'epoch': 2, 'batch': 3043, 'loss': 6.385822772979736}
{'epoch': 2, 'batch': 3044, 'loss': 7.391186714172363}
{'epoch': 2, 'batch': 3045, 'loss': 7.364274501800537}
{'epoch': 2, 'batch': 3046, 'loss': 7.227980136871338}
{'epoch': 2, 'batch': 3047, 'loss': 6.92010498046875}
{'epoch': 2, 'batch': 3048, 'loss': 6.653907775878906}
{'epoch': 2, 'batch': 3049, 'loss': 6.841233730316162}
{'epoch': 2, 'batch': 3050, 'loss': 6.508999347686768}
{'epoch': 2, 'batch': 3051, 'loss': 6.035501480102539}
{'epoch': 2, 'batch': 3052, 'loss': 7.290849208831787}
{'epoch': 2, 'batch': 3053, 'loss': 7.164140224456787}
{'epoch': 2, 'batch': 3054, 'loss': 6.810145378112793}
{'epoch': 2, 'batch': 3055, 'loss': 6.845528602600098}
{'epoch': 2, 'batch': 3056, 'loss': 6.1641106605529785}
{'epoch': 

{'epoch': 2, 'batch': 3188, 'loss': 5.847704887390137}
{'epoch': 2, 'batch': 3189, 'loss': 5.941989898681641}
{'epoch': 2, 'batch': 3190, 'loss': 6.022210597991943}
{'epoch': 2, 'batch': 3191, 'loss': 6.6402268409729}
{'epoch': 2, 'batch': 3192, 'loss': 6.451239585876465}
{'epoch': 2, 'batch': 3193, 'loss': 7.331385612487793}
{'epoch': 2, 'batch': 3194, 'loss': 6.314803123474121}
{'epoch': 2, 'batch': 3195, 'loss': 7.4151611328125}
{'epoch': 2, 'batch': 3196, 'loss': 6.901339054107666}
{'epoch': 2, 'batch': 3197, 'loss': 6.62084436416626}
{'epoch': 2, 'batch': 3198, 'loss': 6.308021068572998}
{'epoch': 2, 'batch': 3199, 'loss': 6.429482936859131}
{'epoch': 2, 'batch': 3200, 'loss': 6.335392475128174}
{'epoch': 2, 'batch': 3201, 'loss': 6.871091842651367}
{'epoch': 2, 'batch': 3202, 'loss': 5.958247661590576}
{'epoch': 2, 'batch': 3203, 'loss': 6.109142780303955}
{'epoch': 2, 'batch': 3204, 'loss': 6.333094596862793}
{'epoch': 2, 'batch': 3205, 'loss': 6.168582439422607}
{'epoch': 2, 'b

{'epoch': 2, 'batch': 3338, 'loss': 7.401626110076904}
{'epoch': 2, 'batch': 3339, 'loss': 6.070826053619385}
{'epoch': 2, 'batch': 3340, 'loss': 6.398755073547363}
{'epoch': 2, 'batch': 3341, 'loss': 6.960975646972656}
{'epoch': 2, 'batch': 3342, 'loss': 5.971774578094482}
{'epoch': 2, 'batch': 3343, 'loss': 6.459031105041504}
{'epoch': 2, 'batch': 3344, 'loss': 6.368663311004639}
{'epoch': 2, 'batch': 3345, 'loss': 6.256043910980225}
{'epoch': 2, 'batch': 3346, 'loss': 6.4422173500061035}
{'epoch': 2, 'batch': 3347, 'loss': 7.440103054046631}
{'epoch': 2, 'batch': 3348, 'loss': 7.178682327270508}
{'epoch': 2, 'batch': 3349, 'loss': 6.271591663360596}
{'epoch': 2, 'batch': 3350, 'loss': 6.067535877227783}
{'epoch': 2, 'batch': 3351, 'loss': 5.7822442054748535}
{'epoch': 2, 'batch': 3352, 'loss': 6.50335693359375}
{'epoch': 2, 'batch': 3353, 'loss': 6.37804651260376}
{'epoch': 2, 'batch': 3354, 'loss': 5.999083042144775}
{'epoch': 2, 'batch': 3355, 'loss': 5.832555770874023}
{'epoch': 

{'epoch': 2, 'batch': 3487, 'loss': 6.60562801361084}
{'epoch': 2, 'batch': 3488, 'loss': 6.92460298538208}
{'epoch': 2, 'batch': 3489, 'loss': 6.461698532104492}
{'epoch': 2, 'batch': 3490, 'loss': 6.283568859100342}
{'epoch': 2, 'batch': 3491, 'loss': 5.952108383178711}
{'epoch': 2, 'batch': 3492, 'loss': 5.657788276672363}
{'epoch': 2, 'batch': 3493, 'loss': 5.89499044418335}
{'epoch': 2, 'batch': 3494, 'loss': 6.807077407836914}
{'epoch': 2, 'batch': 3495, 'loss': 6.622085094451904}
{'epoch': 2, 'batch': 3496, 'loss': 6.577913284301758}
{'epoch': 2, 'batch': 3497, 'loss': 6.5135722160339355}
{'epoch': 2, 'batch': 3498, 'loss': 6.412917137145996}
{'epoch': 2, 'batch': 3499, 'loss': 6.710776329040527}
{'epoch': 2, 'batch': 3500, 'loss': 6.968160629272461}
{'epoch': 2, 'batch': 3501, 'loss': 6.586009979248047}
{'epoch': 2, 'batch': 3502, 'loss': 6.100249767303467}
{'epoch': 2, 'batch': 3503, 'loss': 5.494582653045654}
{'epoch': 2, 'batch': 3504, 'loss': 6.417056083679199}
{'epoch': 2,

{'epoch': 2, 'batch': 3636, 'loss': 6.678946495056152}
{'epoch': 2, 'batch': 3637, 'loss': 6.993358135223389}
{'epoch': 2, 'batch': 3638, 'loss': 6.897556304931641}
{'epoch': 2, 'batch': 3639, 'loss': 6.84977912902832}
{'epoch': 2, 'batch': 3640, 'loss': 6.838344573974609}
{'epoch': 2, 'batch': 3641, 'loss': 6.90497350692749}
{'epoch': 2, 'batch': 3642, 'loss': 7.17031192779541}
{'epoch': 2, 'batch': 3643, 'loss': 6.7425217628479}
{'epoch': 2, 'batch': 3644, 'loss': 6.683507919311523}
{'epoch': 2, 'batch': 3645, 'loss': 6.2612152099609375}
{'epoch': 2, 'batch': 3646, 'loss': 6.34048318862915}
{'epoch': 2, 'batch': 3647, 'loss': 5.800619125366211}
{'epoch': 2, 'batch': 3648, 'loss': 6.774774551391602}
{'epoch': 2, 'batch': 3649, 'loss': 6.874154567718506}
{'epoch': 2, 'batch': 3650, 'loss': 6.576740741729736}
{'epoch': 2, 'batch': 3651, 'loss': 6.523547649383545}
{'epoch': 2, 'batch': 3652, 'loss': 5.889461040496826}
{'epoch': 2, 'batch': 3653, 'loss': 6.481975078582764}
{'epoch': 2, 'b

{'epoch': 3, 'batch': 13, 'loss': 5.401455879211426}
{'epoch': 3, 'batch': 14, 'loss': 5.427688121795654}
{'epoch': 3, 'batch': 15, 'loss': 5.857877254486084}
{'epoch': 3, 'batch': 16, 'loss': 6.744586944580078}
{'epoch': 3, 'batch': 17, 'loss': 6.54957389831543}
{'epoch': 3, 'batch': 18, 'loss': 6.592528343200684}
{'epoch': 3, 'batch': 19, 'loss': 6.757242202758789}
{'epoch': 3, 'batch': 20, 'loss': 7.042788505554199}
{'epoch': 3, 'batch': 21, 'loss': 6.559640884399414}
{'epoch': 3, 'batch': 22, 'loss': 6.375406265258789}
{'epoch': 3, 'batch': 23, 'loss': 6.910581588745117}
{'epoch': 3, 'batch': 24, 'loss': 6.086169242858887}
{'epoch': 3, 'batch': 25, 'loss': 6.721251010894775}
{'epoch': 3, 'batch': 26, 'loss': 6.540920734405518}
{'epoch': 3, 'batch': 27, 'loss': 6.348594665527344}
{'epoch': 3, 'batch': 28, 'loss': 6.181588172912598}
{'epoch': 3, 'batch': 29, 'loss': 6.120377063751221}
{'epoch': 3, 'batch': 30, 'loss': 6.068455696105957}
{'epoch': 3, 'batch': 31, 'loss': 6.02664232254

{'epoch': 3, 'batch': 169, 'loss': 5.599148750305176}
{'epoch': 3, 'batch': 170, 'loss': 6.424321174621582}
{'epoch': 3, 'batch': 171, 'loss': 5.804161071777344}
{'epoch': 3, 'batch': 172, 'loss': 6.082116603851318}
{'epoch': 3, 'batch': 173, 'loss': 6.090302467346191}
{'epoch': 3, 'batch': 174, 'loss': 6.608756065368652}
{'epoch': 3, 'batch': 175, 'loss': 6.314318656921387}
{'epoch': 3, 'batch': 176, 'loss': 6.018039226531982}
{'epoch': 3, 'batch': 177, 'loss': 6.442141532897949}
{'epoch': 3, 'batch': 178, 'loss': 6.358484268188477}
{'epoch': 3, 'batch': 179, 'loss': 6.600184917449951}
{'epoch': 3, 'batch': 180, 'loss': 5.794764041900635}
{'epoch': 3, 'batch': 181, 'loss': 5.765695095062256}
{'epoch': 3, 'batch': 182, 'loss': 6.514316082000732}
{'epoch': 3, 'batch': 183, 'loss': 5.717433929443359}
{'epoch': 3, 'batch': 184, 'loss': 5.659779071807861}
{'epoch': 3, 'batch': 185, 'loss': 6.553854465484619}
{'epoch': 3, 'batch': 186, 'loss': 6.65825080871582}
{'epoch': 3, 'batch': 187, 'l

{'epoch': 3, 'batch': 322, 'loss': 5.8911452293396}
{'epoch': 3, 'batch': 323, 'loss': 5.649248123168945}
{'epoch': 3, 'batch': 324, 'loss': 6.123190879821777}
{'epoch': 3, 'batch': 325, 'loss': 6.7040205001831055}
{'epoch': 3, 'batch': 326, 'loss': 6.416236400604248}
{'epoch': 3, 'batch': 327, 'loss': 5.877232551574707}
{'epoch': 3, 'batch': 328, 'loss': 6.566466331481934}
{'epoch': 3, 'batch': 329, 'loss': 6.8981852531433105}
{'epoch': 3, 'batch': 330, 'loss': 5.331167697906494}
{'epoch': 3, 'batch': 331, 'loss': 6.077739238739014}
{'epoch': 3, 'batch': 332, 'loss': 6.979454517364502}
{'epoch': 3, 'batch': 333, 'loss': 8.514225959777832}
{'epoch': 3, 'batch': 334, 'loss': 7.731654167175293}
{'epoch': 3, 'batch': 335, 'loss': 6.7999043464660645}
{'epoch': 3, 'batch': 336, 'loss': 6.6562910079956055}
{'epoch': 3, 'batch': 337, 'loss': 6.520322322845459}
{'epoch': 3, 'batch': 338, 'loss': 6.561265468597412}
{'epoch': 3, 'batch': 339, 'loss': 6.496542930603027}
{'epoch': 3, 'batch': 340,

{'epoch': 3, 'batch': 475, 'loss': 5.924325466156006}
{'epoch': 3, 'batch': 476, 'loss': 6.218073844909668}
{'epoch': 3, 'batch': 477, 'loss': 6.130323886871338}
{'epoch': 3, 'batch': 478, 'loss': 6.42612361907959}
{'epoch': 3, 'batch': 479, 'loss': 6.319237232208252}
{'epoch': 3, 'batch': 480, 'loss': 6.366375923156738}
{'epoch': 3, 'batch': 481, 'loss': 6.252871036529541}
{'epoch': 3, 'batch': 482, 'loss': 6.468846797943115}
{'epoch': 3, 'batch': 483, 'loss': 7.056605815887451}
{'epoch': 3, 'batch': 484, 'loss': 6.352180480957031}
{'epoch': 3, 'batch': 485, 'loss': 6.670881748199463}
{'epoch': 3, 'batch': 486, 'loss': 6.268479824066162}
{'epoch': 3, 'batch': 487, 'loss': 6.422636032104492}
{'epoch': 3, 'batch': 488, 'loss': 6.239320755004883}
{'epoch': 3, 'batch': 489, 'loss': 6.8454437255859375}
{'epoch': 3, 'batch': 490, 'loss': 6.027137756347656}
{'epoch': 3, 'batch': 491, 'loss': 5.4808430671691895}
{'epoch': 3, 'batch': 492, 'loss': 5.725136756896973}
{'epoch': 3, 'batch': 493, 

{'epoch': 3, 'batch': 629, 'loss': 5.261144638061523}
{'epoch': 3, 'batch': 630, 'loss': 5.510851860046387}
{'epoch': 3, 'batch': 631, 'loss': 5.686822414398193}
{'epoch': 3, 'batch': 632, 'loss': 6.08732795715332}
{'epoch': 3, 'batch': 633, 'loss': 6.465850353240967}
{'epoch': 3, 'batch': 634, 'loss': 6.464890956878662}
{'epoch': 3, 'batch': 635, 'loss': 5.7888665199279785}
{'epoch': 3, 'batch': 636, 'loss': 5.299248218536377}
{'epoch': 3, 'batch': 637, 'loss': 5.649360179901123}
{'epoch': 3, 'batch': 638, 'loss': 5.948685169219971}
{'epoch': 3, 'batch': 639, 'loss': 5.769632816314697}
{'epoch': 3, 'batch': 640, 'loss': 5.531736373901367}
{'epoch': 3, 'batch': 641, 'loss': 6.384293079376221}
{'epoch': 3, 'batch': 642, 'loss': 5.600574493408203}
{'epoch': 3, 'batch': 643, 'loss': 6.143402576446533}
{'epoch': 3, 'batch': 644, 'loss': 6.407041072845459}
{'epoch': 3, 'batch': 645, 'loss': 5.749145984649658}
{'epoch': 3, 'batch': 646, 'loss': 5.934535026550293}
{'epoch': 3, 'batch': 647, '

{'epoch': 3, 'batch': 781, 'loss': 6.220698356628418}
{'epoch': 3, 'batch': 782, 'loss': 5.977877140045166}
{'epoch': 3, 'batch': 783, 'loss': 6.5727949142456055}
{'epoch': 3, 'batch': 784, 'loss': 6.856963634490967}
{'epoch': 3, 'batch': 785, 'loss': 6.637907028198242}
{'epoch': 3, 'batch': 786, 'loss': 5.976768970489502}
{'epoch': 3, 'batch': 787, 'loss': 6.221945762634277}
{'epoch': 3, 'batch': 788, 'loss': 6.247060775756836}
{'epoch': 3, 'batch': 789, 'loss': 5.968642711639404}
{'epoch': 3, 'batch': 790, 'loss': 6.596817493438721}
{'epoch': 3, 'batch': 791, 'loss': 7.224118709564209}
{'epoch': 3, 'batch': 792, 'loss': 6.819575309753418}
{'epoch': 3, 'batch': 793, 'loss': 6.928834438323975}
{'epoch': 3, 'batch': 794, 'loss': 6.631994724273682}
{'epoch': 3, 'batch': 795, 'loss': 6.847792625427246}
{'epoch': 3, 'batch': 796, 'loss': 6.450681209564209}
{'epoch': 3, 'batch': 797, 'loss': 6.820163249969482}
{'epoch': 3, 'batch': 798, 'loss': 6.874448299407959}
{'epoch': 3, 'batch': 799, 

{'epoch': 3, 'batch': 933, 'loss': 6.810827255249023}
{'epoch': 3, 'batch': 934, 'loss': 6.107581615447998}
{'epoch': 3, 'batch': 935, 'loss': 6.762022972106934}
{'epoch': 3, 'batch': 936, 'loss': 5.976262092590332}
{'epoch': 3, 'batch': 937, 'loss': 6.074380874633789}
{'epoch': 3, 'batch': 938, 'loss': 6.228645324707031}
{'epoch': 3, 'batch': 939, 'loss': 6.330111503601074}
{'epoch': 3, 'batch': 940, 'loss': 6.2307891845703125}
{'epoch': 3, 'batch': 941, 'loss': 6.3595991134643555}
{'epoch': 3, 'batch': 942, 'loss': 6.226434230804443}
{'epoch': 3, 'batch': 943, 'loss': 6.159628868103027}
{'epoch': 3, 'batch': 944, 'loss': 5.838046550750732}
{'epoch': 3, 'batch': 945, 'loss': 6.41795539855957}
{'epoch': 3, 'batch': 946, 'loss': 6.108375549316406}
{'epoch': 3, 'batch': 947, 'loss': 5.789572715759277}
{'epoch': 3, 'batch': 948, 'loss': 5.653371334075928}
{'epoch': 3, 'batch': 949, 'loss': 6.126065254211426}
{'epoch': 3, 'batch': 950, 'loss': 6.357118606567383}
{'epoch': 3, 'batch': 951, 

{'epoch': 3, 'batch': 1085, 'loss': 5.792776584625244}
{'epoch': 3, 'batch': 1086, 'loss': 5.532957077026367}
{'epoch': 3, 'batch': 1087, 'loss': 6.103065490722656}
{'epoch': 3, 'batch': 1088, 'loss': 5.976571083068848}
{'epoch': 3, 'batch': 1089, 'loss': 6.189133167266846}
{'epoch': 3, 'batch': 1090, 'loss': 5.687962532043457}
{'epoch': 3, 'batch': 1091, 'loss': 5.829265117645264}
{'epoch': 3, 'batch': 1092, 'loss': 6.009339332580566}
{'epoch': 3, 'batch': 1093, 'loss': 6.176916599273682}
{'epoch': 3, 'batch': 1094, 'loss': 5.644787788391113}
{'epoch': 3, 'batch': 1095, 'loss': 5.4352898597717285}
{'epoch': 3, 'batch': 1096, 'loss': 5.797877788543701}
{'epoch': 3, 'batch': 1097, 'loss': 6.108741283416748}
{'epoch': 3, 'batch': 1098, 'loss': 5.529518127441406}
{'epoch': 3, 'batch': 1099, 'loss': 6.199268817901611}
{'epoch': 3, 'batch': 1100, 'loss': 6.100179195404053}
{'epoch': 3, 'batch': 1101, 'loss': 6.739482402801514}
{'epoch': 3, 'batch': 1102, 'loss': 6.532923698425293}
{'epoch':

{'epoch': 3, 'batch': 1235, 'loss': 6.231178283691406}
{'epoch': 3, 'batch': 1236, 'loss': 6.092886924743652}
{'epoch': 3, 'batch': 1237, 'loss': 7.500725269317627}
{'epoch': 3, 'batch': 1238, 'loss': 7.202164649963379}
{'epoch': 3, 'batch': 1239, 'loss': 6.696048259735107}
{'epoch': 3, 'batch': 1240, 'loss': 5.868289470672607}
{'epoch': 3, 'batch': 1241, 'loss': 5.930171489715576}
{'epoch': 3, 'batch': 1242, 'loss': 6.794304370880127}
{'epoch': 3, 'batch': 1243, 'loss': 6.080567359924316}
{'epoch': 3, 'batch': 1244, 'loss': 6.03447151184082}
{'epoch': 3, 'batch': 1245, 'loss': 6.106076717376709}
{'epoch': 3, 'batch': 1246, 'loss': 6.495742321014404}
{'epoch': 3, 'batch': 1247, 'loss': 6.483403205871582}
{'epoch': 3, 'batch': 1248, 'loss': 6.426935195922852}
{'epoch': 3, 'batch': 1249, 'loss': 6.617088794708252}
{'epoch': 3, 'batch': 1250, 'loss': 6.76724910736084}
{'epoch': 3, 'batch': 1251, 'loss': 6.386830806732178}
{'epoch': 3, 'batch': 1252, 'loss': 6.233480930328369}
{'epoch': 3,

{'epoch': 3, 'batch': 1384, 'loss': 6.208937168121338}
{'epoch': 3, 'batch': 1385, 'loss': 5.475001335144043}
{'epoch': 3, 'batch': 1386, 'loss': 5.560338973999023}
{'epoch': 3, 'batch': 1387, 'loss': 5.6895751953125}
{'epoch': 3, 'batch': 1388, 'loss': 5.151514530181885}
{'epoch': 3, 'batch': 1389, 'loss': 6.79108190536499}
{'epoch': 3, 'batch': 1390, 'loss': 5.832368850708008}
{'epoch': 3, 'batch': 1391, 'loss': 6.177303791046143}
{'epoch': 3, 'batch': 1392, 'loss': 6.172015190124512}
{'epoch': 3, 'batch': 1393, 'loss': 5.829668045043945}
{'epoch': 3, 'batch': 1394, 'loss': 6.0706892013549805}
{'epoch': 3, 'batch': 1395, 'loss': 5.787518501281738}
{'epoch': 3, 'batch': 1396, 'loss': 5.252862453460693}
{'epoch': 3, 'batch': 1397, 'loss': 6.080856800079346}
{'epoch': 3, 'batch': 1398, 'loss': 6.164200305938721}
{'epoch': 3, 'batch': 1399, 'loss': 6.772098541259766}
{'epoch': 3, 'batch': 1400, 'loss': 5.814537048339844}
{'epoch': 3, 'batch': 1401, 'loss': 6.157938480377197}
{'epoch': 3,

{'epoch': 3, 'batch': 1535, 'loss': 6.033750534057617}
{'epoch': 3, 'batch': 1536, 'loss': 5.890686988830566}
{'epoch': 3, 'batch': 1537, 'loss': 5.642495155334473}
{'epoch': 3, 'batch': 1538, 'loss': 6.0586137771606445}
{'epoch': 3, 'batch': 1539, 'loss': 6.541130065917969}
{'epoch': 3, 'batch': 1540, 'loss': 6.2263102531433105}
{'epoch': 3, 'batch': 1541, 'loss': 7.638990879058838}
{'epoch': 3, 'batch': 1542, 'loss': 7.396100044250488}
{'epoch': 3, 'batch': 1543, 'loss': 6.0692219734191895}
{'epoch': 3, 'batch': 1544, 'loss': 6.334005832672119}
{'epoch': 3, 'batch': 1545, 'loss': 6.4088921546936035}
{'epoch': 3, 'batch': 1546, 'loss': 6.490686416625977}
{'epoch': 3, 'batch': 1547, 'loss': 7.305575847625732}
{'epoch': 3, 'batch': 1548, 'loss': 7.224390029907227}
{'epoch': 3, 'batch': 1549, 'loss': 5.952085971832275}
{'epoch': 3, 'batch': 1550, 'loss': 6.120322227478027}
{'epoch': 3, 'batch': 1551, 'loss': 5.925058364868164}
{'epoch': 3, 'batch': 1552, 'loss': 5.780134677886963}
{'epoc

{'epoch': 3, 'batch': 1686, 'loss': 6.17471170425415}
{'epoch': 3, 'batch': 1687, 'loss': 6.643821716308594}
{'epoch': 3, 'batch': 1688, 'loss': 6.083259105682373}
{'epoch': 3, 'batch': 1689, 'loss': 5.678922653198242}
{'epoch': 3, 'batch': 1690, 'loss': 5.1484055519104}
{'epoch': 3, 'batch': 1691, 'loss': 5.706559181213379}
{'epoch': 3, 'batch': 1692, 'loss': 5.692712783813477}
{'epoch': 3, 'batch': 1693, 'loss': 6.160374164581299}
{'epoch': 3, 'batch': 1694, 'loss': 6.205002307891846}
{'epoch': 3, 'batch': 1695, 'loss': 6.046741962432861}
{'epoch': 3, 'batch': 1696, 'loss': 5.723921775817871}
{'epoch': 3, 'batch': 1697, 'loss': 6.337209701538086}
{'epoch': 3, 'batch': 1698, 'loss': 6.307131290435791}
{'epoch': 3, 'batch': 1699, 'loss': 6.036710739135742}
{'epoch': 3, 'batch': 1700, 'loss': 6.270024299621582}
{'epoch': 3, 'batch': 1701, 'loss': 6.165238380432129}
{'epoch': 3, 'batch': 1702, 'loss': 6.257177829742432}
{'epoch': 3, 'batch': 1703, 'loss': 6.0421223640441895}
{'epoch': 3,

{'epoch': 3, 'batch': 1838, 'loss': 5.929712295532227}
{'epoch': 3, 'batch': 1839, 'loss': 5.275757789611816}
{'epoch': 3, 'batch': 1840, 'loss': 5.8401079177856445}
{'epoch': 3, 'batch': 1841, 'loss': 6.157597541809082}
{'epoch': 3, 'batch': 1842, 'loss': 7.634543418884277}
{'epoch': 3, 'batch': 1843, 'loss': 7.074566841125488}
{'epoch': 3, 'batch': 1844, 'loss': 6.818509101867676}
{'epoch': 3, 'batch': 1845, 'loss': 6.761441707611084}
{'epoch': 3, 'batch': 1846, 'loss': 6.42069149017334}
{'epoch': 3, 'batch': 1847, 'loss': 6.502289295196533}
{'epoch': 3, 'batch': 1848, 'loss': 5.887747764587402}
{'epoch': 3, 'batch': 1849, 'loss': 6.3688836097717285}
{'epoch': 3, 'batch': 1850, 'loss': 6.35414457321167}
{'epoch': 3, 'batch': 1851, 'loss': 7.073342323303223}
{'epoch': 3, 'batch': 1852, 'loss': 7.468906879425049}
{'epoch': 3, 'batch': 1853, 'loss': 7.604523658752441}
{'epoch': 3, 'batch': 1854, 'loss': 7.69296407699585}
{'epoch': 3, 'batch': 1855, 'loss': 7.398769855499268}
{'epoch': 3

{'epoch': 3, 'batch': 1987, 'loss': 5.592770576477051}
{'epoch': 3, 'batch': 1988, 'loss': 6.248668193817139}
{'epoch': 3, 'batch': 1989, 'loss': 6.593588829040527}
{'epoch': 3, 'batch': 1990, 'loss': 6.204157829284668}
{'epoch': 3, 'batch': 1991, 'loss': 6.23781156539917}
{'epoch': 3, 'batch': 1992, 'loss': 6.404975414276123}
{'epoch': 3, 'batch': 1993, 'loss': 5.587305068969727}
{'epoch': 3, 'batch': 1994, 'loss': 5.807295322418213}
{'epoch': 3, 'batch': 1995, 'loss': 6.025660037994385}
{'epoch': 3, 'batch': 1996, 'loss': 5.799160957336426}
{'epoch': 3, 'batch': 1997, 'loss': 6.17844820022583}
{'epoch': 3, 'batch': 1998, 'loss': 5.728020668029785}
{'epoch': 3, 'batch': 1999, 'loss': 5.8186187744140625}
{'epoch': 3, 'batch': 2000, 'loss': 6.080969333648682}
{'epoch': 3, 'batch': 2001, 'loss': 7.517783164978027}
{'epoch': 3, 'batch': 2002, 'loss': 7.5185227394104}
{'epoch': 3, 'batch': 2003, 'loss': 7.615769863128662}
{'epoch': 3, 'batch': 2004, 'loss': 7.576144695281982}
{'epoch': 3, 

{'epoch': 3, 'batch': 2136, 'loss': 6.850895404815674}
{'epoch': 3, 'batch': 2137, 'loss': 5.877481937408447}
{'epoch': 3, 'batch': 2138, 'loss': 5.903897285461426}
{'epoch': 3, 'batch': 2139, 'loss': 6.029484272003174}
{'epoch': 3, 'batch': 2140, 'loss': 6.40682315826416}
{'epoch': 3, 'batch': 2141, 'loss': 6.1132493019104}
{'epoch': 3, 'batch': 2142, 'loss': 6.652636528015137}
{'epoch': 3, 'batch': 2143, 'loss': 6.54250955581665}
{'epoch': 3, 'batch': 2144, 'loss': 6.641366481781006}
{'epoch': 3, 'batch': 2145, 'loss': 6.287879467010498}
{'epoch': 3, 'batch': 2146, 'loss': 6.111605167388916}
{'epoch': 3, 'batch': 2147, 'loss': 6.453831672668457}
{'epoch': 3, 'batch': 2148, 'loss': 6.50968074798584}
{'epoch': 3, 'batch': 2149, 'loss': 6.2736101150512695}
{'epoch': 3, 'batch': 2150, 'loss': 5.993146896362305}
{'epoch': 3, 'batch': 2151, 'loss': 6.1868696212768555}
{'epoch': 3, 'batch': 2152, 'loss': 6.11737585067749}
{'epoch': 3, 'batch': 2153, 'loss': 6.139668941497803}
{'epoch': 3, '

{'epoch': 3, 'batch': 2287, 'loss': 6.035262107849121}
{'epoch': 3, 'batch': 2288, 'loss': 6.144853115081787}
{'epoch': 3, 'batch': 2289, 'loss': 6.233171463012695}
{'epoch': 3, 'batch': 2290, 'loss': 6.585267543792725}
{'epoch': 3, 'batch': 2291, 'loss': 6.801639556884766}
{'epoch': 3, 'batch': 2292, 'loss': 6.48644495010376}
{'epoch': 3, 'batch': 2293, 'loss': 5.9295501708984375}
{'epoch': 3, 'batch': 2294, 'loss': 5.7302021980285645}
{'epoch': 3, 'batch': 2295, 'loss': 5.818224906921387}
{'epoch': 3, 'batch': 2296, 'loss': 6.066648960113525}
{'epoch': 3, 'batch': 2297, 'loss': 6.678167819976807}
{'epoch': 3, 'batch': 2298, 'loss': 6.209018230438232}
{'epoch': 3, 'batch': 2299, 'loss': 6.384395122528076}
{'epoch': 3, 'batch': 2300, 'loss': 7.064815521240234}
{'epoch': 3, 'batch': 2301, 'loss': 6.0839128494262695}
{'epoch': 3, 'batch': 2302, 'loss': 6.506166934967041}
{'epoch': 3, 'batch': 2303, 'loss': 6.843400478363037}
{'epoch': 3, 'batch': 2304, 'loss': 6.163460731506348}
{'epoch'

{'epoch': 3, 'batch': 2436, 'loss': 6.439537525177002}
{'epoch': 3, 'batch': 2437, 'loss': 5.565046310424805}
{'epoch': 3, 'batch': 2438, 'loss': 5.572473526000977}
{'epoch': 3, 'batch': 2439, 'loss': 6.14528751373291}
{'epoch': 3, 'batch': 2440, 'loss': 5.980588912963867}
{'epoch': 3, 'batch': 2441, 'loss': 6.186740398406982}
{'epoch': 3, 'batch': 2442, 'loss': 6.08486270904541}
{'epoch': 3, 'batch': 2443, 'loss': 5.997420787811279}
{'epoch': 3, 'batch': 2444, 'loss': 6.157392978668213}
{'epoch': 3, 'batch': 2445, 'loss': 6.291532039642334}
{'epoch': 3, 'batch': 2446, 'loss': 5.52788782119751}
{'epoch': 3, 'batch': 2447, 'loss': 5.719315052032471}
{'epoch': 3, 'batch': 2448, 'loss': 5.637228488922119}
{'epoch': 3, 'batch': 2449, 'loss': 5.66337251663208}
{'epoch': 3, 'batch': 2450, 'loss': 6.11256742477417}
{'epoch': 3, 'batch': 2451, 'loss': 6.638819694519043}
{'epoch': 3, 'batch': 2452, 'loss': 5.697880744934082}
{'epoch': 3, 'batch': 2453, 'loss': 6.345722675323486}
{'epoch': 3, 'b

{'epoch': 3, 'batch': 2589, 'loss': 5.207226276397705}
{'epoch': 3, 'batch': 2590, 'loss': 6.793753623962402}
{'epoch': 3, 'batch': 2591, 'loss': 5.530970096588135}
{'epoch': 3, 'batch': 2592, 'loss': 5.670032978057861}
{'epoch': 3, 'batch': 2593, 'loss': 5.451245307922363}
{'epoch': 3, 'batch': 2594, 'loss': 5.768444061279297}
{'epoch': 3, 'batch': 2595, 'loss': 5.887015342712402}
{'epoch': 3, 'batch': 2596, 'loss': 5.903226852416992}
{'epoch': 3, 'batch': 2597, 'loss': 5.736752033233643}
{'epoch': 3, 'batch': 2598, 'loss': 5.735998153686523}
{'epoch': 3, 'batch': 2599, 'loss': 5.50499963760376}
{'epoch': 3, 'batch': 2600, 'loss': 5.442262649536133}
{'epoch': 3, 'batch': 2601, 'loss': 5.756976127624512}
{'epoch': 3, 'batch': 2602, 'loss': 5.966662883758545}
{'epoch': 3, 'batch': 2603, 'loss': 5.323819637298584}
{'epoch': 3, 'batch': 2604, 'loss': 6.128751277923584}
{'epoch': 3, 'batch': 2605, 'loss': 6.046318531036377}
{'epoch': 3, 'batch': 2606, 'loss': 6.486385345458984}
{'epoch': 3

{'epoch': 3, 'batch': 2741, 'loss': 5.80327033996582}
{'epoch': 3, 'batch': 2742, 'loss': 6.599050045013428}
{'epoch': 3, 'batch': 2743, 'loss': 6.487052917480469}
{'epoch': 3, 'batch': 2744, 'loss': 5.625962257385254}
{'epoch': 3, 'batch': 2745, 'loss': 6.079082012176514}
{'epoch': 3, 'batch': 2746, 'loss': 5.920795917510986}
{'epoch': 3, 'batch': 2747, 'loss': 5.365532398223877}
{'epoch': 3, 'batch': 2748, 'loss': 5.919116973876953}
{'epoch': 3, 'batch': 2749, 'loss': 5.557957172393799}
{'epoch': 3, 'batch': 2750, 'loss': 5.415548324584961}
{'epoch': 3, 'batch': 2751, 'loss': 5.797157287597656}
{'epoch': 3, 'batch': 2752, 'loss': 5.456399917602539}
{'epoch': 3, 'batch': 2753, 'loss': 5.472732067108154}
{'epoch': 3, 'batch': 2754, 'loss': 5.275506019592285}
{'epoch': 3, 'batch': 2755, 'loss': 5.4303812980651855}
{'epoch': 3, 'batch': 2756, 'loss': 5.177780628204346}
{'epoch': 3, 'batch': 2757, 'loss': 5.889474868774414}
{'epoch': 3, 'batch': 2758, 'loss': 5.784592628479004}
{'epoch': 

{'epoch': 3, 'batch': 2891, 'loss': 5.049684524536133}
{'epoch': 3, 'batch': 2892, 'loss': 5.533864498138428}
{'epoch': 3, 'batch': 2893, 'loss': 6.498661994934082}
{'epoch': 3, 'batch': 2894, 'loss': 5.735424041748047}
{'epoch': 3, 'batch': 2895, 'loss': 5.956735134124756}
{'epoch': 3, 'batch': 2896, 'loss': 5.784360885620117}
{'epoch': 3, 'batch': 2897, 'loss': 6.086148262023926}
{'epoch': 3, 'batch': 2898, 'loss': 4.917232990264893}
{'epoch': 3, 'batch': 2899, 'loss': 4.971173286437988}
{'epoch': 3, 'batch': 2900, 'loss': 5.715465545654297}
{'epoch': 3, 'batch': 2901, 'loss': 6.830348968505859}
{'epoch': 3, 'batch': 2902, 'loss': 5.641127586364746}
{'epoch': 3, 'batch': 2903, 'loss': 5.562127113342285}
{'epoch': 3, 'batch': 2904, 'loss': 5.654287338256836}
{'epoch': 3, 'batch': 2905, 'loss': 5.7389984130859375}
{'epoch': 3, 'batch': 2906, 'loss': 5.951582431793213}
{'epoch': 3, 'batch': 2907, 'loss': 6.023876667022705}
{'epoch': 3, 'batch': 2908, 'loss': 6.506661891937256}
{'epoch':

{'epoch': 3, 'batch': 3042, 'loss': 5.063589572906494}
{'epoch': 3, 'batch': 3043, 'loss': 6.075110912322998}
{'epoch': 3, 'batch': 3044, 'loss': 6.850499153137207}
{'epoch': 3, 'batch': 3045, 'loss': 7.00562858581543}
{'epoch': 3, 'batch': 3046, 'loss': 6.876002788543701}
{'epoch': 3, 'batch': 3047, 'loss': 6.639073848724365}
{'epoch': 3, 'batch': 3048, 'loss': 6.364744663238525}
{'epoch': 3, 'batch': 3049, 'loss': 6.469272613525391}
{'epoch': 3, 'batch': 3050, 'loss': 6.288671970367432}
{'epoch': 3, 'batch': 3051, 'loss': 5.821532249450684}
{'epoch': 3, 'batch': 3052, 'loss': 6.999094486236572}
{'epoch': 3, 'batch': 3053, 'loss': 6.876782417297363}
{'epoch': 3, 'batch': 3054, 'loss': 6.533671855926514}
{'epoch': 3, 'batch': 3055, 'loss': 6.441004753112793}
{'epoch': 3, 'batch': 3056, 'loss': 5.773924350738525}
{'epoch': 3, 'batch': 3057, 'loss': 6.611817836761475}
{'epoch': 3, 'batch': 3058, 'loss': 7.173333644866943}
{'epoch': 3, 'batch': 3059, 'loss': 6.811600208282471}
{'epoch': 3

{'epoch': 3, 'batch': 3192, 'loss': 6.115887641906738}
{'epoch': 3, 'batch': 3193, 'loss': 6.893001079559326}
{'epoch': 3, 'batch': 3194, 'loss': 5.8917388916015625}
{'epoch': 3, 'batch': 3195, 'loss': 6.9996867179870605}
{'epoch': 3, 'batch': 3196, 'loss': 6.35768985748291}
{'epoch': 3, 'batch': 3197, 'loss': 6.251112461090088}
{'epoch': 3, 'batch': 3198, 'loss': 5.942107200622559}
{'epoch': 3, 'batch': 3199, 'loss': 6.086304187774658}
{'epoch': 3, 'batch': 3200, 'loss': 6.01505708694458}
{'epoch': 3, 'batch': 3201, 'loss': 6.4305739402771}
{'epoch': 3, 'batch': 3202, 'loss': 5.63813591003418}
{'epoch': 3, 'batch': 3203, 'loss': 5.844542503356934}
{'epoch': 3, 'batch': 3204, 'loss': 6.067041873931885}
{'epoch': 3, 'batch': 3205, 'loss': 5.862354278564453}
{'epoch': 3, 'batch': 3206, 'loss': 6.29049825668335}
{'epoch': 3, 'batch': 3207, 'loss': 6.631120204925537}
{'epoch': 3, 'batch': 3208, 'loss': 5.835613250732422}
{'epoch': 3, 'batch': 3209, 'loss': 6.013215065002441}
{'epoch': 3, '

{'epoch': 3, 'batch': 3344, 'loss': 6.0640082359313965}
{'epoch': 3, 'batch': 3345, 'loss': 5.975852012634277}
{'epoch': 3, 'batch': 3346, 'loss': 6.096653938293457}
{'epoch': 3, 'batch': 3347, 'loss': 6.881768226623535}
{'epoch': 3, 'batch': 3348, 'loss': 6.706209659576416}
{'epoch': 3, 'batch': 3349, 'loss': 5.976603031158447}
{'epoch': 3, 'batch': 3350, 'loss': 5.785846710205078}
{'epoch': 3, 'batch': 3351, 'loss': 5.612887382507324}
{'epoch': 3, 'batch': 3352, 'loss': 6.284054279327393}
{'epoch': 3, 'batch': 3353, 'loss': 6.305502414703369}
{'epoch': 3, 'batch': 3354, 'loss': 5.731723308563232}
{'epoch': 3, 'batch': 3355, 'loss': 5.507810592651367}
{'epoch': 3, 'batch': 3356, 'loss': 5.730266094207764}
{'epoch': 3, 'batch': 3357, 'loss': 6.441444396972656}
{'epoch': 3, 'batch': 3358, 'loss': 6.510507583618164}
{'epoch': 3, 'batch': 3359, 'loss': 6.895079612731934}
{'epoch': 3, 'batch': 3360, 'loss': 6.768777847290039}
{'epoch': 3, 'batch': 3361, 'loss': 6.341531753540039}
{'epoch':

{'epoch': 3, 'batch': 3494, 'loss': 6.407754421234131}
{'epoch': 3, 'batch': 3495, 'loss': 6.165959358215332}
{'epoch': 3, 'batch': 3496, 'loss': 6.23931884765625}
{'epoch': 3, 'batch': 3497, 'loss': 6.198045253753662}
{'epoch': 3, 'batch': 3498, 'loss': 6.109247207641602}
{'epoch': 3, 'batch': 3499, 'loss': 6.440056800842285}
{'epoch': 3, 'batch': 3500, 'loss': 6.618420600891113}
{'epoch': 3, 'batch': 3501, 'loss': 6.233492374420166}
{'epoch': 3, 'batch': 3502, 'loss': 5.8958611488342285}
{'epoch': 3, 'batch': 3503, 'loss': 5.305980205535889}
{'epoch': 3, 'batch': 3504, 'loss': 6.101499080657959}
{'epoch': 3, 'batch': 3505, 'loss': 6.23805046081543}
{'epoch': 3, 'batch': 3506, 'loss': 5.830730438232422}
{'epoch': 3, 'batch': 3507, 'loss': 5.57463264465332}
{'epoch': 3, 'batch': 3508, 'loss': 5.878408432006836}
{'epoch': 3, 'batch': 3509, 'loss': 6.159360408782959}
{'epoch': 3, 'batch': 3510, 'loss': 5.6349310874938965}
{'epoch': 3, 'batch': 3511, 'loss': 6.122389793395996}
{'epoch': 3

{'epoch': 3, 'batch': 3643, 'loss': 6.280032634735107}
{'epoch': 3, 'batch': 3644, 'loss': 6.300113677978516}
{'epoch': 3, 'batch': 3645, 'loss': 5.852411270141602}
{'epoch': 3, 'batch': 3646, 'loss': 5.944094657897949}
{'epoch': 3, 'batch': 3647, 'loss': 5.5241546630859375}
{'epoch': 3, 'batch': 3648, 'loss': 6.466663360595703}
{'epoch': 3, 'batch': 3649, 'loss': 6.447209358215332}
{'epoch': 3, 'batch': 3650, 'loss': 6.222952842712402}
{'epoch': 3, 'batch': 3651, 'loss': 6.148841857910156}
{'epoch': 3, 'batch': 3652, 'loss': 5.500816345214844}
{'epoch': 3, 'batch': 3653, 'loss': 6.039356708526611}
{'epoch': 3, 'batch': 3654, 'loss': 5.750406742095947}
{'epoch': 3, 'batch': 3655, 'loss': 5.632467269897461}
{'epoch': 3, 'batch': 3656, 'loss': 6.19314432144165}
{'epoch': 3, 'batch': 3657, 'loss': 5.674639701843262}
{'epoch': 3, 'batch': 3658, 'loss': 5.769845485687256}
{'epoch': 3, 'batch': 3659, 'loss': 5.828953742980957}
{'epoch': 3, 'batch': 3660, 'loss': 5.887363910675049}
{'epoch': 

{'epoch': 4, 'batch': 20, 'loss': 6.719165325164795}
{'epoch': 4, 'batch': 21, 'loss': 6.181750774383545}
{'epoch': 4, 'batch': 22, 'loss': 5.921290397644043}
{'epoch': 4, 'batch': 23, 'loss': 6.580654144287109}
{'epoch': 4, 'batch': 24, 'loss': 5.823391914367676}
{'epoch': 4, 'batch': 25, 'loss': 6.30499792098999}
{'epoch': 4, 'batch': 26, 'loss': 6.1855692863464355}
{'epoch': 4, 'batch': 27, 'loss': 6.098571300506592}
{'epoch': 4, 'batch': 28, 'loss': 5.709776401519775}
{'epoch': 4, 'batch': 29, 'loss': 5.510692119598389}
{'epoch': 4, 'batch': 30, 'loss': 5.581708908081055}
{'epoch': 4, 'batch': 31, 'loss': 5.5591864585876465}
{'epoch': 4, 'batch': 32, 'loss': 5.4802703857421875}
{'epoch': 4, 'batch': 33, 'loss': 6.176702976226807}
{'epoch': 4, 'batch': 34, 'loss': 5.85349702835083}
{'epoch': 4, 'batch': 35, 'loss': 6.728744029998779}
{'epoch': 4, 'batch': 36, 'loss': 6.3816938400268555}
{'epoch': 4, 'batch': 37, 'loss': 4.97686243057251}
{'epoch': 4, 'batch': 38, 'loss': 5.677440643

{'epoch': 4, 'batch': 173, 'loss': 5.938984394073486}
{'epoch': 4, 'batch': 174, 'loss': 6.399356365203857}
{'epoch': 4, 'batch': 175, 'loss': 6.070921421051025}
{'epoch': 4, 'batch': 176, 'loss': 5.838063716888428}
{'epoch': 4, 'batch': 177, 'loss': 6.255412578582764}
{'epoch': 4, 'batch': 178, 'loss': 6.148855209350586}
{'epoch': 4, 'batch': 179, 'loss': 6.418071269989014}
{'epoch': 4, 'batch': 180, 'loss': 5.582740306854248}
{'epoch': 4, 'batch': 181, 'loss': 5.500864028930664}
{'epoch': 4, 'batch': 182, 'loss': 6.32293701171875}
{'epoch': 4, 'batch': 183, 'loss': 5.4662251472473145}
{'epoch': 4, 'batch': 184, 'loss': 5.3243842124938965}
{'epoch': 4, 'batch': 185, 'loss': 6.283802509307861}
{'epoch': 4, 'batch': 186, 'loss': 6.2962141036987305}
{'epoch': 4, 'batch': 187, 'loss': 5.668374538421631}
{'epoch': 4, 'batch': 188, 'loss': 6.255129337310791}
{'epoch': 4, 'batch': 189, 'loss': 5.758264541625977}
{'epoch': 4, 'batch': 190, 'loss': 7.853882789611816}
{'epoch': 4, 'batch': 191,

{'epoch': 4, 'batch': 327, 'loss': 5.718478202819824}
{'epoch': 4, 'batch': 328, 'loss': 6.287816524505615}
{'epoch': 4, 'batch': 329, 'loss': 6.529379844665527}
{'epoch': 4, 'batch': 330, 'loss': 5.167145252227783}
{'epoch': 4, 'batch': 331, 'loss': 5.764450550079346}
{'epoch': 4, 'batch': 332, 'loss': 6.7088141441345215}
{'epoch': 4, 'batch': 333, 'loss': 8.399845123291016}
{'epoch': 4, 'batch': 334, 'loss': 7.584041118621826}
{'epoch': 4, 'batch': 335, 'loss': 6.625192642211914}
{'epoch': 4, 'batch': 336, 'loss': 6.35887336730957}
{'epoch': 4, 'batch': 337, 'loss': 6.228351593017578}
{'epoch': 4, 'batch': 338, 'loss': 6.456766605377197}
{'epoch': 4, 'batch': 339, 'loss': 6.266656875610352}
{'epoch': 4, 'batch': 340, 'loss': 6.796267509460449}
{'epoch': 4, 'batch': 341, 'loss': 7.004884243011475}
{'epoch': 4, 'batch': 342, 'loss': 6.1092023849487305}
{'epoch': 4, 'batch': 343, 'loss': 5.859723091125488}
{'epoch': 4, 'batch': 344, 'loss': 6.04577112197876}
{'epoch': 4, 'batch': 345, '

{'epoch': 4, 'batch': 479, 'loss': 6.1111907958984375}
{'epoch': 4, 'batch': 480, 'loss': 6.085197925567627}
{'epoch': 4, 'batch': 481, 'loss': 6.058331489562988}
{'epoch': 4, 'batch': 482, 'loss': 6.242053508758545}
{'epoch': 4, 'batch': 483, 'loss': 6.73619270324707}
{'epoch': 4, 'batch': 484, 'loss': 6.096060276031494}
{'epoch': 4, 'batch': 485, 'loss': 6.375153541564941}
{'epoch': 4, 'batch': 486, 'loss': 5.992958068847656}
{'epoch': 4, 'batch': 487, 'loss': 6.12779426574707}
{'epoch': 4, 'batch': 488, 'loss': 6.050503253936768}
{'epoch': 4, 'batch': 489, 'loss': 6.532419681549072}
{'epoch': 4, 'batch': 490, 'loss': 5.691964626312256}
{'epoch': 4, 'batch': 491, 'loss': 5.192493438720703}
{'epoch': 4, 'batch': 492, 'loss': 5.441068172454834}
{'epoch': 4, 'batch': 493, 'loss': 7.066584587097168}
{'epoch': 4, 'batch': 494, 'loss': 7.293368816375732}
{'epoch': 4, 'batch': 495, 'loss': 5.441874027252197}
{'epoch': 4, 'batch': 496, 'loss': 5.161386966705322}
{'epoch': 4, 'batch': 497, 'l

{'epoch': 4, 'batch': 633, 'loss': 6.112220287322998}
{'epoch': 4, 'batch': 634, 'loss': 6.200181007385254}
{'epoch': 4, 'batch': 635, 'loss': 5.52899169921875}
{'epoch': 4, 'batch': 636, 'loss': 5.150089740753174}
{'epoch': 4, 'batch': 637, 'loss': 5.475639820098877}
{'epoch': 4, 'batch': 638, 'loss': 5.71673059463501}
{'epoch': 4, 'batch': 639, 'loss': 5.591248989105225}
{'epoch': 4, 'batch': 640, 'loss': 5.37722635269165}
{'epoch': 4, 'batch': 641, 'loss': 6.161446571350098}
{'epoch': 4, 'batch': 642, 'loss': 5.3451104164123535}
{'epoch': 4, 'batch': 643, 'loss': 5.843561172485352}
{'epoch': 4, 'batch': 644, 'loss': 6.207123756408691}
{'epoch': 4, 'batch': 645, 'loss': 5.0630316734313965}
{'epoch': 4, 'batch': 646, 'loss': 5.489180088043213}
{'epoch': 4, 'batch': 647, 'loss': 5.748842716217041}
{'epoch': 4, 'batch': 648, 'loss': 5.634274005889893}
{'epoch': 4, 'batch': 649, 'loss': 6.661912441253662}
{'epoch': 4, 'batch': 650, 'loss': 6.313178062438965}
{'epoch': 4, 'batch': 651, 'l

{'epoch': 4, 'batch': 786, 'loss': 5.7616658210754395}
{'epoch': 4, 'batch': 787, 'loss': 6.011611461639404}
{'epoch': 4, 'batch': 788, 'loss': 5.968770503997803}
{'epoch': 4, 'batch': 789, 'loss': 5.764533042907715}
{'epoch': 4, 'batch': 790, 'loss': 6.375676155090332}
{'epoch': 4, 'batch': 791, 'loss': 7.349573612213135}
{'epoch': 4, 'batch': 792, 'loss': 7.609734058380127}
{'epoch': 4, 'batch': 793, 'loss': 7.760096073150635}
{'epoch': 4, 'batch': 794, 'loss': 7.0438551902771}
{'epoch': 4, 'batch': 795, 'loss': 7.0291571617126465}
{'epoch': 4, 'batch': 796, 'loss': 6.544581413269043}
{'epoch': 4, 'batch': 797, 'loss': 6.797529220581055}
{'epoch': 4, 'batch': 798, 'loss': 6.8650431632995605}
{'epoch': 4, 'batch': 799, 'loss': 6.724052429199219}
{'epoch': 4, 'batch': 800, 'loss': 5.749730110168457}
{'epoch': 4, 'batch': 801, 'loss': 6.278954029083252}
{'epoch': 4, 'batch': 802, 'loss': 6.34155797958374}
{'epoch': 4, 'batch': 803, 'loss': 6.205164432525635}
{'epoch': 4, 'batch': 804, '

{'epoch': 4, 'batch': 941, 'loss': 6.181589126586914}
{'epoch': 4, 'batch': 942, 'loss': 6.107185363769531}
{'epoch': 4, 'batch': 943, 'loss': 5.9935760498046875}
{'epoch': 4, 'batch': 944, 'loss': 5.692431926727295}
{'epoch': 4, 'batch': 945, 'loss': 6.25503396987915}
{'epoch': 4, 'batch': 946, 'loss': 5.998048782348633}
{'epoch': 4, 'batch': 947, 'loss': 5.595582485198975}
{'epoch': 4, 'batch': 948, 'loss': 5.401336193084717}
{'epoch': 4, 'batch': 949, 'loss': 5.972549915313721}
{'epoch': 4, 'batch': 950, 'loss': 6.103459358215332}
{'epoch': 4, 'batch': 951, 'loss': 6.058720111846924}
{'epoch': 4, 'batch': 952, 'loss': 5.500269889831543}
{'epoch': 4, 'batch': 953, 'loss': 5.928187370300293}
{'epoch': 4, 'batch': 954, 'loss': 5.493486404418945}
{'epoch': 4, 'batch': 955, 'loss': 5.343135833740234}
{'epoch': 4, 'batch': 956, 'loss': 5.184942245483398}
{'epoch': 4, 'batch': 957, 'loss': 6.086977481842041}
{'epoch': 4, 'batch': 958, 'loss': 6.035437107086182}
{'epoch': 4, 'batch': 959, '

{'epoch': 4, 'batch': 1093, 'loss': 5.85374116897583}
{'epoch': 4, 'batch': 1094, 'loss': 5.385529041290283}
{'epoch': 4, 'batch': 1095, 'loss': 5.227725505828857}
{'epoch': 4, 'batch': 1096, 'loss': 5.5549445152282715}
{'epoch': 4, 'batch': 1097, 'loss': 5.83290958404541}
{'epoch': 4, 'batch': 1098, 'loss': 5.2785186767578125}
{'epoch': 4, 'batch': 1099, 'loss': 5.850844860076904}
{'epoch': 4, 'batch': 1100, 'loss': 5.775039196014404}
{'epoch': 4, 'batch': 1101, 'loss': 6.354054927825928}
{'epoch': 4, 'batch': 1102, 'loss': 6.157170295715332}
{'epoch': 4, 'batch': 1103, 'loss': 6.187958240509033}
{'epoch': 4, 'batch': 1104, 'loss': 6.342496871948242}
{'epoch': 4, 'batch': 1105, 'loss': 5.950008869171143}
{'epoch': 4, 'batch': 1106, 'loss': 5.465403079986572}
{'epoch': 4, 'batch': 1107, 'loss': 5.384315013885498}
{'epoch': 4, 'batch': 1108, 'loss': 5.753208637237549}
{'epoch': 4, 'batch': 1109, 'loss': 6.026994228363037}
{'epoch': 4, 'batch': 1110, 'loss': 6.075556755065918}
{'epoch': 

{'epoch': 4, 'batch': 1243, 'loss': 5.76319694519043}
{'epoch': 4, 'batch': 1244, 'loss': 5.839755535125732}
{'epoch': 4, 'batch': 1245, 'loss': 5.799349784851074}
{'epoch': 4, 'batch': 1246, 'loss': 6.109659671783447}
{'epoch': 4, 'batch': 1247, 'loss': 6.151256084442139}
{'epoch': 4, 'batch': 1248, 'loss': 6.1294450759887695}
{'epoch': 4, 'batch': 1249, 'loss': 6.296408653259277}
{'epoch': 4, 'batch': 1250, 'loss': 6.508233547210693}
{'epoch': 4, 'batch': 1251, 'loss': 6.040531635284424}
{'epoch': 4, 'batch': 1252, 'loss': 5.885573863983154}
{'epoch': 4, 'batch': 1253, 'loss': 6.079439163208008}
{'epoch': 4, 'batch': 1254, 'loss': 5.880625247955322}
{'epoch': 4, 'batch': 1255, 'loss': 5.725348472595215}
{'epoch': 4, 'batch': 1256, 'loss': 5.947597980499268}
{'epoch': 4, 'batch': 1257, 'loss': 5.835313320159912}
{'epoch': 4, 'batch': 1258, 'loss': 5.62214994430542}
{'epoch': 4, 'batch': 1259, 'loss': 5.563837051391602}
{'epoch': 4, 'batch': 1260, 'loss': 5.619099140167236}
{'epoch': 4

{'epoch': 4, 'batch': 1393, 'loss': 5.6215667724609375}
{'epoch': 4, 'batch': 1394, 'loss': 5.784626007080078}
{'epoch': 4, 'batch': 1395, 'loss': 5.5641961097717285}
{'epoch': 4, 'batch': 1396, 'loss': 4.902196407318115}
{'epoch': 4, 'batch': 1397, 'loss': 5.7226948738098145}
{'epoch': 4, 'batch': 1398, 'loss': 5.939187526702881}
{'epoch': 4, 'batch': 1399, 'loss': 6.331010341644287}
{'epoch': 4, 'batch': 1400, 'loss': 5.4116997718811035}
{'epoch': 4, 'batch': 1401, 'loss': 5.8124494552612305}
{'epoch': 4, 'batch': 1402, 'loss': 5.09049129486084}
{'epoch': 4, 'batch': 1403, 'loss': 5.545393466949463}
{'epoch': 4, 'batch': 1404, 'loss': 5.832328796386719}
{'epoch': 4, 'batch': 1405, 'loss': 6.110779285430908}
{'epoch': 4, 'batch': 1406, 'loss': 6.441680431365967}
{'epoch': 4, 'batch': 1407, 'loss': 6.057251453399658}
{'epoch': 4, 'batch': 1408, 'loss': 5.222280025482178}
{'epoch': 4, 'batch': 1409, 'loss': 5.553946495056152}
{'epoch': 4, 'batch': 1410, 'loss': 4.905237674713135}
{'epoc

{'epoch': 4, 'batch': 1545, 'loss': 6.128234386444092}
{'epoch': 4, 'batch': 1546, 'loss': 6.175671577453613}
{'epoch': 4, 'batch': 1547, 'loss': 6.841748237609863}
{'epoch': 4, 'batch': 1548, 'loss': 6.790261268615723}
{'epoch': 4, 'batch': 1549, 'loss': 5.629034996032715}
{'epoch': 4, 'batch': 1550, 'loss': 5.912144184112549}
{'epoch': 4, 'batch': 1551, 'loss': 5.579713344573975}
{'epoch': 4, 'batch': 1552, 'loss': 5.444249629974365}
{'epoch': 4, 'batch': 1553, 'loss': 7.286346435546875}
{'epoch': 4, 'batch': 1554, 'loss': 7.6722331047058105}
{'epoch': 4, 'batch': 1555, 'loss': 6.097836017608643}
{'epoch': 4, 'batch': 1556, 'loss': 5.358682632446289}
{'epoch': 4, 'batch': 1557, 'loss': 5.887968063354492}
{'epoch': 4, 'batch': 1558, 'loss': 6.066075325012207}
{'epoch': 4, 'batch': 1559, 'loss': 5.961949348449707}
{'epoch': 4, 'batch': 1560, 'loss': 5.8348069190979}
{'epoch': 4, 'batch': 1561, 'loss': 5.976400852203369}
{'epoch': 4, 'batch': 1562, 'loss': 5.963911533355713}
{'epoch': 4

{'epoch': 4, 'batch': 1698, 'loss': 6.040665149688721}
{'epoch': 4, 'batch': 1699, 'loss': 5.8183417320251465}
{'epoch': 4, 'batch': 1700, 'loss': 5.966440200805664}
{'epoch': 4, 'batch': 1701, 'loss': 5.953341484069824}
{'epoch': 4, 'batch': 1702, 'loss': 5.949711322784424}
{'epoch': 4, 'batch': 1703, 'loss': 5.782787799835205}
{'epoch': 4, 'batch': 1704, 'loss': 6.071255683898926}
{'epoch': 4, 'batch': 1705, 'loss': 6.212284088134766}
{'epoch': 4, 'batch': 1706, 'loss': 6.254525184631348}
{'epoch': 4, 'batch': 1707, 'loss': 6.077681064605713}
{'epoch': 4, 'batch': 1708, 'loss': 6.124300479888916}
{'epoch': 4, 'batch': 1709, 'loss': 5.821528434753418}
{'epoch': 4, 'batch': 1710, 'loss': 5.220477104187012}
{'epoch': 4, 'batch': 1711, 'loss': 5.848947048187256}
{'epoch': 4, 'batch': 1712, 'loss': 5.509692192077637}
{'epoch': 4, 'batch': 1713, 'loss': 6.326328754425049}
{'epoch': 4, 'batch': 1714, 'loss': 6.123575210571289}
{'epoch': 4, 'batch': 1715, 'loss': 6.050657272338867}
{'epoch':

{'epoch': 4, 'batch': 1847, 'loss': 6.196948528289795}
{'epoch': 4, 'batch': 1848, 'loss': 5.589346408843994}
{'epoch': 4, 'batch': 1849, 'loss': 6.089584827423096}
{'epoch': 4, 'batch': 1850, 'loss': 5.972006320953369}
{'epoch': 4, 'batch': 1851, 'loss': 6.257978916168213}
{'epoch': 4, 'batch': 1852, 'loss': 7.27374792098999}
{'epoch': 4, 'batch': 1853, 'loss': 7.366100311279297}
{'epoch': 4, 'batch': 1854, 'loss': 7.197788715362549}
{'epoch': 4, 'batch': 1855, 'loss': 7.0908660888671875}
{'epoch': 4, 'batch': 1856, 'loss': 6.039734840393066}
{'epoch': 4, 'batch': 1857, 'loss': 5.580562114715576}
{'epoch': 4, 'batch': 1858, 'loss': 5.960930347442627}
{'epoch': 4, 'batch': 1859, 'loss': 6.032615661621094}
{'epoch': 4, 'batch': 1860, 'loss': 6.40165376663208}
{'epoch': 4, 'batch': 1861, 'loss': 5.896892547607422}
{'epoch': 4, 'batch': 1862, 'loss': 5.730116844177246}
{'epoch': 4, 'batch': 1863, 'loss': 6.211866855621338}
{'epoch': 4, 'batch': 1864, 'loss': 6.666449546813965}
{'epoch': 4

{'epoch': 4, 'batch': 1996, 'loss': 5.5133466720581055}
{'epoch': 4, 'batch': 1997, 'loss': 5.989556312561035}
{'epoch': 4, 'batch': 1998, 'loss': 5.510376930236816}
{'epoch': 4, 'batch': 1999, 'loss': 5.471424102783203}
{'epoch': 4, 'batch': 2000, 'loss': 5.85837459564209}
{'epoch': 4, 'batch': 2001, 'loss': 6.9870476722717285}
{'epoch': 4, 'batch': 2002, 'loss': 7.07806396484375}
{'epoch': 4, 'batch': 2003, 'loss': 7.176910877227783}
{'epoch': 4, 'batch': 2004, 'loss': 7.28971529006958}
{'epoch': 4, 'batch': 2005, 'loss': 7.401270866394043}
{'epoch': 4, 'batch': 2006, 'loss': 6.581363677978516}
{'epoch': 4, 'batch': 2007, 'loss': 6.7467875480651855}
{'epoch': 4, 'batch': 2008, 'loss': 7.209377288818359}
{'epoch': 4, 'batch': 2009, 'loss': 6.994245529174805}
{'epoch': 4, 'batch': 2010, 'loss': 7.463185787200928}
{'epoch': 4, 'batch': 2011, 'loss': 7.164472579956055}
{'epoch': 4, 'batch': 2012, 'loss': 6.985316753387451}
{'epoch': 4, 'batch': 2013, 'loss': 7.4130425453186035}
{'epoch':

{'epoch': 4, 'batch': 2148, 'loss': 6.290724754333496}
{'epoch': 4, 'batch': 2149, 'loss': 5.944961071014404}
{'epoch': 4, 'batch': 2150, 'loss': 5.7746262550354}
{'epoch': 4, 'batch': 2151, 'loss': 5.954142093658447}
{'epoch': 4, 'batch': 2152, 'loss': 5.829458236694336}
{'epoch': 4, 'batch': 2153, 'loss': 5.824983596801758}
{'epoch': 4, 'batch': 2154, 'loss': 5.996786594390869}
{'epoch': 4, 'batch': 2155, 'loss': 6.074728012084961}
{'epoch': 4, 'batch': 2156, 'loss': 5.533290386199951}
{'epoch': 4, 'batch': 2157, 'loss': 6.033534049987793}
{'epoch': 4, 'batch': 2158, 'loss': 5.547533988952637}
{'epoch': 4, 'batch': 2159, 'loss': 6.213845252990723}
{'epoch': 4, 'batch': 2160, 'loss': 6.516109466552734}
{'epoch': 4, 'batch': 2161, 'loss': 6.9812846183776855}
{'epoch': 4, 'batch': 2162, 'loss': 7.027193546295166}
{'epoch': 4, 'batch': 2163, 'loss': 6.601016998291016}
{'epoch': 4, 'batch': 2164, 'loss': 6.337875843048096}
{'epoch': 4, 'batch': 2165, 'loss': 6.4296345710754395}
{'epoch': 

{'epoch': 4, 'batch': 2298, 'loss': 5.913097858428955}
{'epoch': 4, 'batch': 2299, 'loss': 6.073812961578369}
{'epoch': 4, 'batch': 2300, 'loss': 6.695265293121338}
{'epoch': 4, 'batch': 2301, 'loss': 5.789983749389648}
{'epoch': 4, 'batch': 2302, 'loss': 6.0838212966918945}
{'epoch': 4, 'batch': 2303, 'loss': 6.305393218994141}
{'epoch': 4, 'batch': 2304, 'loss': 5.847172260284424}
{'epoch': 4, 'batch': 2305, 'loss': 6.361652851104736}
{'epoch': 4, 'batch': 2306, 'loss': 6.048818111419678}
{'epoch': 4, 'batch': 2307, 'loss': 5.743246555328369}
{'epoch': 4, 'batch': 2308, 'loss': 6.161622047424316}
{'epoch': 4, 'batch': 2309, 'loss': 6.175785064697266}
{'epoch': 4, 'batch': 2310, 'loss': 6.506150245666504}
{'epoch': 4, 'batch': 2311, 'loss': 6.149143218994141}
{'epoch': 4, 'batch': 2312, 'loss': 6.030868053436279}
{'epoch': 4, 'batch': 2313, 'loss': 5.945651531219482}
{'epoch': 4, 'batch': 2314, 'loss': 5.714905261993408}
{'epoch': 4, 'batch': 2315, 'loss': 5.844395637512207}
{'epoch':

{'epoch': 4, 'batch': 2448, 'loss': 5.405344486236572}
{'epoch': 4, 'batch': 2449, 'loss': 5.376726150512695}
{'epoch': 4, 'batch': 2450, 'loss': 5.8478827476501465}
{'epoch': 4, 'batch': 2451, 'loss': 6.316363334655762}
{'epoch': 4, 'batch': 2452, 'loss': 5.491703510284424}
{'epoch': 4, 'batch': 2453, 'loss': 5.979736328125}
{'epoch': 4, 'batch': 2454, 'loss': 6.129860877990723}
{'epoch': 4, 'batch': 2455, 'loss': 6.0259809494018555}
{'epoch': 4, 'batch': 2456, 'loss': 7.18901252746582}
{'epoch': 4, 'batch': 2457, 'loss': 7.935705661773682}
{'epoch': 4, 'batch': 2458, 'loss': 7.19127082824707}
{'epoch': 4, 'batch': 2459, 'loss': 7.167922496795654}
{'epoch': 4, 'batch': 2460, 'loss': 7.137440204620361}
{'epoch': 4, 'batch': 2461, 'loss': 6.62991189956665}
{'epoch': 4, 'batch': 2462, 'loss': 5.347125053405762}
{'epoch': 4, 'batch': 2463, 'loss': 6.219272613525391}
{'epoch': 4, 'batch': 2464, 'loss': 6.142777442932129}
{'epoch': 4, 'batch': 2465, 'loss': 5.588547706604004}
{'epoch': 4, '

{'epoch': 4, 'batch': 2600, 'loss': 5.167415142059326}
{'epoch': 4, 'batch': 2601, 'loss': 5.520608901977539}
{'epoch': 4, 'batch': 2602, 'loss': 5.825544834136963}
{'epoch': 4, 'batch': 2603, 'loss': 5.135204315185547}
{'epoch': 4, 'batch': 2604, 'loss': 5.7336955070495605}
{'epoch': 4, 'batch': 2605, 'loss': 5.837814807891846}
{'epoch': 4, 'batch': 2606, 'loss': 6.151981353759766}
{'epoch': 4, 'batch': 2607, 'loss': 5.895366191864014}
{'epoch': 4, 'batch': 2608, 'loss': 5.574573516845703}
{'epoch': 4, 'batch': 2609, 'loss': 5.982388496398926}
{'epoch': 4, 'batch': 2610, 'loss': 6.128531455993652}
{'epoch': 4, 'batch': 2611, 'loss': 5.900626182556152}
{'epoch': 4, 'batch': 2612, 'loss': 8.250710487365723}
{'epoch': 4, 'batch': 2613, 'loss': 6.59326696395874}
{'epoch': 4, 'batch': 2614, 'loss': 6.035560131072998}
{'epoch': 4, 'batch': 2615, 'loss': 5.957092761993408}
{'epoch': 4, 'batch': 2616, 'loss': 5.892221450805664}
{'epoch': 4, 'batch': 2617, 'loss': 5.956878662109375}
{'epoch': 

{'epoch': 4, 'batch': 2751, 'loss': 5.5986328125}
{'epoch': 4, 'batch': 2752, 'loss': 5.147730827331543}
{'epoch': 4, 'batch': 2753, 'loss': 5.072622776031494}
{'epoch': 4, 'batch': 2754, 'loss': 4.961339950561523}
{'epoch': 4, 'batch': 2755, 'loss': 5.109561443328857}
{'epoch': 4, 'batch': 2756, 'loss': 4.838000774383545}
{'epoch': 4, 'batch': 2757, 'loss': 5.6390461921691895}
{'epoch': 4, 'batch': 2758, 'loss': 5.530526161193848}
{'epoch': 4, 'batch': 2759, 'loss': 5.982965469360352}
{'epoch': 4, 'batch': 2760, 'loss': 5.664573669433594}
{'epoch': 4, 'batch': 2761, 'loss': 5.565098762512207}
{'epoch': 4, 'batch': 2762, 'loss': 6.400450229644775}
{'epoch': 4, 'batch': 2763, 'loss': 6.065898895263672}
{'epoch': 4, 'batch': 2764, 'loss': 5.969693660736084}
{'epoch': 4, 'batch': 2765, 'loss': 5.7963337898254395}
{'epoch': 4, 'batch': 2766, 'loss': 5.541714191436768}
{'epoch': 4, 'batch': 2767, 'loss': 5.891071319580078}
{'epoch': 4, 'batch': 2768, 'loss': 5.3426055908203125}
{'epoch': 4,

{'epoch': 4, 'batch': 2904, 'loss': 5.455677509307861}
{'epoch': 4, 'batch': 2905, 'loss': 5.479179859161377}
{'epoch': 4, 'batch': 2906, 'loss': 5.691916465759277}
{'epoch': 4, 'batch': 2907, 'loss': 5.719923973083496}
{'epoch': 4, 'batch': 2908, 'loss': 6.153495788574219}
{'epoch': 4, 'batch': 2909, 'loss': 4.939908027648926}
{'epoch': 4, 'batch': 2910, 'loss': 5.0833353996276855}
{'epoch': 4, 'batch': 2911, 'loss': 5.396860122680664}
{'epoch': 4, 'batch': 2912, 'loss': 5.515893936157227}
{'epoch': 4, 'batch': 2913, 'loss': 5.716860294342041}
{'epoch': 4, 'batch': 2914, 'loss': 5.397049903869629}
{'epoch': 4, 'batch': 2915, 'loss': 6.034738063812256}
{'epoch': 4, 'batch': 2916, 'loss': 5.516171932220459}
{'epoch': 4, 'batch': 2917, 'loss': 5.916342258453369}
{'epoch': 4, 'batch': 2918, 'loss': 5.598189830780029}
{'epoch': 4, 'batch': 2919, 'loss': 4.853462219238281}
{'epoch': 4, 'batch': 2920, 'loss': 5.164191246032715}
{'epoch': 4, 'batch': 2921, 'loss': 5.877126216888428}
{'epoch':

{'epoch': 4, 'batch': 3055, 'loss': 6.025943756103516}
{'epoch': 4, 'batch': 3056, 'loss': 5.366600036621094}
{'epoch': 4, 'batch': 3057, 'loss': 6.34781551361084}
{'epoch': 4, 'batch': 3058, 'loss': 6.636831760406494}
{'epoch': 4, 'batch': 3059, 'loss': 6.306480407714844}
{'epoch': 4, 'batch': 3060, 'loss': 6.295355319976807}
{'epoch': 4, 'batch': 3061, 'loss': 6.618927955627441}
{'epoch': 4, 'batch': 3062, 'loss': 6.769526958465576}
{'epoch': 4, 'batch': 3063, 'loss': 6.460066795349121}
{'epoch': 4, 'batch': 3064, 'loss': 6.261166572570801}
{'epoch': 4, 'batch': 3065, 'loss': 6.32800817489624}
{'epoch': 4, 'batch': 3066, 'loss': 5.901689529418945}
{'epoch': 4, 'batch': 3067, 'loss': 5.610431671142578}
{'epoch': 4, 'batch': 3068, 'loss': 5.829976558685303}
{'epoch': 4, 'batch': 3069, 'loss': 6.722793102264404}
{'epoch': 4, 'batch': 3070, 'loss': 6.18223237991333}
{'epoch': 4, 'batch': 3071, 'loss': 6.1417622566223145}
{'epoch': 4, 'batch': 3072, 'loss': 5.924788475036621}
{'epoch': 4,

{'epoch': 4, 'batch': 3204, 'loss': 5.816235065460205}
{'epoch': 4, 'batch': 3205, 'loss': 5.624451637268066}
{'epoch': 4, 'batch': 3206, 'loss': 5.963412284851074}
{'epoch': 4, 'batch': 3207, 'loss': 6.404632091522217}
{'epoch': 4, 'batch': 3208, 'loss': 5.608288288116455}
{'epoch': 4, 'batch': 3209, 'loss': 5.730771541595459}
{'epoch': 4, 'batch': 3210, 'loss': 5.630805969238281}
{'epoch': 4, 'batch': 3211, 'loss': 5.587834358215332}
{'epoch': 4, 'batch': 3212, 'loss': 5.43795108795166}
{'epoch': 4, 'batch': 3213, 'loss': 4.9879350662231445}
{'epoch': 4, 'batch': 3214, 'loss': 5.5030975341796875}
{'epoch': 4, 'batch': 3215, 'loss': 5.126125335693359}
{'epoch': 4, 'batch': 3216, 'loss': 5.133438587188721}
{'epoch': 4, 'batch': 3217, 'loss': 5.228541374206543}
{'epoch': 4, 'batch': 3218, 'loss': 5.164126396179199}
{'epoch': 4, 'batch': 3219, 'loss': 4.923133850097656}
{'epoch': 4, 'batch': 3220, 'loss': 5.037938594818115}
{'epoch': 4, 'batch': 3221, 'loss': 4.965024948120117}
{'epoch':

{'epoch': 4, 'batch': 3355, 'loss': 5.317140579223633}
{'epoch': 4, 'batch': 3356, 'loss': 5.531874179840088}
{'epoch': 4, 'batch': 3357, 'loss': 6.28314733505249}
{'epoch': 4, 'batch': 3358, 'loss': 6.2672929763793945}
{'epoch': 4, 'batch': 3359, 'loss': 6.660117149353027}
{'epoch': 4, 'batch': 3360, 'loss': 6.49322509765625}
{'epoch': 4, 'batch': 3361, 'loss': 5.996598243713379}
{'epoch': 4, 'batch': 3362, 'loss': 5.656256675720215}
{'epoch': 4, 'batch': 3363, 'loss': 5.788277626037598}
{'epoch': 4, 'batch': 3364, 'loss': 6.335062503814697}
{'epoch': 4, 'batch': 3365, 'loss': 5.693881034851074}
{'epoch': 4, 'batch': 3366, 'loss': 5.527317047119141}
{'epoch': 4, 'batch': 3367, 'loss': 5.1548638343811035}
{'epoch': 4, 'batch': 3368, 'loss': 5.662285327911377}
{'epoch': 4, 'batch': 3369, 'loss': 5.7459588050842285}
{'epoch': 4, 'batch': 3370, 'loss': 5.939892768859863}
{'epoch': 4, 'batch': 3371, 'loss': 5.632442951202393}
{'epoch': 4, 'batch': 3372, 'loss': 5.820050239562988}
{'epoch':

{'epoch': 4, 'batch': 3505, 'loss': 5.95628023147583}
{'epoch': 4, 'batch': 3506, 'loss': 5.597336769104004}
{'epoch': 4, 'batch': 3507, 'loss': 5.432270050048828}
{'epoch': 4, 'batch': 3508, 'loss': 5.616073131561279}
{'epoch': 4, 'batch': 3509, 'loss': 5.7703094482421875}
{'epoch': 4, 'batch': 3510, 'loss': 5.335024833679199}
{'epoch': 4, 'batch': 3511, 'loss': 5.836800575256348}
{'epoch': 4, 'batch': 3512, 'loss': 5.2907915115356445}
{'epoch': 4, 'batch': 3513, 'loss': 5.821338176727295}
{'epoch': 4, 'batch': 3514, 'loss': 6.39607572555542}
{'epoch': 4, 'batch': 3515, 'loss': 6.747711658477783}
{'epoch': 4, 'batch': 3516, 'loss': 6.3356451988220215}
{'epoch': 4, 'batch': 3517, 'loss': 5.810073375701904}
{'epoch': 4, 'batch': 3518, 'loss': 5.857337474822998}
{'epoch': 4, 'batch': 3519, 'loss': 6.08296537399292}
{'epoch': 4, 'batch': 3520, 'loss': 6.354096412658691}
{'epoch': 4, 'batch': 3521, 'loss': 6.2359418869018555}
{'epoch': 4, 'batch': 3522, 'loss': 5.7119269371032715}
{'epoch'

{'epoch': 4, 'batch': 3655, 'loss': 5.38243293762207}
{'epoch': 4, 'batch': 3656, 'loss': 5.903055667877197}
{'epoch': 4, 'batch': 3657, 'loss': 5.45587158203125}
{'epoch': 4, 'batch': 3658, 'loss': 5.520533561706543}
{'epoch': 4, 'batch': 3659, 'loss': 5.610815048217773}
{'epoch': 4, 'batch': 3660, 'loss': 5.618457317352295}
{'epoch': 4, 'batch': 3661, 'loss': 6.107969760894775}
{'epoch': 4, 'batch': 3662, 'loss': 5.866027355194092}
{'epoch': 4, 'batch': 3663, 'loss': 5.348288059234619}
{'epoch': 4, 'batch': 3664, 'loss': 5.382282257080078}
{'epoch': 4, 'batch': 3665, 'loss': 5.217879295349121}
{'epoch': 4, 'batch': 3666, 'loss': 5.5408501625061035}
{'epoch': 4, 'batch': 3667, 'loss': 5.208876609802246}
{'epoch': 4, 'batch': 3668, 'loss': 5.090547561645508}
{'epoch': 4, 'batch': 3669, 'loss': 5.248714923858643}
{'epoch': 4, 'batch': 3670, 'loss': 5.367993354797363}
{'epoch': 4, 'batch': 3671, 'loss': 4.88938570022583}
{'epoch': 4, 'batch': 3672, 'loss': 6.271346569061279}
{'epoch': 4,

{'epoch': 5, 'batch': 34, 'loss': 5.482319355010986}
{'epoch': 5, 'batch': 35, 'loss': 6.390511512756348}
{'epoch': 5, 'batch': 36, 'loss': 6.028967380523682}
{'epoch': 5, 'batch': 37, 'loss': 4.7538347244262695}
{'epoch': 5, 'batch': 38, 'loss': 5.373221397399902}
{'epoch': 5, 'batch': 39, 'loss': 5.4842753410339355}
{'epoch': 5, 'batch': 40, 'loss': 5.625278472900391}
{'epoch': 5, 'batch': 41, 'loss': 5.868132591247559}
{'epoch': 5, 'batch': 42, 'loss': 5.9913763999938965}
{'epoch': 5, 'batch': 43, 'loss': 5.817534923553467}
{'epoch': 5, 'batch': 44, 'loss': 5.651578903198242}
{'epoch': 5, 'batch': 45, 'loss': 5.791180610656738}
{'epoch': 5, 'batch': 46, 'loss': 5.14236307144165}
{'epoch': 5, 'batch': 47, 'loss': 5.112537860870361}
{'epoch': 5, 'batch': 48, 'loss': 5.614239692687988}
{'epoch': 5, 'batch': 49, 'loss': 5.6284027099609375}
{'epoch': 5, 'batch': 50, 'loss': 5.6941118240356445}
{'epoch': 5, 'batch': 51, 'loss': 5.819752216339111}
{'epoch': 5, 'batch': 52, 'loss': 5.685069

{'epoch': 5, 'batch': 188, 'loss': 5.921205997467041}
{'epoch': 5, 'batch': 189, 'loss': 5.546597957611084}
{'epoch': 5, 'batch': 190, 'loss': 6.816074371337891}
{'epoch': 5, 'batch': 191, 'loss': 6.515635013580322}
{'epoch': 5, 'batch': 192, 'loss': 6.432676315307617}
{'epoch': 5, 'batch': 193, 'loss': 6.089430809020996}
{'epoch': 5, 'batch': 194, 'loss': 5.96179723739624}
{'epoch': 5, 'batch': 195, 'loss': 6.064146041870117}
{'epoch': 5, 'batch': 196, 'loss': 6.567054271697998}
{'epoch': 5, 'batch': 197, 'loss': 5.685592174530029}
{'epoch': 5, 'batch': 198, 'loss': 6.131303787231445}
{'epoch': 5, 'batch': 199, 'loss': 5.970850467681885}
{'epoch': 5, 'batch': 200, 'loss': 5.683557987213135}
{'epoch': 5, 'batch': 201, 'loss': 5.36499547958374}
{'epoch': 5, 'batch': 202, 'loss': 5.907156944274902}
{'epoch': 5, 'batch': 203, 'loss': 6.520281791687012}
{'epoch': 5, 'batch': 204, 'loss': 8.10018539428711}
{'epoch': 5, 'batch': 205, 'loss': 7.108993053436279}
{'epoch': 5, 'batch': 206, 'los

{'epoch': 5, 'batch': 342, 'loss': 5.5011396408081055}
{'epoch': 5, 'batch': 343, 'loss': 5.514440059661865}
{'epoch': 5, 'batch': 344, 'loss': 5.742260932922363}
{'epoch': 5, 'batch': 345, 'loss': 5.634901523590088}
{'epoch': 5, 'batch': 346, 'loss': 6.388907432556152}
{'epoch': 5, 'batch': 347, 'loss': 5.589712619781494}
{'epoch': 5, 'batch': 348, 'loss': 5.5447869300842285}
{'epoch': 5, 'batch': 349, 'loss': 5.812942981719971}
{'epoch': 5, 'batch': 350, 'loss': 5.917237281799316}
{'epoch': 5, 'batch': 351, 'loss': 6.356276035308838}
{'epoch': 5, 'batch': 352, 'loss': 5.843640327453613}
{'epoch': 5, 'batch': 353, 'loss': 5.800678253173828}
{'epoch': 5, 'batch': 354, 'loss': 5.789416313171387}
{'epoch': 5, 'batch': 355, 'loss': 5.49300479888916}
{'epoch': 5, 'batch': 356, 'loss': 5.205914497375488}
{'epoch': 5, 'batch': 357, 'loss': 5.410920143127441}
{'epoch': 5, 'batch': 358, 'loss': 5.708635330200195}
{'epoch': 5, 'batch': 359, 'loss': 5.581864356994629}
{'epoch': 5, 'batch': 360, 

{'epoch': 5, 'batch': 494, 'loss': 6.447071552276611}
{'epoch': 5, 'batch': 495, 'loss': 5.226693630218506}
{'epoch': 5, 'batch': 496, 'loss': 5.052420616149902}
{'epoch': 5, 'batch': 497, 'loss': 5.59923791885376}
{'epoch': 5, 'batch': 498, 'loss': 5.516948699951172}
{'epoch': 5, 'batch': 499, 'loss': 6.518792629241943}
{'epoch': 5, 'batch': 500, 'loss': 6.188634395599365}
{'epoch': 5, 'batch': 501, 'loss': 6.3665900230407715}
{'epoch': 5, 'batch': 502, 'loss': 6.08427619934082}
{'epoch': 5, 'batch': 503, 'loss': 5.5775580406188965}
{'epoch': 5, 'batch': 504, 'loss': 5.086983680725098}
{'epoch': 5, 'batch': 505, 'loss': 6.2534894943237305}
{'epoch': 5, 'batch': 506, 'loss': 6.354430675506592}
{'epoch': 5, 'batch': 507, 'loss': 5.473842620849609}
{'epoch': 5, 'batch': 508, 'loss': 4.886145114898682}
{'epoch': 5, 'batch': 509, 'loss': 5.7363104820251465}
{'epoch': 5, 'batch': 510, 'loss': 5.484658718109131}
{'epoch': 5, 'batch': 511, 'loss': 5.4505934715271}
{'epoch': 5, 'batch': 512, '

{'epoch': 5, 'batch': 648, 'loss': 5.434535026550293}
{'epoch': 5, 'batch': 649, 'loss': 6.464471817016602}
{'epoch': 5, 'batch': 650, 'loss': 6.130917072296143}
{'epoch': 5, 'batch': 651, 'loss': 5.415689468383789}
{'epoch': 5, 'batch': 652, 'loss': 5.114977836608887}
{'epoch': 5, 'batch': 653, 'loss': 5.090065002441406}
{'epoch': 5, 'batch': 654, 'loss': 5.103456974029541}
{'epoch': 5, 'batch': 655, 'loss': 4.777481555938721}
{'epoch': 5, 'batch': 656, 'loss': 5.524743556976318}
{'epoch': 5, 'batch': 657, 'loss': 5.410301208496094}
{'epoch': 5, 'batch': 658, 'loss': 6.220925807952881}
{'epoch': 5, 'batch': 659, 'loss': 7.8038740158081055}
{'epoch': 5, 'batch': 660, 'loss': 6.5522871017456055}
{'epoch': 5, 'batch': 661, 'loss': 6.442020893096924}
{'epoch': 5, 'batch': 662, 'loss': 6.162816524505615}
{'epoch': 5, 'batch': 663, 'loss': 6.077742099761963}
{'epoch': 5, 'batch': 664, 'loss': 7.081706523895264}
{'epoch': 5, 'batch': 665, 'loss': 5.937784194946289}
{'epoch': 5, 'batch': 666,

{'epoch': 5, 'batch': 801, 'loss': 6.055907249450684}
{'epoch': 5, 'batch': 802, 'loss': 6.115963459014893}
{'epoch': 5, 'batch': 803, 'loss': 6.114727973937988}
{'epoch': 5, 'batch': 804, 'loss': 5.53848934173584}
{'epoch': 5, 'batch': 805, 'loss': 6.319539546966553}
{'epoch': 5, 'batch': 806, 'loss': 6.499319553375244}
{'epoch': 5, 'batch': 807, 'loss': 6.150558948516846}
{'epoch': 5, 'batch': 808, 'loss': 6.494077682495117}
{'epoch': 5, 'batch': 809, 'loss': 6.472832679748535}
{'epoch': 5, 'batch': 810, 'loss': 6.240455150604248}
{'epoch': 5, 'batch': 811, 'loss': 6.421339511871338}
{'epoch': 5, 'batch': 812, 'loss': 6.285893440246582}
{'epoch': 5, 'batch': 813, 'loss': 5.966480255126953}
{'epoch': 5, 'batch': 814, 'loss': 6.285790920257568}
{'epoch': 5, 'batch': 815, 'loss': 6.23848819732666}
{'epoch': 5, 'batch': 816, 'loss': 6.524339199066162}
{'epoch': 5, 'batch': 817, 'loss': 6.463489055633545}
{'epoch': 5, 'batch': 818, 'loss': 6.740074634552002}
{'epoch': 5, 'batch': 819, 'lo

{'epoch': 5, 'batch': 954, 'loss': 5.354091644287109}
{'epoch': 5, 'batch': 955, 'loss': 5.222090721130371}
{'epoch': 5, 'batch': 956, 'loss': 5.057047367095947}
{'epoch': 5, 'batch': 957, 'loss': 5.849123477935791}
{'epoch': 5, 'batch': 958, 'loss': 5.7611188888549805}
{'epoch': 5, 'batch': 959, 'loss': 5.65731954574585}
{'epoch': 5, 'batch': 960, 'loss': 5.45059061050415}
{'epoch': 5, 'batch': 961, 'loss': 5.310511589050293}
{'epoch': 5, 'batch': 962, 'loss': 5.408480644226074}
{'epoch': 5, 'batch': 963, 'loss': 5.754936695098877}
{'epoch': 5, 'batch': 964, 'loss': 5.323466777801514}
{'epoch': 5, 'batch': 965, 'loss': 4.298448085784912}
{'epoch': 5, 'batch': 966, 'loss': 5.926344394683838}
{'epoch': 5, 'batch': 967, 'loss': 6.061001777648926}
{'epoch': 5, 'batch': 968, 'loss': 5.201174259185791}
{'epoch': 5, 'batch': 969, 'loss': 5.750490665435791}
{'epoch': 5, 'batch': 970, 'loss': 5.260518550872803}
{'epoch': 5, 'batch': 971, 'loss': 5.551480770111084}
{'epoch': 5, 'batch': 972, 'l

{'epoch': 5, 'batch': 1105, 'loss': 5.620108604431152}
{'epoch': 5, 'batch': 1106, 'loss': 5.119313716888428}
{'epoch': 5, 'batch': 1107, 'loss': 5.129770755767822}
{'epoch': 5, 'batch': 1108, 'loss': 5.430122375488281}
{'epoch': 5, 'batch': 1109, 'loss': 5.611202716827393}
{'epoch': 5, 'batch': 1110, 'loss': 5.7668280601501465}
{'epoch': 5, 'batch': 1111, 'loss': 6.061395645141602}
{'epoch': 5, 'batch': 1112, 'loss': 6.519081115722656}
{'epoch': 5, 'batch': 1113, 'loss': 7.165764331817627}
{'epoch': 5, 'batch': 1114, 'loss': 6.895129680633545}
{'epoch': 5, 'batch': 1115, 'loss': 6.241501331329346}
{'epoch': 5, 'batch': 1116, 'loss': 5.945934772491455}
{'epoch': 5, 'batch': 1117, 'loss': 6.278813362121582}
{'epoch': 5, 'batch': 1118, 'loss': 7.115938186645508}
{'epoch': 5, 'batch': 1119, 'loss': 6.518479347229004}
{'epoch': 5, 'batch': 1120, 'loss': 5.971286296844482}
{'epoch': 5, 'batch': 1121, 'loss': 5.391048908233643}
{'epoch': 5, 'batch': 1122, 'loss': 5.855838298797607}
{'epoch':

{'epoch': 5, 'batch': 1254, 'loss': 5.656641483306885}
{'epoch': 5, 'batch': 1255, 'loss': 5.501211166381836}
{'epoch': 5, 'batch': 1256, 'loss': 5.755012035369873}
{'epoch': 5, 'batch': 1257, 'loss': 5.689028739929199}
{'epoch': 5, 'batch': 1258, 'loss': 5.488682270050049}
{'epoch': 5, 'batch': 1259, 'loss': 5.377028942108154}
{'epoch': 5, 'batch': 1260, 'loss': 5.386782646179199}
{'epoch': 5, 'batch': 1261, 'loss': 6.187207221984863}
{'epoch': 5, 'batch': 1262, 'loss': 5.845005989074707}
{'epoch': 5, 'batch': 1263, 'loss': 6.209606647491455}
{'epoch': 5, 'batch': 1264, 'loss': 5.928184986114502}
{'epoch': 5, 'batch': 1265, 'loss': 5.969420909881592}
{'epoch': 5, 'batch': 1266, 'loss': 5.868595123291016}
{'epoch': 5, 'batch': 1267, 'loss': 5.9478759765625}
{'epoch': 5, 'batch': 1268, 'loss': 5.355594158172607}
{'epoch': 5, 'batch': 1269, 'loss': 5.17825174331665}
{'epoch': 5, 'batch': 1270, 'loss': 5.524675369262695}
{'epoch': 5, 'batch': 1271, 'loss': 5.753059387207031}
{'epoch': 5, 

{'epoch': 5, 'batch': 1405, 'loss': 5.848728179931641}
{'epoch': 5, 'batch': 1406, 'loss': 6.090417385101318}
{'epoch': 5, 'batch': 1407, 'loss': 5.803647041320801}
{'epoch': 5, 'batch': 1408, 'loss': 4.748377799987793}
{'epoch': 5, 'batch': 1409, 'loss': 5.255392074584961}
{'epoch': 5, 'batch': 1410, 'loss': 4.515111446380615}
{'epoch': 5, 'batch': 1411, 'loss': 5.229938983917236}
{'epoch': 5, 'batch': 1412, 'loss': 4.692533016204834}
{'epoch': 5, 'batch': 1413, 'loss': 4.967127799987793}
{'epoch': 5, 'batch': 1414, 'loss': 5.728806018829346}
{'epoch': 5, 'batch': 1415, 'loss': 5.692986011505127}
{'epoch': 5, 'batch': 1416, 'loss': 5.517139911651611}
{'epoch': 5, 'batch': 1417, 'loss': 4.988483905792236}
{'epoch': 5, 'batch': 1418, 'loss': 4.799064636230469}
{'epoch': 5, 'batch': 1419, 'loss': 5.487937927246094}
{'epoch': 5, 'batch': 1420, 'loss': 5.216941833496094}
{'epoch': 5, 'batch': 1421, 'loss': 5.918222904205322}
{'epoch': 5, 'batch': 1422, 'loss': 6.171384811401367}
{'epoch': 

{'epoch': 5, 'batch': 1556, 'loss': 5.091660022735596}
{'epoch': 5, 'batch': 1557, 'loss': 5.670470237731934}
{'epoch': 5, 'batch': 1558, 'loss': 5.870799541473389}
{'epoch': 5, 'batch': 1559, 'loss': 5.687890529632568}
{'epoch': 5, 'batch': 1560, 'loss': 5.633589267730713}
{'epoch': 5, 'batch': 1561, 'loss': 5.666825771331787}
{'epoch': 5, 'batch': 1562, 'loss': 5.780271530151367}
{'epoch': 5, 'batch': 1563, 'loss': 5.707574844360352}
{'epoch': 5, 'batch': 1564, 'loss': 5.699626445770264}
{'epoch': 5, 'batch': 1565, 'loss': 5.570430278778076}
{'epoch': 5, 'batch': 1566, 'loss': 5.6011271476745605}
{'epoch': 5, 'batch': 1567, 'loss': 5.38956880569458}
{'epoch': 5, 'batch': 1568, 'loss': 5.121595859527588}
{'epoch': 5, 'batch': 1569, 'loss': 5.403183460235596}
{'epoch': 5, 'batch': 1570, 'loss': 5.938967227935791}
{'epoch': 5, 'batch': 1571, 'loss': 5.755679130554199}
{'epoch': 5, 'batch': 1572, 'loss': 5.535698413848877}
{'epoch': 5, 'batch': 1573, 'loss': 5.09237813949585}
{'epoch': 5

{'epoch': 5, 'batch': 1706, 'loss': 6.064028739929199}
{'epoch': 5, 'batch': 1707, 'loss': 5.874517917633057}
{'epoch': 5, 'batch': 1708, 'loss': 5.849358558654785}
{'epoch': 5, 'batch': 1709, 'loss': 5.570157051086426}
{'epoch': 5, 'batch': 1710, 'loss': 5.077663898468018}
{'epoch': 5, 'batch': 1711, 'loss': 5.558211803436279}
{'epoch': 5, 'batch': 1712, 'loss': 5.302887439727783}
{'epoch': 5, 'batch': 1713, 'loss': 6.085824489593506}
{'epoch': 5, 'batch': 1714, 'loss': 5.924807071685791}
{'epoch': 5, 'batch': 1715, 'loss': 5.824379920959473}
{'epoch': 5, 'batch': 1716, 'loss': 5.5527873039245605}
{'epoch': 5, 'batch': 1717, 'loss': 5.250453472137451}
{'epoch': 5, 'batch': 1718, 'loss': 5.704029083251953}
{'epoch': 5, 'batch': 1719, 'loss': 6.367904186248779}
{'epoch': 5, 'batch': 1720, 'loss': 5.439589500427246}
{'epoch': 5, 'batch': 1721, 'loss': 5.882832050323486}
{'epoch': 5, 'batch': 1722, 'loss': 6.181662082672119}
{'epoch': 5, 'batch': 1723, 'loss': 5.717493534088135}
{'epoch':

{'epoch': 5, 'batch': 1856, 'loss': 5.881418704986572}
{'epoch': 5, 'batch': 1857, 'loss': 5.323849678039551}
{'epoch': 5, 'batch': 1858, 'loss': 5.774975299835205}
{'epoch': 5, 'batch': 1859, 'loss': 5.818521976470947}
{'epoch': 5, 'batch': 1860, 'loss': 6.042784214019775}
{'epoch': 5, 'batch': 1861, 'loss': 5.732309341430664}
{'epoch': 5, 'batch': 1862, 'loss': 5.62318229675293}
{'epoch': 5, 'batch': 1863, 'loss': 5.904880046844482}
{'epoch': 5, 'batch': 1864, 'loss': 6.39761209487915}
{'epoch': 5, 'batch': 1865, 'loss': 6.171741485595703}
{'epoch': 5, 'batch': 1866, 'loss': 5.905633926391602}
{'epoch': 5, 'batch': 1867, 'loss': 5.589019775390625}
{'epoch': 5, 'batch': 1868, 'loss': 5.757463455200195}
{'epoch': 5, 'batch': 1869, 'loss': 5.560632228851318}
{'epoch': 5, 'batch': 1870, 'loss': 5.895914077758789}
{'epoch': 5, 'batch': 1871, 'loss': 5.763017654418945}
{'epoch': 5, 'batch': 1872, 'loss': 5.791737079620361}
{'epoch': 5, 'batch': 1873, 'loss': 5.335370063781738}
{'epoch': 5,

{'epoch': 5, 'batch': 2007, 'loss': 6.686883926391602}
{'epoch': 5, 'batch': 2008, 'loss': 7.22584867477417}
{'epoch': 5, 'batch': 2009, 'loss': 6.830294132232666}
{'epoch': 5, 'batch': 2010, 'loss': 7.100232124328613}
{'epoch': 5, 'batch': 2011, 'loss': 6.979422092437744}
{'epoch': 5, 'batch': 2012, 'loss': 6.829611778259277}
{'epoch': 5, 'batch': 2013, 'loss': 7.258511066436768}
{'epoch': 5, 'batch': 2014, 'loss': 5.743651866912842}
{'epoch': 5, 'batch': 2015, 'loss': 6.87907075881958}
{'epoch': 5, 'batch': 2016, 'loss': 6.413537502288818}
{'epoch': 5, 'batch': 2017, 'loss': 6.180464267730713}
{'epoch': 5, 'batch': 2018, 'loss': 6.568340301513672}
{'epoch': 5, 'batch': 2019, 'loss': 5.8184428215026855}
{'epoch': 5, 'batch': 2020, 'loss': 5.53156852722168}
{'epoch': 5, 'batch': 2021, 'loss': 5.913724422454834}
{'epoch': 5, 'batch': 2022, 'loss': 5.81488037109375}
{'epoch': 5, 'batch': 2023, 'loss': 5.952646255493164}
{'epoch': 5, 'batch': 2024, 'loss': 5.619731903076172}
{'epoch': 5, 

{'epoch': 5, 'batch': 2156, 'loss': 5.278213024139404}
{'epoch': 5, 'batch': 2157, 'loss': 5.849734306335449}
{'epoch': 5, 'batch': 2158, 'loss': 5.320550441741943}
{'epoch': 5, 'batch': 2159, 'loss': 5.927071571350098}
{'epoch': 5, 'batch': 2160, 'loss': 6.295626163482666}
{'epoch': 5, 'batch': 2161, 'loss': 6.422612190246582}
{'epoch': 5, 'batch': 2162, 'loss': 6.399078369140625}
{'epoch': 5, 'batch': 2163, 'loss': 6.201048851013184}
{'epoch': 5, 'batch': 2164, 'loss': 6.050411224365234}
{'epoch': 5, 'batch': 2165, 'loss': 6.019189357757568}
{'epoch': 5, 'batch': 2166, 'loss': 5.895859718322754}
{'epoch': 5, 'batch': 2167, 'loss': 6.272922992706299}
{'epoch': 5, 'batch': 2168, 'loss': 6.360198497772217}
{'epoch': 5, 'batch': 2169, 'loss': 5.865188121795654}
{'epoch': 5, 'batch': 2170, 'loss': 5.680759429931641}
{'epoch': 5, 'batch': 2171, 'loss': 6.201570987701416}
{'epoch': 5, 'batch': 2172, 'loss': 5.781844139099121}
{'epoch': 5, 'batch': 2173, 'loss': 6.085195541381836}
{'epoch': 

{'epoch': 5, 'batch': 2308, 'loss': 5.948620319366455}
{'epoch': 5, 'batch': 2309, 'loss': 6.020045757293701}
{'epoch': 5, 'batch': 2310, 'loss': 6.257361888885498}
{'epoch': 5, 'batch': 2311, 'loss': 6.034585952758789}
{'epoch': 5, 'batch': 2312, 'loss': 5.8579301834106445}
{'epoch': 5, 'batch': 2313, 'loss': 5.7253875732421875}
{'epoch': 5, 'batch': 2314, 'loss': 5.587820529937744}
{'epoch': 5, 'batch': 2315, 'loss': 5.734625816345215}
{'epoch': 5, 'batch': 2316, 'loss': 5.899724006652832}
{'epoch': 5, 'batch': 2317, 'loss': 5.919914245605469}
{'epoch': 5, 'batch': 2318, 'loss': 5.733217239379883}
{'epoch': 5, 'batch': 2319, 'loss': 6.009415149688721}
{'epoch': 5, 'batch': 2320, 'loss': 5.8237738609313965}
{'epoch': 5, 'batch': 2321, 'loss': 5.873350143432617}
{'epoch': 5, 'batch': 2322, 'loss': 5.634858131408691}
{'epoch': 5, 'batch': 2323, 'loss': 6.105653762817383}
{'epoch': 5, 'batch': 2324, 'loss': 6.017722129821777}
{'epoch': 5, 'batch': 2325, 'loss': 5.724545001983643}
{'epoch

{'epoch': 5, 'batch': 2459, 'loss': 6.693663120269775}
{'epoch': 5, 'batch': 2460, 'loss': 6.731432914733887}
{'epoch': 5, 'batch': 2461, 'loss': 6.333620548248291}
{'epoch': 5, 'batch': 2462, 'loss': 5.206411361694336}
{'epoch': 5, 'batch': 2463, 'loss': 5.994283199310303}
{'epoch': 5, 'batch': 2464, 'loss': 5.889378070831299}
{'epoch': 5, 'batch': 2465, 'loss': 5.444504737854004}
{'epoch': 5, 'batch': 2466, 'loss': 6.095466613769531}
{'epoch': 5, 'batch': 2467, 'loss': 6.219884872436523}
{'epoch': 5, 'batch': 2468, 'loss': 6.158013820648193}
{'epoch': 5, 'batch': 2469, 'loss': 5.824822902679443}
{'epoch': 5, 'batch': 2470, 'loss': 5.610014915466309}
{'epoch': 5, 'batch': 2471, 'loss': 5.5633864402771}
{'epoch': 5, 'batch': 2472, 'loss': 5.335977554321289}
{'epoch': 5, 'batch': 2473, 'loss': 5.364949703216553}
{'epoch': 5, 'batch': 2474, 'loss': 7.283941745758057}
{'epoch': 5, 'batch': 2475, 'loss': 6.552104949951172}
{'epoch': 5, 'batch': 2476, 'loss': 6.271368980407715}
{'epoch': 5,

{'epoch': 5, 'batch': 2611, 'loss': 5.761936664581299}
{'epoch': 5, 'batch': 2612, 'loss': 7.0305023193359375}
{'epoch': 5, 'batch': 2613, 'loss': 6.250268936157227}
{'epoch': 5, 'batch': 2614, 'loss': 5.81056547164917}
{'epoch': 5, 'batch': 2615, 'loss': 5.656916618347168}
{'epoch': 5, 'batch': 2616, 'loss': 5.639983654022217}
{'epoch': 5, 'batch': 2617, 'loss': 5.772217750549316}
{'epoch': 5, 'batch': 2618, 'loss': 5.8821492195129395}
{'epoch': 5, 'batch': 2619, 'loss': 5.621074676513672}
{'epoch': 5, 'batch': 2620, 'loss': 5.836475372314453}
{'epoch': 5, 'batch': 2621, 'loss': 5.34779691696167}
{'epoch': 5, 'batch': 2622, 'loss': 5.729490756988525}
{'epoch': 5, 'batch': 2623, 'loss': 5.56049108505249}
{'epoch': 5, 'batch': 2624, 'loss': 5.551939964294434}
{'epoch': 5, 'batch': 2625, 'loss': 5.555296897888184}
{'epoch': 5, 'batch': 2626, 'loss': 5.540005207061768}
{'epoch': 5, 'batch': 2627, 'loss': 5.789252758026123}
{'epoch': 5, 'batch': 2628, 'loss': 5.445252418518066}
{'epoch': 5

{'epoch': 5, 'batch': 2762, 'loss': 6.172414302825928}
{'epoch': 5, 'batch': 2763, 'loss': 5.75684928894043}
{'epoch': 5, 'batch': 2764, 'loss': 5.758182525634766}
{'epoch': 5, 'batch': 2765, 'loss': 5.603877067565918}
{'epoch': 5, 'batch': 2766, 'loss': 5.323572158813477}
{'epoch': 5, 'batch': 2767, 'loss': 5.62318229675293}
{'epoch': 5, 'batch': 2768, 'loss': 5.098495960235596}
{'epoch': 5, 'batch': 2769, 'loss': 5.254643440246582}
{'epoch': 5, 'batch': 2770, 'loss': 5.923480987548828}
{'epoch': 5, 'batch': 2771, 'loss': 5.905215263366699}
{'epoch': 5, 'batch': 2772, 'loss': 5.54116678237915}
{'epoch': 5, 'batch': 2773, 'loss': 6.171432971954346}
{'epoch': 5, 'batch': 2774, 'loss': 6.020411491394043}
{'epoch': 5, 'batch': 2775, 'loss': 5.7681803703308105}
{'epoch': 5, 'batch': 2776, 'loss': 5.611307621002197}
{'epoch': 5, 'batch': 2777, 'loss': 5.712045669555664}
{'epoch': 5, 'batch': 2778, 'loss': 6.107429027557373}
{'epoch': 5, 'batch': 2779, 'loss': 5.42186164855957}
{'epoch': 5, 

{'epoch': 5, 'batch': 2911, 'loss': 5.298327922821045}
{'epoch': 5, 'batch': 2912, 'loss': 5.329626083374023}
{'epoch': 5, 'batch': 2913, 'loss': 5.472489356994629}
{'epoch': 5, 'batch': 2914, 'loss': 5.114212512969971}
{'epoch': 5, 'batch': 2915, 'loss': 5.8251519203186035}
{'epoch': 5, 'batch': 2916, 'loss': 5.3250579833984375}
{'epoch': 5, 'batch': 2917, 'loss': 5.698770046234131}
{'epoch': 5, 'batch': 2918, 'loss': 5.306743621826172}
{'epoch': 5, 'batch': 2919, 'loss': 4.567844390869141}
{'epoch': 5, 'batch': 2920, 'loss': 4.9404377937316895}
{'epoch': 5, 'batch': 2921, 'loss': 5.616999626159668}
{'epoch': 5, 'batch': 2922, 'loss': 5.238259315490723}
{'epoch': 5, 'batch': 2923, 'loss': 5.3170342445373535}
{'epoch': 5, 'batch': 2924, 'loss': 5.08749532699585}
{'epoch': 5, 'batch': 2925, 'loss': 4.916961669921875}
{'epoch': 5, 'batch': 2926, 'loss': 5.375504493713379}
{'epoch': 5, 'batch': 2927, 'loss': 5.859821796417236}
{'epoch': 5, 'batch': 2928, 'loss': 4.847775459289551}
{'epoch

{'epoch': 5, 'batch': 3063, 'loss': 6.183378219604492}
{'epoch': 5, 'batch': 3064, 'loss': 6.103887557983398}
{'epoch': 5, 'batch': 3065, 'loss': 6.107892990112305}
{'epoch': 5, 'batch': 3066, 'loss': 5.601738452911377}
{'epoch': 5, 'batch': 3067, 'loss': 5.3762640953063965}
{'epoch': 5, 'batch': 3068, 'loss': 5.693614959716797}
{'epoch': 5, 'batch': 3069, 'loss': 6.364267826080322}
{'epoch': 5, 'batch': 3070, 'loss': 5.94916296005249}
{'epoch': 5, 'batch': 3071, 'loss': 5.857217311859131}
{'epoch': 5, 'batch': 3072, 'loss': 5.686540603637695}
{'epoch': 5, 'batch': 3073, 'loss': 6.01352596282959}
{'epoch': 5, 'batch': 3074, 'loss': 5.974869251251221}
{'epoch': 5, 'batch': 3075, 'loss': 5.749897480010986}
{'epoch': 5, 'batch': 3076, 'loss': 5.958159923553467}
{'epoch': 5, 'batch': 3077, 'loss': 5.707957744598389}
{'epoch': 5, 'batch': 3078, 'loss': 5.828110218048096}
{'epoch': 5, 'batch': 3079, 'loss': 5.908638000488281}
{'epoch': 5, 'batch': 3080, 'loss': 5.517950534820557}
{'epoch': 5

{'epoch': 5, 'batch': 3213, 'loss': 4.745782852172852}
{'epoch': 5, 'batch': 3214, 'loss': 5.19473934173584}
{'epoch': 5, 'batch': 3215, 'loss': 4.894225120544434}
{'epoch': 5, 'batch': 3216, 'loss': 4.942895889282227}
{'epoch': 5, 'batch': 3217, 'loss': 4.872375965118408}
{'epoch': 5, 'batch': 3218, 'loss': 4.76896858215332}
{'epoch': 5, 'batch': 3219, 'loss': 4.621809005737305}
{'epoch': 5, 'batch': 3220, 'loss': 4.7639970779418945}
{'epoch': 5, 'batch': 3221, 'loss': 4.843808650970459}
{'epoch': 5, 'batch': 3222, 'loss': 5.393587589263916}
{'epoch': 5, 'batch': 3223, 'loss': 5.003769874572754}
{'epoch': 5, 'batch': 3224, 'loss': 5.241404056549072}
{'epoch': 5, 'batch': 3225, 'loss': 5.246045112609863}
{'epoch': 5, 'batch': 3226, 'loss': 5.353187084197998}
{'epoch': 5, 'batch': 3227, 'loss': 5.441199779510498}
{'epoch': 5, 'batch': 3228, 'loss': 5.300262451171875}
{'epoch': 5, 'batch': 3229, 'loss': 5.201908111572266}
{'epoch': 5, 'batch': 3230, 'loss': 5.691651821136475}
{'epoch': 5

{'epoch': 5, 'batch': 3363, 'loss': 5.511923313140869}
{'epoch': 5, 'batch': 3364, 'loss': 6.062109470367432}
{'epoch': 5, 'batch': 3365, 'loss': 5.440311431884766}
{'epoch': 5, 'batch': 3366, 'loss': 5.300109386444092}
{'epoch': 5, 'batch': 3367, 'loss': 5.007233619689941}
{'epoch': 5, 'batch': 3368, 'loss': 5.363328456878662}
{'epoch': 5, 'batch': 3369, 'loss': 5.401081562042236}
{'epoch': 5, 'batch': 3370, 'loss': 5.530365943908691}
{'epoch': 5, 'batch': 3371, 'loss': 5.330971717834473}
{'epoch': 5, 'batch': 3372, 'loss': 5.4465861320495605}
{'epoch': 5, 'batch': 3373, 'loss': 6.073460102081299}
{'epoch': 5, 'batch': 3374, 'loss': 5.289006233215332}
{'epoch': 5, 'batch': 3375, 'loss': 5.628517150878906}
{'epoch': 5, 'batch': 3376, 'loss': 5.412631988525391}
{'epoch': 5, 'batch': 3377, 'loss': 5.5189619064331055}
{'epoch': 5, 'batch': 3378, 'loss': 5.781834125518799}
{'epoch': 5, 'batch': 3379, 'loss': 5.521615982055664}
{'epoch': 5, 'batch': 3380, 'loss': 5.314005374908447}
{'epoch'

{'epoch': 5, 'batch': 3513, 'loss': 5.529845237731934}
{'epoch': 5, 'batch': 3514, 'loss': 6.028870105743408}
{'epoch': 5, 'batch': 3515, 'loss': 6.417068958282471}
{'epoch': 5, 'batch': 3516, 'loss': 5.888807773590088}
{'epoch': 5, 'batch': 3517, 'loss': 5.490898609161377}
{'epoch': 5, 'batch': 3518, 'loss': 5.656158924102783}
{'epoch': 5, 'batch': 3519, 'loss': 5.853086948394775}
{'epoch': 5, 'batch': 3520, 'loss': 5.937194347381592}
{'epoch': 5, 'batch': 3521, 'loss': 6.024006366729736}
{'epoch': 5, 'batch': 3522, 'loss': 5.5340399742126465}
{'epoch': 5, 'batch': 3523, 'loss': 5.492733955383301}
{'epoch': 5, 'batch': 3524, 'loss': 5.614474773406982}
{'epoch': 5, 'batch': 3525, 'loss': 5.198441505432129}
{'epoch': 5, 'batch': 3526, 'loss': 5.796334743499756}
{'epoch': 5, 'batch': 3527, 'loss': 5.761887550354004}
{'epoch': 5, 'batch': 3528, 'loss': 6.0332207679748535}
{'epoch': 5, 'batch': 3529, 'loss': 5.514605522155762}
{'epoch': 5, 'batch': 3530, 'loss': 5.08838415145874}
{'epoch':

{'epoch': 5, 'batch': 3664, 'loss': 5.15218448638916}
{'epoch': 5, 'batch': 3665, 'loss': 5.0674729347229}
{'epoch': 5, 'batch': 3666, 'loss': 5.271047592163086}
{'epoch': 5, 'batch': 3667, 'loss': 5.015323638916016}
{'epoch': 5, 'batch': 3668, 'loss': 4.952084541320801}
{'epoch': 5, 'batch': 3669, 'loss': 5.029827117919922}
{'epoch': 5, 'batch': 3670, 'loss': 5.123723983764648}
{'epoch': 5, 'batch': 3671, 'loss': 4.522318363189697}
{'epoch': 5, 'batch': 3672, 'loss': 6.017889022827148}
{'epoch': 5, 'batch': 3673, 'loss': 6.174971103668213}
{'epoch': 5, 'batch': 3674, 'loss': 5.172582149505615}
{'epoch': 5, 'batch': 3675, 'loss': 6.1324567794799805}
{'epoch': 5, 'batch': 3676, 'loss': 5.508859634399414}
{'epoch': 5, 'batch': 3677, 'loss': 5.27449893951416}
{'epoch': 5, 'batch': 3678, 'loss': 5.288520812988281}
{'epoch': 5, 'batch': 3679, 'loss': 6.433299541473389}
{'epoch': 5, 'batch': 3680, 'loss': 4.827494144439697}
{'epoch': 5, 'batch': 3681, 'loss': 5.640861511230469}
{'epoch': 5, 

{'epoch': 6, 'batch': 43, 'loss': 5.6636505126953125}
{'epoch': 6, 'batch': 44, 'loss': 5.325583457946777}
{'epoch': 6, 'batch': 45, 'loss': 5.289915084838867}
{'epoch': 6, 'batch': 46, 'loss': 5.036983013153076}
{'epoch': 6, 'batch': 47, 'loss': 5.00224494934082}
{'epoch': 6, 'batch': 48, 'loss': 5.348466396331787}
{'epoch': 6, 'batch': 49, 'loss': 5.40971040725708}
{'epoch': 6, 'batch': 50, 'loss': 5.4688310623168945}
{'epoch': 6, 'batch': 51, 'loss': 5.516003608703613}
{'epoch': 6, 'batch': 52, 'loss': 5.399340629577637}
{'epoch': 6, 'batch': 53, 'loss': 5.267509937286377}
{'epoch': 6, 'batch': 54, 'loss': 5.081349849700928}
{'epoch': 6, 'batch': 55, 'loss': 4.764654159545898}
{'epoch': 6, 'batch': 56, 'loss': 5.981662750244141}
{'epoch': 6, 'batch': 57, 'loss': 5.753068923950195}
{'epoch': 6, 'batch': 58, 'loss': 4.638804912567139}
{'epoch': 6, 'batch': 59, 'loss': 4.215368747711182}
{'epoch': 6, 'batch': 60, 'loss': 5.374686241149902}
{'epoch': 6, 'batch': 61, 'loss': 5.3755125999

{'epoch': 6, 'batch': 199, 'loss': 5.677662372589111}
{'epoch': 6, 'batch': 200, 'loss': 5.533604145050049}
{'epoch': 6, 'batch': 201, 'loss': 5.29828405380249}
{'epoch': 6, 'batch': 202, 'loss': 5.774575710296631}
{'epoch': 6, 'batch': 203, 'loss': 6.2710161209106445}
{'epoch': 6, 'batch': 204, 'loss': 7.268996238708496}
{'epoch': 6, 'batch': 205, 'loss': 6.646582126617432}
{'epoch': 6, 'batch': 206, 'loss': 5.974832534790039}
{'epoch': 6, 'batch': 207, 'loss': 5.298967361450195}
{'epoch': 6, 'batch': 208, 'loss': 4.947495937347412}
{'epoch': 6, 'batch': 209, 'loss': 5.194277286529541}
{'epoch': 6, 'batch': 210, 'loss': 5.50516414642334}
{'epoch': 6, 'batch': 211, 'loss': 5.35244607925415}
{'epoch': 6, 'batch': 212, 'loss': 5.082058906555176}
{'epoch': 6, 'batch': 213, 'loss': 4.859307765960693}
{'epoch': 6, 'batch': 214, 'loss': 5.319461345672607}
{'epoch': 6, 'batch': 215, 'loss': 4.882752418518066}
{'epoch': 6, 'batch': 216, 'loss': 5.027238368988037}
{'epoch': 6, 'batch': 217, 'lo

{'epoch': 6, 'batch': 352, 'loss': 5.668460369110107}
{'epoch': 6, 'batch': 353, 'loss': 5.709194183349609}
{'epoch': 6, 'batch': 354, 'loss': 5.646300792694092}
{'epoch': 6, 'batch': 355, 'loss': 5.390510559082031}
{'epoch': 6, 'batch': 356, 'loss': 5.027471542358398}
{'epoch': 6, 'batch': 357, 'loss': 5.215199947357178}
{'epoch': 6, 'batch': 358, 'loss': 5.5331130027771}
{'epoch': 6, 'batch': 359, 'loss': 5.237934112548828}
{'epoch': 6, 'batch': 360, 'loss': 4.670091152191162}
{'epoch': 6, 'batch': 361, 'loss': 4.9686455726623535}
{'epoch': 6, 'batch': 362, 'loss': 5.285073757171631}
{'epoch': 6, 'batch': 363, 'loss': 5.858493804931641}
{'epoch': 6, 'batch': 364, 'loss': 6.0499958992004395}
{'epoch': 6, 'batch': 365, 'loss': 5.821796894073486}
{'epoch': 6, 'batch': 366, 'loss': 5.699054718017578}
{'epoch': 6, 'batch': 367, 'loss': 5.584975719451904}
{'epoch': 6, 'batch': 368, 'loss': 5.30086088180542}
{'epoch': 6, 'batch': 369, 'loss': 5.723348140716553}
{'epoch': 6, 'batch': 370, 'l

{'epoch': 6, 'batch': 505, 'loss': 6.056746959686279}
{'epoch': 6, 'batch': 506, 'loss': 6.127667427062988}
{'epoch': 6, 'batch': 507, 'loss': 5.269505500793457}
{'epoch': 6, 'batch': 508, 'loss': 4.715065956115723}
{'epoch': 6, 'batch': 509, 'loss': 5.61358118057251}
{'epoch': 6, 'batch': 510, 'loss': 5.2675323486328125}
{'epoch': 6, 'batch': 511, 'loss': 5.325821876525879}
{'epoch': 6, 'batch': 512, 'loss': 5.231831073760986}
{'epoch': 6, 'batch': 513, 'loss': 4.861913204193115}
{'epoch': 6, 'batch': 514, 'loss': 5.442481517791748}
{'epoch': 6, 'batch': 515, 'loss': 5.320013999938965}
{'epoch': 6, 'batch': 516, 'loss': 6.524504661560059}
{'epoch': 6, 'batch': 517, 'loss': 6.828238010406494}
{'epoch': 6, 'batch': 518, 'loss': 6.277136325836182}
{'epoch': 6, 'batch': 519, 'loss': 6.280810832977295}
{'epoch': 6, 'batch': 520, 'loss': 6.362086772918701}
{'epoch': 6, 'batch': 521, 'loss': 6.102293491363525}
{'epoch': 6, 'batch': 522, 'loss': 6.024132251739502}
{'epoch': 6, 'batch': 523, '

{'epoch': 6, 'batch': 658, 'loss': 5.874344348907471}
{'epoch': 6, 'batch': 659, 'loss': 7.576205253601074}
{'epoch': 6, 'batch': 660, 'loss': 6.060245990753174}
{'epoch': 6, 'batch': 661, 'loss': 5.903179168701172}
{'epoch': 6, 'batch': 662, 'loss': 5.63075590133667}
{'epoch': 6, 'batch': 663, 'loss': 5.6922407150268555}
{'epoch': 6, 'batch': 664, 'loss': 6.551536560058594}
{'epoch': 6, 'batch': 665, 'loss': 5.596689224243164}
{'epoch': 6, 'batch': 666, 'loss': 6.590336799621582}
{'epoch': 6, 'batch': 667, 'loss': 6.248895168304443}
{'epoch': 6, 'batch': 668, 'loss': 6.790099620819092}
{'epoch': 6, 'batch': 669, 'loss': 6.568081378936768}
{'epoch': 6, 'batch': 670, 'loss': 5.413249969482422}
{'epoch': 6, 'batch': 671, 'loss': 5.5121846199035645}
{'epoch': 6, 'batch': 672, 'loss': 6.281553268432617}
{'epoch': 6, 'batch': 673, 'loss': 5.88275146484375}
{'epoch': 6, 'batch': 674, 'loss': 6.241928577423096}
{'epoch': 6, 'batch': 675, 'loss': 6.0229339599609375}
{'epoch': 6, 'batch': 676, 

{'epoch': 6, 'batch': 812, 'loss': 5.908165454864502}
{'epoch': 6, 'batch': 813, 'loss': 5.77531623840332}
{'epoch': 6, 'batch': 814, 'loss': 5.86068058013916}
{'epoch': 6, 'batch': 815, 'loss': 6.037898063659668}
{'epoch': 6, 'batch': 816, 'loss': 6.3984503746032715}
{'epoch': 6, 'batch': 817, 'loss': 6.333824634552002}
{'epoch': 6, 'batch': 818, 'loss': 6.371811389923096}
{'epoch': 6, 'batch': 819, 'loss': 6.521392345428467}
{'epoch': 6, 'batch': 820, 'loss': 6.114547252655029}
{'epoch': 6, 'batch': 821, 'loss': 6.371077060699463}
{'epoch': 6, 'batch': 822, 'loss': 6.047064304351807}
{'epoch': 6, 'batch': 823, 'loss': 5.532394886016846}
{'epoch': 6, 'batch': 824, 'loss': 5.903805255889893}
{'epoch': 6, 'batch': 825, 'loss': 6.0791015625}
{'epoch': 6, 'batch': 826, 'loss': 6.309875965118408}
{'epoch': 6, 'batch': 827, 'loss': 6.152060508728027}
{'epoch': 6, 'batch': 828, 'loss': 5.764166831970215}
{'epoch': 6, 'batch': 829, 'loss': 6.286692142486572}
{'epoch': 6, 'batch': 830, 'loss':

{'epoch': 6, 'batch': 964, 'loss': 5.072999477386475}
{'epoch': 6, 'batch': 965, 'loss': 4.143637657165527}
{'epoch': 6, 'batch': 966, 'loss': 5.809298038482666}
{'epoch': 6, 'batch': 967, 'loss': 5.871503829956055}
{'epoch': 6, 'batch': 968, 'loss': 5.007307052612305}
{'epoch': 6, 'batch': 969, 'loss': 5.620584011077881}
{'epoch': 6, 'batch': 970, 'loss': 5.071526050567627}
{'epoch': 6, 'batch': 971, 'loss': 5.337325096130371}
{'epoch': 6, 'batch': 972, 'loss': 5.019485950469971}
{'epoch': 6, 'batch': 973, 'loss': 5.015571594238281}
{'epoch': 6, 'batch': 974, 'loss': 5.25419282913208}
{'epoch': 6, 'batch': 975, 'loss': 4.892111778259277}
{'epoch': 6, 'batch': 976, 'loss': 5.376657009124756}
{'epoch': 6, 'batch': 977, 'loss': 4.973134994506836}
{'epoch': 6, 'batch': 978, 'loss': 5.382615566253662}
{'epoch': 6, 'batch': 979, 'loss': 4.980497360229492}
{'epoch': 6, 'batch': 980, 'loss': 5.484017848968506}
{'epoch': 6, 'batch': 981, 'loss': 5.998556613922119}
{'epoch': 6, 'batch': 982, 'l

{'epoch': 6, 'batch': 1115, 'loss': 6.078733444213867}
{'epoch': 6, 'batch': 1116, 'loss': 5.881460666656494}
{'epoch': 6, 'batch': 1117, 'loss': 6.1111345291137695}
{'epoch': 6, 'batch': 1118, 'loss': 6.461015701293945}
{'epoch': 6, 'batch': 1119, 'loss': 6.154221057891846}
{'epoch': 6, 'batch': 1120, 'loss': 5.892919063568115}
{'epoch': 6, 'batch': 1121, 'loss': 5.29850959777832}
{'epoch': 6, 'batch': 1122, 'loss': 5.703782081604004}
{'epoch': 6, 'batch': 1123, 'loss': 5.2077131271362305}
{'epoch': 6, 'batch': 1124, 'loss': 5.578609466552734}
{'epoch': 6, 'batch': 1125, 'loss': 5.9335174560546875}
{'epoch': 6, 'batch': 1126, 'loss': 5.67593240737915}
{'epoch': 6, 'batch': 1127, 'loss': 5.753209590911865}
{'epoch': 6, 'batch': 1128, 'loss': 5.135622024536133}
{'epoch': 6, 'batch': 1129, 'loss': 5.914890766143799}
{'epoch': 6, 'batch': 1130, 'loss': 5.669409275054932}
{'epoch': 6, 'batch': 1131, 'loss': 5.713792324066162}
{'epoch': 6, 'batch': 1132, 'loss': 5.433141231536865}
{'epoch':

{'epoch': 6, 'batch': 1264, 'loss': 5.673151016235352}
{'epoch': 6, 'batch': 1265, 'loss': 5.651782989501953}
{'epoch': 6, 'batch': 1266, 'loss': 5.630734443664551}
{'epoch': 6, 'batch': 1267, 'loss': 5.721975803375244}
{'epoch': 6, 'batch': 1268, 'loss': 5.168659687042236}
{'epoch': 6, 'batch': 1269, 'loss': 4.967464923858643}
{'epoch': 6, 'batch': 1270, 'loss': 5.255043029785156}
{'epoch': 6, 'batch': 1271, 'loss': 5.521241188049316}
{'epoch': 6, 'batch': 1272, 'loss': 5.793010234832764}
{'epoch': 6, 'batch': 1273, 'loss': 5.585419654846191}
{'epoch': 6, 'batch': 1274, 'loss': 5.456343650817871}
{'epoch': 6, 'batch': 1275, 'loss': 5.50750732421875}
{'epoch': 6, 'batch': 1276, 'loss': 5.689875602722168}
{'epoch': 6, 'batch': 1277, 'loss': 5.858034610748291}
{'epoch': 6, 'batch': 1278, 'loss': 5.916618347167969}
{'epoch': 6, 'batch': 1279, 'loss': 5.195675849914551}
{'epoch': 6, 'batch': 1280, 'loss': 5.604942798614502}
{'epoch': 6, 'batch': 1281, 'loss': 4.828725337982178}
{'epoch': 6

{'epoch': 6, 'batch': 1415, 'loss': 5.362583637237549}
{'epoch': 6, 'batch': 1416, 'loss': 5.06318473815918}
{'epoch': 6, 'batch': 1417, 'loss': 4.758275508880615}
{'epoch': 6, 'batch': 1418, 'loss': 4.6911234855651855}
{'epoch': 6, 'batch': 1419, 'loss': 5.313358783721924}
{'epoch': 6, 'batch': 1420, 'loss': 5.123171329498291}
{'epoch': 6, 'batch': 1421, 'loss': 5.674454212188721}
{'epoch': 6, 'batch': 1422, 'loss': 5.980044364929199}
{'epoch': 6, 'batch': 1423, 'loss': 5.7361884117126465}
{'epoch': 6, 'batch': 1424, 'loss': 5.908192157745361}
{'epoch': 6, 'batch': 1425, 'loss': 5.903839111328125}
{'epoch': 6, 'batch': 1426, 'loss': 5.088225364685059}
{'epoch': 6, 'batch': 1427, 'loss': 5.487116813659668}
{'epoch': 6, 'batch': 1428, 'loss': 5.458630561828613}
{'epoch': 6, 'batch': 1429, 'loss': 5.39639139175415}
{'epoch': 6, 'batch': 1430, 'loss': 5.520253658294678}
{'epoch': 6, 'batch': 1431, 'loss': 5.760391712188721}
{'epoch': 6, 'batch': 1432, 'loss': 5.833822727203369}
{'epoch': 

{'epoch': 6, 'batch': 1565, 'loss': 5.305222511291504}
{'epoch': 6, 'batch': 1566, 'loss': 5.324900150299072}
{'epoch': 6, 'batch': 1567, 'loss': 5.158487796783447}
{'epoch': 6, 'batch': 1568, 'loss': 5.010538578033447}
{'epoch': 6, 'batch': 1569, 'loss': 5.234994411468506}
{'epoch': 6, 'batch': 1570, 'loss': 5.6432785987854}
{'epoch': 6, 'batch': 1571, 'loss': 5.614949703216553}
{'epoch': 6, 'batch': 1572, 'loss': 5.386046886444092}
{'epoch': 6, 'batch': 1573, 'loss': 5.011158466339111}
{'epoch': 6, 'batch': 1574, 'loss': 5.342738628387451}
{'epoch': 6, 'batch': 1575, 'loss': 5.746949672698975}
{'epoch': 6, 'batch': 1576, 'loss': 5.7691569328308105}
{'epoch': 6, 'batch': 1577, 'loss': 5.818581581115723}
{'epoch': 6, 'batch': 1578, 'loss': 5.943223476409912}
{'epoch': 6, 'batch': 1579, 'loss': 6.152924537658691}
{'epoch': 6, 'batch': 1580, 'loss': 5.328155040740967}
{'epoch': 6, 'batch': 1581, 'loss': 5.539559841156006}
{'epoch': 6, 'batch': 1582, 'loss': 5.9461445808410645}
{'epoch': 

{'epoch': 6, 'batch': 1714, 'loss': 5.730851650238037}
{'epoch': 6, 'batch': 1715, 'loss': 5.478691577911377}
{'epoch': 6, 'batch': 1716, 'loss': 5.335831165313721}
{'epoch': 6, 'batch': 1717, 'loss': 5.046481609344482}
{'epoch': 6, 'batch': 1718, 'loss': 5.520613193511963}
{'epoch': 6, 'batch': 1719, 'loss': 6.103784561157227}
{'epoch': 6, 'batch': 1720, 'loss': 5.168598651885986}
{'epoch': 6, 'batch': 1721, 'loss': 5.53944730758667}
{'epoch': 6, 'batch': 1722, 'loss': 5.979199409484863}
{'epoch': 6, 'batch': 1723, 'loss': 5.413928508758545}
{'epoch': 6, 'batch': 1724, 'loss': 5.459890365600586}
{'epoch': 6, 'batch': 1725, 'loss': 5.974277973175049}
{'epoch': 6, 'batch': 1726, 'loss': 5.81246280670166}
{'epoch': 6, 'batch': 1727, 'loss': 5.240170955657959}
{'epoch': 6, 'batch': 1728, 'loss': 4.921419143676758}
{'epoch': 6, 'batch': 1729, 'loss': 5.463351726531982}
{'epoch': 6, 'batch': 1730, 'loss': 5.68339729309082}
{'epoch': 6, 'batch': 1731, 'loss': 4.815505504608154}
{'epoch': 6, 

{'epoch': 6, 'batch': 1864, 'loss': 6.076363563537598}
{'epoch': 6, 'batch': 1865, 'loss': 5.85203218460083}
{'epoch': 6, 'batch': 1866, 'loss': 5.599905967712402}
{'epoch': 6, 'batch': 1867, 'loss': 5.190922260284424}
{'epoch': 6, 'batch': 1868, 'loss': 5.388401985168457}
{'epoch': 6, 'batch': 1869, 'loss': 5.238736629486084}
{'epoch': 6, 'batch': 1870, 'loss': 5.543420314788818}
{'epoch': 6, 'batch': 1871, 'loss': 5.620655536651611}
{'epoch': 6, 'batch': 1872, 'loss': 5.548098564147949}
{'epoch': 6, 'batch': 1873, 'loss': 5.116606712341309}
{'epoch': 6, 'batch': 1874, 'loss': 5.427033424377441}
{'epoch': 6, 'batch': 1875, 'loss': 5.300340175628662}
{'epoch': 6, 'batch': 1876, 'loss': 5.067686557769775}
{'epoch': 6, 'batch': 1877, 'loss': 5.331501483917236}
{'epoch': 6, 'batch': 1878, 'loss': 5.793473720550537}
{'epoch': 6, 'batch': 1879, 'loss': 5.360387325286865}
{'epoch': 6, 'batch': 1880, 'loss': 5.426539421081543}
{'epoch': 6, 'batch': 1881, 'loss': 5.560876846313477}
{'epoch': 6

{'epoch': 6, 'batch': 2015, 'loss': 6.466710567474365}
{'epoch': 6, 'batch': 2016, 'loss': 6.00481653213501}
{'epoch': 6, 'batch': 2017, 'loss': 5.700557231903076}
{'epoch': 6, 'batch': 2018, 'loss': 6.293653964996338}
{'epoch': 6, 'batch': 2019, 'loss': 5.565298080444336}
{'epoch': 6, 'batch': 2020, 'loss': 5.2168073654174805}
{'epoch': 6, 'batch': 2021, 'loss': 5.619758605957031}
{'epoch': 6, 'batch': 2022, 'loss': 5.637262344360352}
{'epoch': 6, 'batch': 2023, 'loss': 5.679535388946533}
{'epoch': 6, 'batch': 2024, 'loss': 5.4062418937683105}
{'epoch': 6, 'batch': 2025, 'loss': 5.375406742095947}
{'epoch': 6, 'batch': 2026, 'loss': 7.774332046508789}
{'epoch': 6, 'batch': 2027, 'loss': 7.308811187744141}
{'epoch': 6, 'batch': 2028, 'loss': 7.044287204742432}
{'epoch': 6, 'batch': 2029, 'loss': 5.347855091094971}
{'epoch': 6, 'batch': 2030, 'loss': 5.066379547119141}
{'epoch': 6, 'batch': 2031, 'loss': 5.7190632820129395}
{'epoch': 6, 'batch': 2032, 'loss': 6.259109973907471}
{'epoch'

{'epoch': 6, 'batch': 2165, 'loss': 5.901278018951416}
{'epoch': 6, 'batch': 2166, 'loss': 5.81796407699585}
{'epoch': 6, 'batch': 2167, 'loss': 5.979979038238525}
{'epoch': 6, 'batch': 2168, 'loss': 5.9415740966796875}
{'epoch': 6, 'batch': 2169, 'loss': 5.554078578948975}
{'epoch': 6, 'batch': 2170, 'loss': 5.342709064483643}
{'epoch': 6, 'batch': 2171, 'loss': 5.8392653465271}
{'epoch': 6, 'batch': 2172, 'loss': 5.544147491455078}
{'epoch': 6, 'batch': 2173, 'loss': 5.865297794342041}
{'epoch': 6, 'batch': 2174, 'loss': 6.041719436645508}
{'epoch': 6, 'batch': 2175, 'loss': 6.157041072845459}
{'epoch': 6, 'batch': 2176, 'loss': 6.545651912689209}
{'epoch': 6, 'batch': 2177, 'loss': 5.5422234535217285}
{'epoch': 6, 'batch': 2178, 'loss': 6.044113636016846}
{'epoch': 6, 'batch': 2179, 'loss': 5.99498987197876}
{'epoch': 6, 'batch': 2180, 'loss': 6.091230869293213}
{'epoch': 6, 'batch': 2181, 'loss': 5.711968421936035}
{'epoch': 6, 'batch': 2182, 'loss': 5.176618576049805}
{'epoch': 6,

{'epoch': 6, 'batch': 2317, 'loss': 5.676754474639893}
{'epoch': 6, 'batch': 2318, 'loss': 5.518657684326172}
{'epoch': 6, 'batch': 2319, 'loss': 5.761740684509277}
{'epoch': 6, 'batch': 2320, 'loss': 5.611134052276611}
{'epoch': 6, 'batch': 2321, 'loss': 5.67054557800293}
{'epoch': 6, 'batch': 2322, 'loss': 5.497094631195068}
{'epoch': 6, 'batch': 2323, 'loss': 5.8236308097839355}
{'epoch': 6, 'batch': 2324, 'loss': 5.853271484375}
{'epoch': 6, 'batch': 2325, 'loss': 5.5475335121154785}
{'epoch': 6, 'batch': 2326, 'loss': 5.531904697418213}
{'epoch': 6, 'batch': 2327, 'loss': 5.513067722320557}
{'epoch': 6, 'batch': 2328, 'loss': 5.615396976470947}
{'epoch': 6, 'batch': 2329, 'loss': 5.347783088684082}
{'epoch': 6, 'batch': 2330, 'loss': 6.005921840667725}
{'epoch': 6, 'batch': 2331, 'loss': 5.434774398803711}
{'epoch': 6, 'batch': 2332, 'loss': 5.760679721832275}
{'epoch': 6, 'batch': 2333, 'loss': 5.387597560882568}
{'epoch': 6, 'batch': 2334, 'loss': 5.880296230316162}
{'epoch': 6,

{'epoch': 6, 'batch': 2469, 'loss': 5.564787864685059}
{'epoch': 6, 'batch': 2470, 'loss': 5.339101314544678}
{'epoch': 6, 'batch': 2471, 'loss': 5.173025131225586}
{'epoch': 6, 'batch': 2472, 'loss': 5.1282830238342285}
{'epoch': 6, 'batch': 2473, 'loss': 5.141726493835449}
{'epoch': 6, 'batch': 2474, 'loss': 6.4789042472839355}
{'epoch': 6, 'batch': 2475, 'loss': 5.708958625793457}
{'epoch': 6, 'batch': 2476, 'loss': 5.70526123046875}
{'epoch': 6, 'batch': 2477, 'loss': 5.518523216247559}
{'epoch': 6, 'batch': 2478, 'loss': 6.6459221839904785}
{'epoch': 6, 'batch': 2479, 'loss': 6.191952705383301}
{'epoch': 6, 'batch': 2480, 'loss': 6.502616882324219}
{'epoch': 6, 'batch': 2481, 'loss': 5.93950891494751}
{'epoch': 6, 'batch': 2482, 'loss': 6.470246315002441}
{'epoch': 6, 'batch': 2483, 'loss': 5.62473726272583}
{'epoch': 6, 'batch': 2484, 'loss': 5.939962387084961}
{'epoch': 6, 'batch': 2485, 'loss': 6.505931854248047}
{'epoch': 6, 'batch': 2486, 'loss': 6.157203197479248}
{'epoch': 

{'epoch': 6, 'batch': 2618, 'loss': 5.605584144592285}
{'epoch': 6, 'batch': 2619, 'loss': 5.235878944396973}
{'epoch': 6, 'batch': 2620, 'loss': 5.628173351287842}
{'epoch': 6, 'batch': 2621, 'loss': 5.153391361236572}
{'epoch': 6, 'batch': 2622, 'loss': 5.468536853790283}
{'epoch': 6, 'batch': 2623, 'loss': 5.258458137512207}
{'epoch': 6, 'batch': 2624, 'loss': 5.351740837097168}
{'epoch': 6, 'batch': 2625, 'loss': 5.352401256561279}
{'epoch': 6, 'batch': 2626, 'loss': 5.324421405792236}
{'epoch': 6, 'batch': 2627, 'loss': 5.571570873260498}
{'epoch': 6, 'batch': 2628, 'loss': 5.209258079528809}
{'epoch': 6, 'batch': 2629, 'loss': 5.305591106414795}
{'epoch': 6, 'batch': 2630, 'loss': 5.413381576538086}
{'epoch': 6, 'batch': 2631, 'loss': 5.286773204803467}
{'epoch': 6, 'batch': 2632, 'loss': 5.756263256072998}
{'epoch': 6, 'batch': 2633, 'loss': 5.291721343994141}
{'epoch': 6, 'batch': 2634, 'loss': 5.329080581665039}
{'epoch': 6, 'batch': 2635, 'loss': 4.890732288360596}
{'epoch': 

{'epoch': 6, 'batch': 2768, 'loss': 4.835328578948975}
{'epoch': 6, 'batch': 2769, 'loss': 4.952884674072266}
{'epoch': 6, 'batch': 2770, 'loss': 5.709364414215088}
{'epoch': 6, 'batch': 2771, 'loss': 5.610198020935059}
{'epoch': 6, 'batch': 2772, 'loss': 5.383543968200684}
{'epoch': 6, 'batch': 2773, 'loss': 5.9654059410095215}
{'epoch': 6, 'batch': 2774, 'loss': 5.688525199890137}
{'epoch': 6, 'batch': 2775, 'loss': 5.4626874923706055}
{'epoch': 6, 'batch': 2776, 'loss': 5.237203598022461}
{'epoch': 6, 'batch': 2777, 'loss': 5.368180751800537}
{'epoch': 6, 'batch': 2778, 'loss': 5.825555801391602}
{'epoch': 6, 'batch': 2779, 'loss': 5.093748092651367}
{'epoch': 6, 'batch': 2780, 'loss': 5.814868927001953}
{'epoch': 6, 'batch': 2781, 'loss': 5.4112701416015625}
{'epoch': 6, 'batch': 2782, 'loss': 5.458805561065674}
{'epoch': 6, 'batch': 2783, 'loss': 5.561296463012695}
{'epoch': 6, 'batch': 2784, 'loss': 5.641639232635498}
{'epoch': 6, 'batch': 2785, 'loss': 5.194373607635498}
{'epoch

{'epoch': 6, 'batch': 2919, 'loss': 4.398847579956055}
{'epoch': 6, 'batch': 2920, 'loss': 4.761023044586182}
{'epoch': 6, 'batch': 2921, 'loss': 5.422581195831299}
{'epoch': 6, 'batch': 2922, 'loss': 5.036709785461426}
{'epoch': 6, 'batch': 2923, 'loss': 5.1489973068237305}
{'epoch': 6, 'batch': 2924, 'loss': 4.841525077819824}
{'epoch': 6, 'batch': 2925, 'loss': 4.720372676849365}
{'epoch': 6, 'batch': 2926, 'loss': 5.083926200866699}
{'epoch': 6, 'batch': 2927, 'loss': 5.605332374572754}
{'epoch': 6, 'batch': 2928, 'loss': 4.669369220733643}
{'epoch': 6, 'batch': 2929, 'loss': 4.9975361824035645}
{'epoch': 6, 'batch': 2930, 'loss': 4.831674575805664}
{'epoch': 6, 'batch': 2931, 'loss': 4.876885890960693}
{'epoch': 6, 'batch': 2932, 'loss': 5.137609481811523}
{'epoch': 6, 'batch': 2933, 'loss': 4.938349723815918}
{'epoch': 6, 'batch': 2934, 'loss': 4.645214080810547}
{'epoch': 6, 'batch': 2935, 'loss': 4.824741840362549}
{'epoch': 6, 'batch': 2936, 'loss': 5.065290927886963}
{'epoch'

{'epoch': 6, 'batch': 3068, 'loss': 5.568665504455566}
{'epoch': 6, 'batch': 3069, 'loss': 6.005421161651611}
{'epoch': 6, 'batch': 3070, 'loss': 5.701450824737549}
{'epoch': 6, 'batch': 3071, 'loss': 5.6151580810546875}
{'epoch': 6, 'batch': 3072, 'loss': 5.418417930603027}
{'epoch': 6, 'batch': 3073, 'loss': 5.69136905670166}
{'epoch': 6, 'batch': 3074, 'loss': 5.706414699554443}
{'epoch': 6, 'batch': 3075, 'loss': 5.54328727722168}
{'epoch': 6, 'batch': 3076, 'loss': 5.710526943206787}
{'epoch': 6, 'batch': 3077, 'loss': 5.443469047546387}
{'epoch': 6, 'batch': 3078, 'loss': 5.734106540679932}
{'epoch': 6, 'batch': 3079, 'loss': 5.717006206512451}
{'epoch': 6, 'batch': 3080, 'loss': 5.357043266296387}
{'epoch': 6, 'batch': 3081, 'loss': 5.758095741271973}
{'epoch': 6, 'batch': 3082, 'loss': 5.686399936676025}
{'epoch': 6, 'batch': 3083, 'loss': 5.387306213378906}
{'epoch': 6, 'batch': 3084, 'loss': 5.659969806671143}
{'epoch': 6, 'batch': 3085, 'loss': 4.886699199676514}
{'epoch': 6

{'epoch': 6, 'batch': 3218, 'loss': 4.544870853424072}
{'epoch': 6, 'batch': 3219, 'loss': 4.316824913024902}
{'epoch': 6, 'batch': 3220, 'loss': 4.504907131195068}
{'epoch': 6, 'batch': 3221, 'loss': 4.677938461303711}
{'epoch': 6, 'batch': 3222, 'loss': 5.210909366607666}
{'epoch': 6, 'batch': 3223, 'loss': 4.811598300933838}
{'epoch': 6, 'batch': 3224, 'loss': 5.000622272491455}
{'epoch': 6, 'batch': 3225, 'loss': 5.090724945068359}
{'epoch': 6, 'batch': 3226, 'loss': 5.151086330413818}
{'epoch': 6, 'batch': 3227, 'loss': 5.250636577606201}
{'epoch': 6, 'batch': 3228, 'loss': 5.089571475982666}
{'epoch': 6, 'batch': 3229, 'loss': 4.975719928741455}
{'epoch': 6, 'batch': 3230, 'loss': 5.532583236694336}
{'epoch': 6, 'batch': 3231, 'loss': 5.6664042472839355}
{'epoch': 6, 'batch': 3232, 'loss': 5.805309772491455}
{'epoch': 6, 'batch': 3233, 'loss': 5.9890289306640625}
{'epoch': 6, 'batch': 3234, 'loss': 6.026863098144531}
{'epoch': 6, 'batch': 3235, 'loss': 6.163458824157715}
{'epoch'

{'epoch': 6, 'batch': 3370, 'loss': 5.264122009277344}
{'epoch': 6, 'batch': 3371, 'loss': 5.0580267906188965}
{'epoch': 6, 'batch': 3372, 'loss': 5.169167995452881}
{'epoch': 6, 'batch': 3373, 'loss': 5.769690990447998}
{'epoch': 6, 'batch': 3374, 'loss': 5.155360698699951}
{'epoch': 6, 'batch': 3375, 'loss': 5.336155891418457}
{'epoch': 6, 'batch': 3376, 'loss': 5.101088523864746}
{'epoch': 6, 'batch': 3377, 'loss': 5.184378623962402}
{'epoch': 6, 'batch': 3378, 'loss': 5.5249152183532715}
{'epoch': 6, 'batch': 3379, 'loss': 5.31611967086792}
{'epoch': 6, 'batch': 3380, 'loss': 5.148176670074463}
{'epoch': 6, 'batch': 3381, 'loss': 5.232962608337402}
{'epoch': 6, 'batch': 3382, 'loss': 4.361871719360352}
{'epoch': 6, 'batch': 3383, 'loss': 3.993752956390381}
{'epoch': 6, 'batch': 3384, 'loss': 5.130223274230957}
{'epoch': 6, 'batch': 3385, 'loss': 5.03069543838501}
{'epoch': 6, 'batch': 3386, 'loss': 5.314371585845947}
{'epoch': 6, 'batch': 3387, 'loss': 5.117485523223877}
{'epoch': 

{'epoch': 6, 'batch': 3521, 'loss': 5.824657917022705}
{'epoch': 6, 'batch': 3522, 'loss': 5.403623104095459}
{'epoch': 6, 'batch': 3523, 'loss': 5.366190433502197}
{'epoch': 6, 'batch': 3524, 'loss': 5.499354839324951}
{'epoch': 6, 'batch': 3525, 'loss': 5.183807849884033}
{'epoch': 6, 'batch': 3526, 'loss': 5.527454376220703}
{'epoch': 6, 'batch': 3527, 'loss': 5.490545272827148}
{'epoch': 6, 'batch': 3528, 'loss': 5.847625255584717}
{'epoch': 6, 'batch': 3529, 'loss': 5.215404033660889}
{'epoch': 6, 'batch': 3530, 'loss': 4.90285062789917}
{'epoch': 6, 'batch': 3531, 'loss': 5.417979717254639}
{'epoch': 6, 'batch': 3532, 'loss': 5.180124759674072}
{'epoch': 6, 'batch': 3533, 'loss': 5.723851203918457}
{'epoch': 6, 'batch': 3534, 'loss': 4.8208394050598145}
{'epoch': 6, 'batch': 3535, 'loss': 4.3192458152771}
{'epoch': 6, 'batch': 3536, 'loss': 4.944055557250977}
{'epoch': 6, 'batch': 3537, 'loss': 5.639499187469482}
{'epoch': 6, 'batch': 3538, 'loss': 5.384886741638184}
{'epoch': 6,

{'epoch': 6, 'batch': 3672, 'loss': 5.8079447746276855}
{'epoch': 6, 'batch': 3673, 'loss': 6.075235366821289}
{'epoch': 6, 'batch': 3674, 'loss': 5.039193630218506}
{'epoch': 6, 'batch': 3675, 'loss': 6.001158237457275}
{'epoch': 6, 'batch': 3676, 'loss': 5.375493049621582}
{'epoch': 6, 'batch': 3677, 'loss': 4.801785945892334}
{'epoch': 6, 'batch': 3678, 'loss': 4.322310924530029}
{'epoch': 6, 'batch': 3679, 'loss': 5.86135721206665}
{'epoch': 6, 'batch': 3680, 'loss': 4.639681816101074}
{'epoch': 6, 'batch': 3681, 'loss': 5.424464702606201}
{'epoch': 6, 'batch': 3682, 'loss': 5.590024948120117}
{'epoch': 6, 'batch': 3683, 'loss': 5.776875972747803}
{'epoch': 6, 'batch': 3684, 'loss': 5.052090167999268}
{'epoch': 6, 'batch': 3685, 'loss': 4.722568035125732}
{'epoch': 6, 'batch': 3686, 'loss': 4.829254150390625}
{'epoch': 6, 'batch': 3687, 'loss': 5.2982258796691895}
{'epoch': 6, 'batch': 3688, 'loss': 5.381032466888428}
{'epoch': 6, 'batch': 3689, 'loss': 5.462655544281006}
{'epoch':

{'epoch': 7, 'batch': 52, 'loss': 5.2640380859375}
{'epoch': 7, 'batch': 53, 'loss': 5.0995941162109375}
{'epoch': 7, 'batch': 54, 'loss': 4.941547393798828}
{'epoch': 7, 'batch': 55, 'loss': 4.683375835418701}
{'epoch': 7, 'batch': 56, 'loss': 5.735712051391602}
{'epoch': 7, 'batch': 57, 'loss': 5.52767276763916}
{'epoch': 7, 'batch': 58, 'loss': 4.397220134735107}
{'epoch': 7, 'batch': 59, 'loss': 3.917691230773926}
{'epoch': 7, 'batch': 60, 'loss': 5.1417951583862305}
{'epoch': 7, 'batch': 61, 'loss': 5.164231777191162}
{'epoch': 7, 'batch': 62, 'loss': 5.075114727020264}
{'epoch': 7, 'batch': 63, 'loss': 5.338860034942627}
{'epoch': 7, 'batch': 64, 'loss': 4.8203020095825195}
{'epoch': 7, 'batch': 65, 'loss': 4.497106552124023}
{'epoch': 7, 'batch': 66, 'loss': 5.14272928237915}
{'epoch': 7, 'batch': 67, 'loss': 5.849615097045898}
{'epoch': 7, 'batch': 68, 'loss': 5.560541152954102}
{'epoch': 7, 'batch': 69, 'loss': 4.570754528045654}
{'epoch': 7, 'batch': 70, 'loss': 3.84937667846

{'epoch': 7, 'batch': 205, 'loss': 5.736106872558594}
{'epoch': 7, 'batch': 206, 'loss': 5.4359965324401855}
{'epoch': 7, 'batch': 207, 'loss': 5.123529434204102}
{'epoch': 7, 'batch': 208, 'loss': 4.8411078453063965}
{'epoch': 7, 'batch': 209, 'loss': 5.095694541931152}
{'epoch': 7, 'batch': 210, 'loss': 5.2695536613464355}
{'epoch': 7, 'batch': 211, 'loss': 5.174706935882568}
{'epoch': 7, 'batch': 212, 'loss': 5.036357402801514}
{'epoch': 7, 'batch': 213, 'loss': 4.84207820892334}
{'epoch': 7, 'batch': 214, 'loss': 5.303680419921875}
{'epoch': 7, 'batch': 215, 'loss': 4.837343215942383}
{'epoch': 7, 'batch': 216, 'loss': 4.946753978729248}
{'epoch': 7, 'batch': 217, 'loss': 4.835635185241699}
{'epoch': 7, 'batch': 218, 'loss': 5.277646541595459}
{'epoch': 7, 'batch': 219, 'loss': 5.7477288246154785}
{'epoch': 7, 'batch': 220, 'loss': 6.1340765953063965}
{'epoch': 7, 'batch': 221, 'loss': 5.354039669036865}
{'epoch': 7, 'batch': 222, 'loss': 5.227197647094727}
{'epoch': 7, 'batch': 22

{'epoch': 7, 'batch': 359, 'loss': 4.947242736816406}
{'epoch': 7, 'batch': 360, 'loss': 4.375770568847656}
{'epoch': 7, 'batch': 361, 'loss': 4.708206653594971}
{'epoch': 7, 'batch': 362, 'loss': 5.044313430786133}
{'epoch': 7, 'batch': 363, 'loss': 5.617933750152588}
{'epoch': 7, 'batch': 364, 'loss': 5.703666687011719}
{'epoch': 7, 'batch': 365, 'loss': 5.2738518714904785}
{'epoch': 7, 'batch': 366, 'loss': 5.200538635253906}
{'epoch': 7, 'batch': 367, 'loss': 5.4035139083862305}
{'epoch': 7, 'batch': 368, 'loss': 5.124354839324951}
{'epoch': 7, 'batch': 369, 'loss': 5.535276889801025}
{'epoch': 7, 'batch': 370, 'loss': 5.244890213012695}
{'epoch': 7, 'batch': 371, 'loss': 5.0204339027404785}
{'epoch': 7, 'batch': 372, 'loss': 5.033898830413818}
{'epoch': 7, 'batch': 373, 'loss': 5.473636627197266}
{'epoch': 7, 'batch': 374, 'loss': 4.922272205352783}
{'epoch': 7, 'batch': 375, 'loss': 5.20114278793335}
{'epoch': 7, 'batch': 376, 'loss': 5.4730119705200195}
{'epoch': 7, 'batch': 377

{'epoch': 7, 'batch': 512, 'loss': 5.09747314453125}
{'epoch': 7, 'batch': 513, 'loss': 4.738640308380127}
{'epoch': 7, 'batch': 514, 'loss': 5.254688739776611}
{'epoch': 7, 'batch': 515, 'loss': 5.1363701820373535}
{'epoch': 7, 'batch': 516, 'loss': 6.40067195892334}
{'epoch': 7, 'batch': 517, 'loss': 6.590601921081543}
{'epoch': 7, 'batch': 518, 'loss': 6.025752067565918}
{'epoch': 7, 'batch': 519, 'loss': 5.797738075256348}
{'epoch': 7, 'batch': 520, 'loss': 5.931218147277832}
{'epoch': 7, 'batch': 521, 'loss': 5.626603126525879}
{'epoch': 7, 'batch': 522, 'loss': 5.868268013000488}
{'epoch': 7, 'batch': 523, 'loss': 5.415017127990723}
{'epoch': 7, 'batch': 524, 'loss': 5.27536153793335}
{'epoch': 7, 'batch': 525, 'loss': 5.293543338775635}
{'epoch': 7, 'batch': 526, 'loss': 4.911731719970703}
{'epoch': 7, 'batch': 527, 'loss': 5.187274932861328}
{'epoch': 7, 'batch': 528, 'loss': 4.640202045440674}
{'epoch': 7, 'batch': 529, 'loss': 4.980903148651123}
{'epoch': 7, 'batch': 530, 'lo

{'epoch': 7, 'batch': 665, 'loss': 5.389251232147217}
{'epoch': 7, 'batch': 666, 'loss': 6.1573567390441895}
{'epoch': 7, 'batch': 667, 'loss': 5.935450553894043}
{'epoch': 7, 'batch': 668, 'loss': 6.114782333374023}
{'epoch': 7, 'batch': 669, 'loss': 6.160003185272217}
{'epoch': 7, 'batch': 670, 'loss': 5.223324298858643}
{'epoch': 7, 'batch': 671, 'loss': 5.337011337280273}
{'epoch': 7, 'batch': 672, 'loss': 5.835067272186279}
{'epoch': 7, 'batch': 673, 'loss': 5.446571350097656}
{'epoch': 7, 'batch': 674, 'loss': 5.786182403564453}
{'epoch': 7, 'batch': 675, 'loss': 5.362419128417969}
{'epoch': 7, 'batch': 676, 'loss': 6.4387593269348145}
{'epoch': 7, 'batch': 677, 'loss': 5.357265472412109}
{'epoch': 7, 'batch': 678, 'loss': 6.408785820007324}
{'epoch': 7, 'batch': 679, 'loss': 6.110013961791992}
{'epoch': 7, 'batch': 680, 'loss': 6.532660961151123}
{'epoch': 7, 'batch': 681, 'loss': 6.341087818145752}
{'epoch': 7, 'batch': 682, 'loss': 6.851192474365234}
{'epoch': 7, 'batch': 683,

{'epoch': 7, 'batch': 819, 'loss': 6.297327518463135}
{'epoch': 7, 'batch': 820, 'loss': 5.924686431884766}
{'epoch': 7, 'batch': 821, 'loss': 6.2558393478393555}
{'epoch': 7, 'batch': 822, 'loss': 5.92983341217041}
{'epoch': 7, 'batch': 823, 'loss': 5.415797233581543}
{'epoch': 7, 'batch': 824, 'loss': 5.791860103607178}
{'epoch': 7, 'batch': 825, 'loss': 5.932890892028809}
{'epoch': 7, 'batch': 826, 'loss': 6.18427848815918}
{'epoch': 7, 'batch': 827, 'loss': 6.0380024909973145}
{'epoch': 7, 'batch': 828, 'loss': 5.709726810455322}
{'epoch': 7, 'batch': 829, 'loss': 6.106010913848877}
{'epoch': 7, 'batch': 830, 'loss': 5.988492012023926}
{'epoch': 7, 'batch': 831, 'loss': 5.6498332023620605}
{'epoch': 7, 'batch': 832, 'loss': 5.428927421569824}
{'epoch': 7, 'batch': 833, 'loss': 5.795251846313477}
{'epoch': 7, 'batch': 834, 'loss': 5.6413984298706055}
{'epoch': 7, 'batch': 835, 'loss': 5.823320388793945}
{'epoch': 7, 'batch': 836, 'loss': 5.777307033538818}
{'epoch': 7, 'batch': 837,

{'epoch': 7, 'batch': 974, 'loss': 5.062886714935303}
{'epoch': 7, 'batch': 975, 'loss': 4.642370223999023}
{'epoch': 7, 'batch': 976, 'loss': 5.202734470367432}
{'epoch': 7, 'batch': 977, 'loss': 4.788782119750977}
{'epoch': 7, 'batch': 978, 'loss': 5.287434101104736}
{'epoch': 7, 'batch': 979, 'loss': 4.777798652648926}
{'epoch': 7, 'batch': 980, 'loss': 5.291236877441406}
{'epoch': 7, 'batch': 981, 'loss': 5.549901008605957}
{'epoch': 7, 'batch': 982, 'loss': 5.359993934631348}
{'epoch': 7, 'batch': 983, 'loss': 5.10434627532959}
{'epoch': 7, 'batch': 984, 'loss': 5.613613605499268}
{'epoch': 7, 'batch': 985, 'loss': 5.461671829223633}
{'epoch': 7, 'batch': 986, 'loss': 5.068947792053223}
{'epoch': 7, 'batch': 987, 'loss': 5.368241310119629}
{'epoch': 7, 'batch': 988, 'loss': 5.2544331550598145}
{'epoch': 7, 'batch': 989, 'loss': 5.3223490715026855}
{'epoch': 7, 'batch': 990, 'loss': 5.195647716522217}
{'epoch': 7, 'batch': 991, 'loss': 5.009088039398193}
{'epoch': 7, 'batch': 992, 

{'epoch': 7, 'batch': 1125, 'loss': 5.7389726638793945}
{'epoch': 7, 'batch': 1126, 'loss': 5.498496055603027}
{'epoch': 7, 'batch': 1127, 'loss': 5.578577518463135}
{'epoch': 7, 'batch': 1128, 'loss': 4.954204082489014}
{'epoch': 7, 'batch': 1129, 'loss': 5.7306318283081055}
{'epoch': 7, 'batch': 1130, 'loss': 5.541281223297119}
{'epoch': 7, 'batch': 1131, 'loss': 5.5344133377075195}
{'epoch': 7, 'batch': 1132, 'loss': 5.276073932647705}
{'epoch': 7, 'batch': 1133, 'loss': 5.270034313201904}
{'epoch': 7, 'batch': 1134, 'loss': 5.440890789031982}
{'epoch': 7, 'batch': 1135, 'loss': 5.2344584465026855}
{'epoch': 7, 'batch': 1136, 'loss': 5.488227844238281}
{'epoch': 7, 'batch': 1137, 'loss': 5.290564060211182}
{'epoch': 7, 'batch': 1138, 'loss': 5.49897575378418}
{'epoch': 7, 'batch': 1139, 'loss': 5.019347667694092}
{'epoch': 7, 'batch': 1140, 'loss': 5.355417251586914}
{'epoch': 7, 'batch': 1141, 'loss': 5.788792610168457}
{'epoch': 7, 'batch': 1142, 'loss': 5.649808883666992}
{'epoch

{'epoch': 7, 'batch': 1277, 'loss': 5.600522041320801}
{'epoch': 7, 'batch': 1278, 'loss': 5.573939800262451}
{'epoch': 7, 'batch': 1279, 'loss': 5.095966815948486}
{'epoch': 7, 'batch': 1280, 'loss': 5.4098734855651855}
{'epoch': 7, 'batch': 1281, 'loss': 4.609430313110352}
{'epoch': 7, 'batch': 1282, 'loss': 4.233839988708496}
{'epoch': 7, 'batch': 1283, 'loss': 4.849578857421875}
{'epoch': 7, 'batch': 1284, 'loss': 5.091646194458008}
{'epoch': 7, 'batch': 1285, 'loss': 5.101728439331055}
{'epoch': 7, 'batch': 1286, 'loss': 5.160825252532959}
{'epoch': 7, 'batch': 1287, 'loss': 4.856347560882568}
{'epoch': 7, 'batch': 1288, 'loss': 5.587459564208984}
{'epoch': 7, 'batch': 1289, 'loss': 5.4217329025268555}
{'epoch': 7, 'batch': 1290, 'loss': 5.525903224945068}
{'epoch': 7, 'batch': 1291, 'loss': 5.431000709533691}
{'epoch': 7, 'batch': 1292, 'loss': 5.6086602210998535}
{'epoch': 7, 'batch': 1293, 'loss': 5.260538578033447}
{'epoch': 7, 'batch': 1294, 'loss': 5.091997146606445}
{'epoch

{'epoch': 7, 'batch': 1427, 'loss': 5.305276870727539}
{'epoch': 7, 'batch': 1428, 'loss': 5.298427581787109}
{'epoch': 7, 'batch': 1429, 'loss': 5.261645793914795}
{'epoch': 7, 'batch': 1430, 'loss': 5.404394626617432}
{'epoch': 7, 'batch': 1431, 'loss': 5.573955059051514}
{'epoch': 7, 'batch': 1432, 'loss': 5.474628925323486}
{'epoch': 7, 'batch': 1433, 'loss': 5.4246087074279785}
{'epoch': 7, 'batch': 1434, 'loss': 5.667665004730225}
{'epoch': 7, 'batch': 1435, 'loss': 5.647917747497559}
{'epoch': 7, 'batch': 1436, 'loss': 5.351595878601074}
{'epoch': 7, 'batch': 1437, 'loss': 4.924351692199707}
{'epoch': 7, 'batch': 1438, 'loss': 4.95625638961792}
{'epoch': 7, 'batch': 1439, 'loss': 5.318288803100586}
{'epoch': 7, 'batch': 1440, 'loss': 5.2090373039245605}
{'epoch': 7, 'batch': 1441, 'loss': 5.44144868850708}
{'epoch': 7, 'batch': 1442, 'loss': 5.7097578048706055}
{'epoch': 7, 'batch': 1443, 'loss': 5.399309158325195}
{'epoch': 7, 'batch': 1444, 'loss': 4.8249030113220215}
{'epoch'

{'epoch': 7, 'batch': 1579, 'loss': 5.7531867027282715}
{'epoch': 7, 'batch': 1580, 'loss': 5.134391784667969}
{'epoch': 7, 'batch': 1581, 'loss': 5.257627964019775}
{'epoch': 7, 'batch': 1582, 'loss': 5.630918502807617}
{'epoch': 7, 'batch': 1583, 'loss': 5.200325965881348}
{'epoch': 7, 'batch': 1584, 'loss': 5.3723883628845215}
{'epoch': 7, 'batch': 1585, 'loss': 5.139830589294434}
{'epoch': 7, 'batch': 1586, 'loss': 4.787329196929932}
{'epoch': 7, 'batch': 1587, 'loss': 5.496188163757324}
{'epoch': 7, 'batch': 1588, 'loss': 5.113368988037109}
{'epoch': 7, 'batch': 1589, 'loss': 4.828955173492432}
{'epoch': 7, 'batch': 1590, 'loss': 4.452456474304199}
{'epoch': 7, 'batch': 1591, 'loss': 5.188812732696533}
{'epoch': 7, 'batch': 1592, 'loss': 5.286086082458496}
{'epoch': 7, 'batch': 1593, 'loss': 5.179325103759766}
{'epoch': 7, 'batch': 1594, 'loss': 5.412825107574463}
{'epoch': 7, 'batch': 1595, 'loss': 5.245656967163086}
{'epoch': 7, 'batch': 1596, 'loss': 5.385016918182373}
{'epoch'

{'epoch': 7, 'batch': 1728, 'loss': 4.509278774261475}
{'epoch': 7, 'batch': 1729, 'loss': 5.096828460693359}
{'epoch': 7, 'batch': 1730, 'loss': 5.41656494140625}
{'epoch': 7, 'batch': 1731, 'loss': 4.630114555358887}
{'epoch': 7, 'batch': 1732, 'loss': 5.003955841064453}
{'epoch': 7, 'batch': 1733, 'loss': 4.932816982269287}
{'epoch': 7, 'batch': 1734, 'loss': 4.4984049797058105}
{'epoch': 7, 'batch': 1735, 'loss': 4.743956565856934}
{'epoch': 7, 'batch': 1736, 'loss': 4.934122085571289}
{'epoch': 7, 'batch': 1737, 'loss': 5.119829177856445}
{'epoch': 7, 'batch': 1738, 'loss': 5.559532165527344}
{'epoch': 7, 'batch': 1739, 'loss': 5.295918941497803}
{'epoch': 7, 'batch': 1740, 'loss': 4.958159446716309}
{'epoch': 7, 'batch': 1741, 'loss': 5.62457275390625}
{'epoch': 7, 'batch': 1742, 'loss': 5.1878132820129395}
{'epoch': 7, 'batch': 1743, 'loss': 5.50035285949707}
{'epoch': 7, 'batch': 1744, 'loss': 5.303864479064941}
{'epoch': 7, 'batch': 1745, 'loss': 5.004678249359131}
{'epoch': 7

{'epoch': 7, 'batch': 1879, 'loss': 5.2054009437561035}
{'epoch': 7, 'batch': 1880, 'loss': 5.164302349090576}
{'epoch': 7, 'batch': 1881, 'loss': 5.383035659790039}
{'epoch': 7, 'batch': 1882, 'loss': 5.621563911437988}
{'epoch': 7, 'batch': 1883, 'loss': 5.294961929321289}
{'epoch': 7, 'batch': 1884, 'loss': 5.462124824523926}
{'epoch': 7, 'batch': 1885, 'loss': 4.452984809875488}
{'epoch': 7, 'batch': 1886, 'loss': 4.956774711608887}
{'epoch': 7, 'batch': 1887, 'loss': 5.492695331573486}
{'epoch': 7, 'batch': 1888, 'loss': 5.836560249328613}
{'epoch': 7, 'batch': 1889, 'loss': 5.226268768310547}
{'epoch': 7, 'batch': 1890, 'loss': 5.327062606811523}
{'epoch': 7, 'batch': 1891, 'loss': 5.182818412780762}
{'epoch': 7, 'batch': 1892, 'loss': 5.2226786613464355}
{'epoch': 7, 'batch': 1893, 'loss': 5.399203300476074}
{'epoch': 7, 'batch': 1894, 'loss': 5.514954566955566}
{'epoch': 7, 'batch': 1895, 'loss': 4.691298484802246}
{'epoch': 7, 'batch': 1896, 'loss': 5.313246726989746}
{'epoch'

{'epoch': 7, 'batch': 2029, 'loss': 5.146678447723389}
{'epoch': 7, 'batch': 2030, 'loss': 4.8523712158203125}
{'epoch': 7, 'batch': 2031, 'loss': 5.517937660217285}
{'epoch': 7, 'batch': 2032, 'loss': 5.943887710571289}
{'epoch': 7, 'batch': 2033, 'loss': 6.507087230682373}
{'epoch': 7, 'batch': 2034, 'loss': 6.136651515960693}
{'epoch': 7, 'batch': 2035, 'loss': 5.468772888183594}
{'epoch': 7, 'batch': 2036, 'loss': 5.0847697257995605}
{'epoch': 7, 'batch': 2037, 'loss': 5.477668285369873}
{'epoch': 7, 'batch': 2038, 'loss': 5.417777061462402}
{'epoch': 7, 'batch': 2039, 'loss': 5.31758451461792}
{'epoch': 7, 'batch': 2040, 'loss': 5.244711399078369}
{'epoch': 7, 'batch': 2041, 'loss': 5.460144996643066}
{'epoch': 7, 'batch': 2042, 'loss': 5.420880317687988}
{'epoch': 7, 'batch': 2043, 'loss': 5.455105304718018}
{'epoch': 7, 'batch': 2044, 'loss': 5.132073402404785}
{'epoch': 7, 'batch': 2045, 'loss': 5.246049880981445}
{'epoch': 7, 'batch': 2046, 'loss': 5.08534049987793}
{'epoch': 

{'epoch': 7, 'batch': 2179, 'loss': 5.779320240020752}
{'epoch': 7, 'batch': 2180, 'loss': 5.817758083343506}
{'epoch': 7, 'batch': 2181, 'loss': 5.355014324188232}
{'epoch': 7, 'batch': 2182, 'loss': 4.942667484283447}
{'epoch': 7, 'batch': 2183, 'loss': 4.7988080978393555}
{'epoch': 7, 'batch': 2184, 'loss': 4.986988544464111}
{'epoch': 7, 'batch': 2185, 'loss': 5.143790245056152}
{'epoch': 7, 'batch': 2186, 'loss': 6.25354528427124}
{'epoch': 7, 'batch': 2187, 'loss': 5.733096599578857}
{'epoch': 7, 'batch': 2188, 'loss': 5.765079975128174}
{'epoch': 7, 'batch': 2189, 'loss': 5.349655628204346}
{'epoch': 7, 'batch': 2190, 'loss': 5.704679489135742}
{'epoch': 7, 'batch': 2191, 'loss': 5.811420440673828}
{'epoch': 7, 'batch': 2192, 'loss': 4.988800048828125}
{'epoch': 7, 'batch': 2193, 'loss': 4.863080978393555}
{'epoch': 7, 'batch': 2194, 'loss': 5.467658042907715}
{'epoch': 7, 'batch': 2195, 'loss': 4.938355922698975}
{'epoch': 7, 'batch': 2196, 'loss': 5.028573989868164}
{'epoch': 

{'epoch': 7, 'batch': 2330, 'loss': 5.752138137817383}
{'epoch': 7, 'batch': 2331, 'loss': 5.152228355407715}
{'epoch': 7, 'batch': 2332, 'loss': 5.533020496368408}
{'epoch': 7, 'batch': 2333, 'loss': 5.151423454284668}
{'epoch': 7, 'batch': 2334, 'loss': 5.659082889556885}
{'epoch': 7, 'batch': 2335, 'loss': 5.246922969818115}
{'epoch': 7, 'batch': 2336, 'loss': 5.459354400634766}
{'epoch': 7, 'batch': 2337, 'loss': 5.10365629196167}
{'epoch': 7, 'batch': 2338, 'loss': 5.265584468841553}
{'epoch': 7, 'batch': 2339, 'loss': 5.090883731842041}
{'epoch': 7, 'batch': 2340, 'loss': 5.043557643890381}
{'epoch': 7, 'batch': 2341, 'loss': 5.2994208335876465}
{'epoch': 7, 'batch': 2342, 'loss': 5.1824774742126465}
{'epoch': 7, 'batch': 2343, 'loss': 5.0421905517578125}
{'epoch': 7, 'batch': 2344, 'loss': 5.327762603759766}
{'epoch': 7, 'batch': 2345, 'loss': 5.083284854888916}
{'epoch': 7, 'batch': 2346, 'loss': 4.63426399230957}
{'epoch': 7, 'batch': 2347, 'loss': 4.74725866317749}
{'epoch': 

{'epoch': 7, 'batch': 2481, 'loss': 5.718734264373779}
{'epoch': 7, 'batch': 2482, 'loss': 5.6882195472717285}
{'epoch': 7, 'batch': 2483, 'loss': 5.211592674255371}
{'epoch': 7, 'batch': 2484, 'loss': 5.698211193084717}
{'epoch': 7, 'batch': 2485, 'loss': 6.196300983428955}
{'epoch': 7, 'batch': 2486, 'loss': 5.901975154876709}
{'epoch': 7, 'batch': 2487, 'loss': 5.405244827270508}
{'epoch': 7, 'batch': 2488, 'loss': 4.2061052322387695}
{'epoch': 7, 'batch': 2489, 'loss': 5.63644552230835}
{'epoch': 7, 'batch': 2490, 'loss': 5.674641132354736}
{'epoch': 7, 'batch': 2491, 'loss': 6.158973217010498}
{'epoch': 7, 'batch': 2492, 'loss': 5.515837669372559}
{'epoch': 7, 'batch': 2493, 'loss': 5.781453609466553}
{'epoch': 7, 'batch': 2494, 'loss': 5.611554145812988}
{'epoch': 7, 'batch': 2495, 'loss': 5.633916854858398}
{'epoch': 7, 'batch': 2496, 'loss': 5.796123027801514}
{'epoch': 7, 'batch': 2497, 'loss': 5.5288166999816895}
{'epoch': 7, 'batch': 2498, 'loss': 5.7553887367248535}
{'epoch

{'epoch': 7, 'batch': 2633, 'loss': 5.119871616363525}
{'epoch': 7, 'batch': 2634, 'loss': 5.102016448974609}
{'epoch': 7, 'batch': 2635, 'loss': 4.74219274520874}
{'epoch': 7, 'batch': 2636, 'loss': 4.802557945251465}
{'epoch': 7, 'batch': 2637, 'loss': 5.076700687408447}
{'epoch': 7, 'batch': 2638, 'loss': 5.196104526519775}
{'epoch': 7, 'batch': 2639, 'loss': 5.214375972747803}
{'epoch': 7, 'batch': 2640, 'loss': 5.093027114868164}
{'epoch': 7, 'batch': 2641, 'loss': 4.824429512023926}
{'epoch': 7, 'batch': 2642, 'loss': 4.949952125549316}
{'epoch': 7, 'batch': 2643, 'loss': 4.895049571990967}
{'epoch': 7, 'batch': 2644, 'loss': 4.673591613769531}
{'epoch': 7, 'batch': 2645, 'loss': 4.519155502319336}
{'epoch': 7, 'batch': 2646, 'loss': 4.874720573425293}
{'epoch': 7, 'batch': 2647, 'loss': 4.9511213302612305}
{'epoch': 7, 'batch': 2648, 'loss': 4.680032730102539}
{'epoch': 7, 'batch': 2649, 'loss': 5.144795894622803}
{'epoch': 7, 'batch': 2650, 'loss': 5.518084526062012}
{'epoch': 

{'epoch': 7, 'batch': 2784, 'loss': 5.468693256378174}
{'epoch': 7, 'batch': 2785, 'loss': 4.894837379455566}
{'epoch': 7, 'batch': 2786, 'loss': 5.281967639923096}
{'epoch': 7, 'batch': 2787, 'loss': 5.100300312042236}
{'epoch': 7, 'batch': 2788, 'loss': 4.956355571746826}
{'epoch': 7, 'batch': 2789, 'loss': 5.098171234130859}
{'epoch': 7, 'batch': 2790, 'loss': 5.480109691619873}
{'epoch': 7, 'batch': 2791, 'loss': 5.407321929931641}
{'epoch': 7, 'batch': 2792, 'loss': 4.994922637939453}
{'epoch': 7, 'batch': 2793, 'loss': 5.176379680633545}
{'epoch': 7, 'batch': 2794, 'loss': 5.162936210632324}
{'epoch': 7, 'batch': 2795, 'loss': 5.179472923278809}
{'epoch': 7, 'batch': 2796, 'loss': 5.246901988983154}
{'epoch': 7, 'batch': 2797, 'loss': 5.634219169616699}
{'epoch': 7, 'batch': 2798, 'loss': 5.564323902130127}
{'epoch': 7, 'batch': 2799, 'loss': 5.751264572143555}
{'epoch': 7, 'batch': 2800, 'loss': 5.724940299987793}
{'epoch': 7, 'batch': 2801, 'loss': 5.487082004547119}
{'epoch': 

{'epoch': 7, 'batch': 2936, 'loss': 4.855939865112305}
{'epoch': 7, 'batch': 2937, 'loss': 4.951781272888184}
{'epoch': 7, 'batch': 2938, 'loss': 5.189300537109375}
{'epoch': 7, 'batch': 2939, 'loss': 3.708164691925049}
{'epoch': 7, 'batch': 2940, 'loss': 5.178638458251953}
{'epoch': 7, 'batch': 2941, 'loss': 5.2604756355285645}
{'epoch': 7, 'batch': 2942, 'loss': 4.38277530670166}
{'epoch': 7, 'batch': 2943, 'loss': 3.6694934368133545}
{'epoch': 7, 'batch': 2944, 'loss': 4.632348537445068}
{'epoch': 7, 'batch': 2945, 'loss': 3.4424588680267334}
{'epoch': 7, 'batch': 2946, 'loss': 4.091294288635254}
{'epoch': 7, 'batch': 2947, 'loss': 5.051693916320801}
{'epoch': 7, 'batch': 2948, 'loss': 4.701194763183594}
{'epoch': 7, 'batch': 2949, 'loss': 4.66650390625}
{'epoch': 7, 'batch': 2950, 'loss': 5.188798904418945}
{'epoch': 7, 'batch': 2951, 'loss': 4.6929755210876465}
{'epoch': 7, 'batch': 2952, 'loss': 4.345224857330322}
{'epoch': 7, 'batch': 2953, 'loss': 4.569624423980713}
{'epoch': 7

{'epoch': 7, 'batch': 3086, 'loss': 4.805813789367676}
{'epoch': 7, 'batch': 3087, 'loss': 4.735398769378662}
{'epoch': 7, 'batch': 3088, 'loss': 5.252346992492676}
{'epoch': 7, 'batch': 3089, 'loss': 5.726955890655518}
{'epoch': 7, 'batch': 3090, 'loss': 5.301051139831543}
{'epoch': 7, 'batch': 3091, 'loss': 5.020227909088135}
{'epoch': 7, 'batch': 3092, 'loss': 4.944124221801758}
{'epoch': 7, 'batch': 3093, 'loss': 5.436014652252197}
{'epoch': 7, 'batch': 3094, 'loss': 5.168651580810547}
{'epoch': 7, 'batch': 3095, 'loss': 4.843379020690918}
{'epoch': 7, 'batch': 3096, 'loss': 4.699263572692871}
{'epoch': 7, 'batch': 3097, 'loss': 5.416440963745117}
{'epoch': 7, 'batch': 3098, 'loss': 5.6551432609558105}
{'epoch': 7, 'batch': 3099, 'loss': 5.787312030792236}
{'epoch': 7, 'batch': 3100, 'loss': 5.561882495880127}
{'epoch': 7, 'batch': 3101, 'loss': 5.7180399894714355}
{'epoch': 7, 'batch': 3102, 'loss': 5.208001613616943}
{'epoch': 7, 'batch': 3103, 'loss': 5.1284990310668945}
{'epoch

{'epoch': 7, 'batch': 3236, 'loss': 5.4522480964660645}
{'epoch': 7, 'batch': 3237, 'loss': 4.411590576171875}
{'epoch': 7, 'batch': 3238, 'loss': 5.050508499145508}
{'epoch': 7, 'batch': 3239, 'loss': 5.088864326477051}
{'epoch': 7, 'batch': 3240, 'loss': 5.297858715057373}
{'epoch': 7, 'batch': 3241, 'loss': 5.065298557281494}
{'epoch': 7, 'batch': 3242, 'loss': 5.0439934730529785}
{'epoch': 7, 'batch': 3243, 'loss': 5.3452534675598145}
{'epoch': 7, 'batch': 3244, 'loss': 5.473413467407227}
{'epoch': 7, 'batch': 3245, 'loss': 4.895565509796143}
{'epoch': 7, 'batch': 3246, 'loss': 5.080520153045654}
{'epoch': 7, 'batch': 3247, 'loss': 4.788877487182617}
{'epoch': 7, 'batch': 3248, 'loss': 4.973918914794922}
{'epoch': 7, 'batch': 3249, 'loss': 5.219930648803711}
{'epoch': 7, 'batch': 3250, 'loss': 5.372831344604492}
{'epoch': 7, 'batch': 3251, 'loss': 4.875401496887207}
{'epoch': 7, 'batch': 3252, 'loss': 5.75489616394043}
{'epoch': 7, 'batch': 3253, 'loss': 5.210141658782959}
{'epoch'

{'epoch': 7, 'batch': 3385, 'loss': 4.8928327560424805}
{'epoch': 7, 'batch': 3386, 'loss': 5.202696800231934}
{'epoch': 7, 'batch': 3387, 'loss': 4.876898765563965}
{'epoch': 7, 'batch': 3388, 'loss': 4.742721080780029}
{'epoch': 7, 'batch': 3389, 'loss': 4.722965240478516}
{'epoch': 7, 'batch': 3390, 'loss': 4.990715980529785}
{'epoch': 7, 'batch': 3391, 'loss': 5.640472412109375}
{'epoch': 7, 'batch': 3392, 'loss': 5.063918113708496}
{'epoch': 7, 'batch': 3393, 'loss': 5.352560520172119}
{'epoch': 7, 'batch': 3394, 'loss': 5.168613433837891}
{'epoch': 7, 'batch': 3395, 'loss': 5.499172687530518}
{'epoch': 7, 'batch': 3396, 'loss': 5.218918800354004}
{'epoch': 7, 'batch': 3397, 'loss': 3.9650418758392334}
{'epoch': 7, 'batch': 3398, 'loss': 4.697040557861328}
{'epoch': 7, 'batch': 3399, 'loss': 5.05665922164917}
{'epoch': 7, 'batch': 3400, 'loss': 5.2166428565979}
{'epoch': 7, 'batch': 3401, 'loss': 3.9111077785491943}
{'epoch': 7, 'batch': 3402, 'loss': 2.8572824001312256}
{'epoch':

{'epoch': 7, 'batch': 3535, 'loss': 3.997391939163208}
{'epoch': 7, 'batch': 3536, 'loss': 4.760529518127441}
{'epoch': 7, 'batch': 3537, 'loss': 5.401795387268066}
{'epoch': 7, 'batch': 3538, 'loss': 5.0452351570129395}
{'epoch': 7, 'batch': 3539, 'loss': 5.2209014892578125}
{'epoch': 7, 'batch': 3540, 'loss': 4.096451759338379}
{'epoch': 7, 'batch': 3541, 'loss': 4.490899085998535}
{'epoch': 7, 'batch': 3542, 'loss': 5.455352306365967}
{'epoch': 7, 'batch': 3543, 'loss': 5.746950626373291}
{'epoch': 7, 'batch': 3544, 'loss': 5.688848972320557}
{'epoch': 7, 'batch': 3545, 'loss': 5.1874494552612305}
{'epoch': 7, 'batch': 3546, 'loss': 5.31882905960083}
{'epoch': 7, 'batch': 3547, 'loss': 3.6287035942077637}
{'epoch': 7, 'batch': 3548, 'loss': 4.398515224456787}
{'epoch': 7, 'batch': 3549, 'loss': 4.9443230628967285}
{'epoch': 7, 'batch': 3550, 'loss': 4.551901817321777}
{'epoch': 7, 'batch': 3551, 'loss': 4.273856163024902}
{'epoch': 7, 'batch': 3552, 'loss': 4.572757244110107}
{'epoc

{'epoch': 7, 'batch': 3685, 'loss': 4.533040523529053}
{'epoch': 7, 'batch': 3686, 'loss': 4.6567063331604}
{'epoch': 7, 'batch': 3687, 'loss': 5.134801864624023}
{'epoch': 7, 'batch': 3688, 'loss': 5.197551727294922}
{'epoch': 7, 'batch': 3689, 'loss': 5.340326309204102}
{'epoch': 7, 'batch': 3690, 'loss': 5.084744453430176}
{'epoch': 7, 'batch': 3691, 'loss': 5.606624603271484}
{'epoch': 7, 'batch': 3692, 'loss': 4.809589385986328}
{'epoch': 7, 'batch': 3693, 'loss': 5.243707180023193}
{'epoch': 7, 'batch': 3694, 'loss': 5.334558010101318}
{'epoch': 7, 'batch': 3695, 'loss': 5.1713643074035645}
{'epoch': 7, 'batch': 3696, 'loss': 4.86477518081665}
{'epoch': 7, 'batch': 3697, 'loss': 4.796911716461182}
{'epoch': 7, 'batch': 3698, 'loss': 5.011225700378418}
{'epoch': 7, 'batch': 3699, 'loss': 5.112742900848389}
{'epoch': 7, 'batch': 3700, 'loss': 5.181162357330322}
{'epoch': 7, 'batch': 3701, 'loss': 4.713072299957275}
{'epoch': 7, 'batch': 3702, 'loss': 4.7599616050720215}
{'epoch': 7

{'epoch': 8, 'batch': 63, 'loss': 5.234999656677246}
{'epoch': 8, 'batch': 64, 'loss': 4.717653274536133}
{'epoch': 8, 'batch': 65, 'loss': 4.261530876159668}
{'epoch': 8, 'batch': 66, 'loss': 4.918744087219238}
{'epoch': 8, 'batch': 67, 'loss': 5.72188138961792}
{'epoch': 8, 'batch': 68, 'loss': 5.394366264343262}
{'epoch': 8, 'batch': 69, 'loss': 4.395771026611328}
{'epoch': 8, 'batch': 70, 'loss': 3.659878969192505}
{'epoch': 8, 'batch': 71, 'loss': 4.964470386505127}
{'epoch': 8, 'batch': 72, 'loss': 5.284870147705078}
{'epoch': 8, 'batch': 73, 'loss': 4.982376575469971}
{'epoch': 8, 'batch': 74, 'loss': 4.658763885498047}
{'epoch': 8, 'batch': 75, 'loss': 4.509195804595947}
{'epoch': 8, 'batch': 76, 'loss': 5.144177436828613}
{'epoch': 8, 'batch': 77, 'loss': 5.290711879730225}
{'epoch': 8, 'batch': 78, 'loss': 5.220936298370361}
{'epoch': 8, 'batch': 79, 'loss': 4.993115425109863}
{'epoch': 8, 'batch': 80, 'loss': 4.831798553466797}
{'epoch': 8, 'batch': 81, 'loss': 5.24018192291

{'epoch': 8, 'batch': 218, 'loss': 5.175362586975098}
{'epoch': 8, 'batch': 219, 'loss': 5.623661994934082}
{'epoch': 8, 'batch': 220, 'loss': 6.033840179443359}
{'epoch': 8, 'batch': 221, 'loss': 5.251026630401611}
{'epoch': 8, 'batch': 222, 'loss': 5.069577693939209}
{'epoch': 8, 'batch': 223, 'loss': 5.211819171905518}
{'epoch': 8, 'batch': 224, 'loss': 5.335188865661621}
{'epoch': 8, 'batch': 225, 'loss': 5.150150299072266}
{'epoch': 8, 'batch': 226, 'loss': 5.253341197967529}
{'epoch': 8, 'batch': 227, 'loss': 5.363672733306885}
{'epoch': 8, 'batch': 228, 'loss': 5.324688911437988}
{'epoch': 8, 'batch': 229, 'loss': 4.978387355804443}
{'epoch': 8, 'batch': 230, 'loss': 5.2634477615356445}
{'epoch': 8, 'batch': 231, 'loss': 5.04058837890625}
{'epoch': 8, 'batch': 232, 'loss': 4.626654624938965}
{'epoch': 8, 'batch': 233, 'loss': 4.349502086639404}
{'epoch': 8, 'batch': 234, 'loss': 4.062768936157227}
{'epoch': 8, 'batch': 235, 'loss': 4.393519878387451}
{'epoch': 8, 'batch': 236, '

{'epoch': 8, 'batch': 372, 'loss': 4.698391437530518}
{'epoch': 8, 'batch': 373, 'loss': 5.116731643676758}
{'epoch': 8, 'batch': 374, 'loss': 4.818558692932129}
{'epoch': 8, 'batch': 375, 'loss': 5.053810119628906}
{'epoch': 8, 'batch': 376, 'loss': 5.2755889892578125}
{'epoch': 8, 'batch': 377, 'loss': 5.145312309265137}
{'epoch': 8, 'batch': 378, 'loss': 5.622196197509766}
{'epoch': 8, 'batch': 379, 'loss': 5.196800231933594}
{'epoch': 8, 'batch': 380, 'loss': 5.448741912841797}
{'epoch': 8, 'batch': 381, 'loss': 5.411554336547852}
{'epoch': 8, 'batch': 382, 'loss': 5.4065141677856445}
{'epoch': 8, 'batch': 383, 'loss': 4.767934322357178}
{'epoch': 8, 'batch': 384, 'loss': 5.191929340362549}
{'epoch': 8, 'batch': 385, 'loss': 5.571434497833252}
{'epoch': 8, 'batch': 386, 'loss': 5.273114204406738}
{'epoch': 8, 'batch': 387, 'loss': 5.162123680114746}
{'epoch': 8, 'batch': 388, 'loss': 5.090274333953857}
{'epoch': 8, 'batch': 389, 'loss': 5.240464687347412}
{'epoch': 8, 'batch': 390,

{'epoch': 8, 'batch': 524, 'loss': 5.10849142074585}
{'epoch': 8, 'batch': 525, 'loss': 5.179015636444092}
{'epoch': 8, 'batch': 526, 'loss': 4.6539788246154785}
{'epoch': 8, 'batch': 527, 'loss': 4.876870155334473}
{'epoch': 8, 'batch': 528, 'loss': 4.419972896575928}
{'epoch': 8, 'batch': 529, 'loss': 4.792150497436523}
{'epoch': 8, 'batch': 530, 'loss': 5.005648612976074}
{'epoch': 8, 'batch': 531, 'loss': 4.920669078826904}
{'epoch': 8, 'batch': 532, 'loss': 5.352386474609375}
{'epoch': 8, 'batch': 533, 'loss': 5.149708271026611}
{'epoch': 8, 'batch': 534, 'loss': 5.088662624359131}
{'epoch': 8, 'batch': 535, 'loss': 5.038991451263428}
{'epoch': 8, 'batch': 536, 'loss': 5.362665176391602}
{'epoch': 8, 'batch': 537, 'loss': 5.078526020050049}
{'epoch': 8, 'batch': 538, 'loss': 5.114550590515137}
{'epoch': 8, 'batch': 539, 'loss': 4.43529748916626}
{'epoch': 8, 'batch': 540, 'loss': 5.088244915008545}
{'epoch': 8, 'batch': 541, 'loss': 4.870083808898926}
{'epoch': 8, 'batch': 542, 'l

{'epoch': 8, 'batch': 679, 'loss': 5.814647674560547}
{'epoch': 8, 'batch': 680, 'loss': 6.2757887840271}
{'epoch': 8, 'batch': 681, 'loss': 6.100870609283447}
{'epoch': 8, 'batch': 682, 'loss': 6.538320541381836}
{'epoch': 8, 'batch': 683, 'loss': 6.402896881103516}
{'epoch': 8, 'batch': 684, 'loss': 6.739853382110596}
{'epoch': 8, 'batch': 685, 'loss': 4.6638007164001465}
{'epoch': 8, 'batch': 686, 'loss': 6.10813045501709}
{'epoch': 8, 'batch': 687, 'loss': 5.812460422515869}
{'epoch': 8, 'batch': 688, 'loss': 5.689511775970459}
{'epoch': 8, 'batch': 689, 'loss': 5.618941307067871}
{'epoch': 8, 'batch': 690, 'loss': 5.875436782836914}
{'epoch': 8, 'batch': 691, 'loss': 5.54945707321167}
{'epoch': 8, 'batch': 692, 'loss': 5.505316734313965}
{'epoch': 8, 'batch': 693, 'loss': 5.852087497711182}
{'epoch': 8, 'batch': 694, 'loss': 5.582091808319092}
{'epoch': 8, 'batch': 695, 'loss': 5.699781894683838}
{'epoch': 8, 'batch': 696, 'loss': 5.506622314453125}
{'epoch': 8, 'batch': 697, 'los

{'epoch': 8, 'batch': 833, 'loss': 5.55205774307251}
{'epoch': 8, 'batch': 834, 'loss': 5.586872100830078}
{'epoch': 8, 'batch': 835, 'loss': 5.761687755584717}
{'epoch': 8, 'batch': 836, 'loss': 5.724306583404541}
{'epoch': 8, 'batch': 837, 'loss': 5.878007411956787}
{'epoch': 8, 'batch': 838, 'loss': 5.708459377288818}
{'epoch': 8, 'batch': 839, 'loss': 5.6583251953125}
{'epoch': 8, 'batch': 840, 'loss': 5.683513164520264}
{'epoch': 8, 'batch': 841, 'loss': 5.627835273742676}
{'epoch': 8, 'batch': 842, 'loss': 5.428361892700195}
{'epoch': 8, 'batch': 843, 'loss': 4.885610580444336}
{'epoch': 8, 'batch': 844, 'loss': 5.515985012054443}
{'epoch': 8, 'batch': 845, 'loss': 5.047512054443359}
{'epoch': 8, 'batch': 846, 'loss': 5.160888195037842}
{'epoch': 8, 'batch': 847, 'loss': 4.953550338745117}
{'epoch': 8, 'batch': 848, 'loss': 5.183192253112793}
{'epoch': 8, 'batch': 849, 'loss': 5.33215856552124}
{'epoch': 8, 'batch': 850, 'loss': 4.970106601715088}
{'epoch': 8, 'batch': 851, 'loss

{'epoch': 8, 'batch': 985, 'loss': 5.228993892669678}
{'epoch': 8, 'batch': 986, 'loss': 4.960536479949951}
{'epoch': 8, 'batch': 987, 'loss': 5.1456499099731445}
{'epoch': 8, 'batch': 988, 'loss': 5.1109938621521}
{'epoch': 8, 'batch': 989, 'loss': 4.8363800048828125}
{'epoch': 8, 'batch': 990, 'loss': 5.056967258453369}
{'epoch': 8, 'batch': 991, 'loss': 4.863915920257568}
{'epoch': 8, 'batch': 992, 'loss': 3.622082233428955}
{'epoch': 8, 'batch': 993, 'loss': 5.5118842124938965}
{'epoch': 8, 'batch': 994, 'loss': 4.862549781799316}
{'epoch': 8, 'batch': 995, 'loss': 4.896801471710205}
{'epoch': 8, 'batch': 996, 'loss': 4.720130920410156}
{'epoch': 8, 'batch': 997, 'loss': 5.1564717292785645}
{'epoch': 8, 'batch': 998, 'loss': 4.544164657592773}
{'epoch': 8, 'batch': 999, 'loss': 4.869524955749512}
{'epoch': 8, 'batch': 1000, 'loss': 4.3462910652160645}
{'epoch': 8, 'batch': 1001, 'loss': 4.624094009399414}
{'epoch': 8, 'batch': 1002, 'loss': 4.9494123458862305}
{'epoch': 8, 'batch':

{'epoch': 8, 'batch': 1138, 'loss': 5.426490783691406}
{'epoch': 8, 'batch': 1139, 'loss': 4.839361667633057}
{'epoch': 8, 'batch': 1140, 'loss': 5.184901714324951}
{'epoch': 8, 'batch': 1141, 'loss': 5.581380844116211}
{'epoch': 8, 'batch': 1142, 'loss': 5.5146002769470215}
{'epoch': 8, 'batch': 1143, 'loss': 5.171999931335449}
{'epoch': 8, 'batch': 1144, 'loss': 4.900539398193359}
{'epoch': 8, 'batch': 1145, 'loss': 4.867403984069824}
{'epoch': 8, 'batch': 1146, 'loss': 5.277139186859131}
{'epoch': 8, 'batch': 1147, 'loss': 4.668911933898926}
{'epoch': 8, 'batch': 1148, 'loss': 4.90809440612793}
{'epoch': 8, 'batch': 1149, 'loss': 4.974417686462402}
{'epoch': 8, 'batch': 1150, 'loss': 5.2529144287109375}
{'epoch': 8, 'batch': 1151, 'loss': 5.130101680755615}
{'epoch': 8, 'batch': 1152, 'loss': 4.8535075187683105}
{'epoch': 8, 'batch': 1153, 'loss': 5.098022937774658}
{'epoch': 8, 'batch': 1154, 'loss': 5.4782023429870605}
{'epoch': 8, 'batch': 1155, 'loss': 5.0127081871032715}
{'epoc

{'epoch': 8, 'batch': 1287, 'loss': 4.5585713386535645}
{'epoch': 8, 'batch': 1288, 'loss': 5.426938056945801}
{'epoch': 8, 'batch': 1289, 'loss': 5.260091304779053}
{'epoch': 8, 'batch': 1290, 'loss': 5.188810348510742}
{'epoch': 8, 'batch': 1291, 'loss': 5.235979080200195}
{'epoch': 8, 'batch': 1292, 'loss': 5.396495819091797}
{'epoch': 8, 'batch': 1293, 'loss': 5.150269031524658}
{'epoch': 8, 'batch': 1294, 'loss': 4.980482578277588}
{'epoch': 8, 'batch': 1295, 'loss': 5.261222839355469}
{'epoch': 8, 'batch': 1296, 'loss': 5.002464294433594}
{'epoch': 8, 'batch': 1297, 'loss': 4.828397274017334}
{'epoch': 8, 'batch': 1298, 'loss': 5.219025135040283}
{'epoch': 8, 'batch': 1299, 'loss': 5.189463138580322}
{'epoch': 8, 'batch': 1300, 'loss': 5.28373384475708}
{'epoch': 8, 'batch': 1301, 'loss': 5.321136474609375}
{'epoch': 8, 'batch': 1302, 'loss': 4.842644214630127}
{'epoch': 8, 'batch': 1303, 'loss': 4.7404465675354}
{'epoch': 8, 'batch': 1304, 'loss': 4.635511875152588}
{'epoch': 8,

{'epoch': 8, 'batch': 1438, 'loss': 4.718508720397949}
{'epoch': 8, 'batch': 1439, 'loss': 5.248965740203857}
{'epoch': 8, 'batch': 1440, 'loss': 4.957849502563477}
{'epoch': 8, 'batch': 1441, 'loss': 5.323048114776611}
{'epoch': 8, 'batch': 1442, 'loss': 5.53853178024292}
{'epoch': 8, 'batch': 1443, 'loss': 5.204916477203369}
{'epoch': 8, 'batch': 1444, 'loss': 4.559385776519775}
{'epoch': 8, 'batch': 1445, 'loss': 4.923128604888916}
{'epoch': 8, 'batch': 1446, 'loss': 4.807994842529297}
{'epoch': 8, 'batch': 1447, 'loss': 4.901333332061768}
{'epoch': 8, 'batch': 1448, 'loss': 5.174086570739746}
{'epoch': 8, 'batch': 1449, 'loss': 4.600882530212402}
{'epoch': 8, 'batch': 1450, 'loss': 4.922414302825928}
{'epoch': 8, 'batch': 1451, 'loss': 5.187233924865723}
{'epoch': 8, 'batch': 1452, 'loss': 5.261910438537598}
{'epoch': 8, 'batch': 1453, 'loss': 5.28643274307251}
{'epoch': 8, 'batch': 1454, 'loss': 5.359494209289551}
{'epoch': 8, 'batch': 1455, 'loss': 5.628231525421143}
{'epoch': 8,

{'epoch': 8, 'batch': 1588, 'loss': 5.012719631195068}
{'epoch': 8, 'batch': 1589, 'loss': 4.598729610443115}
{'epoch': 8, 'batch': 1590, 'loss': 4.241713523864746}
{'epoch': 8, 'batch': 1591, 'loss': 5.0019378662109375}
{'epoch': 8, 'batch': 1592, 'loss': 5.048202037811279}
{'epoch': 8, 'batch': 1593, 'loss': 5.081993103027344}
{'epoch': 8, 'batch': 1594, 'loss': 5.207019805908203}
{'epoch': 8, 'batch': 1595, 'loss': 5.0360565185546875}
{'epoch': 8, 'batch': 1596, 'loss': 5.181079387664795}
{'epoch': 8, 'batch': 1597, 'loss': 5.042898654937744}
{'epoch': 8, 'batch': 1598, 'loss': 5.017765045166016}
{'epoch': 8, 'batch': 1599, 'loss': 5.405880928039551}
{'epoch': 8, 'batch': 1600, 'loss': 5.281635761260986}
{'epoch': 8, 'batch': 1601, 'loss': 4.76417350769043}
{'epoch': 8, 'batch': 1602, 'loss': 4.8966450691223145}
{'epoch': 8, 'batch': 1603, 'loss': 5.230004787445068}
{'epoch': 8, 'batch': 1604, 'loss': 4.665831565856934}
{'epoch': 8, 'batch': 1605, 'loss': 5.022549152374268}
{'epoch'

{'epoch': 8, 'batch': 1739, 'loss': 5.108612537384033}
{'epoch': 8, 'batch': 1740, 'loss': 4.763564109802246}
{'epoch': 8, 'batch': 1741, 'loss': 5.422582626342773}
{'epoch': 8, 'batch': 1742, 'loss': 4.886323928833008}
{'epoch': 8, 'batch': 1743, 'loss': 5.316208362579346}
{'epoch': 8, 'batch': 1744, 'loss': 5.017993927001953}
{'epoch': 8, 'batch': 1745, 'loss': 4.826096057891846}
{'epoch': 8, 'batch': 1746, 'loss': 4.595638275146484}
{'epoch': 8, 'batch': 1747, 'loss': 5.079990863800049}
{'epoch': 8, 'batch': 1748, 'loss': 4.431247234344482}
{'epoch': 8, 'batch': 1749, 'loss': 4.837438583374023}
{'epoch': 8, 'batch': 1750, 'loss': 4.21644401550293}
{'epoch': 8, 'batch': 1751, 'loss': 5.205916404724121}
{'epoch': 8, 'batch': 1752, 'loss': 5.008391380310059}
{'epoch': 8, 'batch': 1753, 'loss': 5.1145339012146}
{'epoch': 8, 'batch': 1754, 'loss': 4.657593250274658}
{'epoch': 8, 'batch': 1755, 'loss': 4.976939678192139}
{'epoch': 8, 'batch': 1756, 'loss': 5.113796234130859}
{'epoch': 8, 

{'epoch': 8, 'batch': 1891, 'loss': 4.974586486816406}
{'epoch': 8, 'batch': 1892, 'loss': 4.944403648376465}
{'epoch': 8, 'batch': 1893, 'loss': 5.232841968536377}
{'epoch': 8, 'batch': 1894, 'loss': 5.231287956237793}
{'epoch': 8, 'batch': 1895, 'loss': 4.468539714813232}
{'epoch': 8, 'batch': 1896, 'loss': 5.071706771850586}
{'epoch': 8, 'batch': 1897, 'loss': 5.234066963195801}
{'epoch': 8, 'batch': 1898, 'loss': 4.723243236541748}
{'epoch': 8, 'batch': 1899, 'loss': 5.566652297973633}
{'epoch': 8, 'batch': 1900, 'loss': 5.311670303344727}
{'epoch': 8, 'batch': 1901, 'loss': 4.952381134033203}
{'epoch': 8, 'batch': 1902, 'loss': 4.937143802642822}
{'epoch': 8, 'batch': 1903, 'loss': 5.1387248039245605}
{'epoch': 8, 'batch': 1904, 'loss': 3.129459857940674}
{'epoch': 8, 'batch': 1905, 'loss': 4.855696678161621}
{'epoch': 8, 'batch': 1906, 'loss': 4.770774841308594}
{'epoch': 8, 'batch': 1907, 'loss': 4.791843891143799}
{'epoch': 8, 'batch': 1908, 'loss': 4.8745222091674805}
{'epoch'

{'epoch': 8, 'batch': 2040, 'loss': 5.174426078796387}
{'epoch': 8, 'batch': 2041, 'loss': 5.294024467468262}
{'epoch': 8, 'batch': 2042, 'loss': 5.262202739715576}
{'epoch': 8, 'batch': 2043, 'loss': 5.337528705596924}
{'epoch': 8, 'batch': 2044, 'loss': 5.054210186004639}
{'epoch': 8, 'batch': 2045, 'loss': 5.03779411315918}
{'epoch': 8, 'batch': 2046, 'loss': 4.933814525604248}
{'epoch': 8, 'batch': 2047, 'loss': 4.609148979187012}
{'epoch': 8, 'batch': 2048, 'loss': 4.701449871063232}
{'epoch': 8, 'batch': 2049, 'loss': 4.971940040588379}
{'epoch': 8, 'batch': 2050, 'loss': 4.7176127433776855}
{'epoch': 8, 'batch': 2051, 'loss': 4.787347316741943}
{'epoch': 8, 'batch': 2052, 'loss': 4.33162260055542}
{'epoch': 8, 'batch': 2053, 'loss': 4.872755527496338}
{'epoch': 8, 'batch': 2054, 'loss': 5.111733913421631}
{'epoch': 8, 'batch': 2055, 'loss': 4.915651321411133}
{'epoch': 8, 'batch': 2056, 'loss': 4.2767791748046875}
{'epoch': 8, 'batch': 2057, 'loss': 5.051947593688965}
{'epoch': 

{'epoch': 8, 'batch': 2190, 'loss': 5.625345706939697}
{'epoch': 8, 'batch': 2191, 'loss': 5.625429153442383}
{'epoch': 8, 'batch': 2192, 'loss': 5.030421733856201}
{'epoch': 8, 'batch': 2193, 'loss': 4.676828861236572}
{'epoch': 8, 'batch': 2194, 'loss': 5.39885139465332}
{'epoch': 8, 'batch': 2195, 'loss': 4.7756876945495605}
{'epoch': 8, 'batch': 2196, 'loss': 4.930354118347168}
{'epoch': 8, 'batch': 2197, 'loss': 4.893552780151367}
{'epoch': 8, 'batch': 2198, 'loss': 4.729488849639893}
{'epoch': 8, 'batch': 2199, 'loss': 5.214175701141357}
{'epoch': 8, 'batch': 2200, 'loss': 5.023716449737549}
{'epoch': 8, 'batch': 2201, 'loss': 4.648833274841309}
{'epoch': 8, 'batch': 2202, 'loss': 4.469569206237793}
{'epoch': 8, 'batch': 2203, 'loss': 4.328886032104492}
{'epoch': 8, 'batch': 2204, 'loss': 4.668626308441162}
{'epoch': 8, 'batch': 2205, 'loss': 4.769941806793213}
{'epoch': 8, 'batch': 2206, 'loss': 4.446905612945557}
{'epoch': 8, 'batch': 2207, 'loss': 4.332653999328613}
{'epoch': 

{'epoch': 8, 'batch': 2340, 'loss': 4.7318315505981445}
{'epoch': 8, 'batch': 2341, 'loss': 5.187780380249023}
{'epoch': 8, 'batch': 2342, 'loss': 4.9929304122924805}
{'epoch': 8, 'batch': 2343, 'loss': 4.817280292510986}
{'epoch': 8, 'batch': 2344, 'loss': 5.184725284576416}
{'epoch': 8, 'batch': 2345, 'loss': 4.745215892791748}
{'epoch': 8, 'batch': 2346, 'loss': 4.2784037590026855}
{'epoch': 8, 'batch': 2347, 'loss': 4.539974212646484}
{'epoch': 8, 'batch': 2348, 'loss': 4.392288684844971}
{'epoch': 8, 'batch': 2349, 'loss': 4.801307678222656}
{'epoch': 8, 'batch': 2350, 'loss': 4.727509021759033}
{'epoch': 8, 'batch': 2351, 'loss': 4.796224117279053}
{'epoch': 8, 'batch': 2352, 'loss': 4.780974388122559}
{'epoch': 8, 'batch': 2353, 'loss': 5.090480804443359}
{'epoch': 8, 'batch': 2354, 'loss': 5.585333824157715}
{'epoch': 8, 'batch': 2355, 'loss': 5.594539165496826}
{'epoch': 8, 'batch': 2356, 'loss': 5.264052867889404}
{'epoch': 8, 'batch': 2357, 'loss': 5.260493755340576}
{'epoch

{'epoch': 8, 'batch': 2490, 'loss': 5.414330959320068}
{'epoch': 8, 'batch': 2491, 'loss': 5.8722357749938965}
{'epoch': 8, 'batch': 2492, 'loss': 5.321521759033203}
{'epoch': 8, 'batch': 2493, 'loss': 5.679963111877441}
{'epoch': 8, 'batch': 2494, 'loss': 5.423214912414551}
{'epoch': 8, 'batch': 2495, 'loss': 5.574880599975586}
{'epoch': 8, 'batch': 2496, 'loss': 5.66340446472168}
{'epoch': 8, 'batch': 2497, 'loss': 5.313558101654053}
{'epoch': 8, 'batch': 2498, 'loss': 5.477982521057129}
{'epoch': 8, 'batch': 2499, 'loss': 5.104591369628906}
{'epoch': 8, 'batch': 2500, 'loss': 4.833329200744629}
{'epoch': 8, 'batch': 2501, 'loss': 4.385087490081787}
{'epoch': 8, 'batch': 2502, 'loss': 4.884903907775879}
{'epoch': 8, 'batch': 2503, 'loss': 5.747173309326172}
{'epoch': 8, 'batch': 2504, 'loss': 4.8237738609313965}
{'epoch': 8, 'batch': 2505, 'loss': 4.697961807250977}
{'epoch': 8, 'batch': 2506, 'loss': 4.828763008117676}
{'epoch': 8, 'batch': 2507, 'loss': 5.113744258880615}
{'epoch':

{'epoch': 8, 'batch': 2640, 'loss': 4.980461120605469}
{'epoch': 8, 'batch': 2641, 'loss': 4.666106700897217}
{'epoch': 8, 'batch': 2642, 'loss': 4.80120325088501}
{'epoch': 8, 'batch': 2643, 'loss': 4.738030910491943}
{'epoch': 8, 'batch': 2644, 'loss': 4.515621662139893}
{'epoch': 8, 'batch': 2645, 'loss': 4.280721664428711}
{'epoch': 8, 'batch': 2646, 'loss': 4.605711460113525}
{'epoch': 8, 'batch': 2647, 'loss': 4.726145267486572}
{'epoch': 8, 'batch': 2648, 'loss': 4.4829487800598145}
{'epoch': 8, 'batch': 2649, 'loss': 4.963616847991943}
{'epoch': 8, 'batch': 2650, 'loss': 5.179965496063232}
{'epoch': 8, 'batch': 2651, 'loss': 4.945220470428467}
{'epoch': 8, 'batch': 2652, 'loss': 4.913201808929443}
{'epoch': 8, 'batch': 2653, 'loss': 4.579400539398193}
{'epoch': 8, 'batch': 2654, 'loss': 5.183511257171631}
{'epoch': 8, 'batch': 2655, 'loss': 5.593142986297607}
{'epoch': 8, 'batch': 2656, 'loss': 5.142470836639404}
{'epoch': 8, 'batch': 2657, 'loss': 4.533442974090576}
{'epoch': 

{'epoch': 8, 'batch': 2790, 'loss': 5.306221008300781}
{'epoch': 8, 'batch': 2791, 'loss': 5.15637731552124}
{'epoch': 8, 'batch': 2792, 'loss': 4.765665531158447}
{'epoch': 8, 'batch': 2793, 'loss': 4.999447822570801}
{'epoch': 8, 'batch': 2794, 'loss': 4.9091715812683105}
{'epoch': 8, 'batch': 2795, 'loss': 4.959129333496094}
{'epoch': 8, 'batch': 2796, 'loss': 5.126784324645996}
{'epoch': 8, 'batch': 2797, 'loss': 5.3920674324035645}
{'epoch': 8, 'batch': 2798, 'loss': 5.149796962738037}
{'epoch': 8, 'batch': 2799, 'loss': 5.332025527954102}
{'epoch': 8, 'batch': 2800, 'loss': 5.370065212249756}
{'epoch': 8, 'batch': 2801, 'loss': 5.113808631896973}
{'epoch': 8, 'batch': 2802, 'loss': 5.372833728790283}
{'epoch': 8, 'batch': 2803, 'loss': 5.233936309814453}
{'epoch': 8, 'batch': 2804, 'loss': 4.922327041625977}
{'epoch': 8, 'batch': 2805, 'loss': 5.166403770446777}
{'epoch': 8, 'batch': 2806, 'loss': 5.163145065307617}
{'epoch': 8, 'batch': 2807, 'loss': 5.273660182952881}
{'epoch':

{'epoch': 8, 'batch': 2940, 'loss': 5.117319107055664}
{'epoch': 8, 'batch': 2941, 'loss': 5.266904830932617}
{'epoch': 8, 'batch': 2942, 'loss': 4.258975505828857}
{'epoch': 8, 'batch': 2943, 'loss': 3.5004706382751465}
{'epoch': 8, 'batch': 2944, 'loss': 4.526978492736816}
{'epoch': 8, 'batch': 2945, 'loss': 3.40933895111084}
{'epoch': 8, 'batch': 2946, 'loss': 4.054648399353027}
{'epoch': 8, 'batch': 2947, 'loss': 4.961135387420654}
{'epoch': 8, 'batch': 2948, 'loss': 4.658686637878418}
{'epoch': 8, 'batch': 2949, 'loss': 4.547545909881592}
{'epoch': 8, 'batch': 2950, 'loss': 5.120079040527344}
{'epoch': 8, 'batch': 2951, 'loss': 4.582316875457764}
{'epoch': 8, 'batch': 2952, 'loss': 4.300372123718262}
{'epoch': 8, 'batch': 2953, 'loss': 4.3816938400268555}
{'epoch': 8, 'batch': 2954, 'loss': 4.698888778686523}
{'epoch': 8, 'batch': 2955, 'loss': 4.512116432189941}
{'epoch': 8, 'batch': 2956, 'loss': 4.646675109863281}
{'epoch': 8, 'batch': 2957, 'loss': 3.8433048725128174}
{'epoch'

{'epoch': 8, 'batch': 3090, 'loss': 4.893862247467041}
{'epoch': 8, 'batch': 3091, 'loss': 4.809996604919434}
{'epoch': 8, 'batch': 3092, 'loss': 4.773502826690674}
{'epoch': 8, 'batch': 3093, 'loss': 5.101243019104004}
{'epoch': 8, 'batch': 3094, 'loss': 4.982980728149414}
{'epoch': 8, 'batch': 3095, 'loss': 4.624505519866943}
{'epoch': 8, 'batch': 3096, 'loss': 4.544610500335693}
{'epoch': 8, 'batch': 3097, 'loss': 5.310022830963135}
{'epoch': 8, 'batch': 3098, 'loss': 5.4965291023254395}
{'epoch': 8, 'batch': 3099, 'loss': 5.585919380187988}
{'epoch': 8, 'batch': 3100, 'loss': 5.705449104309082}
{'epoch': 8, 'batch': 3101, 'loss': 5.583007335662842}
{'epoch': 8, 'batch': 3102, 'loss': 5.035666465759277}
{'epoch': 8, 'batch': 3103, 'loss': 4.963472366333008}
{'epoch': 8, 'batch': 3104, 'loss': 4.874076843261719}
{'epoch': 8, 'batch': 3105, 'loss': 5.279813289642334}
{'epoch': 8, 'batch': 3106, 'loss': 5.159457206726074}
{'epoch': 8, 'batch': 3107, 'loss': 5.489259719848633}
{'epoch':

{'epoch': 8, 'batch': 3240, 'loss': 4.966564178466797}
{'epoch': 8, 'batch': 3241, 'loss': 4.670727729797363}
{'epoch': 8, 'batch': 3242, 'loss': 4.919846534729004}
{'epoch': 8, 'batch': 3243, 'loss': 5.194820880889893}
{'epoch': 8, 'batch': 3244, 'loss': 5.271571636199951}
{'epoch': 8, 'batch': 3245, 'loss': 4.743220806121826}
{'epoch': 8, 'batch': 3246, 'loss': 4.787934303283691}
{'epoch': 8, 'batch': 3247, 'loss': 4.556652545928955}
{'epoch': 8, 'batch': 3248, 'loss': 4.8165693283081055}
{'epoch': 8, 'batch': 3249, 'loss': 5.0011444091796875}
{'epoch': 8, 'batch': 3250, 'loss': 5.179035663604736}
{'epoch': 8, 'batch': 3251, 'loss': 4.653318405151367}
{'epoch': 8, 'batch': 3252, 'loss': 5.548816204071045}
{'epoch': 8, 'batch': 3253, 'loss': 4.922303199768066}
{'epoch': 8, 'batch': 3254, 'loss': 4.585650444030762}
{'epoch': 8, 'batch': 3255, 'loss': 4.629449844360352}
{'epoch': 8, 'batch': 3256, 'loss': 5.075547695159912}
{'epoch': 8, 'batch': 3257, 'loss': 4.3762736320495605}
{'epoch

{'epoch': 8, 'batch': 3392, 'loss': 4.905062675476074}
{'epoch': 8, 'batch': 3393, 'loss': 5.272511005401611}
{'epoch': 8, 'batch': 3394, 'loss': 5.024483680725098}
{'epoch': 8, 'batch': 3395, 'loss': 5.364589214324951}
{'epoch': 8, 'batch': 3396, 'loss': 5.103221416473389}
{'epoch': 8, 'batch': 3397, 'loss': 3.6986868381500244}
{'epoch': 8, 'batch': 3398, 'loss': 4.46522331237793}
{'epoch': 8, 'batch': 3399, 'loss': 4.848477363586426}
{'epoch': 8, 'batch': 3400, 'loss': 5.081171989440918}
{'epoch': 8, 'batch': 3401, 'loss': 3.7977797985076904}
{'epoch': 8, 'batch': 3402, 'loss': 2.7360870838165283}
{'epoch': 8, 'batch': 3403, 'loss': 4.661459922790527}
{'epoch': 8, 'batch': 3404, 'loss': 4.945305347442627}
{'epoch': 8, 'batch': 3405, 'loss': 4.955530643463135}
{'epoch': 8, 'batch': 3406, 'loss': 4.833045959472656}
{'epoch': 8, 'batch': 3407, 'loss': 4.304473400115967}
{'epoch': 8, 'batch': 3408, 'loss': 4.523647308349609}
{'epoch': 8, 'batch': 3409, 'loss': 4.512185096740723}
{'epoch'

{'epoch': 8, 'batch': 3544, 'loss': 5.630149841308594}
{'epoch': 8, 'batch': 3545, 'loss': 5.023684978485107}
{'epoch': 8, 'batch': 3546, 'loss': 5.078174114227295}
{'epoch': 8, 'batch': 3547, 'loss': 3.317178726196289}
{'epoch': 8, 'batch': 3548, 'loss': 4.151978492736816}
{'epoch': 8, 'batch': 3549, 'loss': 4.721855163574219}
{'epoch': 8, 'batch': 3550, 'loss': 4.439325332641602}
{'epoch': 8, 'batch': 3551, 'loss': 4.033762454986572}
{'epoch': 8, 'batch': 3552, 'loss': 4.438583850860596}
{'epoch': 8, 'batch': 3553, 'loss': 4.558680534362793}
{'epoch': 8, 'batch': 3554, 'loss': 4.882375240325928}
{'epoch': 8, 'batch': 3555, 'loss': 4.543200492858887}
{'epoch': 8, 'batch': 3556, 'loss': 4.500128746032715}
{'epoch': 8, 'batch': 3557, 'loss': 3.910104274749756}
{'epoch': 8, 'batch': 3558, 'loss': 2.9958643913269043}
{'epoch': 8, 'batch': 3559, 'loss': 5.012774467468262}
{'epoch': 8, 'batch': 3560, 'loss': 5.217395305633545}
{'epoch': 8, 'batch': 3561, 'loss': 4.533999443054199}
{'epoch':

{'epoch': 8, 'batch': 3693, 'loss': 5.170358180999756}
{'epoch': 8, 'batch': 3694, 'loss': 5.188459873199463}
{'epoch': 8, 'batch': 3695, 'loss': 4.952507019042969}
{'epoch': 8, 'batch': 3696, 'loss': 4.687317371368408}
{'epoch': 8, 'batch': 3697, 'loss': 4.626108169555664}
{'epoch': 8, 'batch': 3698, 'loss': 4.889431476593018}
{'epoch': 8, 'batch': 3699, 'loss': 4.967245101928711}
{'epoch': 8, 'batch': 3700, 'loss': 5.007695198059082}
{'epoch': 8, 'batch': 3701, 'loss': 4.5754714012146}
{'epoch': 8, 'batch': 3702, 'loss': 4.576894760131836}
{'epoch': 8, 'batch': 3703, 'loss': 4.454598903656006}
{'epoch': 8, 'batch': 3704, 'loss': 5.046604633331299}
{'epoch': 8, 'batch': 3705, 'loss': 4.992031574249268}
{'epoch': 8, 'batch': 3706, 'loss': 4.692417144775391}
{'epoch': 8, 'batch': 3707, 'loss': 4.659806251525879}
{'epoch': 8, 'batch': 3708, 'loss': 4.674500942230225}
{'epoch': 8, 'batch': 3709, 'loss': 4.713550567626953}
{'epoch': 8, 'batch': 3710, 'loss': 4.7659406661987305}
{'epoch': 8

{'epoch': 9, 'batch': 73, 'loss': 4.828895568847656}
{'epoch': 9, 'batch': 74, 'loss': 4.588695526123047}
{'epoch': 9, 'batch': 75, 'loss': 4.429951190948486}
{'epoch': 9, 'batch': 76, 'loss': 4.999102592468262}
{'epoch': 9, 'batch': 77, 'loss': 5.092862129211426}
{'epoch': 9, 'batch': 78, 'loss': 5.132483959197998}
{'epoch': 9, 'batch': 79, 'loss': 4.830002784729004}
{'epoch': 9, 'batch': 80, 'loss': 4.616090774536133}
{'epoch': 9, 'batch': 81, 'loss': 5.029181480407715}
{'epoch': 9, 'batch': 82, 'loss': 5.083810806274414}
{'epoch': 9, 'batch': 83, 'loss': 5.155501842498779}
{'epoch': 9, 'batch': 84, 'loss': 4.820363998413086}
{'epoch': 9, 'batch': 85, 'loss': 5.253713607788086}
{'epoch': 9, 'batch': 86, 'loss': 5.020629405975342}
{'epoch': 9, 'batch': 87, 'loss': 5.002950668334961}
{'epoch': 9, 'batch': 88, 'loss': 4.8725972175598145}
{'epoch': 9, 'batch': 89, 'loss': 5.571315288543701}
{'epoch': 9, 'batch': 90, 'loss': 5.132236003875732}
{'epoch': 9, 'batch': 91, 'loss': 5.016223907

{'epoch': 9, 'batch': 226, 'loss': 5.220410346984863}
{'epoch': 9, 'batch': 227, 'loss': 5.3320512771606445}
{'epoch': 9, 'batch': 228, 'loss': 5.214053153991699}
{'epoch': 9, 'batch': 229, 'loss': 4.900860786437988}
{'epoch': 9, 'batch': 230, 'loss': 5.128321170806885}
{'epoch': 9, 'batch': 231, 'loss': 4.951724052429199}
{'epoch': 9, 'batch': 232, 'loss': 4.53299617767334}
{'epoch': 9, 'batch': 233, 'loss': 4.330313205718994}
{'epoch': 9, 'batch': 234, 'loss': 3.9354214668273926}
{'epoch': 9, 'batch': 235, 'loss': 4.3082475662231445}
{'epoch': 9, 'batch': 236, 'loss': 5.247133731842041}
{'epoch': 9, 'batch': 237, 'loss': 5.49444055557251}
{'epoch': 9, 'batch': 238, 'loss': 4.917172908782959}
{'epoch': 9, 'batch': 239, 'loss': 5.646888256072998}
{'epoch': 9, 'batch': 240, 'loss': 5.983790874481201}
{'epoch': 9, 'batch': 241, 'loss': 4.898025989532471}
{'epoch': 9, 'batch': 242, 'loss': 4.926276206970215}
{'epoch': 9, 'batch': 243, 'loss': 4.944972515106201}
{'epoch': 9, 'batch': 244, 

{'epoch': 9, 'batch': 379, 'loss': 4.922712802886963}
{'epoch': 9, 'batch': 380, 'loss': 5.13287353515625}
{'epoch': 9, 'batch': 381, 'loss': 5.177928924560547}
{'epoch': 9, 'batch': 382, 'loss': 5.322283744812012}
{'epoch': 9, 'batch': 383, 'loss': 4.5054850578308105}
{'epoch': 9, 'batch': 384, 'loss': 5.054922580718994}
{'epoch': 9, 'batch': 385, 'loss': 5.446132659912109}
{'epoch': 9, 'batch': 386, 'loss': 5.138036727905273}
{'epoch': 9, 'batch': 387, 'loss': 5.1045002937316895}
{'epoch': 9, 'batch': 388, 'loss': 4.912671089172363}
{'epoch': 9, 'batch': 389, 'loss': 5.023849010467529}
{'epoch': 9, 'batch': 390, 'loss': 5.233163833618164}
{'epoch': 9, 'batch': 391, 'loss': 5.225788593292236}
{'epoch': 9, 'batch': 392, 'loss': 4.91274356842041}
{'epoch': 9, 'batch': 393, 'loss': 4.905753135681152}
{'epoch': 9, 'batch': 394, 'loss': 4.327577590942383}
{'epoch': 9, 'batch': 395, 'loss': 4.643174648284912}
{'epoch': 9, 'batch': 396, 'loss': 5.054205894470215}
{'epoch': 9, 'batch': 397, '

{'epoch': 9, 'batch': 532, 'loss': 5.244496822357178}
{'epoch': 9, 'batch': 533, 'loss': 5.00670051574707}
{'epoch': 9, 'batch': 534, 'loss': 4.985581398010254}
{'epoch': 9, 'batch': 535, 'loss': 4.934391021728516}
{'epoch': 9, 'batch': 536, 'loss': 5.22852897644043}
{'epoch': 9, 'batch': 537, 'loss': 4.872357368469238}
{'epoch': 9, 'batch': 538, 'loss': 4.94939661026001}
{'epoch': 9, 'batch': 539, 'loss': 4.393185615539551}
{'epoch': 9, 'batch': 540, 'loss': 4.944143295288086}
{'epoch': 9, 'batch': 541, 'loss': 4.657632350921631}
{'epoch': 9, 'batch': 542, 'loss': 5.099989891052246}
{'epoch': 9, 'batch': 543, 'loss': 5.354613304138184}
{'epoch': 9, 'batch': 544, 'loss': 5.295541286468506}
{'epoch': 9, 'batch': 545, 'loss': 5.148381233215332}
{'epoch': 9, 'batch': 546, 'loss': 5.58489465713501}
{'epoch': 9, 'batch': 547, 'loss': 3.7495625019073486}
{'epoch': 9, 'batch': 548, 'loss': 5.449405670166016}
{'epoch': 9, 'batch': 549, 'loss': 6.409523963928223}
{'epoch': 9, 'batch': 550, 'los

{'epoch': 9, 'batch': 686, 'loss': 5.694063663482666}
{'epoch': 9, 'batch': 687, 'loss': 5.679451942443848}
{'epoch': 9, 'batch': 688, 'loss': 5.531042098999023}
{'epoch': 9, 'batch': 689, 'loss': 5.493886947631836}
{'epoch': 9, 'batch': 690, 'loss': 6.012216091156006}
{'epoch': 9, 'batch': 691, 'loss': 5.531632423400879}
{'epoch': 9, 'batch': 692, 'loss': 5.453428745269775}
{'epoch': 9, 'batch': 693, 'loss': 5.714778423309326}
{'epoch': 9, 'batch': 694, 'loss': 5.472306251525879}
{'epoch': 9, 'batch': 695, 'loss': 5.671758651733398}
{'epoch': 9, 'batch': 696, 'loss': 5.342616081237793}
{'epoch': 9, 'batch': 697, 'loss': 5.298380374908447}
{'epoch': 9, 'batch': 698, 'loss': 5.442699432373047}
{'epoch': 9, 'batch': 699, 'loss': 5.014232635498047}
{'epoch': 9, 'batch': 700, 'loss': 4.670638084411621}
{'epoch': 9, 'batch': 701, 'loss': 4.642389297485352}
{'epoch': 9, 'batch': 702, 'loss': 4.870828628540039}
{'epoch': 9, 'batch': 703, 'loss': 5.244452476501465}
{'epoch': 9, 'batch': 704, '

{'epoch': 9, 'batch': 839, 'loss': 5.643310070037842}
{'epoch': 9, 'batch': 840, 'loss': 5.721584320068359}
{'epoch': 9, 'batch': 841, 'loss': 5.315521717071533}
{'epoch': 9, 'batch': 842, 'loss': 5.221777439117432}
{'epoch': 9, 'batch': 843, 'loss': 4.753524303436279}
{'epoch': 9, 'batch': 844, 'loss': 5.188551425933838}
{'epoch': 9, 'batch': 845, 'loss': 5.059424877166748}
{'epoch': 9, 'batch': 846, 'loss': 5.142077922821045}
{'epoch': 9, 'batch': 847, 'loss': 4.920328140258789}
{'epoch': 9, 'batch': 848, 'loss': 5.056333541870117}
{'epoch': 9, 'batch': 849, 'loss': 5.247354984283447}
{'epoch': 9, 'batch': 850, 'loss': 4.740163326263428}
{'epoch': 9, 'batch': 851, 'loss': 5.086030960083008}
{'epoch': 9, 'batch': 852, 'loss': 5.387292861938477}
{'epoch': 9, 'batch': 853, 'loss': 5.25620174407959}
{'epoch': 9, 'batch': 854, 'loss': 5.404615879058838}
{'epoch': 9, 'batch': 855, 'loss': 4.62052059173584}
{'epoch': 9, 'batch': 856, 'loss': 4.018017768859863}
{'epoch': 9, 'batch': 857, 'lo

{'epoch': 9, 'batch': 993, 'loss': 5.338667869567871}
{'epoch': 9, 'batch': 994, 'loss': 4.719155311584473}
{'epoch': 9, 'batch': 995, 'loss': 4.701826572418213}
{'epoch': 9, 'batch': 996, 'loss': 4.354334831237793}
{'epoch': 9, 'batch': 997, 'loss': 5.002671241760254}
{'epoch': 9, 'batch': 998, 'loss': 4.441240310668945}
{'epoch': 9, 'batch': 999, 'loss': 4.702214241027832}
{'epoch': 9, 'batch': 1000, 'loss': 4.235910892486572}
{'epoch': 9, 'batch': 1001, 'loss': 4.464691162109375}
{'epoch': 9, 'batch': 1002, 'loss': 4.766280174255371}
{'epoch': 9, 'batch': 1003, 'loss': 4.8323445320129395}
{'epoch': 9, 'batch': 1004, 'loss': 4.65833044052124}
{'epoch': 9, 'batch': 1005, 'loss': 4.6111369132995605}
{'epoch': 9, 'batch': 1006, 'loss': 4.481996059417725}
{'epoch': 9, 'batch': 1007, 'loss': 4.897536754608154}
{'epoch': 9, 'batch': 1008, 'loss': 4.480860233306885}
{'epoch': 9, 'batch': 1009, 'loss': 4.714054584503174}
{'epoch': 9, 'batch': 1010, 'loss': 4.862215995788574}
{'epoch': 9, 'ba

{'epoch': 9, 'batch': 1145, 'loss': 4.657516956329346}
{'epoch': 9, 'batch': 1146, 'loss': 5.002457141876221}
{'epoch': 9, 'batch': 1147, 'loss': 4.454023361206055}
{'epoch': 9, 'batch': 1148, 'loss': 4.730730056762695}
{'epoch': 9, 'batch': 1149, 'loss': 4.723509788513184}
{'epoch': 9, 'batch': 1150, 'loss': 4.906573295593262}
{'epoch': 9, 'batch': 1151, 'loss': 4.954383850097656}
{'epoch': 9, 'batch': 1152, 'loss': 4.689631462097168}
{'epoch': 9, 'batch': 1153, 'loss': 4.911685943603516}
{'epoch': 9, 'batch': 1154, 'loss': 5.309881210327148}
{'epoch': 9, 'batch': 1155, 'loss': 4.795400619506836}
{'epoch': 9, 'batch': 1156, 'loss': 4.800350189208984}
{'epoch': 9, 'batch': 1157, 'loss': 5.124314308166504}
{'epoch': 9, 'batch': 1158, 'loss': 4.815944194793701}
{'epoch': 9, 'batch': 1159, 'loss': 5.58911657333374}
{'epoch': 9, 'batch': 1160, 'loss': 5.449046611785889}
{'epoch': 9, 'batch': 1161, 'loss': 5.077523231506348}
{'epoch': 9, 'batch': 1162, 'loss': 4.856019496917725}
{'epoch': 9

{'epoch': 9, 'batch': 1295, 'loss': 5.174712657928467}
{'epoch': 9, 'batch': 1296, 'loss': 4.880463123321533}
{'epoch': 9, 'batch': 1297, 'loss': 4.6639227867126465}
{'epoch': 9, 'batch': 1298, 'loss': 5.01089334487915}
{'epoch': 9, 'batch': 1299, 'loss': 5.045207977294922}
{'epoch': 9, 'batch': 1300, 'loss': 5.145278453826904}
{'epoch': 9, 'batch': 1301, 'loss': 5.013026237487793}
{'epoch': 9, 'batch': 1302, 'loss': 4.72379207611084}
{'epoch': 9, 'batch': 1303, 'loss': 4.584104061126709}
{'epoch': 9, 'batch': 1304, 'loss': 4.4316020011901855}
{'epoch': 9, 'batch': 1305, 'loss': 4.795290470123291}
{'epoch': 9, 'batch': 1306, 'loss': 4.629488468170166}
{'epoch': 9, 'batch': 1307, 'loss': 4.763818264007568}
{'epoch': 9, 'batch': 1308, 'loss': 4.5669474601745605}
{'epoch': 9, 'batch': 1309, 'loss': 4.035548686981201}
{'epoch': 9, 'batch': 1310, 'loss': 5.135340213775635}
{'epoch': 9, 'batch': 1311, 'loss': 4.687371730804443}
{'epoch': 9, 'batch': 1312, 'loss': 4.596439838409424}
{'epoch':

{'epoch': 9, 'batch': 1444, 'loss': 4.380651950836182}
{'epoch': 9, 'batch': 1445, 'loss': 4.721531391143799}
{'epoch': 9, 'batch': 1446, 'loss': 4.715755462646484}
{'epoch': 9, 'batch': 1447, 'loss': 4.738864421844482}
{'epoch': 9, 'batch': 1448, 'loss': 4.985640048980713}
{'epoch': 9, 'batch': 1449, 'loss': 4.341804027557373}
{'epoch': 9, 'batch': 1450, 'loss': 4.750905513763428}
{'epoch': 9, 'batch': 1451, 'loss': 5.003549575805664}
{'epoch': 9, 'batch': 1452, 'loss': 4.992649555206299}
{'epoch': 9, 'batch': 1453, 'loss': 4.962838172912598}
{'epoch': 9, 'batch': 1454, 'loss': 5.024378776550293}
{'epoch': 9, 'batch': 1455, 'loss': 5.488102436065674}
{'epoch': 9, 'batch': 1456, 'loss': 5.035852432250977}
{'epoch': 9, 'batch': 1457, 'loss': 5.012106895446777}
{'epoch': 9, 'batch': 1458, 'loss': 4.987341403961182}
{'epoch': 9, 'batch': 1459, 'loss': 4.468963146209717}
{'epoch': 9, 'batch': 1460, 'loss': 4.391979217529297}
{'epoch': 9, 'batch': 1461, 'loss': 4.858349800109863}
{'epoch': 

{'epoch': 9, 'batch': 1594, 'loss': 5.042171478271484}
{'epoch': 9, 'batch': 1595, 'loss': 4.858039855957031}
{'epoch': 9, 'batch': 1596, 'loss': 5.005453109741211}
{'epoch': 9, 'batch': 1597, 'loss': 4.89380407333374}
{'epoch': 9, 'batch': 1598, 'loss': 4.7793707847595215}
{'epoch': 9, 'batch': 1599, 'loss': 5.219298839569092}
{'epoch': 9, 'batch': 1600, 'loss': 5.084074974060059}
{'epoch': 9, 'batch': 1601, 'loss': 4.560495853424072}
{'epoch': 9, 'batch': 1602, 'loss': 4.759673595428467}
{'epoch': 9, 'batch': 1603, 'loss': 5.022365570068359}
{'epoch': 9, 'batch': 1604, 'loss': 4.424724102020264}
{'epoch': 9, 'batch': 1605, 'loss': 4.782027244567871}
{'epoch': 9, 'batch': 1606, 'loss': 4.515575885772705}
{'epoch': 9, 'batch': 1607, 'loss': 4.487797260284424}
{'epoch': 9, 'batch': 1608, 'loss': 4.335276126861572}
{'epoch': 9, 'batch': 1609, 'loss': 4.847230434417725}
{'epoch': 9, 'batch': 1610, 'loss': 4.561958312988281}
{'epoch': 9, 'batch': 1611, 'loss': 4.791405200958252}
{'epoch': 

{'epoch': 9, 'batch': 1745, 'loss': 4.723679542541504}
{'epoch': 9, 'batch': 1746, 'loss': 4.430257797241211}
{'epoch': 9, 'batch': 1747, 'loss': 4.90103006362915}
{'epoch': 9, 'batch': 1748, 'loss': 4.278382301330566}
{'epoch': 9, 'batch': 1749, 'loss': 4.764216899871826}
{'epoch': 9, 'batch': 1750, 'loss': 4.031864643096924}
{'epoch': 9, 'batch': 1751, 'loss': 4.9310173988342285}
{'epoch': 9, 'batch': 1752, 'loss': 4.796807765960693}
{'epoch': 9, 'batch': 1753, 'loss': 4.902725696563721}
{'epoch': 9, 'batch': 1754, 'loss': 4.403112888336182}
{'epoch': 9, 'batch': 1755, 'loss': 4.637045860290527}
{'epoch': 9, 'batch': 1756, 'loss': 4.909363746643066}
{'epoch': 9, 'batch': 1757, 'loss': 4.6116623878479}
{'epoch': 9, 'batch': 1758, 'loss': 4.7699103355407715}
{'epoch': 9, 'batch': 1759, 'loss': 4.85269832611084}
{'epoch': 9, 'batch': 1760, 'loss': 4.7753682136535645}
{'epoch': 9, 'batch': 1761, 'loss': 4.520993232727051}
{'epoch': 9, 'batch': 1762, 'loss': 4.760031223297119}
{'epoch': 9

{'epoch': 9, 'batch': 1895, 'loss': 4.222289085388184}
{'epoch': 9, 'batch': 1896, 'loss': 4.773707866668701}
{'epoch': 9, 'batch': 1897, 'loss': 4.911345958709717}
{'epoch': 9, 'batch': 1898, 'loss': 4.616413116455078}
{'epoch': 9, 'batch': 1899, 'loss': 5.424509525299072}
{'epoch': 9, 'batch': 1900, 'loss': 5.227558612823486}
{'epoch': 9, 'batch': 1901, 'loss': 4.847157955169678}
{'epoch': 9, 'batch': 1902, 'loss': 4.768650531768799}
{'epoch': 9, 'batch': 1903, 'loss': 5.012355327606201}
{'epoch': 9, 'batch': 1904, 'loss': 2.8469738960266113}
{'epoch': 9, 'batch': 1905, 'loss': 4.663544178009033}
{'epoch': 9, 'batch': 1906, 'loss': 4.5426836013793945}
{'epoch': 9, 'batch': 1907, 'loss': 4.6169819831848145}
{'epoch': 9, 'batch': 1908, 'loss': 4.747848033905029}
{'epoch': 9, 'batch': 1909, 'loss': 4.647087574005127}
{'epoch': 9, 'batch': 1910, 'loss': 4.847789764404297}
{'epoch': 9, 'batch': 1911, 'loss': 4.862751483917236}
{'epoch': 9, 'batch': 1912, 'loss': 4.810267448425293}
{'epoch

{'epoch': 9, 'batch': 2047, 'loss': 4.532233715057373}
{'epoch': 9, 'batch': 2048, 'loss': 4.42626428604126}
{'epoch': 9, 'batch': 2049, 'loss': 4.835479736328125}
{'epoch': 9, 'batch': 2050, 'loss': 4.598887920379639}
{'epoch': 9, 'batch': 2051, 'loss': 4.5930867195129395}
{'epoch': 9, 'batch': 2052, 'loss': 4.1554484367370605}
{'epoch': 9, 'batch': 2053, 'loss': 4.650035381317139}
{'epoch': 9, 'batch': 2054, 'loss': 4.9654059410095215}
{'epoch': 9, 'batch': 2055, 'loss': 4.7893805503845215}
{'epoch': 9, 'batch': 2056, 'loss': 3.9734978675842285}
{'epoch': 9, 'batch': 2057, 'loss': 4.848243713378906}
{'epoch': 9, 'batch': 2058, 'loss': 4.954169273376465}
{'epoch': 9, 'batch': 2059, 'loss': 4.8076934814453125}
{'epoch': 9, 'batch': 2060, 'loss': 4.386510372161865}
{'epoch': 9, 'batch': 2061, 'loss': 3.8383634090423584}
{'epoch': 9, 'batch': 2062, 'loss': 4.824104309082031}
{'epoch': 9, 'batch': 2063, 'loss': 4.793155193328857}
{'epoch': 9, 'batch': 2064, 'loss': 4.341612339019775}
{'ep

{'epoch': 9, 'batch': 2197, 'loss': 4.790802478790283}
{'epoch': 9, 'batch': 2198, 'loss': 4.595361232757568}
{'epoch': 9, 'batch': 2199, 'loss': 5.100869655609131}
{'epoch': 9, 'batch': 2200, 'loss': 4.942000389099121}
{'epoch': 9, 'batch': 2201, 'loss': 4.465036392211914}
{'epoch': 9, 'batch': 2202, 'loss': 4.423327445983887}
{'epoch': 9, 'batch': 2203, 'loss': 4.222824573516846}
{'epoch': 9, 'batch': 2204, 'loss': 4.414666175842285}
{'epoch': 9, 'batch': 2205, 'loss': 4.624666213989258}
{'epoch': 9, 'batch': 2206, 'loss': 4.276209354400635}
{'epoch': 9, 'batch': 2207, 'loss': 4.078423023223877}
{'epoch': 9, 'batch': 2208, 'loss': 4.697671413421631}
{'epoch': 9, 'batch': 2209, 'loss': 4.773853302001953}
{'epoch': 9, 'batch': 2210, 'loss': 4.641615390777588}
{'epoch': 9, 'batch': 2211, 'loss': 4.854503631591797}
{'epoch': 9, 'batch': 2212, 'loss': 4.754099369049072}
{'epoch': 9, 'batch': 2213, 'loss': 4.697887897491455}
{'epoch': 9, 'batch': 2214, 'loss': 4.899081707000732}
{'epoch': 

{'epoch': 9, 'batch': 2348, 'loss': 4.255563259124756}
{'epoch': 9, 'batch': 2349, 'loss': 4.616427898406982}
{'epoch': 9, 'batch': 2350, 'loss': 4.5936455726623535}
{'epoch': 9, 'batch': 2351, 'loss': 4.620687961578369}
{'epoch': 9, 'batch': 2352, 'loss': 4.560109615325928}
{'epoch': 9, 'batch': 2353, 'loss': 4.97470235824585}
{'epoch': 9, 'batch': 2354, 'loss': 5.2862653732299805}
{'epoch': 9, 'batch': 2355, 'loss': 5.517625331878662}
{'epoch': 9, 'batch': 2356, 'loss': 5.092662334442139}
{'epoch': 9, 'batch': 2357, 'loss': 5.1553215980529785}
{'epoch': 9, 'batch': 2358, 'loss': 4.871068954467773}
{'epoch': 9, 'batch': 2359, 'loss': 4.916393756866455}
{'epoch': 9, 'batch': 2360, 'loss': 5.204864025115967}
{'epoch': 9, 'batch': 2361, 'loss': 5.048356056213379}
{'epoch': 9, 'batch': 2362, 'loss': 5.291440010070801}
{'epoch': 9, 'batch': 2363, 'loss': 5.175164222717285}
{'epoch': 9, 'batch': 2364, 'loss': 4.838264465332031}
{'epoch': 9, 'batch': 2365, 'loss': 5.136167526245117}
{'epoch'

{'epoch': 9, 'batch': 2499, 'loss': 5.0340704917907715}
{'epoch': 9, 'batch': 2500, 'loss': 4.79636812210083}
{'epoch': 9, 'batch': 2501, 'loss': 4.2146687507629395}
{'epoch': 9, 'batch': 2502, 'loss': 4.793168544769287}
{'epoch': 9, 'batch': 2503, 'loss': 5.57977819442749}
{'epoch': 9, 'batch': 2504, 'loss': 4.597822666168213}
{'epoch': 9, 'batch': 2505, 'loss': 4.445174217224121}
{'epoch': 9, 'batch': 2506, 'loss': 4.740899085998535}
{'epoch': 9, 'batch': 2507, 'loss': 5.032537937164307}
{'epoch': 9, 'batch': 2508, 'loss': 4.926738262176514}
{'epoch': 9, 'batch': 2509, 'loss': 5.15179967880249}
{'epoch': 9, 'batch': 2510, 'loss': 5.1366987228393555}
{'epoch': 9, 'batch': 2511, 'loss': 5.025766849517822}
{'epoch': 9, 'batch': 2512, 'loss': 5.084981918334961}
{'epoch': 9, 'batch': 2513, 'loss': 4.997406482696533}
{'epoch': 9, 'batch': 2514, 'loss': 4.849409580230713}
{'epoch': 9, 'batch': 2515, 'loss': 4.480194568634033}
{'epoch': 9, 'batch': 2516, 'loss': 4.92781400680542}
{'epoch': 9

{'epoch': 9, 'batch': 2648, 'loss': 4.242238521575928}
{'epoch': 9, 'batch': 2649, 'loss': 4.749977111816406}
{'epoch': 9, 'batch': 2650, 'loss': 4.909226894378662}
{'epoch': 9, 'batch': 2651, 'loss': 4.818230628967285}
{'epoch': 9, 'batch': 2652, 'loss': 4.696161270141602}
{'epoch': 9, 'batch': 2653, 'loss': 4.468684673309326}
{'epoch': 9, 'batch': 2654, 'loss': 5.007528305053711}
{'epoch': 9, 'batch': 2655, 'loss': 5.259064674377441}
{'epoch': 9, 'batch': 2656, 'loss': 4.9234137535095215}
{'epoch': 9, 'batch': 2657, 'loss': 4.340346336364746}
{'epoch': 9, 'batch': 2658, 'loss': 4.761012077331543}
{'epoch': 9, 'batch': 2659, 'loss': 4.7859416007995605}
{'epoch': 9, 'batch': 2660, 'loss': 4.769104957580566}
{'epoch': 9, 'batch': 2661, 'loss': 4.830687999725342}
{'epoch': 9, 'batch': 2662, 'loss': 4.9558234214782715}
{'epoch': 9, 'batch': 2663, 'loss': 4.514299392700195}
{'epoch': 9, 'batch': 2664, 'loss': 4.884058475494385}
{'epoch': 9, 'batch': 2665, 'loss': 4.460478782653809}
{'epoch

{'epoch': 9, 'batch': 2798, 'loss': 4.994051933288574}
{'epoch': 9, 'batch': 2799, 'loss': 5.125180721282959}
{'epoch': 9, 'batch': 2800, 'loss': 5.127358913421631}
{'epoch': 9, 'batch': 2801, 'loss': 4.862246036529541}
{'epoch': 9, 'batch': 2802, 'loss': 5.210083961486816}
{'epoch': 9, 'batch': 2803, 'loss': 5.0643157958984375}
{'epoch': 9, 'batch': 2804, 'loss': 4.703268051147461}
{'epoch': 9, 'batch': 2805, 'loss': 4.945070743560791}
{'epoch': 9, 'batch': 2806, 'loss': 5.042072296142578}
{'epoch': 9, 'batch': 2807, 'loss': 5.14397668838501}
{'epoch': 9, 'batch': 2808, 'loss': 5.003085136413574}
{'epoch': 9, 'batch': 2809, 'loss': 4.33669900894165}
{'epoch': 9, 'batch': 2810, 'loss': 4.268935203552246}
{'epoch': 9, 'batch': 2811, 'loss': 4.7755045890808105}
{'epoch': 9, 'batch': 2812, 'loss': 4.687165260314941}
{'epoch': 9, 'batch': 2813, 'loss': 4.921774864196777}
{'epoch': 9, 'batch': 2814, 'loss': 4.776795864105225}
{'epoch': 9, 'batch': 2815, 'loss': 4.915609359741211}
{'epoch': 

{'epoch': 9, 'batch': 2949, 'loss': 4.471684455871582}
{'epoch': 9, 'batch': 2950, 'loss': 4.954641342163086}
{'epoch': 9, 'batch': 2951, 'loss': 4.50143575668335}
{'epoch': 9, 'batch': 2952, 'loss': 4.261991024017334}
{'epoch': 9, 'batch': 2953, 'loss': 4.236264705657959}
{'epoch': 9, 'batch': 2954, 'loss': 4.546035289764404}
{'epoch': 9, 'batch': 2955, 'loss': 4.469110012054443}
{'epoch': 9, 'batch': 2956, 'loss': 4.553247928619385}
{'epoch': 9, 'batch': 2957, 'loss': 3.7127163410186768}
{'epoch': 9, 'batch': 2958, 'loss': 3.196256637573242}
{'epoch': 9, 'batch': 2959, 'loss': 4.482658386230469}
{'epoch': 9, 'batch': 2960, 'loss': 4.508007049560547}
{'epoch': 9, 'batch': 2961, 'loss': 4.752448081970215}
{'epoch': 9, 'batch': 2962, 'loss': 4.726194381713867}
{'epoch': 9, 'batch': 2963, 'loss': 5.0056304931640625}
{'epoch': 9, 'batch': 2964, 'loss': 4.675737380981445}
{'epoch': 9, 'batch': 2965, 'loss': 4.917443752288818}
{'epoch': 9, 'batch': 2966, 'loss': 4.961512565612793}
{'epoch':

{'epoch': 9, 'batch': 3101, 'loss': 5.057137966156006}
{'epoch': 9, 'batch': 3102, 'loss': 4.641947269439697}
{'epoch': 9, 'batch': 3103, 'loss': 4.612873554229736}
{'epoch': 9, 'batch': 3104, 'loss': 4.537210941314697}
{'epoch': 9, 'batch': 3105, 'loss': 5.105105876922607}
{'epoch': 9, 'batch': 3106, 'loss': 4.973956108093262}
{'epoch': 9, 'batch': 3107, 'loss': 5.234067916870117}
{'epoch': 9, 'batch': 3108, 'loss': 5.550563812255859}
{'epoch': 9, 'batch': 3109, 'loss': 4.212307929992676}
{'epoch': 9, 'batch': 3110, 'loss': 4.765971660614014}
{'epoch': 9, 'batch': 3111, 'loss': 5.52733850479126}
{'epoch': 9, 'batch': 3112, 'loss': 5.0860981941223145}
{'epoch': 9, 'batch': 3113, 'loss': 4.781856060028076}
{'epoch': 9, 'batch': 3114, 'loss': 5.071240425109863}
{'epoch': 9, 'batch': 3115, 'loss': 5.19161319732666}
{'epoch': 9, 'batch': 3116, 'loss': 5.23054313659668}
{'epoch': 9, 'batch': 3117, 'loss': 5.51451301574707}
{'epoch': 9, 'batch': 3118, 'loss': 4.964364051818848}
{'epoch': 9, 

{'epoch': 9, 'batch': 3254, 'loss': 4.466183185577393}
{'epoch': 9, 'batch': 3255, 'loss': 4.497129440307617}
{'epoch': 9, 'batch': 3256, 'loss': 4.982985496520996}
{'epoch': 9, 'batch': 3257, 'loss': 4.362363338470459}
{'epoch': 9, 'batch': 3258, 'loss': 5.064716815948486}
{'epoch': 9, 'batch': 3259, 'loss': 4.656639575958252}
{'epoch': 9, 'batch': 3260, 'loss': 5.021005630493164}
{'epoch': 9, 'batch': 3261, 'loss': 4.396699905395508}
{'epoch': 9, 'batch': 3262, 'loss': 4.062851905822754}
{'epoch': 9, 'batch': 3263, 'loss': 4.467896461486816}
{'epoch': 9, 'batch': 3264, 'loss': 4.3031697273254395}
{'epoch': 9, 'batch': 3265, 'loss': 4.709795951843262}
{'epoch': 9, 'batch': 3266, 'loss': 4.6064863204956055}
{'epoch': 9, 'batch': 3267, 'loss': 4.206806659698486}
{'epoch': 9, 'batch': 3268, 'loss': 4.639572620391846}
{'epoch': 9, 'batch': 3269, 'loss': 5.019217014312744}
{'epoch': 9, 'batch': 3270, 'loss': 4.901776313781738}
{'epoch': 9, 'batch': 3271, 'loss': 4.6017351150512695}
{'epoch

{'epoch': 9, 'batch': 3403, 'loss': 4.645779609680176}
{'epoch': 9, 'batch': 3404, 'loss': 4.907769203186035}
{'epoch': 9, 'batch': 3405, 'loss': 4.800051212310791}
{'epoch': 9, 'batch': 3406, 'loss': 4.618527889251709}
{'epoch': 9, 'batch': 3407, 'loss': 4.186199188232422}
{'epoch': 9, 'batch': 3408, 'loss': 4.352522373199463}
{'epoch': 9, 'batch': 3409, 'loss': 4.135274887084961}
{'epoch': 9, 'batch': 3410, 'loss': 4.794023513793945}
{'epoch': 9, 'batch': 3411, 'loss': 4.674112796783447}
{'epoch': 9, 'batch': 3412, 'loss': 5.073636054992676}
{'epoch': 9, 'batch': 3413, 'loss': 4.753217697143555}
{'epoch': 9, 'batch': 3414, 'loss': 4.426525592803955}
{'epoch': 9, 'batch': 3415, 'loss': 4.169083118438721}
{'epoch': 9, 'batch': 3416, 'loss': 4.5456624031066895}
{'epoch': 9, 'batch': 3417, 'loss': 4.884456634521484}
{'epoch': 9, 'batch': 3418, 'loss': 5.06331729888916}
{'epoch': 9, 'batch': 3419, 'loss': 4.798466682434082}
{'epoch': 9, 'batch': 3420, 'loss': 4.9023566246032715}
{'epoch':

{'epoch': 9, 'batch': 3553, 'loss': 4.469320297241211}
{'epoch': 9, 'batch': 3554, 'loss': 4.797766208648682}
{'epoch': 9, 'batch': 3555, 'loss': 4.3780293464660645}
{'epoch': 9, 'batch': 3556, 'loss': 4.339352607727051}
{'epoch': 9, 'batch': 3557, 'loss': 3.720871686935425}
{'epoch': 9, 'batch': 3558, 'loss': 2.83424711227417}
{'epoch': 9, 'batch': 3559, 'loss': 4.9008307456970215}
{'epoch': 9, 'batch': 3560, 'loss': 5.215640544891357}
{'epoch': 9, 'batch': 3561, 'loss': 4.457951545715332}
{'epoch': 9, 'batch': 3562, 'loss': 4.2097320556640625}
{'epoch': 9, 'batch': 3563, 'loss': 5.083764553070068}
{'epoch': 9, 'batch': 3564, 'loss': 5.29644775390625}
{'epoch': 9, 'batch': 3565, 'loss': 5.636395454406738}
{'epoch': 9, 'batch': 3566, 'loss': 4.490509986877441}
{'epoch': 9, 'batch': 3567, 'loss': 4.514094829559326}
{'epoch': 9, 'batch': 3568, 'loss': 4.491553783416748}
{'epoch': 9, 'batch': 3569, 'loss': 4.68256950378418}
{'epoch': 9, 'batch': 3570, 'loss': 4.868077278137207}
{'epoch': 

{'epoch': 9, 'batch': 3705, 'loss': 4.899797439575195}
{'epoch': 9, 'batch': 3706, 'loss': 4.55679178237915}
{'epoch': 9, 'batch': 3707, 'loss': 4.375979423522949}
{'epoch': 9, 'batch': 3708, 'loss': 4.498317718505859}
{'epoch': 9, 'batch': 3709, 'loss': 4.524518966674805}
{'epoch': 9, 'batch': 3710, 'loss': 4.654964447021484}
{'epoch': 9, 'batch': 3711, 'loss': 4.098900318145752}
{'epoch': 9, 'batch': 3712, 'loss': 4.046326637268066}
{'epoch': 9, 'batch': 3713, 'loss': 4.981124401092529}
{'epoch': 9, 'batch': 3714, 'loss': 4.925671577453613}
{'epoch': 9, 'batch': 3715, 'loss': 4.610495090484619}
{'epoch': 9, 'batch': 3716, 'loss': 4.616221904754639}
{'epoch': 9, 'batch': 3717, 'loss': 5.075581073760986}
{'epoch': 9, 'batch': 3718, 'loss': 4.707354545593262}
{'epoch': 9, 'batch': 3719, 'loss': 4.793537139892578}
{'epoch': 9, 'batch': 3720, 'loss': 4.992832660675049}
{'epoch': 9, 'batch': 3721, 'loss': 4.592745780944824}
{'epoch': 9, 'batch': 3722, 'loss': 5.207592964172363}
{'epoch': 9

In [28]:
torch.save(model.state_dict(), "model/lstm_pop_positive.pth")

In [7]:
from nltk.tokenize import RegexpTokenizer
text = 'hallo ik \n ben er ook'
text = text.replace('\n', ' Ж ')
print(text)
tokenizer = RegexpTokenizer(r'\w+|\$[\d\.]+|\S+')
tokens = tokenizer.tokenize(text)
tokens

hallo ik  Ж  ben er ook


['hallo', 'ik', 'Ж', 'ben', 'er', 'ook']