In [9]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import pandas as pd
import numpy as np
import torch
import requests
import os
import argparse
from torch.utils.data import DataLoader
from collections import Counter

In [2]:
class Model(nn.Module):
    def __init__(self, dataset):
        super(Model, self).__init__()
        self.lstm_size = 128
        self.embedding_dim = 128
        self.num_layers = 3

        n_vocab = len(dataset.uniq_words)
        self.embedding = nn.Embedding(
            num_embeddings=n_vocab,
            embedding_dim=self.embedding_dim,
        )
        self.lstm = nn.LSTM(
            input_size=self.lstm_size,
            hidden_size=self.lstm_size,
            num_layers=self.num_layers,
            dropout=0.2,
        )
        self.fc = nn.Linear(self.lstm_size, n_vocab)

    def forward(self, x, prev_state):
        embed = self.embedding(x)
        output, state = self.lstm(embed, prev_state)
        logits = self.fc(output)
        return logits, state

    def init_state(self, sequence_length):
        return (torch.zeros(self.num_layers, sequence_length, self.lstm_size),
                torch.zeros(self.num_layers, sequence_length, self.lstm_size))

In [3]:
class Dataset(torch.utils.data.Dataset):
    def __init__(
        self,
        args,
    ):
        self.args = args
        self.words = self.load_words()
        self.uniq_words = self.get_uniq_words()

        self.index_to_word = {index: word for index, word in enumerate(self.uniq_words)}
        self.word_to_index = {word: index for index, word in enumerate(self.uniq_words)}

        self.words_indexes = [self.word_to_index[w] for w in self.words]

    def load_words(self):
        train_df = pd.read_csv('greatgat.csv')
        #train_df = train_df[:3000]
        text = train_df['Line'].str.cat(sep=' ')
        return text.split(' ')

    def get_uniq_words(self):
        word_counts = Counter(self.words)
        return sorted(word_counts, key=word_counts.get, reverse=True)

    def __len__(self):
        return len(self.words_indexes) - self.args.sequence_length

    def __getitem__(self, index):
        return (
            torch.tensor(self.words_indexes[index:index+self.args.sequence_length]),
            torch.tensor(self.words_indexes[index+1:index+self.args.sequence_length+1]),
        )

In [4]:
def train(dataset, model, args):
    model.train()

    dataloader = DataLoader(dataset, batch_size=args.batch_size)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)

    for epoch in range(args.max_epochs):
        state_h, state_c = model.init_state(args.sequence_length)

        for batch, (x, y) in enumerate(dataloader):
            optimizer.zero_grad()

            y_pred, (state_h, state_c) = model(x, (state_h, state_c))
            loss = criterion(y_pred.transpose(1, 2), y)

            state_h = state_h.detach()
            state_c = state_c.detach()

            loss.backward()
            optimizer.step()

            print({ 'epoch': epoch, 'batch': batch, 'loss': loss.item() })

In [5]:
def predict(dataset, model, text, next_words=100):
    model.eval()

    words = text.split(' ')
    state_h, state_c = model.init_state(len(words))

    for i in range(0, next_words):
        x = torch.tensor([[dataset.word_to_index[w] for w in words[i:]]])
        y_pred, (state_h, state_c) = model(x, (state_h, state_c))

        last_word_logits = y_pred[0][-1]
        p = torch.nn.functional.softmax(last_word_logits, dim=0).detach().numpy()
        word_index = np.random.choice(len(last_word_logits), p=p)
        words.append(dataset.index_to_word[word_index])

    return words

In [17]:
parser = argparse.ArgumentParser()
parser.add_argument('--max-epochs', type=int, default=100)
parser.add_argument('--batch-size', type=int, default=256)
parser.add_argument('--sequence-length', type=int, default=4)
#args = parser.parse_args()
args, unknown = parser.parse_known_args()
dataset = Dataset(args)
model = Model(dataset)

In [18]:
train_df = pd.read_csv('greatgat.csv')
train_df.head()

Unnamed: 0.1,Unnamed: 0,Line
0,0,” Thomas Parke d’Invilliers ...
1,1,“Whenever you feel like criticizing anyone...
2,2,"” He didn’t say any more, but we’ve always ..."
3,3,"In consequence, I’m inclined to reserve all j..."
4,4,The abnormal mind is quick to detect and att...


In [19]:
train(dataset, model, args)

{'epoch': 0, 'batch': 0, 'loss': 9.015240669250488}
{'epoch': 0, 'batch': 1, 'loss': 9.017495155334473}
{'epoch': 0, 'batch': 2, 'loss': 9.00110149383545}
{'epoch': 0, 'batch': 3, 'loss': 8.98803424835205}
{'epoch': 0, 'batch': 4, 'loss': 8.969182014465332}
{'epoch': 0, 'batch': 5, 'loss': 8.957881927490234}
{'epoch': 0, 'batch': 6, 'loss': 8.908501625061035}
{'epoch': 0, 'batch': 7, 'loss': 8.873184204101562}
{'epoch': 0, 'batch': 8, 'loss': 8.801514625549316}
{'epoch': 0, 'batch': 9, 'loss': 8.62646198272705}
{'epoch': 0, 'batch': 10, 'loss': 8.504570007324219}
{'epoch': 0, 'batch': 11, 'loss': 8.338414192199707}
{'epoch': 0, 'batch': 12, 'loss': 7.795628070831299}
{'epoch': 0, 'batch': 13, 'loss': 7.829349040985107}
{'epoch': 0, 'batch': 14, 'loss': 7.7339863777160645}
{'epoch': 0, 'batch': 15, 'loss': 7.548402309417725}
{'epoch': 0, 'batch': 16, 'loss': 7.456308364868164}
{'epoch': 0, 'batch': 17, 'loss': 7.24577522277832}
{'epoch': 0, 'batch': 18, 'loss': 7.325206756591797}
{'epoc

{'epoch': 0, 'batch': 154, 'loss': 6.0835676193237305}
{'epoch': 0, 'batch': 155, 'loss': 6.2007246017456055}
{'epoch': 0, 'batch': 156, 'loss': 6.191518306732178}
{'epoch': 0, 'batch': 157, 'loss': 5.847102642059326}
{'epoch': 0, 'batch': 158, 'loss': 6.41625452041626}
{'epoch': 0, 'batch': 159, 'loss': 6.976774215698242}
{'epoch': 0, 'batch': 160, 'loss': 6.409364700317383}
{'epoch': 0, 'batch': 161, 'loss': 6.32051420211792}
{'epoch': 0, 'batch': 162, 'loss': 6.462332248687744}
{'epoch': 0, 'batch': 163, 'loss': 5.899334907531738}
{'epoch': 0, 'batch': 164, 'loss': 5.90755033493042}
{'epoch': 0, 'batch': 165, 'loss': 6.111796855926514}
{'epoch': 0, 'batch': 166, 'loss': 5.9979352951049805}
{'epoch': 0, 'batch': 167, 'loss': 6.059804916381836}
{'epoch': 0, 'batch': 168, 'loss': 6.240462779998779}
{'epoch': 0, 'batch': 169, 'loss': 6.031896114349365}
{'epoch': 0, 'batch': 170, 'loss': 5.77513313293457}
{'epoch': 0, 'batch': 171, 'loss': 6.084109306335449}
{'epoch': 0, 'batch': 172, 'l

{'epoch': 1, 'batch': 72, 'loss': 6.503358364105225}
{'epoch': 1, 'batch': 73, 'loss': 6.514651775360107}
{'epoch': 1, 'batch': 74, 'loss': 6.486187934875488}
{'epoch': 1, 'batch': 75, 'loss': 5.973686218261719}
{'epoch': 1, 'batch': 76, 'loss': 5.683351039886475}
{'epoch': 1, 'batch': 77, 'loss': 6.662032127380371}
{'epoch': 1, 'batch': 78, 'loss': 6.888248920440674}
{'epoch': 1, 'batch': 79, 'loss': 6.553680419921875}
{'epoch': 1, 'batch': 80, 'loss': 6.131580352783203}
{'epoch': 1, 'batch': 81, 'loss': 6.269300937652588}
{'epoch': 1, 'batch': 82, 'loss': 6.217254638671875}
{'epoch': 1, 'batch': 83, 'loss': 6.593562126159668}
{'epoch': 1, 'batch': 84, 'loss': 6.327206134796143}
{'epoch': 1, 'batch': 85, 'loss': 6.242116451263428}
{'epoch': 1, 'batch': 86, 'loss': 6.206827163696289}
{'epoch': 1, 'batch': 87, 'loss': 6.478701591491699}
{'epoch': 1, 'batch': 88, 'loss': 6.014859676361084}
{'epoch': 1, 'batch': 89, 'loss': 6.070873737335205}
{'epoch': 1, 'batch': 90, 'loss': 6.1419816017

{'epoch': 1, 'batch': 225, 'loss': 6.140289306640625}
{'epoch': 1, 'batch': 226, 'loss': 5.976425647735596}
{'epoch': 1, 'batch': 227, 'loss': 6.616509437561035}
{'epoch': 1, 'batch': 228, 'loss': 6.843236923217773}
{'epoch': 1, 'batch': 229, 'loss': 6.529181957244873}
{'epoch': 1, 'batch': 230, 'loss': 6.06021785736084}
{'epoch': 1, 'batch': 231, 'loss': 5.844700336456299}
{'epoch': 1, 'batch': 232, 'loss': 6.179050922393799}
{'epoch': 1, 'batch': 233, 'loss': 6.169127941131592}
{'epoch': 1, 'batch': 234, 'loss': 6.540583610534668}
{'epoch': 1, 'batch': 235, 'loss': 6.485411643981934}
{'epoch': 2, 'batch': 0, 'loss': 5.724004745483398}
{'epoch': 2, 'batch': 1, 'loss': 6.771238803863525}
{'epoch': 2, 'batch': 2, 'loss': 6.680895805358887}
{'epoch': 2, 'batch': 3, 'loss': 6.350881576538086}
{'epoch': 2, 'batch': 4, 'loss': 6.290071487426758}
{'epoch': 2, 'batch': 5, 'loss': 6.852134704589844}
{'epoch': 2, 'batch': 6, 'loss': 6.536174297332764}
{'epoch': 2, 'batch': 7, 'loss': 6.59213829

{'epoch': 2, 'batch': 143, 'loss': 5.3221306800842285}
{'epoch': 2, 'batch': 144, 'loss': 5.419126987457275}
{'epoch': 2, 'batch': 145, 'loss': 6.2513041496276855}
{'epoch': 2, 'batch': 146, 'loss': 6.13002872467041}
{'epoch': 2, 'batch': 147, 'loss': 5.849802017211914}
{'epoch': 2, 'batch': 148, 'loss': 5.659485340118408}
{'epoch': 2, 'batch': 149, 'loss': 5.753809452056885}
{'epoch': 2, 'batch': 150, 'loss': 5.777842998504639}
{'epoch': 2, 'batch': 151, 'loss': 5.6201958656311035}
{'epoch': 2, 'batch': 152, 'loss': 5.672755241394043}
{'epoch': 2, 'batch': 153, 'loss': 5.495534896850586}
{'epoch': 2, 'batch': 154, 'loss': 5.707192897796631}
{'epoch': 2, 'batch': 155, 'loss': 5.772284984588623}
{'epoch': 2, 'batch': 156, 'loss': 5.750075340270996}
{'epoch': 2, 'batch': 157, 'loss': 5.420426845550537}
{'epoch': 2, 'batch': 158, 'loss': 6.044336795806885}
{'epoch': 2, 'batch': 159, 'loss': 6.527623653411865}
{'epoch': 2, 'batch': 160, 'loss': 5.977081775665283}
{'epoch': 2, 'batch': 161,

{'epoch': 3, 'batch': 60, 'loss': 5.245382785797119}
{'epoch': 3, 'batch': 61, 'loss': 5.867039203643799}
{'epoch': 3, 'batch': 62, 'loss': 5.316956043243408}
{'epoch': 3, 'batch': 63, 'loss': 6.273022174835205}
{'epoch': 3, 'batch': 64, 'loss': 6.056234359741211}
{'epoch': 3, 'batch': 65, 'loss': 6.151889801025391}
{'epoch': 3, 'batch': 66, 'loss': 5.8833441734313965}
{'epoch': 3, 'batch': 67, 'loss': 5.701224327087402}
{'epoch': 3, 'batch': 68, 'loss': 6.0020012855529785}
{'epoch': 3, 'batch': 69, 'loss': 5.300006866455078}
{'epoch': 3, 'batch': 70, 'loss': 5.6502766609191895}
{'epoch': 3, 'batch': 71, 'loss': 5.68026876449585}
{'epoch': 3, 'batch': 72, 'loss': 6.234835624694824}
{'epoch': 3, 'batch': 73, 'loss': 6.233715057373047}
{'epoch': 3, 'batch': 74, 'loss': 6.236238479614258}
{'epoch': 3, 'batch': 75, 'loss': 5.591158866882324}
{'epoch': 3, 'batch': 76, 'loss': 5.218832492828369}
{'epoch': 3, 'batch': 77, 'loss': 6.379348278045654}
{'epoch': 3, 'batch': 78, 'loss': 6.61445808

{'epoch': 3, 'batch': 213, 'loss': 4.267364501953125}
{'epoch': 3, 'batch': 214, 'loss': 5.812581539154053}
{'epoch': 3, 'batch': 215, 'loss': 5.345072269439697}
{'epoch': 3, 'batch': 216, 'loss': 5.40595817565918}
{'epoch': 3, 'batch': 217, 'loss': 5.441609859466553}
{'epoch': 3, 'batch': 218, 'loss': 5.92111349105835}
{'epoch': 3, 'batch': 219, 'loss': 5.281543254852295}
{'epoch': 3, 'batch': 220, 'loss': 5.6827874183654785}
{'epoch': 3, 'batch': 221, 'loss': 5.259250164031982}
{'epoch': 3, 'batch': 222, 'loss': 5.3565216064453125}
{'epoch': 3, 'batch': 223, 'loss': 3.7293899059295654}
{'epoch': 3, 'batch': 224, 'loss': 3.581848382949829}
{'epoch': 3, 'batch': 225, 'loss': 5.697538375854492}
{'epoch': 3, 'batch': 226, 'loss': 5.631659030914307}
{'epoch': 3, 'batch': 227, 'loss': 6.204029560089111}
{'epoch': 3, 'batch': 228, 'loss': 6.4373273849487305}
{'epoch': 3, 'batch': 229, 'loss': 6.12925910949707}
{'epoch': 3, 'batch': 230, 'loss': 5.691658973693848}
{'epoch': 3, 'batch': 231, 

{'epoch': 4, 'batch': 131, 'loss': 5.251754283905029}
{'epoch': 4, 'batch': 132, 'loss': 5.414978981018066}
{'epoch': 4, 'batch': 133, 'loss': 6.138244152069092}
{'epoch': 4, 'batch': 134, 'loss': 5.554742336273193}
{'epoch': 4, 'batch': 135, 'loss': 5.759081840515137}
{'epoch': 4, 'batch': 136, 'loss': 5.83030891418457}
{'epoch': 4, 'batch': 137, 'loss': 5.992263317108154}
{'epoch': 4, 'batch': 138, 'loss': 5.181901454925537}
{'epoch': 4, 'batch': 139, 'loss': 5.829707622528076}
{'epoch': 4, 'batch': 140, 'loss': 5.4363532066345215}
{'epoch': 4, 'batch': 141, 'loss': 5.488533973693848}
{'epoch': 4, 'batch': 142, 'loss': 5.823673725128174}
{'epoch': 4, 'batch': 143, 'loss': 5.026287078857422}
{'epoch': 4, 'batch': 144, 'loss': 5.077232837677002}
{'epoch': 4, 'batch': 145, 'loss': 5.987585544586182}
{'epoch': 4, 'batch': 146, 'loss': 5.7919182777404785}
{'epoch': 4, 'batch': 147, 'loss': 5.5273613929748535}
{'epoch': 4, 'batch': 148, 'loss': 5.330165386199951}
{'epoch': 4, 'batch': 149,

{'epoch': 5, 'batch': 48, 'loss': 4.548708915710449}
{'epoch': 5, 'batch': 49, 'loss': 6.0734944343566895}
{'epoch': 5, 'batch': 50, 'loss': 6.343962669372559}
{'epoch': 5, 'batch': 51, 'loss': 6.0657477378845215}
{'epoch': 5, 'batch': 52, 'loss': 5.85246467590332}
{'epoch': 5, 'batch': 53, 'loss': 5.416804790496826}
{'epoch': 5, 'batch': 54, 'loss': 5.344804763793945}
{'epoch': 5, 'batch': 55, 'loss': 5.129200458526611}
{'epoch': 5, 'batch': 56, 'loss': 5.721820831298828}
{'epoch': 5, 'batch': 57, 'loss': 5.381167411804199}
{'epoch': 5, 'batch': 58, 'loss': 5.3037848472595215}
{'epoch': 5, 'batch': 59, 'loss': 5.775981426239014}
{'epoch': 5, 'batch': 60, 'loss': 4.907673358917236}
{'epoch': 5, 'batch': 61, 'loss': 5.4825615882873535}
{'epoch': 5, 'batch': 62, 'loss': 4.978257179260254}
{'epoch': 5, 'batch': 63, 'loss': 5.92234468460083}
{'epoch': 5, 'batch': 64, 'loss': 5.716780662536621}
{'epoch': 5, 'batch': 65, 'loss': 5.800926208496094}
{'epoch': 5, 'batch': 66, 'loss': 5.53621625

{'epoch': 5, 'batch': 201, 'loss': 5.611135482788086}
{'epoch': 5, 'batch': 202, 'loss': 5.267281532287598}
{'epoch': 5, 'batch': 203, 'loss': 4.9574971199035645}
{'epoch': 5, 'batch': 204, 'loss': 4.984174728393555}
{'epoch': 5, 'batch': 205, 'loss': 5.469449520111084}
{'epoch': 5, 'batch': 206, 'loss': 5.624486446380615}
{'epoch': 5, 'batch': 207, 'loss': 5.343667030334473}
{'epoch': 5, 'batch': 208, 'loss': 5.929231643676758}
{'epoch': 5, 'batch': 209, 'loss': 4.778463363647461}
{'epoch': 5, 'batch': 210, 'loss': 5.9196624755859375}
{'epoch': 5, 'batch': 211, 'loss': 5.0862226486206055}
{'epoch': 5, 'batch': 212, 'loss': 5.6314897537231445}
{'epoch': 5, 'batch': 213, 'loss': 4.016678333282471}
{'epoch': 5, 'batch': 214, 'loss': 5.474498271942139}
{'epoch': 5, 'batch': 215, 'loss': 4.9354424476623535}
{'epoch': 5, 'batch': 216, 'loss': 5.068926811218262}
{'epoch': 5, 'batch': 217, 'loss': 5.104128360748291}
{'epoch': 5, 'batch': 218, 'loss': 5.572904586791992}
{'epoch': 5, 'batch': 2

{'epoch': 6, 'batch': 119, 'loss': 5.04392147064209}
{'epoch': 6, 'batch': 120, 'loss': 5.125288009643555}
{'epoch': 6, 'batch': 121, 'loss': 5.3055315017700195}
{'epoch': 6, 'batch': 122, 'loss': 5.321775436401367}
{'epoch': 6, 'batch': 123, 'loss': 4.484869480133057}
{'epoch': 6, 'batch': 124, 'loss': 5.707819938659668}
{'epoch': 6, 'batch': 125, 'loss': 5.686760902404785}
{'epoch': 6, 'batch': 126, 'loss': 5.711294174194336}
{'epoch': 6, 'batch': 127, 'loss': 5.827754974365234}
{'epoch': 6, 'batch': 128, 'loss': 5.79377555847168}
{'epoch': 6, 'batch': 129, 'loss': 5.187405109405518}
{'epoch': 6, 'batch': 130, 'loss': 4.756673336029053}
{'epoch': 6, 'batch': 131, 'loss': 4.9388861656188965}
{'epoch': 6, 'batch': 132, 'loss': 5.1043782234191895}
{'epoch': 6, 'batch': 133, 'loss': 5.77393913269043}
{'epoch': 6, 'batch': 134, 'loss': 5.2311224937438965}
{'epoch': 6, 'batch': 135, 'loss': 5.399355888366699}
{'epoch': 6, 'batch': 136, 'loss': 5.472524642944336}
{'epoch': 6, 'batch': 137, 

{'epoch': 7, 'batch': 36, 'loss': 5.703861236572266}
{'epoch': 7, 'batch': 37, 'loss': 5.466698169708252}
{'epoch': 7, 'batch': 38, 'loss': 5.457484722137451}
{'epoch': 7, 'batch': 39, 'loss': 4.9975266456604}
{'epoch': 7, 'batch': 40, 'loss': 4.9141669273376465}
{'epoch': 7, 'batch': 41, 'loss': 4.7486114501953125}
{'epoch': 7, 'batch': 42, 'loss': 5.0581488609313965}
{'epoch': 7, 'batch': 43, 'loss': 5.035308361053467}
{'epoch': 7, 'batch': 44, 'loss': 5.072613716125488}
{'epoch': 7, 'batch': 45, 'loss': 5.4751715660095215}
{'epoch': 7, 'batch': 46, 'loss': 5.21522855758667}
{'epoch': 7, 'batch': 47, 'loss': 5.438648223876953}
{'epoch': 7, 'batch': 48, 'loss': 4.320201873779297}
{'epoch': 7, 'batch': 49, 'loss': 5.765899181365967}
{'epoch': 7, 'batch': 50, 'loss': 6.097893238067627}
{'epoch': 7, 'batch': 51, 'loss': 5.856900691986084}
{'epoch': 7, 'batch': 52, 'loss': 5.633598327636719}
{'epoch': 7, 'batch': 53, 'loss': 5.231101036071777}
{'epoch': 7, 'batch': 54, 'loss': 5.137350559

{'epoch': 7, 'batch': 189, 'loss': 5.392600059509277}
{'epoch': 7, 'batch': 190, 'loss': 5.5541863441467285}
{'epoch': 7, 'batch': 191, 'loss': 5.320279121398926}
{'epoch': 7, 'batch': 192, 'loss': 5.307539463043213}
{'epoch': 7, 'batch': 193, 'loss': 5.49943733215332}
{'epoch': 7, 'batch': 194, 'loss': 5.09435510635376}
{'epoch': 7, 'batch': 195, 'loss': 5.096439361572266}
{'epoch': 7, 'batch': 196, 'loss': 5.048191547393799}
{'epoch': 7, 'batch': 197, 'loss': 4.587686061859131}
{'epoch': 7, 'batch': 198, 'loss': 5.244313716888428}
{'epoch': 7, 'batch': 199, 'loss': 4.79462194442749}
{'epoch': 7, 'batch': 200, 'loss': 5.078470706939697}
{'epoch': 7, 'batch': 201, 'loss': 5.32668924331665}
{'epoch': 7, 'batch': 202, 'loss': 4.986645221710205}
{'epoch': 7, 'batch': 203, 'loss': 4.668034076690674}
{'epoch': 7, 'batch': 204, 'loss': 4.754247188568115}
{'epoch': 7, 'batch': 205, 'loss': 5.150454521179199}
{'epoch': 7, 'batch': 206, 'loss': 5.31156587600708}
{'epoch': 7, 'batch': 207, 'loss

{'epoch': 8, 'batch': 107, 'loss': 5.121212482452393}
{'epoch': 8, 'batch': 108, 'loss': 4.9997239112854}
{'epoch': 8, 'batch': 109, 'loss': 4.732479572296143}
{'epoch': 8, 'batch': 110, 'loss': 4.8965654373168945}
{'epoch': 8, 'batch': 111, 'loss': 4.844364166259766}
{'epoch': 8, 'batch': 112, 'loss': 5.233872413635254}
{'epoch': 8, 'batch': 113, 'loss': 5.298027515411377}
{'epoch': 8, 'batch': 114, 'loss': 4.705752372741699}
{'epoch': 8, 'batch': 115, 'loss': 4.701495170593262}
{'epoch': 8, 'batch': 116, 'loss': 5.5552520751953125}
{'epoch': 8, 'batch': 117, 'loss': 5.149324893951416}
{'epoch': 8, 'batch': 118, 'loss': 5.433868885040283}
{'epoch': 8, 'batch': 119, 'loss': 4.832916259765625}
{'epoch': 8, 'batch': 120, 'loss': 4.88790225982666}
{'epoch': 8, 'batch': 121, 'loss': 5.001031875610352}
{'epoch': 8, 'batch': 122, 'loss': 5.052438259124756}
{'epoch': 8, 'batch': 123, 'loss': 4.236992359161377}
{'epoch': 8, 'batch': 124, 'loss': 5.389345645904541}
{'epoch': 8, 'batch': 125, 'l

{'epoch': 9, 'batch': 24, 'loss': 5.142109394073486}
{'epoch': 9, 'batch': 25, 'loss': 4.77603006362915}
{'epoch': 9, 'batch': 26, 'loss': 5.312765121459961}
{'epoch': 9, 'batch': 27, 'loss': 5.094260215759277}
{'epoch': 9, 'batch': 28, 'loss': 4.994326114654541}
{'epoch': 9, 'batch': 29, 'loss': 5.372824668884277}
{'epoch': 9, 'batch': 30, 'loss': 5.227774143218994}
{'epoch': 9, 'batch': 31, 'loss': 5.19572639465332}
{'epoch': 9, 'batch': 32, 'loss': 4.829512596130371}
{'epoch': 9, 'batch': 33, 'loss': 5.00858211517334}
{'epoch': 9, 'batch': 34, 'loss': 4.749255657196045}
{'epoch': 9, 'batch': 35, 'loss': 5.02907133102417}
{'epoch': 9, 'batch': 36, 'loss': 5.420416355133057}
{'epoch': 9, 'batch': 37, 'loss': 5.170199871063232}
{'epoch': 9, 'batch': 38, 'loss': 5.190542221069336}
{'epoch': 9, 'batch': 39, 'loss': 4.7630510330200195}
{'epoch': 9, 'batch': 40, 'loss': 4.668788433074951}
{'epoch': 9, 'batch': 41, 'loss': 4.562072277069092}
{'epoch': 9, 'batch': 42, 'loss': 4.8791370391845

{'epoch': 9, 'batch': 178, 'loss': 5.087075710296631}
{'epoch': 9, 'batch': 179, 'loss': 4.662727355957031}
{'epoch': 9, 'batch': 180, 'loss': 4.877151966094971}
{'epoch': 9, 'batch': 181, 'loss': 4.983131408691406}
{'epoch': 9, 'batch': 182, 'loss': 4.494729042053223}
{'epoch': 9, 'batch': 183, 'loss': 4.692080497741699}
{'epoch': 9, 'batch': 184, 'loss': 4.245936393737793}
{'epoch': 9, 'batch': 185, 'loss': 4.819622039794922}
{'epoch': 9, 'batch': 186, 'loss': 4.844113349914551}
{'epoch': 9, 'batch': 187, 'loss': 3.9885289669036865}
{'epoch': 9, 'batch': 188, 'loss': 4.937809467315674}
{'epoch': 9, 'batch': 189, 'loss': 5.1940765380859375}
{'epoch': 9, 'batch': 190, 'loss': 5.3135881423950195}
{'epoch': 9, 'batch': 191, 'loss': 5.088984489440918}
{'epoch': 9, 'batch': 192, 'loss': 5.0432209968566895}
{'epoch': 9, 'batch': 193, 'loss': 5.182196617126465}
{'epoch': 9, 'batch': 194, 'loss': 4.820571422576904}
{'epoch': 9, 'batch': 195, 'loss': 4.882045269012451}
{'epoch': 9, 'batch': 19

{'epoch': 10, 'batch': 94, 'loss': 4.599967956542969}
{'epoch': 10, 'batch': 95, 'loss': 4.831803321838379}
{'epoch': 10, 'batch': 96, 'loss': 5.129228115081787}
{'epoch': 10, 'batch': 97, 'loss': 4.9351935386657715}
{'epoch': 10, 'batch': 98, 'loss': 5.00274133682251}
{'epoch': 10, 'batch': 99, 'loss': 5.073225021362305}
{'epoch': 10, 'batch': 100, 'loss': 4.697441101074219}
{'epoch': 10, 'batch': 101, 'loss': 4.791044235229492}
{'epoch': 10, 'batch': 102, 'loss': 4.3206024169921875}
{'epoch': 10, 'batch': 103, 'loss': 4.5595703125}
{'epoch': 10, 'batch': 104, 'loss': 4.27252197265625}
{'epoch': 10, 'batch': 105, 'loss': 4.7237548828125}
{'epoch': 10, 'batch': 106, 'loss': 4.877377986907959}
{'epoch': 10, 'batch': 107, 'loss': 4.865639686584473}
{'epoch': 10, 'batch': 108, 'loss': 4.794768333435059}
{'epoch': 10, 'batch': 109, 'loss': 4.533067226409912}
{'epoch': 10, 'batch': 110, 'loss': 4.6788763999938965}
{'epoch': 10, 'batch': 111, 'loss': 4.706246852874756}
{'epoch': 10, 'batch':

{'epoch': 11, 'batch': 8, 'loss': 5.2689924240112305}
{'epoch': 11, 'batch': 9, 'loss': 4.889403820037842}
{'epoch': 11, 'batch': 10, 'loss': 4.9005231857299805}
{'epoch': 11, 'batch': 11, 'loss': 5.17302942276001}
{'epoch': 11, 'batch': 12, 'loss': 4.532139301300049}
{'epoch': 11, 'batch': 13, 'loss': 4.824102401733398}
{'epoch': 11, 'batch': 14, 'loss': 4.9128828048706055}
{'epoch': 11, 'batch': 15, 'loss': 4.964649677276611}
{'epoch': 11, 'batch': 16, 'loss': 5.204141616821289}
{'epoch': 11, 'batch': 17, 'loss': 4.986422538757324}
{'epoch': 11, 'batch': 18, 'loss': 5.301891326904297}
{'epoch': 11, 'batch': 19, 'loss': 4.495054721832275}
{'epoch': 11, 'batch': 20, 'loss': 5.362207412719727}
{'epoch': 11, 'batch': 21, 'loss': 4.881782531738281}
{'epoch': 11, 'batch': 22, 'loss': 5.128276824951172}
{'epoch': 11, 'batch': 23, 'loss': 4.854419231414795}
{'epoch': 11, 'batch': 24, 'loss': 4.933780670166016}
{'epoch': 11, 'batch': 25, 'loss': 4.618090629577637}
{'epoch': 11, 'batch': 26, '

{'epoch': 11, 'batch': 159, 'loss': 5.251222133636475}
{'epoch': 11, 'batch': 160, 'loss': 4.770096778869629}
{'epoch': 11, 'batch': 161, 'loss': 4.741562366485596}
{'epoch': 11, 'batch': 162, 'loss': 4.710635662078857}
{'epoch': 11, 'batch': 163, 'loss': 4.3200297355651855}
{'epoch': 11, 'batch': 164, 'loss': 4.242063522338867}
{'epoch': 11, 'batch': 165, 'loss': 4.516632556915283}
{'epoch': 11, 'batch': 166, 'loss': 4.347585201263428}
{'epoch': 11, 'batch': 167, 'loss': 4.63904333114624}
{'epoch': 11, 'batch': 168, 'loss': 4.719234943389893}
{'epoch': 11, 'batch': 169, 'loss': 4.370443344116211}
{'epoch': 11, 'batch': 170, 'loss': 4.171297073364258}
{'epoch': 11, 'batch': 171, 'loss': 4.559449672698975}
{'epoch': 11, 'batch': 172, 'loss': 4.9636549949646}
{'epoch': 11, 'batch': 173, 'loss': 4.294369220733643}
{'epoch': 11, 'batch': 174, 'loss': 4.998660087585449}
{'epoch': 11, 'batch': 175, 'loss': 4.8962602615356445}
{'epoch': 11, 'batch': 176, 'loss': 4.915676116943359}
{'epoch': 1

{'epoch': 12, 'batch': 74, 'loss': 5.071171760559082}
{'epoch': 12, 'batch': 75, 'loss': 4.534951210021973}
{'epoch': 12, 'batch': 76, 'loss': 4.229673385620117}
{'epoch': 12, 'batch': 77, 'loss': 5.115421772003174}
{'epoch': 12, 'batch': 78, 'loss': 5.22979211807251}
{'epoch': 12, 'batch': 79, 'loss': 5.06088924407959}
{'epoch': 12, 'batch': 80, 'loss': 4.5714850425720215}
{'epoch': 12, 'batch': 81, 'loss': 4.700266361236572}
{'epoch': 12, 'batch': 82, 'loss': 4.710891246795654}
{'epoch': 12, 'batch': 83, 'loss': 5.003078460693359}
{'epoch': 12, 'batch': 84, 'loss': 4.665901184082031}
{'epoch': 12, 'batch': 85, 'loss': 4.813778877258301}
{'epoch': 12, 'batch': 86, 'loss': 4.645036697387695}
{'epoch': 12, 'batch': 87, 'loss': 4.872755527496338}
{'epoch': 12, 'batch': 88, 'loss': 4.4163713455200195}
{'epoch': 12, 'batch': 89, 'loss': 4.593414783477783}
{'epoch': 12, 'batch': 90, 'loss': 4.6381425857543945}
{'epoch': 12, 'batch': 91, 'loss': 4.2303266525268555}
{'epoch': 12, 'batch': 92,

{'epoch': 12, 'batch': 224, 'loss': 2.77982497215271}
{'epoch': 12, 'batch': 225, 'loss': 4.556008815765381}
{'epoch': 12, 'batch': 226, 'loss': 4.451690196990967}
{'epoch': 12, 'batch': 227, 'loss': 5.017170429229736}
{'epoch': 12, 'batch': 228, 'loss': 5.055655479431152}
{'epoch': 12, 'batch': 229, 'loss': 4.908980369567871}
{'epoch': 12, 'batch': 230, 'loss': 4.552800178527832}
{'epoch': 12, 'batch': 231, 'loss': 4.32000732421875}
{'epoch': 12, 'batch': 232, 'loss': 4.820824146270752}
{'epoch': 12, 'batch': 233, 'loss': 4.710269451141357}
{'epoch': 12, 'batch': 234, 'loss': 4.893354415893555}
{'epoch': 12, 'batch': 235, 'loss': 4.712344169616699}
{'epoch': 13, 'batch': 0, 'loss': 4.259313106536865}
{'epoch': 13, 'batch': 1, 'loss': 5.139498233795166}
{'epoch': 13, 'batch': 2, 'loss': 4.984991550445557}
{'epoch': 13, 'batch': 3, 'loss': 4.805582523345947}
{'epoch': 13, 'batch': 4, 'loss': 4.727428913116455}
{'epoch': 13, 'batch': 5, 'loss': 5.147953510284424}
{'epoch': 13, 'batch': 6

{'epoch': 13, 'batch': 139, 'loss': 4.779466152191162}
{'epoch': 13, 'batch': 140, 'loss': 4.350493907928467}
{'epoch': 13, 'batch': 141, 'loss': 4.4520463943481445}
{'epoch': 13, 'batch': 142, 'loss': 4.6010870933532715}
{'epoch': 13, 'batch': 143, 'loss': 4.0255022048950195}
{'epoch': 13, 'batch': 144, 'loss': 4.083107948303223}
{'epoch': 13, 'batch': 145, 'loss': 4.817449569702148}
{'epoch': 13, 'batch': 146, 'loss': 4.6112518310546875}
{'epoch': 13, 'batch': 147, 'loss': 4.380173206329346}
{'epoch': 13, 'batch': 148, 'loss': 4.306407928466797}
{'epoch': 13, 'batch': 149, 'loss': 4.409460067749023}
{'epoch': 13, 'batch': 150, 'loss': 4.343847274780273}
{'epoch': 13, 'batch': 151, 'loss': 4.2770915031433105}
{'epoch': 13, 'batch': 152, 'loss': 4.2906174659729}
{'epoch': 13, 'batch': 153, 'loss': 3.9830551147460938}
{'epoch': 13, 'batch': 154, 'loss': 4.223176956176758}
{'epoch': 13, 'batch': 155, 'loss': 4.260504722595215}
{'epoch': 13, 'batch': 156, 'loss': 4.310708522796631}
{'epoc

{'epoch': 14, 'batch': 53, 'loss': 4.545676231384277}
{'epoch': 14, 'batch': 54, 'loss': 4.4045867919921875}
{'epoch': 14, 'batch': 55, 'loss': 4.2825188636779785}
{'epoch': 14, 'batch': 56, 'loss': 4.79330587387085}
{'epoch': 14, 'batch': 57, 'loss': 4.259772300720215}
{'epoch': 14, 'batch': 58, 'loss': 4.32861328125}
{'epoch': 14, 'batch': 59, 'loss': 4.679703235626221}
{'epoch': 14, 'batch': 60, 'loss': 4.076999664306641}
{'epoch': 14, 'batch': 61, 'loss': 4.5491204261779785}
{'epoch': 14, 'batch': 62, 'loss': 4.183203220367432}
{'epoch': 14, 'batch': 63, 'loss': 4.88865852355957}
{'epoch': 14, 'batch': 64, 'loss': 4.745063781738281}
{'epoch': 14, 'batch': 65, 'loss': 4.821557998657227}
{'epoch': 14, 'batch': 66, 'loss': 4.689648628234863}
{'epoch': 14, 'batch': 67, 'loss': 4.4411444664001465}
{'epoch': 14, 'batch': 68, 'loss': 4.750596046447754}
{'epoch': 14, 'batch': 69, 'loss': 4.042381763458252}
{'epoch': 14, 'batch': 70, 'loss': 4.394163608551025}
{'epoch': 14, 'batch': 71, 'lo

{'epoch': 14, 'batch': 203, 'loss': 4.0606513023376465}
{'epoch': 14, 'batch': 204, 'loss': 4.087654113769531}
{'epoch': 14, 'batch': 205, 'loss': 4.460257530212402}
{'epoch': 14, 'batch': 206, 'loss': 4.590916156768799}
{'epoch': 14, 'batch': 207, 'loss': 4.5052080154418945}
{'epoch': 14, 'batch': 208, 'loss': 4.908406734466553}
{'epoch': 14, 'batch': 209, 'loss': 3.899172306060791}
{'epoch': 14, 'batch': 210, 'loss': 4.933688163757324}
{'epoch': 14, 'batch': 211, 'loss': 4.211328029632568}
{'epoch': 14, 'batch': 212, 'loss': 4.6483635902404785}
{'epoch': 14, 'batch': 213, 'loss': 3.31072998046875}
{'epoch': 14, 'batch': 214, 'loss': 4.416330814361572}
{'epoch': 14, 'batch': 215, 'loss': 3.9742069244384766}
{'epoch': 14, 'batch': 216, 'loss': 4.1833391189575195}
{'epoch': 14, 'batch': 217, 'loss': 4.228044509887695}
{'epoch': 14, 'batch': 218, 'loss': 4.478689193725586}
{'epoch': 14, 'batch': 219, 'loss': 4.029266357421875}
{'epoch': 14, 'batch': 220, 'loss': 4.399860858917236}
{'epoc

{'epoch': 15, 'batch': 118, 'loss': 4.720677375793457}
{'epoch': 15, 'batch': 119, 'loss': 4.276216983795166}
{'epoch': 15, 'batch': 120, 'loss': 4.287270545959473}
{'epoch': 15, 'batch': 121, 'loss': 4.348339557647705}
{'epoch': 15, 'batch': 122, 'loss': 4.415908336639404}
{'epoch': 15, 'batch': 123, 'loss': 3.7483737468719482}
{'epoch': 15, 'batch': 124, 'loss': 4.797586917877197}
{'epoch': 15, 'batch': 125, 'loss': 4.727705478668213}
{'epoch': 15, 'batch': 126, 'loss': 4.719381809234619}
{'epoch': 15, 'batch': 127, 'loss': 4.725353240966797}
{'epoch': 15, 'batch': 128, 'loss': 4.823613166809082}
{'epoch': 15, 'batch': 129, 'loss': 4.496414661407471}
{'epoch': 15, 'batch': 130, 'loss': 3.938838005065918}
{'epoch': 15, 'batch': 131, 'loss': 4.065924167633057}
{'epoch': 15, 'batch': 132, 'loss': 4.324789047241211}
{'epoch': 15, 'batch': 133, 'loss': 4.724617004394531}
{'epoch': 15, 'batch': 134, 'loss': 4.235006809234619}
{'epoch': 15, 'batch': 135, 'loss': 4.559253215789795}
{'epoch':

{'epoch': 16, 'batch': 32, 'loss': 4.318667888641357}
{'epoch': 16, 'batch': 33, 'loss': 4.396330833435059}
{'epoch': 16, 'batch': 34, 'loss': 4.136430263519287}
{'epoch': 16, 'batch': 35, 'loss': 4.41534423828125}
{'epoch': 16, 'batch': 36, 'loss': 4.780320644378662}
{'epoch': 16, 'batch': 37, 'loss': 4.523279190063477}
{'epoch': 16, 'batch': 38, 'loss': 4.6006364822387695}
{'epoch': 16, 'batch': 39, 'loss': 4.293412208557129}
{'epoch': 16, 'batch': 40, 'loss': 4.145483016967773}
{'epoch': 16, 'batch': 41, 'loss': 4.081039905548096}
{'epoch': 16, 'batch': 42, 'loss': 4.296281814575195}
{'epoch': 16, 'batch': 43, 'loss': 4.415982723236084}
{'epoch': 16, 'batch': 44, 'loss': 4.2650909423828125}
{'epoch': 16, 'batch': 45, 'loss': 4.630899429321289}
{'epoch': 16, 'batch': 46, 'loss': 4.514345169067383}
{'epoch': 16, 'batch': 47, 'loss': 4.622936248779297}
{'epoch': 16, 'batch': 48, 'loss': 3.626553535461426}
{'epoch': 16, 'batch': 49, 'loss': 4.870351314544678}
{'epoch': 16, 'batch': 50, 

{'epoch': 16, 'batch': 183, 'loss': 4.127248764038086}
{'epoch': 16, 'batch': 184, 'loss': 3.742094039916992}
{'epoch': 16, 'batch': 185, 'loss': 4.22627592086792}
{'epoch': 16, 'batch': 186, 'loss': 4.2102837562561035}
{'epoch': 16, 'batch': 187, 'loss': 3.5245206356048584}
{'epoch': 16, 'batch': 188, 'loss': 4.338801860809326}
{'epoch': 16, 'batch': 189, 'loss': 4.460343360900879}
{'epoch': 16, 'batch': 190, 'loss': 4.589303970336914}
{'epoch': 16, 'batch': 191, 'loss': 4.296594619750977}
{'epoch': 16, 'batch': 192, 'loss': 4.437391757965088}
{'epoch': 16, 'batch': 193, 'loss': 4.438488006591797}
{'epoch': 16, 'batch': 194, 'loss': 4.181804656982422}
{'epoch': 16, 'batch': 195, 'loss': 4.260193824768066}
{'epoch': 16, 'batch': 196, 'loss': 4.226377487182617}
{'epoch': 16, 'batch': 197, 'loss': 3.8544976711273193}
{'epoch': 16, 'batch': 198, 'loss': 4.4361252784729}
{'epoch': 16, 'batch': 199, 'loss': 4.025999546051025}
{'epoch': 16, 'batch': 200, 'loss': 4.371436595916748}
{'epoch': 

{'epoch': 17, 'batch': 98, 'loss': 4.567680358886719}
{'epoch': 17, 'batch': 99, 'loss': 4.612455368041992}
{'epoch': 17, 'batch': 100, 'loss': 4.2381272315979}
{'epoch': 17, 'batch': 101, 'loss': 4.270408630371094}
{'epoch': 17, 'batch': 102, 'loss': 3.867002248764038}
{'epoch': 17, 'batch': 103, 'loss': 4.095653533935547}
{'epoch': 17, 'batch': 104, 'loss': 3.817589282989502}
{'epoch': 17, 'batch': 105, 'loss': 4.178048610687256}
{'epoch': 17, 'batch': 106, 'loss': 4.345704078674316}
{'epoch': 17, 'batch': 107, 'loss': 4.346246242523193}
{'epoch': 17, 'batch': 108, 'loss': 4.361979007720947}
{'epoch': 17, 'batch': 109, 'loss': 4.14421272277832}
{'epoch': 17, 'batch': 110, 'loss': 4.212007999420166}
{'epoch': 17, 'batch': 111, 'loss': 4.162049770355225}
{'epoch': 17, 'batch': 112, 'loss': 4.523691177368164}
{'epoch': 17, 'batch': 113, 'loss': 4.5251264572143555}
{'epoch': 17, 'batch': 114, 'loss': 3.971259832382202}
{'epoch': 17, 'batch': 115, 'loss': 3.9955780506134033}
{'epoch': 17,

{'epoch': 18, 'batch': 12, 'loss': 3.963348865509033}
{'epoch': 18, 'batch': 13, 'loss': 4.213346481323242}
{'epoch': 18, 'batch': 14, 'loss': 4.209657192230225}
{'epoch': 18, 'batch': 15, 'loss': 4.277805328369141}
{'epoch': 18, 'batch': 16, 'loss': 4.525505542755127}
{'epoch': 18, 'batch': 17, 'loss': 4.375152587890625}
{'epoch': 18, 'batch': 18, 'loss': 4.652092933654785}
{'epoch': 18, 'batch': 19, 'loss': 3.8292036056518555}
{'epoch': 18, 'batch': 20, 'loss': 4.631565093994141}
{'epoch': 18, 'batch': 21, 'loss': 4.192580223083496}
{'epoch': 18, 'batch': 22, 'loss': 4.502158164978027}
{'epoch': 18, 'batch': 23, 'loss': 4.275028228759766}
{'epoch': 18, 'batch': 24, 'loss': 4.258966445922852}
{'epoch': 18, 'batch': 25, 'loss': 4.035979270935059}
{'epoch': 18, 'batch': 26, 'loss': 4.455739974975586}
{'epoch': 18, 'batch': 27, 'loss': 4.361447334289551}
{'epoch': 18, 'batch': 28, 'loss': 4.191460132598877}
{'epoch': 18, 'batch': 29, 'loss': 4.543316841125488}
{'epoch': 18, 'batch': 30, 

{'epoch': 18, 'batch': 163, 'loss': 3.857435703277588}
{'epoch': 18, 'batch': 164, 'loss': 3.7579305171966553}
{'epoch': 18, 'batch': 165, 'loss': 4.011751651763916}
{'epoch': 18, 'batch': 166, 'loss': 3.818504571914673}
{'epoch': 18, 'batch': 167, 'loss': 4.0676679611206055}
{'epoch': 18, 'batch': 168, 'loss': 4.192660331726074}
{'epoch': 18, 'batch': 169, 'loss': 3.8177549839019775}
{'epoch': 18, 'batch': 170, 'loss': 3.742657423019409}
{'epoch': 18, 'batch': 171, 'loss': 4.038835525512695}
{'epoch': 18, 'batch': 172, 'loss': 4.414272308349609}
{'epoch': 18, 'batch': 173, 'loss': 3.8369016647338867}
{'epoch': 18, 'batch': 174, 'loss': 4.381459712982178}
{'epoch': 18, 'batch': 175, 'loss': 4.330813884735107}
{'epoch': 18, 'batch': 176, 'loss': 4.324984550476074}
{'epoch': 18, 'batch': 177, 'loss': 4.166407585144043}
{'epoch': 18, 'batch': 178, 'loss': 4.244510173797607}
{'epoch': 18, 'batch': 179, 'loss': 3.9068710803985596}
{'epoch': 18, 'batch': 180, 'loss': 4.138777256011963}
{'epo

{'epoch': 19, 'batch': 77, 'loss': 4.489131927490234}
{'epoch': 19, 'batch': 78, 'loss': 4.512368202209473}
{'epoch': 19, 'batch': 79, 'loss': 4.386943817138672}
{'epoch': 19, 'batch': 80, 'loss': 4.07927942276001}
{'epoch': 19, 'batch': 81, 'loss': 4.1031012535095215}
{'epoch': 19, 'batch': 82, 'loss': 4.143487453460693}
{'epoch': 19, 'batch': 83, 'loss': 4.395373344421387}
{'epoch': 19, 'batch': 84, 'loss': 4.073875427246094}
{'epoch': 19, 'batch': 85, 'loss': 4.14613151550293}
{'epoch': 19, 'batch': 86, 'loss': 4.114333629608154}
{'epoch': 19, 'batch': 87, 'loss': 4.334775924682617}
{'epoch': 19, 'batch': 88, 'loss': 3.904916524887085}
{'epoch': 19, 'batch': 89, 'loss': 4.073831081390381}
{'epoch': 19, 'batch': 90, 'loss': 4.047417163848877}
{'epoch': 19, 'batch': 91, 'loss': 3.7860279083251953}
{'epoch': 19, 'batch': 92, 'loss': 4.018829822540283}
{'epoch': 19, 'batch': 93, 'loss': 3.9244637489318848}
{'epoch': 19, 'batch': 94, 'loss': 3.990452766418457}
{'epoch': 19, 'batch': 95, 

{'epoch': 19, 'batch': 227, 'loss': 4.502588748931885}
{'epoch': 19, 'batch': 228, 'loss': 4.46319055557251}
{'epoch': 19, 'batch': 229, 'loss': 4.372432231903076}
{'epoch': 19, 'batch': 230, 'loss': 4.007516860961914}
{'epoch': 19, 'batch': 231, 'loss': 3.8231961727142334}
{'epoch': 19, 'batch': 232, 'loss': 4.289599895477295}
{'epoch': 19, 'batch': 233, 'loss': 4.221064567565918}
{'epoch': 19, 'batch': 234, 'loss': 4.281520843505859}
{'epoch': 19, 'batch': 235, 'loss': 4.135705471038818}
{'epoch': 20, 'batch': 0, 'loss': 3.748805046081543}
{'epoch': 20, 'batch': 1, 'loss': 4.506040573120117}
{'epoch': 20, 'batch': 2, 'loss': 4.292947769165039}
{'epoch': 20, 'batch': 3, 'loss': 4.280077934265137}
{'epoch': 20, 'batch': 4, 'loss': 4.245569229125977}
{'epoch': 20, 'batch': 5, 'loss': 4.5431437492370605}
{'epoch': 20, 'batch': 6, 'loss': 4.385800361633301}
{'epoch': 20, 'batch': 7, 'loss': 4.414464950561523}
{'epoch': 20, 'batch': 8, 'loss': 4.383208751678467}
{'epoch': 20, 'batch': 9, '

{'epoch': 20, 'batch': 142, 'loss': 4.014571666717529}
{'epoch': 20, 'batch': 143, 'loss': 3.5105555057525635}
{'epoch': 20, 'batch': 144, 'loss': 3.5984933376312256}
{'epoch': 20, 'batch': 145, 'loss': 4.145930767059326}
{'epoch': 20, 'batch': 146, 'loss': 3.965318202972412}
{'epoch': 20, 'batch': 147, 'loss': 3.87445330619812}
{'epoch': 20, 'batch': 148, 'loss': 3.8156421184539795}
{'epoch': 20, 'batch': 149, 'loss': 3.8501996994018555}
{'epoch': 20, 'batch': 150, 'loss': 3.81479549407959}
{'epoch': 20, 'batch': 151, 'loss': 3.7333953380584717}
{'epoch': 20, 'batch': 152, 'loss': 3.7632079124450684}
{'epoch': 20, 'batch': 153, 'loss': 3.4619457721710205}
{'epoch': 20, 'batch': 154, 'loss': 3.689120054244995}
{'epoch': 20, 'batch': 155, 'loss': 3.713590383529663}
{'epoch': 20, 'batch': 156, 'loss': 3.7101099491119385}
{'epoch': 20, 'batch': 157, 'loss': 3.511563539505005}
{'epoch': 20, 'batch': 158, 'loss': 4.192141056060791}
{'epoch': 20, 'batch': 159, 'loss': 4.373971462249756}
{'ep

{'epoch': 21, 'batch': 56, 'loss': 4.21864128112793}
{'epoch': 21, 'batch': 57, 'loss': 3.777430534362793}
{'epoch': 21, 'batch': 58, 'loss': 3.8062589168548584}
{'epoch': 21, 'batch': 59, 'loss': 4.074230194091797}
{'epoch': 21, 'batch': 60, 'loss': 3.6713321208953857}
{'epoch': 21, 'batch': 61, 'loss': 4.049709320068359}
{'epoch': 21, 'batch': 62, 'loss': 3.711873769760132}
{'epoch': 21, 'batch': 63, 'loss': 4.225169658660889}
{'epoch': 21, 'batch': 64, 'loss': 4.115242958068848}
{'epoch': 21, 'batch': 65, 'loss': 4.162017345428467}
{'epoch': 21, 'batch': 66, 'loss': 4.154334545135498}
{'epoch': 21, 'batch': 67, 'loss': 3.9338934421539307}
{'epoch': 21, 'batch': 68, 'loss': 4.189919471740723}
{'epoch': 21, 'batch': 69, 'loss': 3.562974214553833}
{'epoch': 21, 'batch': 70, 'loss': 3.823568105697632}
{'epoch': 21, 'batch': 71, 'loss': 4.079883098602295}
{'epoch': 21, 'batch': 72, 'loss': 4.19795036315918}
{'epoch': 21, 'batch': 73, 'loss': 4.216605186462402}
{'epoch': 21, 'batch': 74, 

{'epoch': 21, 'batch': 206, 'loss': 3.992809772491455}
{'epoch': 21, 'batch': 207, 'loss': 4.01275110244751}
{'epoch': 21, 'batch': 208, 'loss': 4.302684783935547}
{'epoch': 21, 'batch': 209, 'loss': 3.4295716285705566}
{'epoch': 21, 'batch': 210, 'loss': 4.286067008972168}
{'epoch': 21, 'batch': 211, 'loss': 3.8278536796569824}
{'epoch': 21, 'batch': 212, 'loss': 4.039834976196289}
{'epoch': 21, 'batch': 213, 'loss': 3.0144224166870117}
{'epoch': 21, 'batch': 214, 'loss': 3.9596400260925293}
{'epoch': 21, 'batch': 215, 'loss': 3.5461413860321045}
{'epoch': 21, 'batch': 216, 'loss': 3.7570571899414062}
{'epoch': 21, 'batch': 217, 'loss': 3.7962749004364014}
{'epoch': 21, 'batch': 218, 'loss': 3.934471368789673}
{'epoch': 21, 'batch': 219, 'loss': 3.612262725830078}
{'epoch': 21, 'batch': 220, 'loss': 3.932072877883911}
{'epoch': 21, 'batch': 221, 'loss': 3.695512533187866}
{'epoch': 21, 'batch': 222, 'loss': 3.7746031284332275}
{'epoch': 21, 'batch': 223, 'loss': 2.4653069972991943}
{'

{'epoch': 22, 'batch': 121, 'loss': 3.830198049545288}
{'epoch': 22, 'batch': 122, 'loss': 3.891103744506836}
{'epoch': 22, 'batch': 123, 'loss': 3.3446309566497803}
{'epoch': 22, 'batch': 124, 'loss': 4.212148189544678}
{'epoch': 22, 'batch': 125, 'loss': 4.142510890960693}
{'epoch': 22, 'batch': 126, 'loss': 4.106016635894775}
{'epoch': 22, 'batch': 127, 'loss': 4.103542327880859}
{'epoch': 22, 'batch': 128, 'loss': 4.335122108459473}
{'epoch': 22, 'batch': 129, 'loss': 3.996424913406372}
{'epoch': 22, 'batch': 130, 'loss': 3.484527349472046}
{'epoch': 22, 'batch': 131, 'loss': 3.5800318717956543}
{'epoch': 22, 'batch': 132, 'loss': 3.8287413120269775}
{'epoch': 22, 'batch': 133, 'loss': 4.223843574523926}
{'epoch': 22, 'batch': 134, 'loss': 3.8321797847747803}
{'epoch': 22, 'batch': 135, 'loss': 4.111625671386719}
{'epoch': 22, 'batch': 136, 'loss': 4.041238307952881}
{'epoch': 22, 'batch': 137, 'loss': 4.09135627746582}
{'epoch': 22, 'batch': 138, 'loss': 3.568652391433716}
{'epoch

{'epoch': 23, 'batch': 34, 'loss': 3.6577751636505127}
{'epoch': 23, 'batch': 35, 'loss': 3.8844892978668213}
{'epoch': 23, 'batch': 36, 'loss': 4.2243475914001465}
{'epoch': 23, 'batch': 37, 'loss': 3.99776554107666}
{'epoch': 23, 'batch': 38, 'loss': 3.994204521179199}
{'epoch': 23, 'batch': 39, 'loss': 3.7386720180511475}
{'epoch': 23, 'batch': 40, 'loss': 3.655431032180786}
{'epoch': 23, 'batch': 41, 'loss': 3.5775723457336426}
{'epoch': 23, 'batch': 42, 'loss': 3.859567880630493}
{'epoch': 23, 'batch': 43, 'loss': 3.8978750705718994}
{'epoch': 23, 'batch': 44, 'loss': 3.8374266624450684}
{'epoch': 23, 'batch': 45, 'loss': 4.184288501739502}
{'epoch': 23, 'batch': 46, 'loss': 4.029929161071777}
{'epoch': 23, 'batch': 47, 'loss': 4.069807529449463}
{'epoch': 23, 'batch': 48, 'loss': 3.1512863636016846}
{'epoch': 23, 'batch': 49, 'loss': 4.257014274597168}
{'epoch': 23, 'batch': 50, 'loss': 4.3341755867004395}
{'epoch': 23, 'batch': 51, 'loss': 4.253657341003418}
{'epoch': 23, 'batch

{'epoch': 23, 'batch': 184, 'loss': 3.4170095920562744}
{'epoch': 23, 'batch': 185, 'loss': 3.763336420059204}
{'epoch': 23, 'batch': 186, 'loss': 3.695244312286377}
{'epoch': 23, 'batch': 187, 'loss': 3.073848009109497}
{'epoch': 23, 'batch': 188, 'loss': 3.8681888580322266}
{'epoch': 23, 'batch': 189, 'loss': 4.003723621368408}
{'epoch': 23, 'batch': 190, 'loss': 4.081578731536865}
{'epoch': 23, 'batch': 191, 'loss': 3.796266794204712}
{'epoch': 23, 'batch': 192, 'loss': 4.043593406677246}
{'epoch': 23, 'batch': 193, 'loss': 3.927779197692871}
{'epoch': 23, 'batch': 194, 'loss': 3.7101688385009766}
{'epoch': 23, 'batch': 195, 'loss': 3.883883237838745}
{'epoch': 23, 'batch': 196, 'loss': 3.6900832653045654}
{'epoch': 23, 'batch': 197, 'loss': 3.456005573272705}
{'epoch': 23, 'batch': 198, 'loss': 3.963261604309082}
{'epoch': 23, 'batch': 199, 'loss': 3.538905620574951}
{'epoch': 23, 'batch': 200, 'loss': 3.8544256687164307}
{'epoch': 23, 'batch': 201, 'loss': 4.050098419189453}
{'epo

{'epoch': 24, 'batch': 99, 'loss': 4.166284084320068}
{'epoch': 24, 'batch': 100, 'loss': 3.7666072845458984}
{'epoch': 24, 'batch': 101, 'loss': 3.8345441818237305}
{'epoch': 24, 'batch': 102, 'loss': 3.3640031814575195}
{'epoch': 24, 'batch': 103, 'loss': 3.612180233001709}
{'epoch': 24, 'batch': 104, 'loss': 3.246691942214966}
{'epoch': 24, 'batch': 105, 'loss': 3.6814184188842773}
{'epoch': 24, 'batch': 106, 'loss': 3.742589235305786}
{'epoch': 24, 'batch': 107, 'loss': 3.859853744506836}
{'epoch': 24, 'batch': 108, 'loss': 3.797250747680664}
{'epoch': 24, 'batch': 109, 'loss': 3.6399612426757812}
{'epoch': 24, 'batch': 110, 'loss': 3.6507041454315186}
{'epoch': 24, 'batch': 111, 'loss': 3.639098882675171}
{'epoch': 24, 'batch': 112, 'loss': 3.9309375286102295}
{'epoch': 24, 'batch': 113, 'loss': 3.877037286758423}
{'epoch': 24, 'batch': 114, 'loss': 3.485419750213623}
{'epoch': 24, 'batch': 115, 'loss': 3.5499444007873535}
{'epoch': 24, 'batch': 116, 'loss': 3.97408390045166}
{'ep

{'epoch': 25, 'batch': 12, 'loss': 3.5804314613342285}
{'epoch': 25, 'batch': 13, 'loss': 3.754481315612793}
{'epoch': 25, 'batch': 14, 'loss': 3.7211947441101074}
{'epoch': 25, 'batch': 15, 'loss': 3.733384132385254}
{'epoch': 25, 'batch': 16, 'loss': 4.052765846252441}
{'epoch': 25, 'batch': 17, 'loss': 3.865743398666382}
{'epoch': 25, 'batch': 18, 'loss': 4.1422224044799805}
{'epoch': 25, 'batch': 19, 'loss': 3.418241500854492}
{'epoch': 25, 'batch': 20, 'loss': 4.104116916656494}
{'epoch': 25, 'batch': 21, 'loss': 3.76713490486145}
{'epoch': 25, 'batch': 22, 'loss': 3.990797996520996}
{'epoch': 25, 'batch': 23, 'loss': 3.8732123374938965}
{'epoch': 25, 'batch': 24, 'loss': 3.7486460208892822}
{'epoch': 25, 'batch': 25, 'loss': 3.727304697036743}
{'epoch': 25, 'batch': 26, 'loss': 3.933581590652466}
{'epoch': 25, 'batch': 27, 'loss': 3.952655792236328}
{'epoch': 25, 'batch': 28, 'loss': 3.653322458267212}
{'epoch': 25, 'batch': 29, 'loss': 4.012921333312988}
{'epoch': 25, 'batch': 3

{'epoch': 25, 'batch': 162, 'loss': 3.5624513626098633}
{'epoch': 25, 'batch': 163, 'loss': 3.4590210914611816}
{'epoch': 25, 'batch': 164, 'loss': 3.2681167125701904}
{'epoch': 25, 'batch': 165, 'loss': 3.539418935775757}
{'epoch': 25, 'batch': 166, 'loss': 3.3529551029205322}
{'epoch': 25, 'batch': 167, 'loss': 3.611161947250366}
{'epoch': 25, 'batch': 168, 'loss': 3.698028087615967}
{'epoch': 25, 'batch': 169, 'loss': 3.4081411361694336}
{'epoch': 25, 'batch': 170, 'loss': 3.3300678730010986}
{'epoch': 25, 'batch': 171, 'loss': 3.64457631111145}
{'epoch': 25, 'batch': 172, 'loss': 3.915560722351074}
{'epoch': 25, 'batch': 173, 'loss': 3.4418256282806396}
{'epoch': 25, 'batch': 174, 'loss': 3.8897135257720947}
{'epoch': 25, 'batch': 175, 'loss': 3.927694082260132}
{'epoch': 25, 'batch': 176, 'loss': 3.8966495990753174}
{'epoch': 25, 'batch': 177, 'loss': 3.729923725128174}
{'epoch': 25, 'batch': 178, 'loss': 3.7500178813934326}
{'epoch': 25, 'batch': 179, 'loss': 3.4375946521759033}


{'epoch': 26, 'batch': 76, 'loss': 3.321033000946045}
{'epoch': 26, 'batch': 77, 'loss': 3.8857500553131104}
{'epoch': 26, 'batch': 78, 'loss': 3.7125742435455322}
{'epoch': 26, 'batch': 79, 'loss': 3.7504348754882812}
{'epoch': 26, 'batch': 80, 'loss': 3.650326728820801}
{'epoch': 26, 'batch': 81, 'loss': 3.6247191429138184}
{'epoch': 26, 'batch': 82, 'loss': 3.6682777404785156}
{'epoch': 26, 'batch': 83, 'loss': 3.8420145511627197}
{'epoch': 26, 'batch': 84, 'loss': 3.607029438018799}
{'epoch': 26, 'batch': 85, 'loss': 3.7108731269836426}
{'epoch': 26, 'batch': 86, 'loss': 3.682521104812622}
{'epoch': 26, 'batch': 87, 'loss': 3.883007526397705}
{'epoch': 26, 'batch': 88, 'loss': 3.429015874862671}
{'epoch': 26, 'batch': 89, 'loss': 3.640052080154419}
{'epoch': 26, 'batch': 90, 'loss': 3.5607028007507324}
{'epoch': 26, 'batch': 91, 'loss': 3.331345319747925}
{'epoch': 26, 'batch': 92, 'loss': 3.513615608215332}
{'epoch': 26, 'batch': 93, 'loss': 3.575810432434082}
{'epoch': 26, 'batch

{'epoch': 26, 'batch': 225, 'loss': 3.615288257598877}
{'epoch': 26, 'batch': 226, 'loss': 3.636507987976074}
{'epoch': 26, 'batch': 227, 'loss': 3.9560718536376953}
{'epoch': 26, 'batch': 228, 'loss': 3.915166139602661}
{'epoch': 26, 'batch': 229, 'loss': 3.8662185668945312}
{'epoch': 26, 'batch': 230, 'loss': 3.607410430908203}
{'epoch': 26, 'batch': 231, 'loss': 3.401123046875}
{'epoch': 26, 'batch': 232, 'loss': 3.7633180618286133}
{'epoch': 26, 'batch': 233, 'loss': 3.7493081092834473}
{'epoch': 26, 'batch': 234, 'loss': 3.8527138233184814}
{'epoch': 26, 'batch': 235, 'loss': 3.662449836730957}
{'epoch': 27, 'batch': 0, 'loss': 3.430633068084717}
{'epoch': 27, 'batch': 1, 'loss': 4.110119819641113}
{'epoch': 27, 'batch': 2, 'loss': 4.035067081451416}
{'epoch': 27, 'batch': 3, 'loss': 3.9140679836273193}
{'epoch': 27, 'batch': 4, 'loss': 3.816615104675293}
{'epoch': 27, 'batch': 5, 'loss': 3.943939208984375}
{'epoch': 27, 'batch': 6, 'loss': 3.745173215866089}
{'epoch': 27, 'batch'

{'epoch': 27, 'batch': 139, 'loss': 3.7082865238189697}
{'epoch': 27, 'batch': 140, 'loss': 3.4101366996765137}
{'epoch': 27, 'batch': 141, 'loss': 3.480116367340088}
{'epoch': 27, 'batch': 142, 'loss': 3.530163049697876}
{'epoch': 27, 'batch': 143, 'loss': 3.1231536865234375}
{'epoch': 27, 'batch': 144, 'loss': 3.2413530349731445}
{'epoch': 27, 'batch': 145, 'loss': 3.6668593883514404}
{'epoch': 27, 'batch': 146, 'loss': 3.5461997985839844}
{'epoch': 27, 'batch': 147, 'loss': 3.4012515544891357}
{'epoch': 27, 'batch': 148, 'loss': 3.442584991455078}
{'epoch': 27, 'batch': 149, 'loss': 3.473771572113037}
{'epoch': 27, 'batch': 150, 'loss': 3.462400436401367}
{'epoch': 27, 'batch': 151, 'loss': 3.3806347846984863}
{'epoch': 27, 'batch': 152, 'loss': 3.3596718311309814}
{'epoch': 27, 'batch': 153, 'loss': 3.1150283813476562}
{'epoch': 27, 'batch': 154, 'loss': 3.3069262504577637}
{'epoch': 27, 'batch': 155, 'loss': 3.330073356628418}
{'epoch': 27, 'batch': 156, 'loss': 3.3248841762542725

{'epoch': 28, 'batch': 52, 'loss': 3.734374523162842}
{'epoch': 28, 'batch': 53, 'loss': 3.597606658935547}
{'epoch': 28, 'batch': 54, 'loss': 3.524625062942505}
{'epoch': 28, 'batch': 55, 'loss': 3.3679802417755127}
{'epoch': 28, 'batch': 56, 'loss': 3.717750072479248}
{'epoch': 28, 'batch': 57, 'loss': 3.2797441482543945}
{'epoch': 28, 'batch': 58, 'loss': 3.3975412845611572}
{'epoch': 28, 'batch': 59, 'loss': 3.6079776287078857}
{'epoch': 28, 'batch': 60, 'loss': 3.3232262134552}
{'epoch': 28, 'batch': 61, 'loss': 3.607778549194336}
{'epoch': 28, 'batch': 62, 'loss': 3.3519318103790283}
{'epoch': 28, 'batch': 63, 'loss': 3.6773133277893066}
{'epoch': 28, 'batch': 64, 'loss': 3.6438233852386475}
{'epoch': 28, 'batch': 65, 'loss': 3.696584463119507}
{'epoch': 28, 'batch': 66, 'loss': 3.690673589706421}
{'epoch': 28, 'batch': 67, 'loss': 3.5010995864868164}
{'epoch': 28, 'batch': 68, 'loss': 3.7254436016082764}
{'epoch': 28, 'batch': 69, 'loss': 3.1372950077056885}
{'epoch': 28, 'batch

{'epoch': 28, 'batch': 201, 'loss': 3.72114896774292}
{'epoch': 28, 'batch': 202, 'loss': 3.484518527984619}
{'epoch': 28, 'batch': 203, 'loss': 3.2078590393066406}
{'epoch': 28, 'batch': 204, 'loss': 3.2816574573516846}
{'epoch': 28, 'batch': 205, 'loss': 3.561769723892212}
{'epoch': 28, 'batch': 206, 'loss': 3.577791452407837}
{'epoch': 28, 'batch': 207, 'loss': 3.575004816055298}
{'epoch': 28, 'batch': 208, 'loss': 3.9244766235351562}
{'epoch': 28, 'batch': 209, 'loss': 3.082697629928589}
{'epoch': 28, 'batch': 210, 'loss': 3.8144140243530273}
{'epoch': 28, 'batch': 211, 'loss': 3.480247974395752}
{'epoch': 28, 'batch': 212, 'loss': 3.6586623191833496}
{'epoch': 28, 'batch': 213, 'loss': 2.7767553329467773}
{'epoch': 28, 'batch': 214, 'loss': 3.5199780464172363}
{'epoch': 28, 'batch': 215, 'loss': 3.2284371852874756}
{'epoch': 28, 'batch': 216, 'loss': 3.378899574279785}
{'epoch': 28, 'batch': 217, 'loss': 3.4272122383117676}
{'epoch': 28, 'batch': 218, 'loss': 3.531741142272949}
{'

{'epoch': 29, 'batch': 115, 'loss': 3.2716400623321533}
{'epoch': 29, 'batch': 116, 'loss': 3.5797629356384277}
{'epoch': 29, 'batch': 117, 'loss': 3.335322618484497}
{'epoch': 29, 'batch': 118, 'loss': 3.4944465160369873}
{'epoch': 29, 'batch': 119, 'loss': 3.463364839553833}
{'epoch': 29, 'batch': 120, 'loss': 3.3187899589538574}
{'epoch': 29, 'batch': 121, 'loss': 3.2437119483947754}
{'epoch': 29, 'batch': 122, 'loss': 3.387763500213623}
{'epoch': 29, 'batch': 123, 'loss': 2.947345733642578}
{'epoch': 29, 'batch': 124, 'loss': 3.6139659881591797}
{'epoch': 29, 'batch': 125, 'loss': 3.5914807319641113}
{'epoch': 29, 'batch': 126, 'loss': 3.5317976474761963}
{'epoch': 29, 'batch': 127, 'loss': 3.469618797302246}
{'epoch': 29, 'batch': 128, 'loss': 3.657179117202759}
{'epoch': 29, 'batch': 129, 'loss': 3.592832088470459}
{'epoch': 29, 'batch': 130, 'loss': 3.0283215045928955}
{'epoch': 29, 'batch': 131, 'loss': 3.0207631587982178}
{'epoch': 29, 'batch': 132, 'loss': 3.3697986602783203}

{'epoch': 30, 'batch': 28, 'loss': 3.2483999729156494}
{'epoch': 30, 'batch': 29, 'loss': 3.681743621826172}
{'epoch': 30, 'batch': 30, 'loss': 3.531338691711426}
{'epoch': 30, 'batch': 31, 'loss': 3.535623073577881}
{'epoch': 30, 'batch': 32, 'loss': 3.390573024749756}
{'epoch': 30, 'batch': 33, 'loss': 3.445862054824829}
{'epoch': 30, 'batch': 34, 'loss': 3.126056671142578}
{'epoch': 30, 'batch': 35, 'loss': 3.3311691284179688}
{'epoch': 30, 'batch': 36, 'loss': 3.670146942138672}
{'epoch': 30, 'batch': 37, 'loss': 3.4913880825042725}
{'epoch': 30, 'batch': 38, 'loss': 3.4895496368408203}
{'epoch': 30, 'batch': 39, 'loss': 3.282109498977661}
{'epoch': 30, 'batch': 40, 'loss': 3.2462410926818848}
{'epoch': 30, 'batch': 41, 'loss': 3.2198286056518555}
{'epoch': 30, 'batch': 42, 'loss': 3.45053768157959}
{'epoch': 30, 'batch': 43, 'loss': 3.4497108459472656}
{'epoch': 30, 'batch': 44, 'loss': 3.4334535598754883}
{'epoch': 30, 'batch': 45, 'loss': 3.728041648864746}
{'epoch': 30, 'batch'

{'epoch': 30, 'batch': 177, 'loss': 3.4312424659729004}
{'epoch': 30, 'batch': 178, 'loss': 3.371691942214966}
{'epoch': 30, 'batch': 179, 'loss': 3.144630193710327}
{'epoch': 30, 'batch': 180, 'loss': 3.375288248062134}
{'epoch': 30, 'batch': 181, 'loss': 3.4709174633026123}
{'epoch': 30, 'batch': 182, 'loss': 3.154233455657959}
{'epoch': 30, 'batch': 183, 'loss': 3.311103105545044}
{'epoch': 30, 'batch': 184, 'loss': 3.0497794151306152}
{'epoch': 30, 'batch': 185, 'loss': 3.326881170272827}
{'epoch': 30, 'batch': 186, 'loss': 3.2730300426483154}
{'epoch': 30, 'batch': 187, 'loss': 2.6895694732666016}
{'epoch': 30, 'batch': 188, 'loss': 3.3954436779022217}
{'epoch': 30, 'batch': 189, 'loss': 3.417398452758789}
{'epoch': 30, 'batch': 190, 'loss': 3.5551235675811768}
{'epoch': 30, 'batch': 191, 'loss': 3.253969669342041}
{'epoch': 30, 'batch': 192, 'loss': 3.5947749614715576}
{'epoch': 30, 'batch': 193, 'loss': 3.4000418186187744}
{'epoch': 30, 'batch': 194, 'loss': 3.2615153789520264}


{'epoch': 31, 'batch': 91, 'loss': 3.0954201221466064}
{'epoch': 31, 'batch': 92, 'loss': 3.1280720233917236}
{'epoch': 31, 'batch': 93, 'loss': 3.1966054439544678}
{'epoch': 31, 'batch': 94, 'loss': 3.196913719177246}
{'epoch': 31, 'batch': 95, 'loss': 3.577688694000244}
{'epoch': 31, 'batch': 96, 'loss': 3.627607583999634}
{'epoch': 31, 'batch': 97, 'loss': 3.5017306804656982}
{'epoch': 31, 'batch': 98, 'loss': 3.695587158203125}
{'epoch': 31, 'batch': 99, 'loss': 3.7946600914001465}
{'epoch': 31, 'batch': 100, 'loss': 3.3477699756622314}
{'epoch': 31, 'batch': 101, 'loss': 3.477146863937378}
{'epoch': 31, 'batch': 102, 'loss': 2.9734671115875244}
{'epoch': 31, 'batch': 103, 'loss': 3.151756525039673}
{'epoch': 31, 'batch': 104, 'loss': 2.844835042953491}
{'epoch': 31, 'batch': 105, 'loss': 3.2722244262695312}
{'epoch': 31, 'batch': 106, 'loss': 3.2471730709075928}
{'epoch': 31, 'batch': 107, 'loss': 3.3758962154388428}
{'epoch': 31, 'batch': 108, 'loss': 3.3467061519622803}
{'epoch'

{'epoch': 32, 'batch': 3, 'loss': 3.4620814323425293}
{'epoch': 32, 'batch': 4, 'loss': 3.4048945903778076}
{'epoch': 32, 'batch': 5, 'loss': 3.525400400161743}
{'epoch': 32, 'batch': 6, 'loss': 3.4743192195892334}
{'epoch': 32, 'batch': 7, 'loss': 3.525893449783325}
{'epoch': 32, 'batch': 8, 'loss': 3.431823492050171}
{'epoch': 32, 'batch': 9, 'loss': 3.4443323612213135}
{'epoch': 32, 'batch': 10, 'loss': 3.3411314487457275}
{'epoch': 32, 'batch': 11, 'loss': 3.616577625274658}
{'epoch': 32, 'batch': 12, 'loss': 3.2627499103546143}
{'epoch': 32, 'batch': 13, 'loss': 3.368411064147949}
{'epoch': 32, 'batch': 14, 'loss': 3.251237630844116}
{'epoch': 32, 'batch': 15, 'loss': 3.276150941848755}
{'epoch': 32, 'batch': 16, 'loss': 3.4925003051757812}
{'epoch': 32, 'batch': 17, 'loss': 3.355971097946167}
{'epoch': 32, 'batch': 18, 'loss': 3.6045401096343994}
{'epoch': 32, 'batch': 19, 'loss': 3.0503222942352295}
{'epoch': 32, 'batch': 20, 'loss': 3.482144832611084}
{'epoch': 32, 'batch': 21,

{'epoch': 32, 'batch': 153, 'loss': 2.8183586597442627}
{'epoch': 32, 'batch': 154, 'loss': 2.9739110469818115}
{'epoch': 32, 'batch': 155, 'loss': 2.9967007637023926}
{'epoch': 32, 'batch': 156, 'loss': 3.0168418884277344}
{'epoch': 32, 'batch': 157, 'loss': 2.861579418182373}
{'epoch': 32, 'batch': 158, 'loss': 3.3059723377227783}
{'epoch': 32, 'batch': 159, 'loss': 3.3990540504455566}
{'epoch': 32, 'batch': 160, 'loss': 3.2909038066864014}
{'epoch': 32, 'batch': 161, 'loss': 3.3101449012756348}
{'epoch': 32, 'batch': 162, 'loss': 3.062662363052368}
{'epoch': 32, 'batch': 163, 'loss': 3.119483232498169}
{'epoch': 32, 'batch': 164, 'loss': 2.973433256149292}
{'epoch': 32, 'batch': 165, 'loss': 3.1784749031066895}
{'epoch': 32, 'batch': 166, 'loss': 3.035127639770508}
{'epoch': 32, 'batch': 167, 'loss': 3.1736621856689453}
{'epoch': 32, 'batch': 168, 'loss': 3.2955522537231445}
{'epoch': 32, 'batch': 169, 'loss': 3.008695363998413}
{'epoch': 32, 'batch': 170, 'loss': 2.8787894248962402

{'epoch': 33, 'batch': 66, 'loss': 3.3560564517974854}
{'epoch': 33, 'batch': 67, 'loss': 3.243621587753296}
{'epoch': 33, 'batch': 68, 'loss': 3.4322705268859863}
{'epoch': 33, 'batch': 69, 'loss': 2.8901572227478027}
{'epoch': 33, 'batch': 70, 'loss': 3.058084011077881}
{'epoch': 33, 'batch': 71, 'loss': 3.4154818058013916}
{'epoch': 33, 'batch': 72, 'loss': 3.295107364654541}
{'epoch': 33, 'batch': 73, 'loss': 3.284031391143799}
{'epoch': 33, 'batch': 74, 'loss': 3.489995241165161}
{'epoch': 33, 'batch': 75, 'loss': 3.2377769947052}
{'epoch': 33, 'batch': 76, 'loss': 3.05047607421875}
{'epoch': 33, 'batch': 77, 'loss': 3.309504270553589}
{'epoch': 33, 'batch': 78, 'loss': 2.951902151107788}
{'epoch': 33, 'batch': 79, 'loss': 3.063347101211548}
{'epoch': 33, 'batch': 80, 'loss': 3.1924471855163574}
{'epoch': 33, 'batch': 81, 'loss': 3.0870771408081055}
{'epoch': 33, 'batch': 82, 'loss': 3.1330723762512207}
{'epoch': 33, 'batch': 83, 'loss': 3.2485759258270264}
{'epoch': 33, 'batch': 

{'epoch': 33, 'batch': 215, 'loss': 2.981505870819092}
{'epoch': 33, 'batch': 216, 'loss': 3.1407740116119385}
{'epoch': 33, 'batch': 217, 'loss': 3.1423180103302}
{'epoch': 33, 'batch': 218, 'loss': 3.23455810546875}
{'epoch': 33, 'batch': 219, 'loss': 2.966040849685669}
{'epoch': 33, 'batch': 220, 'loss': 3.233384847640991}
{'epoch': 33, 'batch': 221, 'loss': 3.096524953842163}
{'epoch': 33, 'batch': 222, 'loss': 3.2136309146881104}
{'epoch': 33, 'batch': 223, 'loss': 2.021695852279663}
{'epoch': 33, 'batch': 224, 'loss': 1.6042307615280151}
{'epoch': 33, 'batch': 225, 'loss': 3.1609909534454346}
{'epoch': 33, 'batch': 226, 'loss': 3.214711904525757}
{'epoch': 33, 'batch': 227, 'loss': 3.46052622795105}
{'epoch': 33, 'batch': 228, 'loss': 3.3858346939086914}
{'epoch': 33, 'batch': 229, 'loss': 3.4358043670654297}
{'epoch': 33, 'batch': 230, 'loss': 3.2205159664154053}
{'epoch': 33, 'batch': 231, 'loss': 3.0382914543151855}
{'epoch': 33, 'batch': 232, 'loss': 3.449470043182373}
{'epoc

{'epoch': 34, 'batch': 129, 'loss': 3.332982063293457}
{'epoch': 34, 'batch': 130, 'loss': 2.834315538406372}
{'epoch': 34, 'batch': 131, 'loss': 2.761744260787964}
{'epoch': 34, 'batch': 132, 'loss': 3.136610984802246}
{'epoch': 34, 'batch': 133, 'loss': 3.3160898685455322}
{'epoch': 34, 'batch': 134, 'loss': 2.9988839626312256}
{'epoch': 34, 'batch': 135, 'loss': 3.3150649070739746}
{'epoch': 34, 'batch': 136, 'loss': 3.1889843940734863}
{'epoch': 34, 'batch': 137, 'loss': 3.2366135120391846}
{'epoch': 34, 'batch': 138, 'loss': 2.888845682144165}
{'epoch': 34, 'batch': 139, 'loss': 3.3214683532714844}
{'epoch': 34, 'batch': 140, 'loss': 2.999671220779419}
{'epoch': 34, 'batch': 141, 'loss': 3.0702176094055176}
{'epoch': 34, 'batch': 142, 'loss': 3.1479876041412354}
{'epoch': 34, 'batch': 143, 'loss': 2.7681939601898193}
{'epoch': 34, 'batch': 144, 'loss': 2.895023822784424}
{'epoch': 34, 'batch': 145, 'loss': 3.226102590560913}
{'epoch': 34, 'batch': 146, 'loss': 3.1690163612365723}


{'epoch': 35, 'batch': 42, 'loss': 3.119476556777954}
{'epoch': 35, 'batch': 43, 'loss': 3.2200350761413574}
{'epoch': 35, 'batch': 44, 'loss': 3.2170469760894775}
{'epoch': 35, 'batch': 45, 'loss': 3.4543187618255615}
{'epoch': 35, 'batch': 46, 'loss': 3.4016456604003906}
{'epoch': 35, 'batch': 47, 'loss': 3.257890462875366}
{'epoch': 35, 'batch': 48, 'loss': 2.4464826583862305}
{'epoch': 35, 'batch': 49, 'loss': 3.2900290489196777}
{'epoch': 35, 'batch': 50, 'loss': 3.2495410442352295}
{'epoch': 35, 'batch': 51, 'loss': 3.3944170475006104}
{'epoch': 35, 'batch': 52, 'loss': 3.257117509841919}
{'epoch': 35, 'batch': 53, 'loss': 3.269131660461426}
{'epoch': 35, 'batch': 54, 'loss': 3.242548942565918}
{'epoch': 35, 'batch': 55, 'loss': 3.0737123489379883}
{'epoch': 35, 'batch': 56, 'loss': 3.2997004985809326}
{'epoch': 35, 'batch': 57, 'loss': 2.8121728897094727}
{'epoch': 35, 'batch': 58, 'loss': 2.965009927749634}
{'epoch': 35, 'batch': 59, 'loss': 3.026925802230835}
{'epoch': 35, 'ba

{'epoch': 35, 'batch': 191, 'loss': 2.908336639404297}
{'epoch': 35, 'batch': 192, 'loss': 3.2613935470581055}
{'epoch': 35, 'batch': 193, 'loss': 3.0360000133514404}
{'epoch': 35, 'batch': 194, 'loss': 2.9305167198181152}
{'epoch': 35, 'batch': 195, 'loss': 3.116424798965454}
{'epoch': 35, 'batch': 196, 'loss': 2.9700005054473877}
{'epoch': 35, 'batch': 197, 'loss': 2.849416971206665}
{'epoch': 35, 'batch': 198, 'loss': 3.1867892742156982}
{'epoch': 35, 'batch': 199, 'loss': 2.898562431335449}
{'epoch': 35, 'batch': 200, 'loss': 3.203993082046509}
{'epoch': 35, 'batch': 201, 'loss': 3.2062973976135254}
{'epoch': 35, 'batch': 202, 'loss': 3.104086399078369}
{'epoch': 35, 'batch': 203, 'loss': 2.8492679595947266}
{'epoch': 35, 'batch': 204, 'loss': 2.9202959537506104}
{'epoch': 35, 'batch': 205, 'loss': 3.1849422454833984}
{'epoch': 35, 'batch': 206, 'loss': 3.0973551273345947}
{'epoch': 35, 'batch': 207, 'loss': 3.2123379707336426}
{'epoch': 35, 'batch': 208, 'loss': 3.4743716716766357

{'epoch': 36, 'batch': 105, 'loss': 3.107839345932007}
{'epoch': 36, 'batch': 106, 'loss': 3.077660322189331}
{'epoch': 36, 'batch': 107, 'loss': 3.1797714233398438}
{'epoch': 36, 'batch': 108, 'loss': 3.1681087017059326}
{'epoch': 36, 'batch': 109, 'loss': 3.1102209091186523}
{'epoch': 36, 'batch': 110, 'loss': 3.1505215167999268}
{'epoch': 36, 'batch': 111, 'loss': 3.064969539642334}
{'epoch': 36, 'batch': 112, 'loss': 3.2340097427368164}
{'epoch': 36, 'batch': 113, 'loss': 3.19122576713562}
{'epoch': 36, 'batch': 114, 'loss': 2.9301373958587646}
{'epoch': 36, 'batch': 115, 'loss': 2.9651219844818115}
{'epoch': 36, 'batch': 116, 'loss': 3.1566720008850098}
{'epoch': 36, 'batch': 117, 'loss': 2.903242588043213}
{'epoch': 36, 'batch': 118, 'loss': 3.134813070297241}
{'epoch': 36, 'batch': 119, 'loss': 3.1116437911987305}
{'epoch': 36, 'batch': 120, 'loss': 2.9517147541046143}
{'epoch': 36, 'batch': 121, 'loss': 2.9150288105010986}
{'epoch': 36, 'batch': 122, 'loss': 3.064765691757202}


{'epoch': 37, 'batch': 17, 'loss': 3.105163812637329}
{'epoch': 37, 'batch': 18, 'loss': 3.2965917587280273}
{'epoch': 37, 'batch': 19, 'loss': 2.7974727153778076}
{'epoch': 37, 'batch': 20, 'loss': 3.134885311126709}
{'epoch': 37, 'batch': 21, 'loss': 3.0473172664642334}
{'epoch': 37, 'batch': 22, 'loss': 3.2105166912078857}
{'epoch': 37, 'batch': 23, 'loss': 2.985603094100952}
{'epoch': 37, 'batch': 24, 'loss': 2.862726926803589}
{'epoch': 37, 'batch': 25, 'loss': 3.1220180988311768}
{'epoch': 37, 'batch': 26, 'loss': 3.091308832168579}
{'epoch': 37, 'batch': 27, 'loss': 3.211449384689331}
{'epoch': 37, 'batch': 28, 'loss': 2.7516613006591797}
{'epoch': 37, 'batch': 29, 'loss': 3.209080696105957}
{'epoch': 37, 'batch': 30, 'loss': 3.070390462875366}
{'epoch': 37, 'batch': 31, 'loss': 3.0599968433380127}
{'epoch': 37, 'batch': 32, 'loss': 3.015542507171631}
{'epoch': 37, 'batch': 33, 'loss': 3.020812749862671}
{'epoch': 37, 'batch': 34, 'loss': 2.7851240634918213}
{'epoch': 37, 'batch

{'epoch': 37, 'batch': 167, 'loss': 2.919555902481079}
{'epoch': 37, 'batch': 168, 'loss': 3.048375129699707}
{'epoch': 37, 'batch': 169, 'loss': 2.78037166595459}
{'epoch': 37, 'batch': 170, 'loss': 2.6467370986938477}
{'epoch': 37, 'batch': 171, 'loss': 2.9244537353515625}
{'epoch': 37, 'batch': 172, 'loss': 3.121181011199951}
{'epoch': 37, 'batch': 173, 'loss': 2.7543187141418457}
{'epoch': 37, 'batch': 174, 'loss': 3.101351022720337}
{'epoch': 37, 'batch': 175, 'loss': 3.124713182449341}
{'epoch': 37, 'batch': 176, 'loss': 3.158818483352661}
{'epoch': 37, 'batch': 177, 'loss': 3.0679409503936768}
{'epoch': 37, 'batch': 178, 'loss': 2.9231343269348145}
{'epoch': 37, 'batch': 179, 'loss': 2.770824432373047}
{'epoch': 37, 'batch': 180, 'loss': 3.031531572341919}
{'epoch': 37, 'batch': 181, 'loss': 3.1440210342407227}
{'epoch': 37, 'batch': 182, 'loss': 2.8343400955200195}
{'epoch': 37, 'batch': 183, 'loss': 3.0047988891601562}
{'epoch': 37, 'batch': 184, 'loss': 2.808316946029663}
{'e

{'epoch': 38, 'batch': 81, 'loss': 2.971565008163452}
{'epoch': 38, 'batch': 82, 'loss': 2.904541015625}
{'epoch': 38, 'batch': 83, 'loss': 3.1310930252075195}
{'epoch': 38, 'batch': 84, 'loss': 2.8371260166168213}
{'epoch': 38, 'batch': 85, 'loss': 2.910064697265625}
{'epoch': 38, 'batch': 86, 'loss': 3.0912816524505615}
{'epoch': 38, 'batch': 87, 'loss': 3.1166610717773438}
{'epoch': 38, 'batch': 88, 'loss': 2.757690906524658}
{'epoch': 38, 'batch': 89, 'loss': 3.113882541656494}
{'epoch': 38, 'batch': 90, 'loss': 2.838250160217285}
{'epoch': 38, 'batch': 91, 'loss': 2.7026166915893555}
{'epoch': 38, 'batch': 92, 'loss': 2.685619592666626}
{'epoch': 38, 'batch': 93, 'loss': 2.8584203720092773}
{'epoch': 38, 'batch': 94, 'loss': 2.8089089393615723}
{'epoch': 38, 'batch': 95, 'loss': 3.263310670852661}
{'epoch': 38, 'batch': 96, 'loss': 3.2347183227539062}
{'epoch': 38, 'batch': 97, 'loss': 3.0331509113311768}
{'epoch': 38, 'batch': 98, 'loss': 3.2431459426879883}
{'epoch': 38, 'batch'

{'epoch': 38, 'batch': 229, 'loss': 3.0980818271636963}
{'epoch': 38, 'batch': 230, 'loss': 2.9778852462768555}
{'epoch': 38, 'batch': 231, 'loss': 2.803143262863159}
{'epoch': 38, 'batch': 232, 'loss': 3.1658108234405518}
{'epoch': 38, 'batch': 233, 'loss': 3.141723394393921}
{'epoch': 38, 'batch': 234, 'loss': 3.0040624141693115}
{'epoch': 38, 'batch': 235, 'loss': 2.8047637939453125}
{'epoch': 39, 'batch': 0, 'loss': 2.5489485263824463}
{'epoch': 39, 'batch': 1, 'loss': 3.049402952194214}
{'epoch': 39, 'batch': 2, 'loss': 2.9194278717041016}
{'epoch': 39, 'batch': 3, 'loss': 3.061814785003662}
{'epoch': 39, 'batch': 4, 'loss': 3.0231449604034424}
{'epoch': 39, 'batch': 5, 'loss': 3.078317642211914}
{'epoch': 39, 'batch': 6, 'loss': 3.038083553314209}
{'epoch': 39, 'batch': 7, 'loss': 3.130061149597168}
{'epoch': 39, 'batch': 8, 'loss': 2.9899659156799316}
{'epoch': 39, 'batch': 9, 'loss': 2.999568462371826}
{'epoch': 39, 'batch': 10, 'loss': 2.9258036613464355}
{'epoch': 39, 'batch'

{'epoch': 39, 'batch': 143, 'loss': 2.5477845668792725}
{'epoch': 39, 'batch': 144, 'loss': 2.6634466648101807}
{'epoch': 39, 'batch': 145, 'loss': 2.965769052505493}
{'epoch': 39, 'batch': 146, 'loss': 2.9082560539245605}
{'epoch': 39, 'batch': 147, 'loss': 2.7730863094329834}
{'epoch': 39, 'batch': 148, 'loss': 2.880808115005493}
{'epoch': 39, 'batch': 149, 'loss': 2.8284964561462402}
{'epoch': 39, 'batch': 150, 'loss': 2.816953420639038}
{'epoch': 39, 'batch': 151, 'loss': 2.7099521160125732}
{'epoch': 39, 'batch': 152, 'loss': 2.750767946243286}
{'epoch': 39, 'batch': 153, 'loss': 2.500314235687256}
{'epoch': 39, 'batch': 154, 'loss': 2.675413131713867}
{'epoch': 39, 'batch': 155, 'loss': 2.652392864227295}
{'epoch': 39, 'batch': 156, 'loss': 2.705148935317993}
{'epoch': 39, 'batch': 157, 'loss': 2.6401777267456055}
{'epoch': 39, 'batch': 158, 'loss': 2.9666390419006348}
{'epoch': 39, 'batch': 159, 'loss': 2.9729530811309814}
{'epoch': 39, 'batch': 160, 'loss': 2.8865396976470947}


{'epoch': 40, 'batch': 56, 'loss': 2.976519823074341}
{'epoch': 40, 'batch': 57, 'loss': 2.5140700340270996}
{'epoch': 40, 'batch': 58, 'loss': 2.7774579524993896}
{'epoch': 40, 'batch': 59, 'loss': 2.7582380771636963}
{'epoch': 40, 'batch': 60, 'loss': 2.861006498336792}
{'epoch': 40, 'batch': 61, 'loss': 2.998701572418213}
{'epoch': 40, 'batch': 62, 'loss': 2.918084144592285}
{'epoch': 40, 'batch': 63, 'loss': 2.879939556121826}
{'epoch': 40, 'batch': 64, 'loss': 2.9038002490997314}
{'epoch': 40, 'batch': 65, 'loss': 2.892868757247925}
{'epoch': 40, 'batch': 66, 'loss': 2.969106912612915}
{'epoch': 40, 'batch': 67, 'loss': 2.8982160091400146}
{'epoch': 40, 'batch': 68, 'loss': 3.0637290477752686}
{'epoch': 40, 'batch': 69, 'loss': 2.627957344055176}
{'epoch': 40, 'batch': 70, 'loss': 2.774423360824585}
{'epoch': 40, 'batch': 71, 'loss': 3.1284310817718506}
{'epoch': 40, 'batch': 72, 'loss': 2.883096218109131}
{'epoch': 40, 'batch': 73, 'loss': 2.9365501403808594}
{'epoch': 40, 'batch

{'epoch': 40, 'batch': 205, 'loss': 2.9462711811065674}
{'epoch': 40, 'batch': 206, 'loss': 2.8053739070892334}
{'epoch': 40, 'batch': 207, 'loss': 2.9219765663146973}
{'epoch': 40, 'batch': 208, 'loss': 3.1928744316101074}
{'epoch': 40, 'batch': 209, 'loss': 2.4855217933654785}
{'epoch': 40, 'batch': 210, 'loss': 2.9825847148895264}
{'epoch': 40, 'batch': 211, 'loss': 2.834759473800659}
{'epoch': 40, 'batch': 212, 'loss': 2.9691309928894043}
{'epoch': 40, 'batch': 213, 'loss': 2.274557590484619}
{'epoch': 40, 'batch': 214, 'loss': 2.7906606197357178}
{'epoch': 40, 'batch': 215, 'loss': 2.6312355995178223}
{'epoch': 40, 'batch': 216, 'loss': 2.7976887226104736}
{'epoch': 40, 'batch': 217, 'loss': 2.7554309368133545}
{'epoch': 40, 'batch': 218, 'loss': 2.8112337589263916}
{'epoch': 40, 'batch': 219, 'loss': 2.613537073135376}
{'epoch': 40, 'batch': 220, 'loss': 2.7776474952697754}
{'epoch': 40, 'batch': 221, 'loss': 2.697111129760742}
{'epoch': 40, 'batch': 222, 'loss': 2.90875649452209

{'epoch': 41, 'batch': 119, 'loss': 2.978644847869873}
{'epoch': 41, 'batch': 120, 'loss': 2.8725929260253906}
{'epoch': 41, 'batch': 121, 'loss': 2.775437831878662}
{'epoch': 41, 'batch': 122, 'loss': 2.763969659805298}
{'epoch': 41, 'batch': 123, 'loss': 2.532411813735962}
{'epoch': 41, 'batch': 124, 'loss': 3.00807523727417}
{'epoch': 41, 'batch': 125, 'loss': 2.8423376083374023}
{'epoch': 41, 'batch': 126, 'loss': 2.746084690093994}
{'epoch': 41, 'batch': 127, 'loss': 2.6480562686920166}
{'epoch': 41, 'batch': 128, 'loss': 2.86850905418396}
{'epoch': 41, 'batch': 129, 'loss': 3.0200035572052}
{'epoch': 41, 'batch': 130, 'loss': 2.5485446453094482}
{'epoch': 41, 'batch': 131, 'loss': 2.4582440853118896}
{'epoch': 41, 'batch': 132, 'loss': 2.835043430328369}
{'epoch': 41, 'batch': 133, 'loss': 2.8907759189605713}
{'epoch': 41, 'batch': 134, 'loss': 2.565748453140259}
{'epoch': 41, 'batch': 135, 'loss': 2.9348175525665283}
{'epoch': 41, 'batch': 136, 'loss': 2.7829535007476807}
{'epoc

{'epoch': 42, 'batch': 32, 'loss': 2.7183949947357178}
{'epoch': 42, 'batch': 33, 'loss': 2.778092861175537}
{'epoch': 42, 'batch': 34, 'loss': 2.555631160736084}
{'epoch': 42, 'batch': 35, 'loss': 2.679227113723755}
{'epoch': 42, 'batch': 36, 'loss': 3.041771173477173}
{'epoch': 42, 'batch': 37, 'loss': 2.757504463195801}
{'epoch': 42, 'batch': 38, 'loss': 2.7004942893981934}
{'epoch': 42, 'batch': 39, 'loss': 2.829672336578369}
{'epoch': 42, 'batch': 40, 'loss': 2.7280023097991943}
{'epoch': 42, 'batch': 41, 'loss': 2.808323621749878}
{'epoch': 42, 'batch': 42, 'loss': 2.9155426025390625}
{'epoch': 42, 'batch': 43, 'loss': 2.930523633956909}
{'epoch': 42, 'batch': 44, 'loss': 2.9458489418029785}
{'epoch': 42, 'batch': 45, 'loss': 3.1165659427642822}
{'epoch': 42, 'batch': 46, 'loss': 3.0840566158294678}
{'epoch': 42, 'batch': 47, 'loss': 2.9994595050811768}
{'epoch': 42, 'batch': 48, 'loss': 2.247100830078125}
{'epoch': 42, 'batch': 49, 'loss': 2.908750534057617}
{'epoch': 42, 'batch

{'epoch': 42, 'batch': 181, 'loss': 2.8970022201538086}
{'epoch': 42, 'batch': 182, 'loss': 2.5855071544647217}
{'epoch': 42, 'batch': 183, 'loss': 2.74867582321167}
{'epoch': 42, 'batch': 184, 'loss': 2.5976357460021973}
{'epoch': 42, 'batch': 185, 'loss': 2.726696252822876}
{'epoch': 42, 'batch': 186, 'loss': 2.7140438556671143}
{'epoch': 42, 'batch': 187, 'loss': 2.17059588432312}
{'epoch': 42, 'batch': 188, 'loss': 2.815995693206787}
{'epoch': 42, 'batch': 189, 'loss': 2.7491848468780518}
{'epoch': 42, 'batch': 190, 'loss': 2.84740948677063}
{'epoch': 42, 'batch': 191, 'loss': 2.540466785430908}
{'epoch': 42, 'batch': 192, 'loss': 2.92464280128479}
{'epoch': 42, 'batch': 193, 'loss': 2.6686997413635254}
{'epoch': 42, 'batch': 194, 'loss': 2.629941463470459}
{'epoch': 42, 'batch': 195, 'loss': 2.7989485263824463}
{'epoch': 42, 'batch': 196, 'loss': 2.6037800312042236}
{'epoch': 42, 'batch': 197, 'loss': 2.52996563911438}
{'epoch': 42, 'batch': 198, 'loss': 2.7867002487182617}
{'epoc

{'epoch': 43, 'batch': 95, 'loss': 2.9791207313537598}
{'epoch': 43, 'batch': 96, 'loss': 2.968062400817871}
{'epoch': 43, 'batch': 97, 'loss': 2.82051682472229}
{'epoch': 43, 'batch': 98, 'loss': 3.0390923023223877}
{'epoch': 43, 'batch': 99, 'loss': 3.1672749519348145}
{'epoch': 43, 'batch': 100, 'loss': 2.86346697807312}
{'epoch': 43, 'batch': 101, 'loss': 2.9604604244232178}
{'epoch': 43, 'batch': 102, 'loss': 2.6034862995147705}
{'epoch': 43, 'batch': 103, 'loss': 2.738804817199707}
{'epoch': 43, 'batch': 104, 'loss': 2.6028263568878174}
{'epoch': 43, 'batch': 105, 'loss': 2.91048264503479}
{'epoch': 43, 'batch': 106, 'loss': 2.7982730865478516}
{'epoch': 43, 'batch': 107, 'loss': 2.931751012802124}
{'epoch': 43, 'batch': 108, 'loss': 2.949878454208374}
{'epoch': 43, 'batch': 109, 'loss': 2.9392266273498535}
{'epoch': 43, 'batch': 110, 'loss': 2.886261463165283}
{'epoch': 43, 'batch': 111, 'loss': 2.8794126510620117}
{'epoch': 43, 'batch': 112, 'loss': 3.0225071907043457}
{'epoch'

{'epoch': 44, 'batch': 8, 'loss': 2.7015798091888428}
{'epoch': 44, 'batch': 9, 'loss': 2.7904651165008545}
{'epoch': 44, 'batch': 10, 'loss': 2.729628086090088}
{'epoch': 44, 'batch': 11, 'loss': 2.9438328742980957}
{'epoch': 44, 'batch': 12, 'loss': 2.728569269180298}
{'epoch': 44, 'batch': 13, 'loss': 2.6424734592437744}
{'epoch': 44, 'batch': 14, 'loss': 2.6277449131011963}
{'epoch': 44, 'batch': 15, 'loss': 2.5881192684173584}
{'epoch': 44, 'batch': 16, 'loss': 2.772193670272827}
{'epoch': 44, 'batch': 17, 'loss': 2.67085599899292}
{'epoch': 44, 'batch': 18, 'loss': 2.843508720397949}
{'epoch': 44, 'batch': 19, 'loss': 2.4757978916168213}
{'epoch': 44, 'batch': 20, 'loss': 2.7164645195007324}
{'epoch': 44, 'batch': 21, 'loss': 2.732663154602051}
{'epoch': 44, 'batch': 22, 'loss': 2.8300318717956543}
{'epoch': 44, 'batch': 23, 'loss': 2.6331634521484375}
{'epoch': 44, 'batch': 24, 'loss': 2.541820764541626}
{'epoch': 44, 'batch': 25, 'loss': 2.8033535480499268}
{'epoch': 44, 'batch

{'epoch': 44, 'batch': 158, 'loss': 2.788342237472534}
{'epoch': 44, 'batch': 159, 'loss': 2.800211191177368}
{'epoch': 44, 'batch': 160, 'loss': 2.657493829727173}
{'epoch': 44, 'batch': 161, 'loss': 2.6665899753570557}
{'epoch': 44, 'batch': 162, 'loss': 2.4147322177886963}
{'epoch': 44, 'batch': 163, 'loss': 2.6768438816070557}
{'epoch': 44, 'batch': 164, 'loss': 2.537107229232788}
{'epoch': 44, 'batch': 165, 'loss': 2.6406514644622803}
{'epoch': 44, 'batch': 166, 'loss': 2.59315824508667}
{'epoch': 44, 'batch': 167, 'loss': 2.7046265602111816}
{'epoch': 44, 'batch': 168, 'loss': 2.8219547271728516}
{'epoch': 44, 'batch': 169, 'loss': 2.5570549964904785}
{'epoch': 44, 'batch': 170, 'loss': 2.471432685852051}
{'epoch': 44, 'batch': 171, 'loss': 2.688291311264038}
{'epoch': 44, 'batch': 172, 'loss': 2.8055999279022217}
{'epoch': 44, 'batch': 173, 'loss': 2.5183255672454834}
{'epoch': 44, 'batch': 174, 'loss': 2.7606513500213623}
{'epoch': 44, 'batch': 175, 'loss': 2.839690923690796}
{

{'epoch': 45, 'batch': 72, 'loss': 2.660525321960449}
{'epoch': 45, 'batch': 73, 'loss': 2.667058229446411}
{'epoch': 45, 'batch': 74, 'loss': 2.9440674781799316}
{'epoch': 45, 'batch': 75, 'loss': 2.6825547218322754}
{'epoch': 45, 'batch': 76, 'loss': 2.392561912536621}
{'epoch': 45, 'batch': 77, 'loss': 2.5694074630737305}
{'epoch': 45, 'batch': 78, 'loss': 2.110149621963501}
{'epoch': 45, 'batch': 79, 'loss': 2.355794668197632}
{'epoch': 45, 'batch': 80, 'loss': 2.7135350704193115}
{'epoch': 45, 'batch': 81, 'loss': 2.515054941177368}
{'epoch': 45, 'batch': 82, 'loss': 2.6334657669067383}
{'epoch': 45, 'batch': 83, 'loss': 2.571305274963379}
{'epoch': 45, 'batch': 84, 'loss': 2.397751569747925}
{'epoch': 45, 'batch': 85, 'loss': 2.6254026889801025}
{'epoch': 45, 'batch': 86, 'loss': 2.5971643924713135}
{'epoch': 45, 'batch': 87, 'loss': 2.811023235321045}
{'epoch': 45, 'batch': 88, 'loss': 2.449800491333008}
{'epoch': 45, 'batch': 89, 'loss': 2.8437092304229736}
{'epoch': 45, 'batch

{'epoch': 45, 'batch': 221, 'loss': 2.64788818359375}
{'epoch': 45, 'batch': 222, 'loss': 2.7583742141723633}
{'epoch': 45, 'batch': 223, 'loss': 1.7116869688034058}
{'epoch': 45, 'batch': 224, 'loss': 1.2037349939346313}
{'epoch': 45, 'batch': 225, 'loss': 2.656937837600708}
{'epoch': 45, 'batch': 226, 'loss': 2.755037307739258}
{'epoch': 45, 'batch': 227, 'loss': 2.7031445503234863}
{'epoch': 45, 'batch': 228, 'loss': 2.7040224075317383}
{'epoch': 45, 'batch': 229, 'loss': 2.784883499145508}
{'epoch': 45, 'batch': 230, 'loss': 2.752389430999756}
{'epoch': 45, 'batch': 231, 'loss': 2.569094657897949}
{'epoch': 45, 'batch': 232, 'loss': 2.8922007083892822}
{'epoch': 45, 'batch': 233, 'loss': 2.8301432132720947}
{'epoch': 45, 'batch': 234, 'loss': 2.665972948074341}
{'epoch': 45, 'batch': 235, 'loss': 2.459683656692505}
{'epoch': 46, 'batch': 0, 'loss': 2.201694965362549}
{'epoch': 46, 'batch': 1, 'loss': 2.56821870803833}
{'epoch': 46, 'batch': 2, 'loss': 2.5197408199310303}
{'epoch': 

{'epoch': 46, 'batch': 135, 'loss': 2.8237814903259277}
{'epoch': 46, 'batch': 136, 'loss': 2.608768939971924}
{'epoch': 46, 'batch': 137, 'loss': 2.6945760250091553}
{'epoch': 46, 'batch': 138, 'loss': 2.408330202102661}
{'epoch': 46, 'batch': 139, 'loss': 2.7042489051818848}
{'epoch': 46, 'batch': 140, 'loss': 2.521601915359497}
{'epoch': 46, 'batch': 141, 'loss': 2.5938658714294434}
{'epoch': 46, 'batch': 142, 'loss': 2.5346949100494385}
{'epoch': 46, 'batch': 143, 'loss': 2.2297022342681885}
{'epoch': 46, 'batch': 144, 'loss': 2.4459307193756104}
{'epoch': 46, 'batch': 145, 'loss': 2.5828936100006104}
{'epoch': 46, 'batch': 146, 'loss': 2.594939708709717}
{'epoch': 46, 'batch': 147, 'loss': 2.519263744354248}
{'epoch': 46, 'batch': 148, 'loss': 2.5835678577423096}
{'epoch': 46, 'batch': 149, 'loss': 2.581718921661377}
{'epoch': 46, 'batch': 150, 'loss': 2.5774190425872803}
{'epoch': 46, 'batch': 151, 'loss': 2.5131332874298096}
{'epoch': 46, 'batch': 152, 'loss': 2.564919948577881}

{'epoch': 47, 'batch': 48, 'loss': 1.9487186670303345}
{'epoch': 47, 'batch': 49, 'loss': 2.6661665439605713}
{'epoch': 47, 'batch': 50, 'loss': 2.4403531551361084}
{'epoch': 47, 'batch': 51, 'loss': 2.6533052921295166}
{'epoch': 47, 'batch': 52, 'loss': 2.5276498794555664}
{'epoch': 47, 'batch': 53, 'loss': 2.6954431533813477}
{'epoch': 47, 'batch': 54, 'loss': 2.6864893436431885}
{'epoch': 47, 'batch': 55, 'loss': 2.5307564735412598}
{'epoch': 47, 'batch': 56, 'loss': 2.5956640243530273}
{'epoch': 47, 'batch': 57, 'loss': 2.190462589263916}
{'epoch': 47, 'batch': 58, 'loss': 2.5048389434814453}
{'epoch': 47, 'batch': 59, 'loss': 2.513960123062134}
{'epoch': 47, 'batch': 60, 'loss': 2.510011672973633}
{'epoch': 47, 'batch': 61, 'loss': 2.6630969047546387}
{'epoch': 47, 'batch': 62, 'loss': 2.6413981914520264}
{'epoch': 47, 'batch': 63, 'loss': 2.541452407836914}
{'epoch': 47, 'batch': 64, 'loss': 2.43573260307312}
{'epoch': 47, 'batch': 65, 'loss': 2.6768224239349365}
{'epoch': 47, 'b

{'epoch': 47, 'batch': 197, 'loss': 2.5368435382843018}
{'epoch': 47, 'batch': 198, 'loss': 2.900585412979126}
{'epoch': 47, 'batch': 199, 'loss': 2.5790793895721436}
{'epoch': 47, 'batch': 200, 'loss': 2.812037944793701}
{'epoch': 47, 'batch': 201, 'loss': 2.7557549476623535}
{'epoch': 47, 'batch': 202, 'loss': 2.679219961166382}
{'epoch': 47, 'batch': 203, 'loss': 2.5156381130218506}
{'epoch': 47, 'batch': 204, 'loss': 2.5967867374420166}
{'epoch': 47, 'batch': 205, 'loss': 2.739891290664673}
{'epoch': 47, 'batch': 206, 'loss': 2.7064106464385986}
{'epoch': 47, 'batch': 207, 'loss': 2.7793588638305664}
{'epoch': 47, 'batch': 208, 'loss': 2.9345943927764893}
{'epoch': 47, 'batch': 209, 'loss': 2.2095062732696533}
{'epoch': 47, 'batch': 210, 'loss': 2.741887092590332}
{'epoch': 47, 'batch': 211, 'loss': 2.628422975540161}
{'epoch': 47, 'batch': 212, 'loss': 2.792701244354248}
{'epoch': 47, 'batch': 213, 'loss': 2.205397129058838}
{'epoch': 47, 'batch': 214, 'loss': 2.71840238571167}
{'

{'epoch': 48, 'batch': 111, 'loss': 2.470500946044922}
{'epoch': 48, 'batch': 112, 'loss': 2.609462261199951}
{'epoch': 48, 'batch': 113, 'loss': 2.652221441268921}
{'epoch': 48, 'batch': 114, 'loss': 2.5045313835144043}
{'epoch': 48, 'batch': 115, 'loss': 2.577406406402588}
{'epoch': 48, 'batch': 116, 'loss': 2.5927937030792236}
{'epoch': 48, 'batch': 117, 'loss': 2.429274559020996}
{'epoch': 48, 'batch': 118, 'loss': 2.5291969776153564}
{'epoch': 48, 'batch': 119, 'loss': 2.713566541671753}
{'epoch': 48, 'batch': 120, 'loss': 2.618121862411499}
{'epoch': 48, 'batch': 121, 'loss': 2.5066964626312256}
{'epoch': 48, 'batch': 122, 'loss': 2.535529136657715}
{'epoch': 48, 'batch': 123, 'loss': 2.3423402309417725}
{'epoch': 48, 'batch': 124, 'loss': 2.824708938598633}
{'epoch': 48, 'batch': 125, 'loss': 2.6267902851104736}
{'epoch': 48, 'batch': 126, 'loss': 2.5213844776153564}
{'epoch': 48, 'batch': 127, 'loss': 2.484064817428589}
{'epoch': 48, 'batch': 128, 'loss': 2.6691906452178955}
{'

{'epoch': 49, 'batch': 24, 'loss': 2.3293192386627197}
{'epoch': 49, 'batch': 25, 'loss': 2.676266670227051}
{'epoch': 49, 'batch': 26, 'loss': 2.5277225971221924}
{'epoch': 49, 'batch': 27, 'loss': 2.76485276222229}
{'epoch': 49, 'batch': 28, 'loss': 2.0819313526153564}
{'epoch': 49, 'batch': 29, 'loss': 2.6729161739349365}
{'epoch': 49, 'batch': 30, 'loss': 2.5446293354034424}
{'epoch': 49, 'batch': 31, 'loss': 2.485109806060791}
{'epoch': 49, 'batch': 32, 'loss': 2.426753044128418}
{'epoch': 49, 'batch': 33, 'loss': 2.5428316593170166}
{'epoch': 49, 'batch': 34, 'loss': 2.3713748455047607}
{'epoch': 49, 'batch': 35, 'loss': 2.357327461242676}
{'epoch': 49, 'batch': 36, 'loss': 2.669471263885498}
{'epoch': 49, 'batch': 37, 'loss': 2.4502322673797607}
{'epoch': 49, 'batch': 38, 'loss': 2.352050542831421}
{'epoch': 49, 'batch': 39, 'loss': 2.5273430347442627}
{'epoch': 49, 'batch': 40, 'loss': 2.4610767364501953}
{'epoch': 49, 'batch': 41, 'loss': 2.5324268341064453}
{'epoch': 49, 'bat

{'epoch': 49, 'batch': 173, 'loss': 2.3082380294799805}
{'epoch': 49, 'batch': 174, 'loss': 2.5283772945404053}
{'epoch': 49, 'batch': 175, 'loss': 2.6859641075134277}
{'epoch': 49, 'batch': 176, 'loss': 2.703305959701538}
{'epoch': 49, 'batch': 177, 'loss': 2.6970407962799072}
{'epoch': 49, 'batch': 178, 'loss': 2.5992989540100098}
{'epoch': 49, 'batch': 179, 'loss': 2.417675018310547}
{'epoch': 49, 'batch': 180, 'loss': 2.60282301902771}
{'epoch': 49, 'batch': 181, 'loss': 2.721829891204834}
{'epoch': 49, 'batch': 182, 'loss': 2.4297337532043457}
{'epoch': 49, 'batch': 183, 'loss': 2.5671138763427734}
{'epoch': 49, 'batch': 184, 'loss': 2.407707691192627}
{'epoch': 49, 'batch': 185, 'loss': 2.540225028991699}
{'epoch': 49, 'batch': 186, 'loss': 2.4852118492126465}
{'epoch': 49, 'batch': 187, 'loss': 2.053807497024536}
{'epoch': 49, 'batch': 188, 'loss': 2.6403393745422363}
{'epoch': 49, 'batch': 189, 'loss': 2.5193698406219482}
{'epoch': 49, 'batch': 190, 'loss': 2.6117091178894043}


{'epoch': 50, 'batch': 87, 'loss': 2.6050400733947754}
{'epoch': 50, 'batch': 88, 'loss': 2.3240699768066406}
{'epoch': 50, 'batch': 89, 'loss': 2.6976301670074463}
{'epoch': 50, 'batch': 90, 'loss': 2.4159963130950928}
{'epoch': 50, 'batch': 91, 'loss': 2.3244998455047607}
{'epoch': 50, 'batch': 92, 'loss': 2.3082523345947266}
{'epoch': 50, 'batch': 93, 'loss': 2.399444103240967}
{'epoch': 50, 'batch': 94, 'loss': 2.4158620834350586}
{'epoch': 50, 'batch': 95, 'loss': 2.8144307136535645}
{'epoch': 50, 'batch': 96, 'loss': 2.650981903076172}
{'epoch': 50, 'batch': 97, 'loss': 2.6179425716400146}
{'epoch': 50, 'batch': 98, 'loss': 2.7130868434906006}
{'epoch': 50, 'batch': 99, 'loss': 2.8489794731140137}
{'epoch': 50, 'batch': 100, 'loss': 2.591240406036377}
{'epoch': 50, 'batch': 101, 'loss': 2.682353973388672}
{'epoch': 50, 'batch': 102, 'loss': 2.2810981273651123}
{'epoch': 50, 'batch': 103, 'loss': 2.389634370803833}
{'epoch': 50, 'batch': 104, 'loss': 2.191786050796509}
{'epoch': 5

{'epoch': 50, 'batch': 235, 'loss': 2.2337050437927246}
{'epoch': 51, 'batch': 0, 'loss': 2.0333592891693115}
{'epoch': 51, 'batch': 1, 'loss': 2.339299440383911}
{'epoch': 51, 'batch': 2, 'loss': 2.2655141353607178}
{'epoch': 51, 'batch': 3, 'loss': 2.557175874710083}
{'epoch': 51, 'batch': 4, 'loss': 2.5021307468414307}
{'epoch': 51, 'batch': 5, 'loss': 2.445281505584717}
{'epoch': 51, 'batch': 6, 'loss': 2.4494149684906006}
{'epoch': 51, 'batch': 7, 'loss': 2.5001509189605713}
{'epoch': 51, 'batch': 8, 'loss': 2.3978610038757324}
{'epoch': 51, 'batch': 9, 'loss': 2.555060863494873}
{'epoch': 51, 'batch': 10, 'loss': 2.4765734672546387}
{'epoch': 51, 'batch': 11, 'loss': 2.6349751949310303}
{'epoch': 51, 'batch': 12, 'loss': 2.525193452835083}
{'epoch': 51, 'batch': 13, 'loss': 2.4265055656433105}
{'epoch': 51, 'batch': 14, 'loss': 2.327493667602539}
{'epoch': 51, 'batch': 15, 'loss': 2.2872049808502197}
{'epoch': 51, 'batch': 16, 'loss': 2.43668794631958}
{'epoch': 51, 'batch': 17, 

{'epoch': 51, 'batch': 149, 'loss': 2.4630935192108154}
{'epoch': 51, 'batch': 150, 'loss': 2.461146831512451}
{'epoch': 51, 'batch': 151, 'loss': 2.3470799922943115}
{'epoch': 51, 'batch': 152, 'loss': 2.4362215995788574}
{'epoch': 51, 'batch': 153, 'loss': 2.232400894165039}
{'epoch': 51, 'batch': 154, 'loss': 2.249476432800293}
{'epoch': 51, 'batch': 155, 'loss': 2.267953395843506}
{'epoch': 51, 'batch': 156, 'loss': 2.281186819076538}
{'epoch': 51, 'batch': 157, 'loss': 2.315326690673828}
{'epoch': 51, 'batch': 158, 'loss': 2.5304274559020996}
{'epoch': 51, 'batch': 159, 'loss': 2.420969009399414}
{'epoch': 51, 'batch': 160, 'loss': 2.349789619445801}
{'epoch': 51, 'batch': 161, 'loss': 2.44330096244812}
{'epoch': 51, 'batch': 162, 'loss': 2.2097585201263428}
{'epoch': 51, 'batch': 163, 'loss': 2.467103958129883}
{'epoch': 51, 'batch': 164, 'loss': 2.3808047771453857}
{'epoch': 51, 'batch': 165, 'loss': 2.421398401260376}
{'epoch': 51, 'batch': 166, 'loss': 2.316575765609741}
{'epo

{'epoch': 52, 'batch': 63, 'loss': 2.242178201675415}
{'epoch': 52, 'batch': 64, 'loss': 2.2426860332489014}
{'epoch': 52, 'batch': 65, 'loss': 2.353550910949707}
{'epoch': 52, 'batch': 66, 'loss': 2.4148504734039307}
{'epoch': 52, 'batch': 67, 'loss': 2.3900349140167236}
{'epoch': 52, 'batch': 68, 'loss': 2.510913848876953}
{'epoch': 52, 'batch': 69, 'loss': 2.1518218517303467}
{'epoch': 52, 'batch': 70, 'loss': 2.171984910964966}
{'epoch': 52, 'batch': 71, 'loss': 2.5045697689056396}
{'epoch': 52, 'batch': 72, 'loss': 2.326474666595459}
{'epoch': 52, 'batch': 73, 'loss': 2.356860399246216}
{'epoch': 52, 'batch': 74, 'loss': 2.5269432067871094}
{'epoch': 52, 'batch': 75, 'loss': 2.3486461639404297}
{'epoch': 52, 'batch': 76, 'loss': 2.0388357639312744}
{'epoch': 52, 'batch': 77, 'loss': 2.1607611179351807}
{'epoch': 52, 'batch': 78, 'loss': 1.7039140462875366}
{'epoch': 52, 'batch': 79, 'loss': 2.0423014163970947}
{'epoch': 52, 'batch': 80, 'loss': 2.375762939453125}
{'epoch': 52, 'ba

{'epoch': 52, 'batch': 212, 'loss': 2.5037336349487305}
{'epoch': 52, 'batch': 213, 'loss': 1.974895715713501}
{'epoch': 52, 'batch': 214, 'loss': 2.3866381645202637}
{'epoch': 52, 'batch': 215, 'loss': 2.2280826568603516}
{'epoch': 52, 'batch': 216, 'loss': 2.385612964630127}
{'epoch': 52, 'batch': 217, 'loss': 2.3611936569213867}
{'epoch': 52, 'batch': 218, 'loss': 2.30086612701416}
{'epoch': 52, 'batch': 219, 'loss': 2.1756277084350586}
{'epoch': 52, 'batch': 220, 'loss': 2.3808484077453613}
{'epoch': 52, 'batch': 221, 'loss': 2.3845295906066895}
{'epoch': 52, 'batch': 222, 'loss': 2.550175905227661}
{'epoch': 52, 'batch': 223, 'loss': 1.628011703491211}
{'epoch': 52, 'batch': 224, 'loss': 1.0976022481918335}
{'epoch': 52, 'batch': 225, 'loss': 2.455057144165039}
{'epoch': 52, 'batch': 226, 'loss': 2.5444114208221436}
{'epoch': 52, 'batch': 227, 'loss': 2.390069007873535}
{'epoch': 52, 'batch': 228, 'loss': 2.4269120693206787}
{'epoch': 52, 'batch': 229, 'loss': 2.496877431869507}
{

{'epoch': 53, 'batch': 126, 'loss': 2.124406099319458}
{'epoch': 53, 'batch': 127, 'loss': 2.1163175106048584}
{'epoch': 53, 'batch': 128, 'loss': 2.2895708084106445}
{'epoch': 53, 'batch': 129, 'loss': 2.6236653327941895}
{'epoch': 53, 'batch': 130, 'loss': 2.261971950531006}
{'epoch': 53, 'batch': 131, 'loss': 2.1623384952545166}
{'epoch': 53, 'batch': 132, 'loss': 2.4399032592773438}
{'epoch': 53, 'batch': 133, 'loss': 2.4035451412200928}
{'epoch': 53, 'batch': 134, 'loss': 2.2098560333251953}
{'epoch': 53, 'batch': 135, 'loss': 2.575397253036499}
{'epoch': 53, 'batch': 136, 'loss': 2.319936990737915}
{'epoch': 53, 'batch': 137, 'loss': 2.3886091709136963}
{'epoch': 53, 'batch': 138, 'loss': 2.1516318321228027}
{'epoch': 53, 'batch': 139, 'loss': 2.4971210956573486}
{'epoch': 53, 'batch': 140, 'loss': 2.237710952758789}
{'epoch': 53, 'batch': 141, 'loss': 2.4121294021606445}
{'epoch': 53, 'batch': 142, 'loss': 2.231321096420288}
{'epoch': 53, 'batch': 143, 'loss': 2.020031690597534}

{'epoch': 54, 'batch': 39, 'loss': 2.357839345932007}
{'epoch': 54, 'batch': 40, 'loss': 2.1791749000549316}
{'epoch': 54, 'batch': 41, 'loss': 2.3215770721435547}
{'epoch': 54, 'batch': 42, 'loss': 2.3917102813720703}
{'epoch': 54, 'batch': 43, 'loss': 2.4514365196228027}
{'epoch': 54, 'batch': 44, 'loss': 2.5343358516693115}
{'epoch': 54, 'batch': 45, 'loss': 2.591038942337036}
{'epoch': 54, 'batch': 46, 'loss': 2.5955867767333984}
{'epoch': 54, 'batch': 47, 'loss': 2.4435901641845703}
{'epoch': 54, 'batch': 48, 'loss': 1.7964574098587036}
{'epoch': 54, 'batch': 49, 'loss': 2.3240461349487305}
{'epoch': 54, 'batch': 50, 'loss': 2.0304179191589355}
{'epoch': 54, 'batch': 51, 'loss': 2.32240891456604}
{'epoch': 54, 'batch': 52, 'loss': 2.2566769123077393}
{'epoch': 54, 'batch': 53, 'loss': 2.479832172393799}
{'epoch': 54, 'batch': 54, 'loss': 2.4516353607177734}
{'epoch': 54, 'batch': 55, 'loss': 2.2700061798095703}
{'epoch': 54, 'batch': 56, 'loss': 2.2785069942474365}
{'epoch': 54, '

{'epoch': 54, 'batch': 188, 'loss': 2.484393358230591}
{'epoch': 54, 'batch': 189, 'loss': 2.3789517879486084}
{'epoch': 54, 'batch': 190, 'loss': 2.4078574180603027}
{'epoch': 54, 'batch': 191, 'loss': 2.1660056114196777}
{'epoch': 54, 'batch': 192, 'loss': 2.5931332111358643}
{'epoch': 54, 'batch': 193, 'loss': 2.2650463581085205}
{'epoch': 54, 'batch': 194, 'loss': 2.2315683364868164}
{'epoch': 54, 'batch': 195, 'loss': 2.400416851043701}
{'epoch': 54, 'batch': 196, 'loss': 2.1762728691101074}
{'epoch': 54, 'batch': 197, 'loss': 2.21284818649292}
{'epoch': 54, 'batch': 198, 'loss': 2.40799617767334}
{'epoch': 54, 'batch': 199, 'loss': 2.3012232780456543}
{'epoch': 54, 'batch': 200, 'loss': 2.4273829460144043}
{'epoch': 54, 'batch': 201, 'loss': 2.416083574295044}
{'epoch': 54, 'batch': 202, 'loss': 2.3564224243164062}
{'epoch': 54, 'batch': 203, 'loss': 2.163205623626709}
{'epoch': 54, 'batch': 204, 'loss': 2.233590602874756}
{'epoch': 54, 'batch': 205, 'loss': 2.417078971862793}
{'

{'epoch': 55, 'batch': 102, 'loss': 2.1324994564056396}
{'epoch': 55, 'batch': 103, 'loss': 2.2040088176727295}
{'epoch': 55, 'batch': 104, 'loss': 2.0488367080688477}
{'epoch': 55, 'batch': 105, 'loss': 2.3241937160491943}
{'epoch': 55, 'batch': 106, 'loss': 2.2029001712799072}
{'epoch': 55, 'batch': 107, 'loss': 2.297041416168213}
{'epoch': 55, 'batch': 108, 'loss': 2.361684560775757}
{'epoch': 55, 'batch': 109, 'loss': 2.413388252258301}
{'epoch': 55, 'batch': 110, 'loss': 2.3926994800567627}
{'epoch': 55, 'batch': 111, 'loss': 2.2888996601104736}
{'epoch': 55, 'batch': 112, 'loss': 2.2843451499938965}
{'epoch': 55, 'batch': 113, 'loss': 2.2742607593536377}
{'epoch': 55, 'batch': 114, 'loss': 2.194474458694458}
{'epoch': 55, 'batch': 115, 'loss': 2.256458044052124}
{'epoch': 55, 'batch': 116, 'loss': 2.181283950805664}
{'epoch': 55, 'batch': 117, 'loss': 1.9798157215118408}
{'epoch': 55, 'batch': 118, 'loss': 2.137432336807251}
{'epoch': 55, 'batch': 119, 'loss': 2.449812889099121}


{'epoch': 56, 'batch': 15, 'loss': 2.111639976501465}
{'epoch': 56, 'batch': 16, 'loss': 2.2835769653320312}
{'epoch': 56, 'batch': 17, 'loss': 2.2157745361328125}
{'epoch': 56, 'batch': 18, 'loss': 2.4271273612976074}
{'epoch': 56, 'batch': 19, 'loss': 2.136428117752075}
{'epoch': 56, 'batch': 20, 'loss': 2.158201217651367}
{'epoch': 56, 'batch': 21, 'loss': 2.2854790687561035}
{'epoch': 56, 'batch': 22, 'loss': 2.316411256790161}
{'epoch': 56, 'batch': 23, 'loss': 2.1123926639556885}
{'epoch': 56, 'batch': 24, 'loss': 2.0777714252471924}
{'epoch': 56, 'batch': 25, 'loss': 2.4178707599639893}
{'epoch': 56, 'batch': 26, 'loss': 2.246009349822998}
{'epoch': 56, 'batch': 27, 'loss': 2.387505292892456}
{'epoch': 56, 'batch': 28, 'loss': 1.828444242477417}
{'epoch': 56, 'batch': 29, 'loss': 2.328399896621704}
{'epoch': 56, 'batch': 30, 'loss': 2.2107527256011963}
{'epoch': 56, 'batch': 31, 'loss': 2.218217611312866}
{'epoch': 56, 'batch': 32, 'loss': 2.1686346530914307}
{'epoch': 56, 'batc

{'epoch': 56, 'batch': 165, 'loss': 2.2193076610565186}
{'epoch': 56, 'batch': 166, 'loss': 2.1639020442962646}
{'epoch': 56, 'batch': 167, 'loss': 2.2598304748535156}
{'epoch': 56, 'batch': 168, 'loss': 2.324498176574707}
{'epoch': 56, 'batch': 169, 'loss': 2.1651008129119873}
{'epoch': 56, 'batch': 170, 'loss': 2.1246583461761475}
{'epoch': 56, 'batch': 171, 'loss': 2.329876661300659}
{'epoch': 56, 'batch': 172, 'loss': 2.282975196838379}
{'epoch': 56, 'batch': 173, 'loss': 2.1287267208099365}
{'epoch': 56, 'batch': 174, 'loss': 2.198880672454834}
{'epoch': 56, 'batch': 175, 'loss': 2.384214401245117}
{'epoch': 56, 'batch': 176, 'loss': 2.3872592449188232}
{'epoch': 56, 'batch': 177, 'loss': 2.2995660305023193}
{'epoch': 56, 'batch': 178, 'loss': 2.1513304710388184}
{'epoch': 56, 'batch': 179, 'loss': 2.0872232913970947}
{'epoch': 56, 'batch': 180, 'loss': 2.319241523742676}
{'epoch': 56, 'batch': 181, 'loss': 2.413531541824341}
{'epoch': 56, 'batch': 182, 'loss': 2.2020578384399414}

{'epoch': 57, 'batch': 78, 'loss': 1.6405131816864014}
{'epoch': 57, 'batch': 79, 'loss': 1.9413429498672485}
{'epoch': 57, 'batch': 80, 'loss': 2.3045692443847656}
{'epoch': 57, 'batch': 81, 'loss': 2.0971996784210205}
{'epoch': 57, 'batch': 82, 'loss': 2.084132671356201}
{'epoch': 57, 'batch': 83, 'loss': 2.059852361679077}
{'epoch': 57, 'batch': 84, 'loss': 1.910706639289856}
{'epoch': 57, 'batch': 85, 'loss': 2.2153117656707764}
{'epoch': 57, 'batch': 86, 'loss': 2.2036361694335938}
{'epoch': 57, 'batch': 87, 'loss': 2.2758822441101074}
{'epoch': 57, 'batch': 88, 'loss': 2.1042063236236572}
{'epoch': 57, 'batch': 89, 'loss': 2.4714229106903076}
{'epoch': 57, 'batch': 90, 'loss': 2.192103385925293}
{'epoch': 57, 'batch': 91, 'loss': 2.0409412384033203}
{'epoch': 57, 'batch': 92, 'loss': 2.0310888290405273}
{'epoch': 57, 'batch': 93, 'loss': 2.138385057449341}
{'epoch': 57, 'batch': 94, 'loss': 2.171485662460327}
{'epoch': 57, 'batch': 95, 'loss': 2.60248064994812}
{'epoch': 57, 'bat

{'epoch': 57, 'batch': 227, 'loss': 2.2030551433563232}
{'epoch': 57, 'batch': 228, 'loss': 2.2050812244415283}
{'epoch': 57, 'batch': 229, 'loss': 2.356354236602783}
{'epoch': 57, 'batch': 230, 'loss': 2.3392229080200195}
{'epoch': 57, 'batch': 231, 'loss': 2.1424474716186523}
{'epoch': 57, 'batch': 232, 'loss': 2.488232135772705}
{'epoch': 57, 'batch': 233, 'loss': 2.3568365573883057}
{'epoch': 57, 'batch': 234, 'loss': 2.2351341247558594}
{'epoch': 57, 'batch': 235, 'loss': 1.981348991394043}
{'epoch': 58, 'batch': 0, 'loss': 1.8033161163330078}
{'epoch': 58, 'batch': 1, 'loss': 2.073970317840576}
{'epoch': 58, 'batch': 2, 'loss': 1.975455641746521}
{'epoch': 58, 'batch': 3, 'loss': 2.3443849086761475}
{'epoch': 58, 'batch': 4, 'loss': 2.2098140716552734}
{'epoch': 58, 'batch': 5, 'loss': 2.167680025100708}
{'epoch': 58, 'batch': 6, 'loss': 2.189741849899292}
{'epoch': 58, 'batch': 7, 'loss': 2.2479496002197266}
{'epoch': 58, 'batch': 8, 'loss': 2.2013020515441895}
{'epoch': 58, 'ba

{'epoch': 58, 'batch': 141, 'loss': 2.2150824069976807}
{'epoch': 58, 'batch': 142, 'loss': 2.1230268478393555}
{'epoch': 58, 'batch': 143, 'loss': 1.8794353008270264}
{'epoch': 58, 'batch': 144, 'loss': 2.077759265899658}
{'epoch': 58, 'batch': 145, 'loss': 2.0572307109832764}
{'epoch': 58, 'batch': 146, 'loss': 2.1119723320007324}
{'epoch': 58, 'batch': 147, 'loss': 2.0617101192474365}
{'epoch': 58, 'batch': 148, 'loss': 2.1752982139587402}
{'epoch': 58, 'batch': 149, 'loss': 2.1894707679748535}
{'epoch': 58, 'batch': 150, 'loss': 2.190115213394165}
{'epoch': 58, 'batch': 151, 'loss': 2.127960205078125}
{'epoch': 58, 'batch': 152, 'loss': 2.1733877658843994}
{'epoch': 58, 'batch': 153, 'loss': 1.9557784795761108}
{'epoch': 58, 'batch': 154, 'loss': 1.9951905012130737}
{'epoch': 58, 'batch': 155, 'loss': 2.0665740966796875}
{'epoch': 58, 'batch': 156, 'loss': 2.0367417335510254}
{'epoch': 58, 'batch': 157, 'loss': 2.100834608078003}
{'epoch': 58, 'batch': 158, 'loss': 2.24531865119934

{'epoch': 59, 'batch': 54, 'loss': 2.2970941066741943}
{'epoch': 59, 'batch': 55, 'loss': 2.124770164489746}
{'epoch': 59, 'batch': 56, 'loss': 2.125614643096924}
{'epoch': 59, 'batch': 57, 'loss': 1.7869126796722412}
{'epoch': 59, 'batch': 58, 'loss': 2.083587646484375}
{'epoch': 59, 'batch': 59, 'loss': 1.8842052221298218}
{'epoch': 59, 'batch': 60, 'loss': 2.109100103378296}
{'epoch': 59, 'batch': 61, 'loss': 2.1419780254364014}
{'epoch': 59, 'batch': 62, 'loss': 2.2225146293640137}
{'epoch': 59, 'batch': 63, 'loss': 1.9491082429885864}
{'epoch': 59, 'batch': 64, 'loss': 2.0289976596832275}
{'epoch': 59, 'batch': 65, 'loss': 2.0598018169403076}
{'epoch': 59, 'batch': 66, 'loss': 2.1537318229675293}
{'epoch': 59, 'batch': 67, 'loss': 2.1603081226348877}
{'epoch': 59, 'batch': 68, 'loss': 2.265688896179199}
{'epoch': 59, 'batch': 69, 'loss': 1.904921054840088}
{'epoch': 59, 'batch': 70, 'loss': 1.9151628017425537}
{'epoch': 59, 'batch': 71, 'loss': 2.2488596439361572}
{'epoch': 59, 'b

{'epoch': 59, 'batch': 203, 'loss': 2.0489087104797363}
{'epoch': 59, 'batch': 204, 'loss': 2.0976767539978027}
{'epoch': 59, 'batch': 205, 'loss': 2.340970516204834}
{'epoch': 59, 'batch': 206, 'loss': 2.199110984802246}
{'epoch': 59, 'batch': 207, 'loss': 2.31318998336792}
{'epoch': 59, 'batch': 208, 'loss': 2.395428419113159}
{'epoch': 59, 'batch': 209, 'loss': 1.7697001695632935}
{'epoch': 59, 'batch': 210, 'loss': 2.2094640731811523}
{'epoch': 59, 'batch': 211, 'loss': 2.202342987060547}
{'epoch': 59, 'batch': 212, 'loss': 2.400390386581421}
{'epoch': 59, 'batch': 213, 'loss': 1.8183047771453857}
{'epoch': 59, 'batch': 214, 'loss': 2.1728811264038086}
{'epoch': 59, 'batch': 215, 'loss': 2.063086986541748}
{'epoch': 59, 'batch': 216, 'loss': 2.234994649887085}
{'epoch': 59, 'batch': 217, 'loss': 2.213118553161621}
{'epoch': 59, 'batch': 218, 'loss': 2.062324285507202}
{'epoch': 59, 'batch': 219, 'loss': 2.0326032638549805}
{'epoch': 59, 'batch': 220, 'loss': 2.2162222862243652}
{'e

{'epoch': 60, 'batch': 117, 'loss': 1.7945350408554077}
{'epoch': 60, 'batch': 118, 'loss': 2.0639514923095703}
{'epoch': 60, 'batch': 119, 'loss': 2.2885427474975586}
{'epoch': 60, 'batch': 120, 'loss': 2.161500930786133}
{'epoch': 60, 'batch': 121, 'loss': 2.0604195594787598}
{'epoch': 60, 'batch': 122, 'loss': 1.9917470216751099}
{'epoch': 60, 'batch': 123, 'loss': 2.041018486022949}
{'epoch': 60, 'batch': 124, 'loss': 2.1823928356170654}
{'epoch': 60, 'batch': 125, 'loss': 2.0716826915740967}
{'epoch': 60, 'batch': 126, 'loss': 1.8895398378372192}
{'epoch': 60, 'batch': 127, 'loss': 2.005263566970825}
{'epoch': 60, 'batch': 128, 'loss': 2.057140827178955}
{'epoch': 60, 'batch': 129, 'loss': 2.396028995513916}
{'epoch': 60, 'batch': 130, 'loss': 2.1264536380767822}
{'epoch': 60, 'batch': 131, 'loss': 1.9834749698638916}
{'epoch': 60, 'batch': 132, 'loss': 2.295238733291626}
{'epoch': 60, 'batch': 133, 'loss': 2.1923434734344482}
{'epoch': 60, 'batch': 134, 'loss': 2.023920774459839}

{'epoch': 61, 'batch': 30, 'loss': 2.019941806793213}
{'epoch': 61, 'batch': 31, 'loss': 2.0794825553894043}
{'epoch': 61, 'batch': 32, 'loss': 2.046311140060425}
{'epoch': 61, 'batch': 33, 'loss': 2.093906879425049}
{'epoch': 61, 'batch': 34, 'loss': 1.9076778888702393}
{'epoch': 61, 'batch': 35, 'loss': 1.9559029340744019}
{'epoch': 61, 'batch': 36, 'loss': 2.160123348236084}
{'epoch': 61, 'batch': 37, 'loss': 2.0120253562927246}
{'epoch': 61, 'batch': 38, 'loss': 1.9071775674819946}
{'epoch': 61, 'batch': 39, 'loss': 2.1031291484832764}
{'epoch': 61, 'batch': 40, 'loss': 1.9829751253128052}
{'epoch': 61, 'batch': 41, 'loss': 2.1644604206085205}
{'epoch': 61, 'batch': 42, 'loss': 2.1694843769073486}
{'epoch': 61, 'batch': 43, 'loss': 2.3176238536834717}
{'epoch': 61, 'batch': 44, 'loss': 2.350269317626953}
{'epoch': 61, 'batch': 45, 'loss': 2.3577182292938232}
{'epoch': 61, 'batch': 46, 'loss': 2.421586513519287}
{'epoch': 61, 'batch': 47, 'loss': 2.154097080230713}
{'epoch': 61, 'ba

{'epoch': 61, 'batch': 179, 'loss': 1.9687983989715576}
{'epoch': 61, 'batch': 180, 'loss': 2.2365057468414307}
{'epoch': 61, 'batch': 181, 'loss': 2.2279202938079834}
{'epoch': 61, 'batch': 182, 'loss': 2.079240560531616}
{'epoch': 61, 'batch': 183, 'loss': 2.2365338802337646}
{'epoch': 61, 'batch': 184, 'loss': 2.135658025741577}
{'epoch': 61, 'batch': 185, 'loss': 2.180485486984253}
{'epoch': 61, 'batch': 186, 'loss': 2.064290761947632}
{'epoch': 61, 'batch': 187, 'loss': 1.751136302947998}
{'epoch': 61, 'batch': 188, 'loss': 2.1809823513031006}
{'epoch': 61, 'batch': 189, 'loss': 2.215484857559204}
{'epoch': 61, 'batch': 190, 'loss': 2.18241286277771}
{'epoch': 61, 'batch': 191, 'loss': 1.956683874130249}
{'epoch': 61, 'batch': 192, 'loss': 2.271087169647217}
{'epoch': 61, 'batch': 193, 'loss': 2.008748769760132}
{'epoch': 61, 'batch': 194, 'loss': 1.9850817918777466}
{'epoch': 61, 'batch': 195, 'loss': 2.18572998046875}
{'epoch': 61, 'batch': 196, 'loss': 1.9747023582458496}
{'epo

{'epoch': 62, 'batch': 93, 'loss': 1.987868070602417}
{'epoch': 62, 'batch': 94, 'loss': 2.0075814723968506}
{'epoch': 62, 'batch': 95, 'loss': 2.3727529048919678}
{'epoch': 62, 'batch': 96, 'loss': 2.1615238189697266}
{'epoch': 62, 'batch': 97, 'loss': 2.184494972229004}
{'epoch': 62, 'batch': 98, 'loss': 2.356046438217163}
{'epoch': 62, 'batch': 99, 'loss': 2.436099052429199}
{'epoch': 62, 'batch': 100, 'loss': 2.239117383956909}
{'epoch': 62, 'batch': 101, 'loss': 2.3711016178131104}
{'epoch': 62, 'batch': 102, 'loss': 1.9933003187179565}
{'epoch': 62, 'batch': 103, 'loss': 2.010951280593872}
{'epoch': 62, 'batch': 104, 'loss': 1.952597737312317}
{'epoch': 62, 'batch': 105, 'loss': 2.155785322189331}
{'epoch': 62, 'batch': 106, 'loss': 2.0758230686187744}
{'epoch': 62, 'batch': 107, 'loss': 2.063986301422119}
{'epoch': 62, 'batch': 108, 'loss': 2.1326558589935303}
{'epoch': 62, 'batch': 109, 'loss': 2.1620535850524902}
{'epoch': 62, 'batch': 110, 'loss': 2.1135687828063965}
{'epoch'

{'epoch': 63, 'batch': 5, 'loss': 1.9482457637786865}
{'epoch': 63, 'batch': 6, 'loss': 2.0770742893218994}
{'epoch': 63, 'batch': 7, 'loss': 2.0699636936187744}
{'epoch': 63, 'batch': 8, 'loss': 2.0569379329681396}
{'epoch': 63, 'batch': 9, 'loss': 2.139246702194214}
{'epoch': 63, 'batch': 10, 'loss': 2.1161224842071533}
{'epoch': 63, 'batch': 11, 'loss': 2.2210311889648438}
{'epoch': 63, 'batch': 12, 'loss': 2.236457586288452}
{'epoch': 63, 'batch': 13, 'loss': 2.077897310256958}
{'epoch': 63, 'batch': 14, 'loss': 1.99882972240448}
{'epoch': 63, 'batch': 15, 'loss': 1.946559190750122}
{'epoch': 63, 'batch': 16, 'loss': 2.049551248550415}
{'epoch': 63, 'batch': 17, 'loss': 2.0276803970336914}
{'epoch': 63, 'batch': 18, 'loss': 2.166595220565796}
{'epoch': 63, 'batch': 19, 'loss': 1.9645776748657227}
{'epoch': 63, 'batch': 20, 'loss': 1.944771409034729}
{'epoch': 63, 'batch': 21, 'loss': 2.06986141204834}
{'epoch': 63, 'batch': 22, 'loss': 2.1142380237579346}
{'epoch': 63, 'batch': 23,

{'epoch': 63, 'batch': 155, 'loss': 1.903387188911438}
{'epoch': 63, 'batch': 156, 'loss': 1.8782131671905518}
{'epoch': 63, 'batch': 157, 'loss': 1.9717386960983276}
{'epoch': 63, 'batch': 158, 'loss': 2.0900626182556152}
{'epoch': 63, 'batch': 159, 'loss': 1.9938855171203613}
{'epoch': 63, 'batch': 160, 'loss': 1.9650442600250244}
{'epoch': 63, 'batch': 161, 'loss': 2.0738365650177}
{'epoch': 63, 'batch': 162, 'loss': 1.7601338624954224}
{'epoch': 63, 'batch': 163, 'loss': 2.141927719116211}
{'epoch': 63, 'batch': 164, 'loss': 1.9509961605072021}
{'epoch': 63, 'batch': 165, 'loss': 2.053485870361328}
{'epoch': 63, 'batch': 166, 'loss': 1.9844979047775269}
{'epoch': 63, 'batch': 167, 'loss': 2.0233311653137207}
{'epoch': 63, 'batch': 168, 'loss': 2.073312759399414}
{'epoch': 63, 'batch': 169, 'loss': 1.920836329460144}
{'epoch': 63, 'batch': 170, 'loss': 1.9138706922531128}
{'epoch': 63, 'batch': 171, 'loss': 2.0913944244384766}
{'epoch': 63, 'batch': 172, 'loss': 2.099191427230835}
{

{'epoch': 64, 'batch': 68, 'loss': 2.128692388534546}
{'epoch': 64, 'batch': 69, 'loss': 1.8400379419326782}
{'epoch': 64, 'batch': 70, 'loss': 1.8326637744903564}
{'epoch': 64, 'batch': 71, 'loss': 2.0676820278167725}
{'epoch': 64, 'batch': 72, 'loss': 1.96140718460083}
{'epoch': 64, 'batch': 73, 'loss': 1.9177067279815674}
{'epoch': 64, 'batch': 74, 'loss': 2.147014856338501}
{'epoch': 64, 'batch': 75, 'loss': 1.9762113094329834}
{'epoch': 64, 'batch': 76, 'loss': 1.714459776878357}
{'epoch': 64, 'batch': 77, 'loss': 1.7393357753753662}
{'epoch': 64, 'batch': 78, 'loss': 1.392231822013855}
{'epoch': 64, 'batch': 79, 'loss': 1.7354979515075684}
{'epoch': 64, 'batch': 80, 'loss': 2.024876117706299}
{'epoch': 64, 'batch': 81, 'loss': 1.9149655103683472}
{'epoch': 64, 'batch': 82, 'loss': 1.9317984580993652}
{'epoch': 64, 'batch': 83, 'loss': 1.8504964113235474}
{'epoch': 64, 'batch': 84, 'loss': 1.7421163320541382}
{'epoch': 64, 'batch': 85, 'loss': 2.0150253772735596}
{'epoch': 64, 'ba

{'epoch': 64, 'batch': 216, 'loss': 2.0678224563598633}
{'epoch': 64, 'batch': 217, 'loss': 2.0126419067382812}
{'epoch': 64, 'batch': 218, 'loss': 1.9055743217468262}
{'epoch': 64, 'batch': 219, 'loss': 1.8478403091430664}
{'epoch': 64, 'batch': 220, 'loss': 2.0205605030059814}
{'epoch': 64, 'batch': 221, 'loss': 1.9953259229660034}
{'epoch': 64, 'batch': 222, 'loss': 2.1635947227478027}
{'epoch': 64, 'batch': 223, 'loss': 1.400583267211914}
{'epoch': 64, 'batch': 224, 'loss': 0.8801119327545166}
{'epoch': 64, 'batch': 225, 'loss': 2.065093755722046}
{'epoch': 64, 'batch': 226, 'loss': 2.172342538833618}
{'epoch': 64, 'batch': 227, 'loss': 2.001944065093994}
{'epoch': 64, 'batch': 228, 'loss': 1.9438287019729614}
{'epoch': 64, 'batch': 229, 'loss': 2.083852767944336}
{'epoch': 64, 'batch': 230, 'loss': 2.146291971206665}
{'epoch': 64, 'batch': 231, 'loss': 1.9360694885253906}
{'epoch': 64, 'batch': 232, 'loss': 2.231884241104126}
{'epoch': 64, 'batch': 233, 'loss': 2.1534228324890137}

{'epoch': 65, 'batch': 130, 'loss': 1.9576267004013062}
{'epoch': 65, 'batch': 131, 'loss': 1.8786274194717407}
{'epoch': 65, 'batch': 132, 'loss': 2.201054573059082}
{'epoch': 65, 'batch': 133, 'loss': 2.1149041652679443}
{'epoch': 65, 'batch': 134, 'loss': 1.8823336362838745}
{'epoch': 65, 'batch': 135, 'loss': 2.252563238143921}
{'epoch': 65, 'batch': 136, 'loss': 2.0171027183532715}
{'epoch': 65, 'batch': 137, 'loss': 2.0368802547454834}
{'epoch': 65, 'batch': 138, 'loss': 1.9076539278030396}
{'epoch': 65, 'batch': 139, 'loss': 2.1666369438171387}
{'epoch': 65, 'batch': 140, 'loss': 2.010366201400757}
{'epoch': 65, 'batch': 141, 'loss': 2.107665777206421}
{'epoch': 65, 'batch': 142, 'loss': 1.9135769605636597}
{'epoch': 65, 'batch': 143, 'loss': 1.7375110387802124}
{'epoch': 65, 'batch': 144, 'loss': 1.9781392812728882}
{'epoch': 65, 'batch': 145, 'loss': 1.9274009466171265}
{'epoch': 65, 'batch': 146, 'loss': 2.0094151496887207}
{'epoch': 65, 'batch': 147, 'loss': 2.00129699707031

{'epoch': 66, 'batch': 43, 'loss': 2.09346866607666}
{'epoch': 66, 'batch': 44, 'loss': 2.1597049236297607}
{'epoch': 66, 'batch': 45, 'loss': 2.1151070594787598}
{'epoch': 66, 'batch': 46, 'loss': 2.2399191856384277}
{'epoch': 66, 'batch': 47, 'loss': 2.0385730266571045}
{'epoch': 66, 'batch': 48, 'loss': 1.3919248580932617}
{'epoch': 66, 'batch': 49, 'loss': 1.8852624893188477}
{'epoch': 66, 'batch': 50, 'loss': 1.6016149520874023}
{'epoch': 66, 'batch': 51, 'loss': 1.8496711254119873}
{'epoch': 66, 'batch': 52, 'loss': 1.8516504764556885}
{'epoch': 66, 'batch': 53, 'loss': 2.0838801860809326}
{'epoch': 66, 'batch': 54, 'loss': 2.067513942718506}
{'epoch': 66, 'batch': 55, 'loss': 1.9489703178405762}
{'epoch': 66, 'batch': 56, 'loss': 1.8956636190414429}
{'epoch': 66, 'batch': 57, 'loss': 1.6009353399276733}
{'epoch': 66, 'batch': 58, 'loss': 1.8433810472488403}
{'epoch': 66, 'batch': 59, 'loss': 1.7019052505493164}
{'epoch': 66, 'batch': 60, 'loss': 1.9552747011184692}
{'epoch': 66,

{'epoch': 66, 'batch': 192, 'loss': 2.200639486312866}
{'epoch': 66, 'batch': 193, 'loss': 1.850069284439087}
{'epoch': 66, 'batch': 194, 'loss': 1.9016300439834595}
{'epoch': 66, 'batch': 195, 'loss': 2.133089780807495}
{'epoch': 66, 'batch': 196, 'loss': 1.8388787508010864}
{'epoch': 66, 'batch': 197, 'loss': 1.940395474433899}
{'epoch': 66, 'batch': 198, 'loss': 2.0621416568756104}
{'epoch': 66, 'batch': 199, 'loss': 2.0371623039245605}
{'epoch': 66, 'batch': 200, 'loss': 2.0309066772460938}
{'epoch': 66, 'batch': 201, 'loss': 2.094217300415039}
{'epoch': 66, 'batch': 202, 'loss': 2.0118250846862793}
{'epoch': 66, 'batch': 203, 'loss': 1.8766710758209229}
{'epoch': 66, 'batch': 204, 'loss': 1.9090964794158936}
{'epoch': 66, 'batch': 205, 'loss': 2.0663790702819824}
{'epoch': 66, 'batch': 206, 'loss': 1.9432770013809204}
{'epoch': 66, 'batch': 207, 'loss': 2.0755696296691895}
{'epoch': 66, 'batch': 208, 'loss': 2.172475576400757}
{'epoch': 66, 'batch': 209, 'loss': 1.6266623735427856

{'epoch': 67, 'batch': 106, 'loss': 1.907688021659851}
{'epoch': 67, 'batch': 107, 'loss': 1.953309416770935}
{'epoch': 67, 'batch': 108, 'loss': 1.952454924583435}
{'epoch': 67, 'batch': 109, 'loss': 2.0480878353118896}
{'epoch': 67, 'batch': 110, 'loss': 1.985259771347046}
{'epoch': 67, 'batch': 111, 'loss': 1.890583872795105}
{'epoch': 67, 'batch': 112, 'loss': 1.9514433145523071}
{'epoch': 67, 'batch': 113, 'loss': 1.9549356698989868}
{'epoch': 67, 'batch': 114, 'loss': 1.878692865371704}
{'epoch': 67, 'batch': 115, 'loss': 2.010908603668213}
{'epoch': 67, 'batch': 116, 'loss': 1.7690763473510742}
{'epoch': 67, 'batch': 117, 'loss': 1.6291965246200562}
{'epoch': 67, 'batch': 118, 'loss': 1.7498719692230225}
{'epoch': 67, 'batch': 119, 'loss': 2.0512208938598633}
{'epoch': 67, 'batch': 120, 'loss': 1.9634608030319214}
{'epoch': 67, 'batch': 121, 'loss': 1.7561919689178467}
{'epoch': 67, 'batch': 122, 'loss': 1.8335847854614258}
{'epoch': 67, 'batch': 123, 'loss': 1.8189315795898438}

{'epoch': 68, 'batch': 18, 'loss': 2.031433343887329}
{'epoch': 68, 'batch': 19, 'loss': 1.843644618988037}
{'epoch': 68, 'batch': 20, 'loss': 1.7913206815719604}
{'epoch': 68, 'batch': 21, 'loss': 1.959275722503662}
{'epoch': 68, 'batch': 22, 'loss': 1.967595100402832}
{'epoch': 68, 'batch': 23, 'loss': 1.8233882188796997}
{'epoch': 68, 'batch': 24, 'loss': 1.7274258136749268}
{'epoch': 68, 'batch': 25, 'loss': 2.072957754135132}
{'epoch': 68, 'batch': 26, 'loss': 1.9140764474868774}
{'epoch': 68, 'batch': 27, 'loss': 2.046743392944336}
{'epoch': 68, 'batch': 28, 'loss': 1.4179785251617432}
{'epoch': 68, 'batch': 29, 'loss': 1.9779400825500488}
{'epoch': 68, 'batch': 30, 'loss': 1.8566607236862183}
{'epoch': 68, 'batch': 31, 'loss': 1.8807076215744019}
{'epoch': 68, 'batch': 32, 'loss': 1.8126790523529053}
{'epoch': 68, 'batch': 33, 'loss': 1.8762357234954834}
{'epoch': 68, 'batch': 34, 'loss': 1.7335788011550903}
{'epoch': 68, 'batch': 35, 'loss': 1.7453949451446533}
{'epoch': 68, 'b

{'epoch': 68, 'batch': 167, 'loss': 1.87740159034729}
{'epoch': 68, 'batch': 168, 'loss': 1.9279084205627441}
{'epoch': 68, 'batch': 169, 'loss': 1.8549563884735107}
{'epoch': 68, 'batch': 170, 'loss': 1.8176544904708862}
{'epoch': 68, 'batch': 171, 'loss': 1.976694107055664}
{'epoch': 68, 'batch': 172, 'loss': 1.9162743091583252}
{'epoch': 68, 'batch': 173, 'loss': 1.8202662467956543}
{'epoch': 68, 'batch': 174, 'loss': 1.8181917667388916}
{'epoch': 68, 'batch': 175, 'loss': 1.972398281097412}
{'epoch': 68, 'batch': 176, 'loss': 2.0557518005371094}
{'epoch': 68, 'batch': 177, 'loss': 1.964349627494812}
{'epoch': 68, 'batch': 178, 'loss': 1.7738442420959473}
{'epoch': 68, 'batch': 179, 'loss': 1.7621229887008667}
{'epoch': 68, 'batch': 180, 'loss': 1.9960687160491943}
{'epoch': 68, 'batch': 181, 'loss': 2.0306508541107178}
{'epoch': 68, 'batch': 182, 'loss': 1.9021633863449097}
{'epoch': 68, 'batch': 183, 'loss': 1.99918794631958}
{'epoch': 68, 'batch': 184, 'loss': 1.9711729288101196}

{'epoch': 69, 'batch': 80, 'loss': 1.8986245393753052}
{'epoch': 69, 'batch': 81, 'loss': 1.7611169815063477}
{'epoch': 69, 'batch': 82, 'loss': 1.7690017223358154}
{'epoch': 69, 'batch': 83, 'loss': 1.7349127531051636}
{'epoch': 69, 'batch': 84, 'loss': 1.6029947996139526}
{'epoch': 69, 'batch': 85, 'loss': 1.874464511871338}
{'epoch': 69, 'batch': 86, 'loss': 1.814476728439331}
{'epoch': 69, 'batch': 87, 'loss': 1.8517013788223267}
{'epoch': 69, 'batch': 88, 'loss': 1.7198618650436401}
{'epoch': 69, 'batch': 89, 'loss': 2.0608391761779785}
{'epoch': 69, 'batch': 90, 'loss': 1.7699812650680542}
{'epoch': 69, 'batch': 91, 'loss': 1.724355936050415}
{'epoch': 69, 'batch': 92, 'loss': 1.7760683298110962}
{'epoch': 69, 'batch': 93, 'loss': 1.8445261716842651}
{'epoch': 69, 'batch': 94, 'loss': 1.8397785425186157}
{'epoch': 69, 'batch': 95, 'loss': 2.211359739303589}
{'epoch': 69, 'batch': 96, 'loss': 1.895612359046936}
{'epoch': 69, 'batch': 97, 'loss': 1.905000925064087}
{'epoch': 69, 'b

{'epoch': 69, 'batch': 228, 'loss': 1.8157298564910889}
{'epoch': 69, 'batch': 229, 'loss': 1.9241777658462524}
{'epoch': 69, 'batch': 230, 'loss': 2.0073773860931396}
{'epoch': 69, 'batch': 231, 'loss': 1.8537336587905884}
{'epoch': 69, 'batch': 232, 'loss': 2.101656198501587}
{'epoch': 69, 'batch': 233, 'loss': 1.977099061012268}
{'epoch': 69, 'batch': 234, 'loss': 1.8441962003707886}
{'epoch': 69, 'batch': 235, 'loss': 1.6075294017791748}
{'epoch': 70, 'batch': 0, 'loss': 1.4423415660858154}
{'epoch': 70, 'batch': 1, 'loss': 1.6388040781021118}
{'epoch': 70, 'batch': 2, 'loss': 1.6532926559448242}
{'epoch': 70, 'batch': 3, 'loss': 1.8868532180786133}
{'epoch': 70, 'batch': 4, 'loss': 1.834490418434143}
{'epoch': 70, 'batch': 5, 'loss': 1.7236108779907227}
{'epoch': 70, 'batch': 6, 'loss': 1.836791753768921}
{'epoch': 70, 'batch': 7, 'loss': 1.8629602193832397}
{'epoch': 70, 'batch': 8, 'loss': 1.7467533349990845}
{'epoch': 70, 'batch': 9, 'loss': 1.9191219806671143}
{'epoch': 70, 'b

{'epoch': 70, 'batch': 142, 'loss': 1.8407379388809204}
{'epoch': 70, 'batch': 143, 'loss': 1.590086579322815}
{'epoch': 70, 'batch': 144, 'loss': 1.94309663772583}
{'epoch': 70, 'batch': 145, 'loss': 1.7347224950790405}
{'epoch': 70, 'batch': 146, 'loss': 1.835559368133545}
{'epoch': 70, 'batch': 147, 'loss': 1.7196815013885498}
{'epoch': 70, 'batch': 148, 'loss': 1.8848638534545898}
{'epoch': 70, 'batch': 149, 'loss': 1.9422115087509155}
{'epoch': 70, 'batch': 150, 'loss': 1.9800156354904175}
{'epoch': 70, 'batch': 151, 'loss': 1.8494137525558472}
{'epoch': 70, 'batch': 152, 'loss': 1.862099289894104}
{'epoch': 70, 'batch': 153, 'loss': 1.685479998588562}
{'epoch': 70, 'batch': 154, 'loss': 1.7575082778930664}
{'epoch': 70, 'batch': 155, 'loss': 1.7227646112442017}
{'epoch': 70, 'batch': 156, 'loss': 1.8061892986297607}
{'epoch': 70, 'batch': 157, 'loss': 1.8928815126419067}
{'epoch': 70, 'batch': 158, 'loss': 1.9278455972671509}
{'epoch': 70, 'batch': 159, 'loss': 1.777050256729126}

{'epoch': 71, 'batch': 55, 'loss': 1.816643476486206}
{'epoch': 71, 'batch': 56, 'loss': 1.7099272012710571}
{'epoch': 71, 'batch': 57, 'loss': 1.474865436553955}
{'epoch': 71, 'batch': 58, 'loss': 1.7637702226638794}
{'epoch': 71, 'batch': 59, 'loss': 1.5375604629516602}
{'epoch': 71, 'batch': 60, 'loss': 1.873355746269226}
{'epoch': 71, 'batch': 61, 'loss': 1.8765497207641602}
{'epoch': 71, 'batch': 62, 'loss': 1.9557976722717285}
{'epoch': 71, 'batch': 63, 'loss': 1.7123403549194336}
{'epoch': 71, 'batch': 64, 'loss': 1.7966443300247192}
{'epoch': 71, 'batch': 65, 'loss': 1.8068517446517944}
{'epoch': 71, 'batch': 66, 'loss': 1.8902347087860107}
{'epoch': 71, 'batch': 67, 'loss': 1.9133862257003784}
{'epoch': 71, 'batch': 68, 'loss': 1.9686545133590698}
{'epoch': 71, 'batch': 69, 'loss': 1.6923319101333618}
{'epoch': 71, 'batch': 70, 'loss': 1.582356333732605}
{'epoch': 71, 'batch': 71, 'loss': 1.891789197921753}
{'epoch': 71, 'batch': 72, 'loss': 1.807518482208252}
{'epoch': 71, 'b

{'epoch': 71, 'batch': 203, 'loss': 1.7328699827194214}
{'epoch': 71, 'batch': 204, 'loss': 1.7820147275924683}
{'epoch': 71, 'batch': 205, 'loss': 1.9341700077056885}
{'epoch': 71, 'batch': 206, 'loss': 1.7387245893478394}
{'epoch': 71, 'batch': 207, 'loss': 1.9588520526885986}
{'epoch': 71, 'batch': 208, 'loss': 1.9828468561172485}
{'epoch': 71, 'batch': 209, 'loss': 1.4606062173843384}
{'epoch': 71, 'batch': 210, 'loss': 1.8502330780029297}
{'epoch': 71, 'batch': 211, 'loss': 1.9331490993499756}
{'epoch': 71, 'batch': 212, 'loss': 1.9900649785995483}
{'epoch': 71, 'batch': 213, 'loss': 1.5747135877609253}
{'epoch': 71, 'batch': 214, 'loss': 1.7441489696502686}
{'epoch': 71, 'batch': 215, 'loss': 1.7250266075134277}
{'epoch': 71, 'batch': 216, 'loss': 1.9066673517227173}
{'epoch': 71, 'batch': 217, 'loss': 1.8594553470611572}
{'epoch': 71, 'batch': 218, 'loss': 1.7075245380401611}
{'epoch': 71, 'batch': 219, 'loss': 1.7099801301956177}
{'epoch': 71, 'batch': 220, 'loss': 1.8712204694

{'epoch': 72, 'batch': 117, 'loss': 1.5113019943237305}
{'epoch': 72, 'batch': 118, 'loss': 1.6135666370391846}
{'epoch': 72, 'batch': 119, 'loss': 1.9150006771087646}
{'epoch': 72, 'batch': 120, 'loss': 1.818458914756775}
{'epoch': 72, 'batch': 121, 'loss': 1.6897674798965454}
{'epoch': 72, 'batch': 122, 'loss': 1.6870501041412354}
{'epoch': 72, 'batch': 123, 'loss': 1.6997452974319458}
{'epoch': 72, 'batch': 124, 'loss': 1.8198107481002808}
{'epoch': 72, 'batch': 125, 'loss': 1.6916744709014893}
{'epoch': 72, 'batch': 126, 'loss': 1.5811337232589722}
{'epoch': 72, 'batch': 127, 'loss': 1.5795398950576782}
{'epoch': 72, 'batch': 128, 'loss': 1.5708558559417725}
{'epoch': 72, 'batch': 129, 'loss': 2.1178336143493652}
{'epoch': 72, 'batch': 130, 'loss': 1.836103081703186}
{'epoch': 72, 'batch': 131, 'loss': 1.7214534282684326}
{'epoch': 72, 'batch': 132, 'loss': 1.990242838859558}
{'epoch': 72, 'batch': 133, 'loss': 1.8398140668869019}
{'epoch': 72, 'batch': 134, 'loss': 1.7369873523712

{'epoch': 73, 'batch': 29, 'loss': 1.8592219352722168}
{'epoch': 73, 'batch': 30, 'loss': 1.732236623764038}
{'epoch': 73, 'batch': 31, 'loss': 1.7873892784118652}
{'epoch': 73, 'batch': 32, 'loss': 1.7719483375549316}
{'epoch': 73, 'batch': 33, 'loss': 1.7776362895965576}
{'epoch': 73, 'batch': 34, 'loss': 1.6042057275772095}
{'epoch': 73, 'batch': 35, 'loss': 1.5708286762237549}
{'epoch': 73, 'batch': 36, 'loss': 1.7745305299758911}
{'epoch': 73, 'batch': 37, 'loss': 1.7206366062164307}
{'epoch': 73, 'batch': 38, 'loss': 1.5865377187728882}
{'epoch': 73, 'batch': 39, 'loss': 1.7942602634429932}
{'epoch': 73, 'batch': 40, 'loss': 1.7085593938827515}
{'epoch': 73, 'batch': 41, 'loss': 1.8309910297393799}
{'epoch': 73, 'batch': 42, 'loss': 1.9389680624008179}
{'epoch': 73, 'batch': 43, 'loss': 2.0325353145599365}
{'epoch': 73, 'batch': 44, 'loss': 2.066504716873169}
{'epoch': 73, 'batch': 45, 'loss': 2.0179555416107178}
{'epoch': 73, 'batch': 46, 'loss': 2.109900712966919}
{'epoch': 73,

{'epoch': 73, 'batch': 178, 'loss': 1.6496973037719727}
{'epoch': 73, 'batch': 179, 'loss': 1.6285229921340942}
{'epoch': 73, 'batch': 180, 'loss': 1.8788186311721802}
{'epoch': 73, 'batch': 181, 'loss': 1.918021321296692}
{'epoch': 73, 'batch': 182, 'loss': 1.8054817914962769}
{'epoch': 73, 'batch': 183, 'loss': 1.9393106698989868}
{'epoch': 73, 'batch': 184, 'loss': 1.8986295461654663}
{'epoch': 73, 'batch': 185, 'loss': 1.9343767166137695}
{'epoch': 73, 'batch': 186, 'loss': 1.73172128200531}
{'epoch': 73, 'batch': 187, 'loss': 1.4875807762145996}
{'epoch': 73, 'batch': 188, 'loss': 1.8126202821731567}
{'epoch': 73, 'batch': 189, 'loss': 1.8593437671661377}
{'epoch': 73, 'batch': 190, 'loss': 1.8125847578048706}
{'epoch': 73, 'batch': 191, 'loss': 1.6071292161941528}
{'epoch': 73, 'batch': 192, 'loss': 1.9630281925201416}
{'epoch': 73, 'batch': 193, 'loss': 1.6494413614273071}
{'epoch': 73, 'batch': 194, 'loss': 1.6455183029174805}
{'epoch': 73, 'batch': 195, 'loss': 1.9525841474533

{'epoch': 74, 'batch': 91, 'loss': 1.6373332738876343}
{'epoch': 74, 'batch': 92, 'loss': 1.5894765853881836}
{'epoch': 74, 'batch': 93, 'loss': 1.7403115034103394}
{'epoch': 74, 'batch': 94, 'loss': 1.743246078491211}
{'epoch': 74, 'batch': 95, 'loss': 2.067124605178833}
{'epoch': 74, 'batch': 96, 'loss': 1.8157511949539185}
{'epoch': 74, 'batch': 97, 'loss': 1.7721291780471802}
{'epoch': 74, 'batch': 98, 'loss': 1.950980544090271}
{'epoch': 74, 'batch': 99, 'loss': 2.063046932220459}
{'epoch': 74, 'batch': 100, 'loss': 1.8944005966186523}
{'epoch': 74, 'batch': 101, 'loss': 1.982232928276062}
{'epoch': 74, 'batch': 102, 'loss': 1.6380677223205566}
{'epoch': 74, 'batch': 103, 'loss': 1.6802467107772827}
{'epoch': 74, 'batch': 104, 'loss': 1.7069875001907349}
{'epoch': 74, 'batch': 105, 'loss': 1.8512401580810547}
{'epoch': 74, 'batch': 106, 'loss': 1.758414387702942}
{'epoch': 74, 'batch': 107, 'loss': 1.8313368558883667}
{'epoch': 74, 'batch': 108, 'loss': 1.8100835084915161}
{'epoch

{'epoch': 75, 'batch': 3, 'loss': 1.7918014526367188}
{'epoch': 75, 'batch': 4, 'loss': 1.734054446220398}
{'epoch': 75, 'batch': 5, 'loss': 1.5872410535812378}
{'epoch': 75, 'batch': 6, 'loss': 1.697951316833496}
{'epoch': 75, 'batch': 7, 'loss': 1.735899567604065}
{'epoch': 75, 'batch': 8, 'loss': 1.6810234785079956}
{'epoch': 75, 'batch': 9, 'loss': 1.8053303956985474}
{'epoch': 75, 'batch': 10, 'loss': 1.741973876953125}
{'epoch': 75, 'batch': 11, 'loss': 1.9000059366226196}
{'epoch': 75, 'batch': 12, 'loss': 1.9682693481445312}
{'epoch': 75, 'batch': 13, 'loss': 1.7793710231781006}
{'epoch': 75, 'batch': 14, 'loss': 1.6486538648605347}
{'epoch': 75, 'batch': 15, 'loss': 1.5943357944488525}
{'epoch': 75, 'batch': 16, 'loss': 1.699812412261963}
{'epoch': 75, 'batch': 17, 'loss': 1.755566120147705}
{'epoch': 75, 'batch': 18, 'loss': 1.822535514831543}
{'epoch': 75, 'batch': 19, 'loss': 1.7001205682754517}
{'epoch': 75, 'batch': 20, 'loss': 1.7075637578964233}
{'epoch': 75, 'batch': 2

{'epoch': 75, 'batch': 152, 'loss': 1.7033889293670654}
{'epoch': 75, 'batch': 153, 'loss': 1.568581223487854}
{'epoch': 75, 'batch': 154, 'loss': 1.6469498872756958}
{'epoch': 75, 'batch': 155, 'loss': 1.6210105419158936}
{'epoch': 75, 'batch': 156, 'loss': 1.6587908267974854}
{'epoch': 75, 'batch': 157, 'loss': 1.734315276145935}
{'epoch': 75, 'batch': 158, 'loss': 1.8640856742858887}
{'epoch': 75, 'batch': 159, 'loss': 1.7214499711990356}
{'epoch': 75, 'batch': 160, 'loss': 1.6629854440689087}
{'epoch': 75, 'batch': 161, 'loss': 1.7107127904891968}
{'epoch': 75, 'batch': 162, 'loss': 1.514889121055603}
{'epoch': 75, 'batch': 163, 'loss': 1.873746633529663}
{'epoch': 75, 'batch': 164, 'loss': 1.717893123626709}
{'epoch': 75, 'batch': 165, 'loss': 1.7713268995285034}
{'epoch': 75, 'batch': 166, 'loss': 1.7753528356552124}
{'epoch': 75, 'batch': 167, 'loss': 1.7637419700622559}
{'epoch': 75, 'batch': 168, 'loss': 1.8924344778060913}
{'epoch': 75, 'batch': 169, 'loss': 1.697516918182373

{'epoch': 76, 'batch': 65, 'loss': 1.5924216508865356}
{'epoch': 76, 'batch': 66, 'loss': 1.7789875268936157}
{'epoch': 76, 'batch': 67, 'loss': 1.7472738027572632}
{'epoch': 76, 'batch': 68, 'loss': 1.848646640777588}
{'epoch': 76, 'batch': 69, 'loss': 1.5767982006072998}
{'epoch': 76, 'batch': 70, 'loss': 1.4966343641281128}
{'epoch': 76, 'batch': 71, 'loss': 1.8292444944381714}
{'epoch': 76, 'batch': 72, 'loss': 1.725322961807251}
{'epoch': 76, 'batch': 73, 'loss': 1.5934690237045288}
{'epoch': 76, 'batch': 74, 'loss': 1.8480430841445923}
{'epoch': 76, 'batch': 75, 'loss': 1.7045769691467285}
{'epoch': 76, 'batch': 76, 'loss': 1.4006940126419067}
{'epoch': 76, 'batch': 77, 'loss': 1.364302396774292}
{'epoch': 76, 'batch': 78, 'loss': 1.1049405336380005}
{'epoch': 76, 'batch': 79, 'loss': 1.3484244346618652}
{'epoch': 76, 'batch': 80, 'loss': 1.6711441278457642}
{'epoch': 76, 'batch': 81, 'loss': 1.6155431270599365}
{'epoch': 76, 'batch': 82, 'loss': 1.597687005996704}
{'epoch': 76, 

{'epoch': 76, 'batch': 213, 'loss': 1.5111241340637207}
{'epoch': 76, 'batch': 214, 'loss': 1.6855597496032715}
{'epoch': 76, 'batch': 215, 'loss': 1.6581063270568848}
{'epoch': 76, 'batch': 216, 'loss': 1.8325536251068115}
{'epoch': 76, 'batch': 217, 'loss': 1.7344824075698853}
{'epoch': 76, 'batch': 218, 'loss': 1.7112849950790405}
{'epoch': 76, 'batch': 219, 'loss': 1.611343502998352}
{'epoch': 76, 'batch': 220, 'loss': 1.7485792636871338}
{'epoch': 76, 'batch': 221, 'loss': 1.7163854837417603}
{'epoch': 76, 'batch': 222, 'loss': 1.973251223564148}
{'epoch': 76, 'batch': 223, 'loss': 1.2248605489730835}
{'epoch': 76, 'batch': 224, 'loss': 0.7455610632896423}
{'epoch': 76, 'batch': 225, 'loss': 1.7151986360549927}
{'epoch': 76, 'batch': 226, 'loss': 1.8778871297836304}
{'epoch': 76, 'batch': 227, 'loss': 1.6269686222076416}
{'epoch': 76, 'batch': 228, 'loss': 1.6285743713378906}
{'epoch': 76, 'batch': 229, 'loss': 1.752905249595642}
{'epoch': 76, 'batch': 230, 'loss': 1.8426758050918

{'epoch': 77, 'batch': 126, 'loss': 1.47288179397583}
{'epoch': 77, 'batch': 127, 'loss': 1.4617663621902466}
{'epoch': 77, 'batch': 128, 'loss': 1.456809163093567}
{'epoch': 77, 'batch': 129, 'loss': 1.934584379196167}
{'epoch': 77, 'batch': 130, 'loss': 1.8022143840789795}
{'epoch': 77, 'batch': 131, 'loss': 1.6712324619293213}
{'epoch': 77, 'batch': 132, 'loss': 1.872373104095459}
{'epoch': 77, 'batch': 133, 'loss': 1.7199103832244873}
{'epoch': 77, 'batch': 134, 'loss': 1.5747138261795044}
{'epoch': 77, 'batch': 135, 'loss': 1.936060905456543}
{'epoch': 77, 'batch': 136, 'loss': 1.7518389225006104}
{'epoch': 77, 'batch': 137, 'loss': 1.7858465909957886}
{'epoch': 77, 'batch': 138, 'loss': 1.7021152973175049}
{'epoch': 77, 'batch': 139, 'loss': 1.8512694835662842}
{'epoch': 77, 'batch': 140, 'loss': 1.747664213180542}
{'epoch': 77, 'batch': 141, 'loss': 1.8264185190200806}
{'epoch': 77, 'batch': 142, 'loss': 1.7022660970687866}
{'epoch': 77, 'batch': 143, 'loss': 1.5345613956451416}

{'epoch': 78, 'batch': 38, 'loss': 1.4341052770614624}
{'epoch': 78, 'batch': 39, 'loss': 1.6146184206008911}
{'epoch': 78, 'batch': 40, 'loss': 1.5367807149887085}
{'epoch': 78, 'batch': 41, 'loss': 1.75437331199646}
{'epoch': 78, 'batch': 42, 'loss': 1.7640374898910522}
{'epoch': 78, 'batch': 43, 'loss': 1.8487508296966553}
{'epoch': 78, 'batch': 44, 'loss': 1.9036927223205566}
{'epoch': 78, 'batch': 45, 'loss': 1.799591302871704}
{'epoch': 78, 'batch': 46, 'loss': 1.8872342109680176}
{'epoch': 78, 'batch': 47, 'loss': 1.7273324728012085}
{'epoch': 78, 'batch': 48, 'loss': 1.1957240104675293}
{'epoch': 78, 'batch': 49, 'loss': 1.5253456830978394}
{'epoch': 78, 'batch': 50, 'loss': 1.3260815143585205}
{'epoch': 78, 'batch': 51, 'loss': 1.5137346982955933}
{'epoch': 78, 'batch': 52, 'loss': 1.5330371856689453}
{'epoch': 78, 'batch': 53, 'loss': 1.7492847442626953}
{'epoch': 78, 'batch': 54, 'loss': 1.789971113204956}
{'epoch': 78, 'batch': 55, 'loss': 1.665336012840271}
{'epoch': 78, '

{'epoch': 78, 'batch': 187, 'loss': 1.4332884550094604}
{'epoch': 78, 'batch': 188, 'loss': 1.75021493434906}
{'epoch': 78, 'batch': 189, 'loss': 1.7458845376968384}
{'epoch': 78, 'batch': 190, 'loss': 1.7350887060165405}
{'epoch': 78, 'batch': 191, 'loss': 1.5995770692825317}
{'epoch': 78, 'batch': 192, 'loss': 1.8958864212036133}
{'epoch': 78, 'batch': 193, 'loss': 1.6339551210403442}
{'epoch': 78, 'batch': 194, 'loss': 1.6148533821105957}
{'epoch': 78, 'batch': 195, 'loss': 1.8642950057983398}
{'epoch': 78, 'batch': 196, 'loss': 1.5715341567993164}
{'epoch': 78, 'batch': 197, 'loss': 1.7483208179473877}
{'epoch': 78, 'batch': 198, 'loss': 1.8565077781677246}
{'epoch': 78, 'batch': 199, 'loss': 1.858498454093933}
{'epoch': 78, 'batch': 200, 'loss': 1.6911019086837769}
{'epoch': 78, 'batch': 201, 'loss': 1.7765421867370605}
{'epoch': 78, 'batch': 202, 'loss': 1.745011329650879}
{'epoch': 78, 'batch': 203, 'loss': 1.6375305652618408}
{'epoch': 78, 'batch': 204, 'loss': 1.61674857139587

{'epoch': 79, 'batch': 100, 'loss': 1.7771061658859253}
{'epoch': 79, 'batch': 101, 'loss': 1.9082252979278564}
{'epoch': 79, 'batch': 102, 'loss': 1.5863821506500244}
{'epoch': 79, 'batch': 103, 'loss': 1.5925902128219604}
{'epoch': 79, 'batch': 104, 'loss': 1.6432145833969116}
{'epoch': 79, 'batch': 105, 'loss': 1.7811354398727417}
{'epoch': 79, 'batch': 106, 'loss': 1.6861263513565063}
{'epoch': 79, 'batch': 107, 'loss': 1.6903488636016846}
{'epoch': 79, 'batch': 108, 'loss': 1.76328444480896}
{'epoch': 79, 'batch': 109, 'loss': 1.7607213258743286}
{'epoch': 79, 'batch': 110, 'loss': 1.6785614490509033}
{'epoch': 79, 'batch': 111, 'loss': 1.6783159971237183}
{'epoch': 79, 'batch': 112, 'loss': 1.6491334438323975}
{'epoch': 79, 'batch': 113, 'loss': 1.7292742729187012}
{'epoch': 79, 'batch': 114, 'loss': 1.6036094427108765}
{'epoch': 79, 'batch': 115, 'loss': 1.8095780611038208}
{'epoch': 79, 'batch': 116, 'loss': 1.5094273090362549}
{'epoch': 79, 'batch': 117, 'loss': 1.455583691596

{'epoch': 80, 'batch': 12, 'loss': 1.8081223964691162}
{'epoch': 80, 'batch': 13, 'loss': 1.7123476266860962}
{'epoch': 80, 'batch': 14, 'loss': 1.5200822353363037}
{'epoch': 80, 'batch': 15, 'loss': 1.5258829593658447}
{'epoch': 80, 'batch': 16, 'loss': 1.5768448114395142}
{'epoch': 80, 'batch': 17, 'loss': 1.6027617454528809}
{'epoch': 80, 'batch': 18, 'loss': 1.7792034149169922}
{'epoch': 80, 'batch': 19, 'loss': 1.588634729385376}
{'epoch': 80, 'batch': 20, 'loss': 1.5609548091888428}
{'epoch': 80, 'batch': 21, 'loss': 1.7180217504501343}
{'epoch': 80, 'batch': 22, 'loss': 1.7028905153274536}
{'epoch': 80, 'batch': 23, 'loss': 1.4925518035888672}
{'epoch': 80, 'batch': 24, 'loss': 1.4394865036010742}
{'epoch': 80, 'batch': 25, 'loss': 1.8356817960739136}
{'epoch': 80, 'batch': 26, 'loss': 1.5887726545333862}
{'epoch': 80, 'batch': 27, 'loss': 1.710150957107544}
{'epoch': 80, 'batch': 28, 'loss': 1.1061784029006958}
{'epoch': 80, 'batch': 29, 'loss': 1.6731845140457153}
{'epoch': 80

{'epoch': 80, 'batch': 161, 'loss': 1.6499706506729126}
{'epoch': 80, 'batch': 162, 'loss': 1.4098702669143677}
{'epoch': 80, 'batch': 163, 'loss': 1.8333178758621216}
{'epoch': 80, 'batch': 164, 'loss': 1.7077890634536743}
{'epoch': 80, 'batch': 165, 'loss': 1.6794109344482422}
{'epoch': 80, 'batch': 166, 'loss': 1.6695120334625244}
{'epoch': 80, 'batch': 167, 'loss': 1.6554845571517944}
{'epoch': 80, 'batch': 168, 'loss': 1.7585275173187256}
{'epoch': 80, 'batch': 169, 'loss': 1.5835806131362915}
{'epoch': 80, 'batch': 170, 'loss': 1.5959855318069458}
{'epoch': 80, 'batch': 171, 'loss': 1.82663094997406}
{'epoch': 80, 'batch': 172, 'loss': 1.721548080444336}
{'epoch': 80, 'batch': 173, 'loss': 1.6885643005371094}
{'epoch': 80, 'batch': 174, 'loss': 1.5227807760238647}
{'epoch': 80, 'batch': 175, 'loss': 1.8173773288726807}
{'epoch': 80, 'batch': 176, 'loss': 1.8692487478256226}
{'epoch': 80, 'batch': 177, 'loss': 1.7825108766555786}
{'epoch': 80, 'batch': 178, 'loss': 1.5490761995315

{'epoch': 81, 'batch': 74, 'loss': 1.6659104824066162}
{'epoch': 81, 'batch': 75, 'loss': 1.6057707071304321}
{'epoch': 81, 'batch': 76, 'loss': 1.2931534051895142}
{'epoch': 81, 'batch': 77, 'loss': 1.2268855571746826}
{'epoch': 81, 'batch': 78, 'loss': 0.979686975479126}
{'epoch': 81, 'batch': 79, 'loss': 1.2865763902664185}
{'epoch': 81, 'batch': 80, 'loss': 1.5714937448501587}
{'epoch': 81, 'batch': 81, 'loss': 1.5043078660964966}
{'epoch': 81, 'batch': 82, 'loss': 1.5352593660354614}
{'epoch': 81, 'batch': 83, 'loss': 1.4365887641906738}
{'epoch': 81, 'batch': 84, 'loss': 1.2900967597961426}
{'epoch': 81, 'batch': 85, 'loss': 1.5995948314666748}
{'epoch': 81, 'batch': 86, 'loss': 1.5119216442108154}
{'epoch': 81, 'batch': 87, 'loss': 1.5809701681137085}
{'epoch': 81, 'batch': 88, 'loss': 1.4596283435821533}
{'epoch': 81, 'batch': 89, 'loss': 1.7630956172943115}
{'epoch': 81, 'batch': 90, 'loss': 1.5483582019805908}
{'epoch': 81, 'batch': 91, 'loss': 1.4623019695281982}
{'epoch': 8

{'epoch': 81, 'batch': 222, 'loss': 1.8202730417251587}
{'epoch': 81, 'batch': 223, 'loss': 1.1981781721115112}
{'epoch': 81, 'batch': 224, 'loss': 0.711811363697052}
{'epoch': 81, 'batch': 225, 'loss': 1.6379035711288452}
{'epoch': 81, 'batch': 226, 'loss': 1.7317390441894531}
{'epoch': 81, 'batch': 227, 'loss': 1.5433155298233032}
{'epoch': 81, 'batch': 228, 'loss': 1.5768030881881714}
{'epoch': 81, 'batch': 229, 'loss': 1.6770628690719604}
{'epoch': 81, 'batch': 230, 'loss': 1.7892913818359375}
{'epoch': 81, 'batch': 231, 'loss': 1.5508639812469482}
{'epoch': 81, 'batch': 232, 'loss': 1.8046694993972778}
{'epoch': 81, 'batch': 233, 'loss': 1.718814492225647}
{'epoch': 81, 'batch': 234, 'loss': 1.6440625190734863}
{'epoch': 81, 'batch': 235, 'loss': 1.332308053970337}
{'epoch': 82, 'batch': 0, 'loss': 1.3104575872421265}
{'epoch': 82, 'batch': 1, 'loss': 1.50774085521698}
{'epoch': 82, 'batch': 2, 'loss': 1.4784016609191895}
{'epoch': 82, 'batch': 3, 'loss': 1.7446311712265015}
{'epo

{'epoch': 82, 'batch': 135, 'loss': 1.8950761556625366}
{'epoch': 82, 'batch': 136, 'loss': 1.6312472820281982}
{'epoch': 82, 'batch': 137, 'loss': 1.7670199871063232}
{'epoch': 82, 'batch': 138, 'loss': 1.647814154624939}
{'epoch': 82, 'batch': 139, 'loss': 1.8455750942230225}
{'epoch': 82, 'batch': 140, 'loss': 1.6765563488006592}
{'epoch': 82, 'batch': 141, 'loss': 1.7773607969284058}
{'epoch': 82, 'batch': 142, 'loss': 1.6489516496658325}
{'epoch': 82, 'batch': 143, 'loss': 1.4603012800216675}
{'epoch': 82, 'batch': 144, 'loss': 1.6415600776672363}
{'epoch': 82, 'batch': 145, 'loss': 1.6077252626419067}
{'epoch': 82, 'batch': 146, 'loss': 1.6404887437820435}
{'epoch': 82, 'batch': 147, 'loss': 1.608999252319336}
{'epoch': 82, 'batch': 148, 'loss': 1.785502314567566}
{'epoch': 82, 'batch': 149, 'loss': 1.6598526239395142}
{'epoch': 82, 'batch': 150, 'loss': 1.7108409404754639}
{'epoch': 82, 'batch': 151, 'loss': 1.6670746803283691}
{'epoch': 82, 'batch': 152, 'loss': 1.6620666980743

{'epoch': 83, 'batch': 47, 'loss': 1.6754530668258667}
{'epoch': 83, 'batch': 48, 'loss': 1.1597990989685059}
{'epoch': 83, 'batch': 49, 'loss': 1.4590262174606323}
{'epoch': 83, 'batch': 50, 'loss': 1.2743624448776245}
{'epoch': 83, 'batch': 51, 'loss': 1.4956289529800415}
{'epoch': 83, 'batch': 52, 'loss': 1.4447609186172485}
{'epoch': 83, 'batch': 53, 'loss': 1.6834605932235718}
{'epoch': 83, 'batch': 54, 'loss': 1.7160555124282837}
{'epoch': 83, 'batch': 55, 'loss': 1.7202162742614746}
{'epoch': 83, 'batch': 56, 'loss': 1.4892522096633911}
{'epoch': 83, 'batch': 57, 'loss': 1.2901027202606201}
{'epoch': 83, 'batch': 58, 'loss': 1.5305683612823486}
{'epoch': 83, 'batch': 59, 'loss': 1.3302786350250244}
{'epoch': 83, 'batch': 60, 'loss': 1.5848947763442993}
{'epoch': 83, 'batch': 61, 'loss': 1.6139612197875977}
{'epoch': 83, 'batch': 62, 'loss': 1.6813091039657593}
{'epoch': 83, 'batch': 63, 'loss': 1.4016084671020508}
{'epoch': 83, 'batch': 64, 'loss': 1.4519163370132446}
{'epoch': 

{'epoch': 83, 'batch': 195, 'loss': 1.7120599746704102}
{'epoch': 83, 'batch': 196, 'loss': 1.4560930728912354}
{'epoch': 83, 'batch': 197, 'loss': 1.5812278985977173}
{'epoch': 83, 'batch': 198, 'loss': 1.7398420572280884}
{'epoch': 83, 'batch': 199, 'loss': 1.7223889827728271}
{'epoch': 83, 'batch': 200, 'loss': 1.6024553775787354}
{'epoch': 83, 'batch': 201, 'loss': 1.665696382522583}
{'epoch': 83, 'batch': 202, 'loss': 1.6470930576324463}
{'epoch': 83, 'batch': 203, 'loss': 1.5393726825714111}
{'epoch': 83, 'batch': 204, 'loss': 1.5748478174209595}
{'epoch': 83, 'batch': 205, 'loss': 1.6857504844665527}
{'epoch': 83, 'batch': 206, 'loss': 1.583708643913269}
{'epoch': 83, 'batch': 207, 'loss': 1.7077730894088745}
{'epoch': 83, 'batch': 208, 'loss': 1.7246118783950806}
{'epoch': 83, 'batch': 209, 'loss': 1.3262392282485962}
{'epoch': 83, 'batch': 210, 'loss': 1.5919660329818726}
{'epoch': 83, 'batch': 211, 'loss': 1.7430453300476074}
{'epoch': 83, 'batch': 212, 'loss': 1.791330814361

{'epoch': 84, 'batch': 108, 'loss': 1.658043622970581}
{'epoch': 84, 'batch': 109, 'loss': 1.6043686866760254}
{'epoch': 84, 'batch': 110, 'loss': 1.5491350889205933}
{'epoch': 84, 'batch': 111, 'loss': 1.5972561836242676}
{'epoch': 84, 'batch': 112, 'loss': 1.5580894947052002}
{'epoch': 84, 'batch': 113, 'loss': 1.5809810161590576}
{'epoch': 84, 'batch': 114, 'loss': 1.478136420249939}
{'epoch': 84, 'batch': 115, 'loss': 1.6633920669555664}
{'epoch': 84, 'batch': 116, 'loss': 1.4050848484039307}
{'epoch': 84, 'batch': 117, 'loss': 1.2602355480194092}
{'epoch': 84, 'batch': 118, 'loss': 1.3452244997024536}
{'epoch': 84, 'batch': 119, 'loss': 1.5916327238082886}
{'epoch': 84, 'batch': 120, 'loss': 1.5296841859817505}
{'epoch': 84, 'batch': 121, 'loss': 1.3788163661956787}
{'epoch': 84, 'batch': 122, 'loss': 1.4044430255889893}
{'epoch': 84, 'batch': 123, 'loss': 1.4545265436172485}
{'epoch': 84, 'batch': 124, 'loss': 1.4565773010253906}
{'epoch': 84, 'batch': 125, 'loss': 1.414400935173

{'epoch': 85, 'batch': 20, 'loss': 1.4374819993972778}
{'epoch': 85, 'batch': 21, 'loss': 1.6116247177124023}
{'epoch': 85, 'batch': 22, 'loss': 1.6247901916503906}
{'epoch': 85, 'batch': 23, 'loss': 1.3890630006790161}
{'epoch': 85, 'batch': 24, 'loss': 1.3936071395874023}
{'epoch': 85, 'batch': 25, 'loss': 1.7060303688049316}
{'epoch': 85, 'batch': 26, 'loss': 1.4858710765838623}
{'epoch': 85, 'batch': 27, 'loss': 1.6240003108978271}
{'epoch': 85, 'batch': 28, 'loss': 1.044634222984314}
{'epoch': 85, 'batch': 29, 'loss': 1.584071397781372}
{'epoch': 85, 'batch': 30, 'loss': 1.45101797580719}
{'epoch': 85, 'batch': 31, 'loss': 1.5430748462677002}
{'epoch': 85, 'batch': 32, 'loss': 1.4996808767318726}
{'epoch': 85, 'batch': 33, 'loss': 1.5153210163116455}
{'epoch': 85, 'batch': 34, 'loss': 1.4385989904403687}
{'epoch': 85, 'batch': 35, 'loss': 1.3247755765914917}
{'epoch': 85, 'batch': 36, 'loss': 1.4593092203140259}
{'epoch': 85, 'batch': 37, 'loss': 1.3899130821228027}
{'epoch': 85, 

{'epoch': 85, 'batch': 169, 'loss': 1.6065261363983154}
{'epoch': 85, 'batch': 170, 'loss': 1.6096200942993164}
{'epoch': 85, 'batch': 171, 'loss': 1.7569812536239624}
{'epoch': 85, 'batch': 172, 'loss': 1.6475896835327148}
{'epoch': 85, 'batch': 173, 'loss': 1.5681378841400146}
{'epoch': 85, 'batch': 174, 'loss': 1.386147141456604}
{'epoch': 85, 'batch': 175, 'loss': 1.6793863773345947}
{'epoch': 85, 'batch': 176, 'loss': 1.756568193435669}
{'epoch': 85, 'batch': 177, 'loss': 1.6374614238739014}
{'epoch': 85, 'batch': 178, 'loss': 1.4573400020599365}
{'epoch': 85, 'batch': 179, 'loss': 1.4396060705184937}
{'epoch': 85, 'batch': 180, 'loss': 1.711172103881836}
{'epoch': 85, 'batch': 181, 'loss': 1.7106186151504517}
{'epoch': 85, 'batch': 182, 'loss': 1.5429128408432007}
{'epoch': 85, 'batch': 183, 'loss': 1.7499041557312012}
{'epoch': 85, 'batch': 184, 'loss': 1.7176634073257446}
{'epoch': 85, 'batch': 185, 'loss': 1.7235714197158813}
{'epoch': 85, 'batch': 186, 'loss': 1.4977087974548

{'epoch': 86, 'batch': 82, 'loss': 1.4623258113861084}
{'epoch': 86, 'batch': 83, 'loss': 1.3539528846740723}
{'epoch': 86, 'batch': 84, 'loss': 1.2685086727142334}
{'epoch': 86, 'batch': 85, 'loss': 1.5072633028030396}
{'epoch': 86, 'batch': 86, 'loss': 1.424114465713501}
{'epoch': 86, 'batch': 87, 'loss': 1.4243645668029785}
{'epoch': 86, 'batch': 88, 'loss': 1.33217453956604}
{'epoch': 86, 'batch': 89, 'loss': 1.689550757408142}
{'epoch': 86, 'batch': 90, 'loss': 1.4599883556365967}
{'epoch': 86, 'batch': 91, 'loss': 1.4253431558609009}
{'epoch': 86, 'batch': 92, 'loss': 1.3448268175125122}
{'epoch': 86, 'batch': 93, 'loss': 1.4858542680740356}
{'epoch': 86, 'batch': 94, 'loss': 1.4902310371398926}
{'epoch': 86, 'batch': 95, 'loss': 1.8740043640136719}
{'epoch': 86, 'batch': 96, 'loss': 1.5460063219070435}
{'epoch': 86, 'batch': 97, 'loss': 1.600895881652832}
{'epoch': 86, 'batch': 98, 'loss': 1.7440276145935059}
{'epoch': 86, 'batch': 99, 'loss': 1.7891792058944702}
{'epoch': 86, '

{'epoch': 86, 'batch': 230, 'loss': 1.7274370193481445}
{'epoch': 86, 'batch': 231, 'loss': 1.5208033323287964}
{'epoch': 86, 'batch': 232, 'loss': 1.785259485244751}
{'epoch': 86, 'batch': 233, 'loss': 1.7323452234268188}
{'epoch': 86, 'batch': 234, 'loss': 1.6337624788284302}
{'epoch': 86, 'batch': 235, 'loss': 1.2184407711029053}
{'epoch': 87, 'batch': 0, 'loss': 1.1343293190002441}
{'epoch': 87, 'batch': 1, 'loss': 1.2968252897262573}
{'epoch': 87, 'batch': 2, 'loss': 1.3264644145965576}
{'epoch': 87, 'batch': 3, 'loss': 1.5478426218032837}
{'epoch': 87, 'batch': 4, 'loss': 1.5181005001068115}
{'epoch': 87, 'batch': 5, 'loss': 1.311766266822815}
{'epoch': 87, 'batch': 6, 'loss': 1.425133466720581}
{'epoch': 87, 'batch': 7, 'loss': 1.456441879272461}
{'epoch': 87, 'batch': 8, 'loss': 1.371909737586975}
{'epoch': 87, 'batch': 9, 'loss': 1.5220094919204712}
{'epoch': 87, 'batch': 10, 'loss': 1.4507930278778076}
{'epoch': 87, 'batch': 11, 'loss': 1.6159145832061768}
{'epoch': 87, 'batc

{'epoch': 87, 'batch': 143, 'loss': 1.3085832595825195}
{'epoch': 87, 'batch': 144, 'loss': 1.5904525518417358}
{'epoch': 87, 'batch': 145, 'loss': 1.4157029390335083}
{'epoch': 87, 'batch': 146, 'loss': 1.5183486938476562}
{'epoch': 87, 'batch': 147, 'loss': 1.4893537759780884}
{'epoch': 87, 'batch': 148, 'loss': 1.5940800905227661}
{'epoch': 87, 'batch': 149, 'loss': 1.6167153120040894}
{'epoch': 87, 'batch': 150, 'loss': 1.5946073532104492}
{'epoch': 87, 'batch': 151, 'loss': 1.5749025344848633}
{'epoch': 87, 'batch': 152, 'loss': 1.5962551832199097}
{'epoch': 87, 'batch': 153, 'loss': 1.3800605535507202}
{'epoch': 87, 'batch': 154, 'loss': 1.4165750741958618}
{'epoch': 87, 'batch': 155, 'loss': 1.4754713773727417}
{'epoch': 87, 'batch': 156, 'loss': 1.5023865699768066}
{'epoch': 87, 'batch': 157, 'loss': 1.6200698614120483}
{'epoch': 87, 'batch': 158, 'loss': 1.556702971458435}
{'epoch': 87, 'batch': 159, 'loss': 1.5165915489196777}
{'epoch': 87, 'batch': 160, 'loss': 1.44032704830

{'epoch': 88, 'batch': 55, 'loss': 1.5659681558609009}
{'epoch': 88, 'batch': 56, 'loss': 1.4125347137451172}
{'epoch': 88, 'batch': 57, 'loss': 1.2194023132324219}
{'epoch': 88, 'batch': 58, 'loss': 1.5005357265472412}
{'epoch': 88, 'batch': 59, 'loss': 1.1921151876449585}
{'epoch': 88, 'batch': 60, 'loss': 1.562404751777649}
{'epoch': 88, 'batch': 61, 'loss': 1.5406062602996826}
{'epoch': 88, 'batch': 62, 'loss': 1.6195435523986816}
{'epoch': 88, 'batch': 63, 'loss': 1.263156533241272}
{'epoch': 88, 'batch': 64, 'loss': 1.2822800874710083}
{'epoch': 88, 'batch': 65, 'loss': 1.357334017753601}
{'epoch': 88, 'batch': 66, 'loss': 1.4893224239349365}
{'epoch': 88, 'batch': 67, 'loss': 1.491284966468811}
{'epoch': 88, 'batch': 68, 'loss': 1.5191245079040527}
{'epoch': 88, 'batch': 69, 'loss': 1.4189410209655762}
{'epoch': 88, 'batch': 70, 'loss': 1.2900935411453247}
{'epoch': 88, 'batch': 71, 'loss': 1.5368915796279907}
{'epoch': 88, 'batch': 72, 'loss': 1.451240062713623}
{'epoch': 88, '

{'epoch': 88, 'batch': 203, 'loss': 1.4596339464187622}
{'epoch': 88, 'batch': 204, 'loss': 1.476872444152832}
{'epoch': 88, 'batch': 205, 'loss': 1.5707939863204956}
{'epoch': 88, 'batch': 206, 'loss': 1.4944895505905151}
{'epoch': 88, 'batch': 207, 'loss': 1.6624678373336792}
{'epoch': 88, 'batch': 208, 'loss': 1.6395235061645508}
{'epoch': 88, 'batch': 209, 'loss': 1.259676218032837}
{'epoch': 88, 'batch': 210, 'loss': 1.5408293008804321}
{'epoch': 88, 'batch': 211, 'loss': 1.61892831325531}
{'epoch': 88, 'batch': 212, 'loss': 1.663331389427185}
{'epoch': 88, 'batch': 213, 'loss': 1.418647289276123}
{'epoch': 88, 'batch': 214, 'loss': 1.4458292722702026}
{'epoch': 88, 'batch': 215, 'loss': 1.4684185981750488}
{'epoch': 88, 'batch': 216, 'loss': 1.6421467065811157}
{'epoch': 88, 'batch': 217, 'loss': 1.6045420169830322}
{'epoch': 88, 'batch': 218, 'loss': 1.4852324724197388}
{'epoch': 88, 'batch': 219, 'loss': 1.4667702913284302}
{'epoch': 88, 'batch': 220, 'loss': 1.553978443145752}

{'epoch': 89, 'batch': 116, 'loss': 1.3097188472747803}
{'epoch': 89, 'batch': 117, 'loss': 1.1812852621078491}
{'epoch': 89, 'batch': 118, 'loss': 1.2631571292877197}
{'epoch': 89, 'batch': 119, 'loss': 1.553191065788269}
{'epoch': 89, 'batch': 120, 'loss': 1.4999109506607056}
{'epoch': 89, 'batch': 121, 'loss': 1.2851839065551758}
{'epoch': 89, 'batch': 122, 'loss': 1.319331407546997}
{'epoch': 89, 'batch': 123, 'loss': 1.3944675922393799}
{'epoch': 89, 'batch': 124, 'loss': 1.4042022228240967}
{'epoch': 89, 'batch': 125, 'loss': 1.3426063060760498}
{'epoch': 89, 'batch': 126, 'loss': 1.2012547254562378}
{'epoch': 89, 'batch': 127, 'loss': 1.2044180631637573}
{'epoch': 89, 'batch': 128, 'loss': 1.2019838094711304}
{'epoch': 89, 'batch': 129, 'loss': 1.6342582702636719}
{'epoch': 89, 'batch': 130, 'loss': 1.5092194080352783}
{'epoch': 89, 'batch': 131, 'loss': 1.4431263208389282}
{'epoch': 89, 'batch': 132, 'loss': 1.619446039199829}
{'epoch': 89, 'batch': 133, 'loss': 1.4452501535415

{'epoch': 90, 'batch': 28, 'loss': 0.9771827459335327}
{'epoch': 90, 'batch': 29, 'loss': 1.5166882276535034}
{'epoch': 90, 'batch': 30, 'loss': 1.3363903760910034}
{'epoch': 90, 'batch': 31, 'loss': 1.4055064916610718}
{'epoch': 90, 'batch': 32, 'loss': 1.3425685167312622}
{'epoch': 90, 'batch': 33, 'loss': 1.4647490978240967}
{'epoch': 90, 'batch': 34, 'loss': 1.3389403820037842}
{'epoch': 90, 'batch': 35, 'loss': 1.2374459505081177}
{'epoch': 90, 'batch': 36, 'loss': 1.387323021888733}
{'epoch': 90, 'batch': 37, 'loss': 1.3451110124588013}
{'epoch': 90, 'batch': 38, 'loss': 1.3053982257843018}
{'epoch': 90, 'batch': 39, 'loss': 1.4114569425582886}
{'epoch': 90, 'batch': 40, 'loss': 1.3185383081436157}
{'epoch': 90, 'batch': 41, 'loss': 1.5190105438232422}
{'epoch': 90, 'batch': 42, 'loss': 1.587322473526001}
{'epoch': 90, 'batch': 43, 'loss': 1.605878233909607}
{'epoch': 90, 'batch': 44, 'loss': 1.6655970811843872}
{'epoch': 90, 'batch': 45, 'loss': 1.5848866701126099}
{'epoch': 90,

{'epoch': 90, 'batch': 177, 'loss': 1.4996222257614136}
{'epoch': 90, 'batch': 178, 'loss': 1.3236784934997559}
{'epoch': 90, 'batch': 179, 'loss': 1.323211669921875}
{'epoch': 90, 'batch': 180, 'loss': 1.5451894998550415}
{'epoch': 90, 'batch': 181, 'loss': 1.6180039644241333}
{'epoch': 90, 'batch': 182, 'loss': 1.46943998336792}
{'epoch': 90, 'batch': 183, 'loss': 1.685583472251892}
{'epoch': 90, 'batch': 184, 'loss': 1.6248058080673218}
{'epoch': 90, 'batch': 185, 'loss': 1.6017520427703857}
{'epoch': 90, 'batch': 186, 'loss': 1.4096636772155762}
{'epoch': 90, 'batch': 187, 'loss': 1.2247388362884521}
{'epoch': 90, 'batch': 188, 'loss': 1.4541900157928467}
{'epoch': 90, 'batch': 189, 'loss': 1.517523169517517}
{'epoch': 90, 'batch': 190, 'loss': 1.5099388360977173}
{'epoch': 90, 'batch': 191, 'loss': 1.3006359338760376}
{'epoch': 90, 'batch': 192, 'loss': 1.5868364572525024}
{'epoch': 90, 'batch': 193, 'loss': 1.2757041454315186}
{'epoch': 90, 'batch': 194, 'loss': 1.334400653839111

{'epoch': 91, 'batch': 90, 'loss': 1.400719404220581}
{'epoch': 91, 'batch': 91, 'loss': 1.3017914295196533}
{'epoch': 91, 'batch': 92, 'loss': 1.3139535188674927}
{'epoch': 91, 'batch': 93, 'loss': 1.422466516494751}
{'epoch': 91, 'batch': 94, 'loss': 1.4323625564575195}
{'epoch': 91, 'batch': 95, 'loss': 1.8520946502685547}
{'epoch': 91, 'batch': 96, 'loss': 1.5248336791992188}
{'epoch': 91, 'batch': 97, 'loss': 1.4849811792373657}
{'epoch': 91, 'batch': 98, 'loss': 1.6569615602493286}
{'epoch': 91, 'batch': 99, 'loss': 1.705415964126587}
{'epoch': 91, 'batch': 100, 'loss': 1.5228244066238403}
{'epoch': 91, 'batch': 101, 'loss': 1.6237800121307373}
{'epoch': 91, 'batch': 102, 'loss': 1.3979090452194214}
{'epoch': 91, 'batch': 103, 'loss': 1.3435713052749634}
{'epoch': 91, 'batch': 104, 'loss': 1.4247289896011353}
{'epoch': 91, 'batch': 105, 'loss': 1.5123591423034668}
{'epoch': 91, 'batch': 106, 'loss': 1.448732852935791}
{'epoch': 91, 'batch': 107, 'loss': 1.4228096008300781}
{'epoc

{'epoch': 92, 'batch': 2, 'loss': 1.287158489227295}
{'epoch': 92, 'batch': 3, 'loss': 1.4794248342514038}
{'epoch': 92, 'batch': 4, 'loss': 1.433462381362915}
{'epoch': 92, 'batch': 5, 'loss': 1.2458035945892334}
{'epoch': 92, 'batch': 6, 'loss': 1.406646728515625}
{'epoch': 92, 'batch': 7, 'loss': 1.4443498849868774}
{'epoch': 92, 'batch': 8, 'loss': 1.2887139320373535}
{'epoch': 92, 'batch': 9, 'loss': 1.4444462060928345}
{'epoch': 92, 'batch': 10, 'loss': 1.387835144996643}
{'epoch': 92, 'batch': 11, 'loss': 1.4732314348220825}
{'epoch': 92, 'batch': 12, 'loss': 1.6059664487838745}
{'epoch': 92, 'batch': 13, 'loss': 1.4563701152801514}
{'epoch': 92, 'batch': 14, 'loss': 1.284204125404358}
{'epoch': 92, 'batch': 15, 'loss': 1.3457903861999512}
{'epoch': 92, 'batch': 16, 'loss': 1.3443211317062378}
{'epoch': 92, 'batch': 17, 'loss': 1.3734118938446045}
{'epoch': 92, 'batch': 18, 'loss': 1.5441091060638428}
{'epoch': 92, 'batch': 19, 'loss': 1.40535306930542}
{'epoch': 92, 'batch': 20

{'epoch': 92, 'batch': 151, 'loss': 1.5273100137710571}
{'epoch': 92, 'batch': 152, 'loss': 1.5735886096954346}
{'epoch': 92, 'batch': 153, 'loss': 1.3745567798614502}
{'epoch': 92, 'batch': 154, 'loss': 1.4239835739135742}
{'epoch': 92, 'batch': 155, 'loss': 1.4643065929412842}
{'epoch': 92, 'batch': 156, 'loss': 1.3801954984664917}
{'epoch': 92, 'batch': 157, 'loss': 1.481721043586731}
{'epoch': 92, 'batch': 158, 'loss': 1.5379478931427002}
{'epoch': 92, 'batch': 159, 'loss': 1.4086341857910156}
{'epoch': 92, 'batch': 160, 'loss': 1.3535306453704834}
{'epoch': 92, 'batch': 161, 'loss': 1.4715242385864258}
{'epoch': 92, 'batch': 162, 'loss': 1.2993351221084595}
{'epoch': 92, 'batch': 163, 'loss': 1.6736971139907837}
{'epoch': 92, 'batch': 164, 'loss': 1.5426833629608154}
{'epoch': 92, 'batch': 165, 'loss': 1.484772801399231}
{'epoch': 92, 'batch': 166, 'loss': 1.5099461078643799}
{'epoch': 92, 'batch': 167, 'loss': 1.4775285720825195}
{'epoch': 92, 'batch': 168, 'loss': 1.557425975799

{'epoch': 93, 'batch': 64, 'loss': 1.2614368200302124}
{'epoch': 93, 'batch': 65, 'loss': 1.3458971977233887}
{'epoch': 93, 'batch': 66, 'loss': 1.4064743518829346}
{'epoch': 93, 'batch': 67, 'loss': 1.4658570289611816}
{'epoch': 93, 'batch': 68, 'loss': 1.4584447145462036}
{'epoch': 93, 'batch': 69, 'loss': 1.2863680124282837}
{'epoch': 93, 'batch': 70, 'loss': 1.1648601293563843}
{'epoch': 93, 'batch': 71, 'loss': 1.44566011428833}
{'epoch': 93, 'batch': 72, 'loss': 1.3285856246948242}
{'epoch': 93, 'batch': 73, 'loss': 1.2720837593078613}
{'epoch': 93, 'batch': 74, 'loss': 1.4991936683654785}
{'epoch': 93, 'batch': 75, 'loss': 1.4030486345291138}
{'epoch': 93, 'batch': 76, 'loss': 1.095884919166565}
{'epoch': 93, 'batch': 77, 'loss': 1.109623670578003}
{'epoch': 93, 'batch': 78, 'loss': 0.8182051181793213}
{'epoch': 93, 'batch': 79, 'loss': 1.0721086263656616}
{'epoch': 93, 'batch': 80, 'loss': 1.3453088998794556}
{'epoch': 93, 'batch': 81, 'loss': 1.3075615167617798}
{'epoch': 93, 

{'epoch': 93, 'batch': 212, 'loss': 1.5991592407226562}
{'epoch': 93, 'batch': 213, 'loss': 1.3276879787445068}
{'epoch': 93, 'batch': 214, 'loss': 1.3126293420791626}
{'epoch': 93, 'batch': 215, 'loss': 1.390295386314392}
{'epoch': 93, 'batch': 216, 'loss': 1.5331236124038696}
{'epoch': 93, 'batch': 217, 'loss': 1.4874765872955322}
{'epoch': 93, 'batch': 218, 'loss': 1.3335933685302734}
{'epoch': 93, 'batch': 219, 'loss': 1.4098786115646362}
{'epoch': 93, 'batch': 220, 'loss': 1.454485297203064}
{'epoch': 93, 'batch': 221, 'loss': 1.597413182258606}
{'epoch': 93, 'batch': 222, 'loss': 1.6270807981491089}
{'epoch': 93, 'batch': 223, 'loss': 1.1191672086715698}
{'epoch': 93, 'batch': 224, 'loss': 0.6182501912117004}
{'epoch': 93, 'batch': 225, 'loss': 1.4502955675125122}
{'epoch': 93, 'batch': 226, 'loss': 1.5922678709030151}
{'epoch': 93, 'batch': 227, 'loss': 1.4043747186660767}
{'epoch': 93, 'batch': 228, 'loss': 1.3505675792694092}
{'epoch': 93, 'batch': 229, 'loss': 1.4504344463348

{'epoch': 94, 'batch': 125, 'loss': 1.2606213092803955}
{'epoch': 94, 'batch': 126, 'loss': 1.0877538919448853}
{'epoch': 94, 'batch': 127, 'loss': 1.1212384700775146}
{'epoch': 94, 'batch': 128, 'loss': 1.215535283088684}
{'epoch': 94, 'batch': 129, 'loss': 1.5996075868606567}
{'epoch': 94, 'batch': 130, 'loss': 1.4064854383468628}
{'epoch': 94, 'batch': 131, 'loss': 1.3974711894989014}
{'epoch': 94, 'batch': 132, 'loss': 1.5573093891143799}
{'epoch': 94, 'batch': 133, 'loss': 1.3631879091262817}
{'epoch': 94, 'batch': 134, 'loss': 1.2965362071990967}
{'epoch': 94, 'batch': 135, 'loss': 1.7028952836990356}
{'epoch': 94, 'batch': 136, 'loss': 1.4513354301452637}
{'epoch': 94, 'batch': 137, 'loss': 1.5437387228012085}
{'epoch': 94, 'batch': 138, 'loss': 1.455489158630371}
{'epoch': 94, 'batch': 139, 'loss': 1.6297376155853271}
{'epoch': 94, 'batch': 140, 'loss': 1.3795547485351562}
{'epoch': 94, 'batch': 141, 'loss': 1.5680325031280518}
{'epoch': 94, 'batch': 142, 'loss': 1.354568719863

{'epoch': 95, 'batch': 37, 'loss': 1.2690922021865845}
{'epoch': 95, 'batch': 38, 'loss': 1.1611093282699585}
{'epoch': 95, 'batch': 39, 'loss': 1.4105358123779297}
{'epoch': 95, 'batch': 40, 'loss': 1.31869375705719}
{'epoch': 95, 'batch': 41, 'loss': 1.5527868270874023}
{'epoch': 95, 'batch': 42, 'loss': 1.4689005613327026}
{'epoch': 95, 'batch': 43, 'loss': 1.580670714378357}
{'epoch': 95, 'batch': 44, 'loss': 1.6569160223007202}
{'epoch': 95, 'batch': 45, 'loss': 1.5211243629455566}
{'epoch': 95, 'batch': 46, 'loss': 1.6347534656524658}
{'epoch': 95, 'batch': 47, 'loss': 1.4059334993362427}
{'epoch': 95, 'batch': 48, 'loss': 1.0108046531677246}
{'epoch': 95, 'batch': 49, 'loss': 1.2202266454696655}
{'epoch': 95, 'batch': 50, 'loss': 0.9888579249382019}
{'epoch': 95, 'batch': 51, 'loss': 1.2251757383346558}
{'epoch': 95, 'batch': 52, 'loss': 1.2434606552124023}
{'epoch': 95, 'batch': 53, 'loss': 1.4391391277313232}
{'epoch': 95, 'batch': 54, 'loss': 1.543147325515747}
{'epoch': 95, 

{'epoch': 95, 'batch': 186, 'loss': 1.3059072494506836}
{'epoch': 95, 'batch': 187, 'loss': 1.1609456539154053}
{'epoch': 95, 'batch': 188, 'loss': 1.4022539854049683}
{'epoch': 95, 'batch': 189, 'loss': 1.4544607400894165}
{'epoch': 95, 'batch': 190, 'loss': 1.3752388954162598}
{'epoch': 95, 'batch': 191, 'loss': 1.196311116218567}
{'epoch': 95, 'batch': 192, 'loss': 1.4715029001235962}
{'epoch': 95, 'batch': 193, 'loss': 1.1927481889724731}
{'epoch': 95, 'batch': 194, 'loss': 1.272854208946228}
{'epoch': 95, 'batch': 195, 'loss': 1.521985411643982}
{'epoch': 95, 'batch': 196, 'loss': 1.252726435661316}
{'epoch': 95, 'batch': 197, 'loss': 1.4203397035598755}
{'epoch': 95, 'batch': 198, 'loss': 1.49995756149292}
{'epoch': 95, 'batch': 199, 'loss': 1.5131205320358276}
{'epoch': 95, 'batch': 200, 'loss': 1.333495855331421}
{'epoch': 95, 'batch': 201, 'loss': 1.491217851638794}
{'epoch': 95, 'batch': 202, 'loss': 1.4216917753219604}
{'epoch': 95, 'batch': 203, 'loss': 1.3473681211471558}


{'epoch': 96, 'batch': 99, 'loss': 1.6509445905685425}
{'epoch': 96, 'batch': 100, 'loss': 1.4499608278274536}
{'epoch': 96, 'batch': 101, 'loss': 1.5861575603485107}
{'epoch': 96, 'batch': 102, 'loss': 1.3495336771011353}
{'epoch': 96, 'batch': 103, 'loss': 1.3238528966903687}
{'epoch': 96, 'batch': 104, 'loss': 1.322285771369934}
{'epoch': 96, 'batch': 105, 'loss': 1.467461347579956}
{'epoch': 96, 'batch': 106, 'loss': 1.3727093935012817}
{'epoch': 96, 'batch': 107, 'loss': 1.3662232160568237}
{'epoch': 96, 'batch': 108, 'loss': 1.3690513372421265}
{'epoch': 96, 'batch': 109, 'loss': 1.4002857208251953}
{'epoch': 96, 'batch': 110, 'loss': 1.3300496339797974}
{'epoch': 96, 'batch': 111, 'loss': 1.333086609840393}
{'epoch': 96, 'batch': 112, 'loss': 1.337096095085144}
{'epoch': 96, 'batch': 113, 'loss': 1.3176079988479614}
{'epoch': 96, 'batch': 114, 'loss': 1.2639453411102295}
{'epoch': 96, 'batch': 115, 'loss': 1.458189845085144}
{'epoch': 96, 'batch': 116, 'loss': 1.122597336769104}

{'epoch': 97, 'batch': 11, 'loss': 1.428573727607727}
{'epoch': 97, 'batch': 12, 'loss': 1.5371276140213013}
{'epoch': 97, 'batch': 13, 'loss': 1.3253893852233887}
{'epoch': 97, 'batch': 14, 'loss': 1.2754489183425903}
{'epoch': 97, 'batch': 15, 'loss': 1.201340913772583}
{'epoch': 97, 'batch': 16, 'loss': 1.2786413431167603}
{'epoch': 97, 'batch': 17, 'loss': 1.3090308904647827}
{'epoch': 97, 'batch': 18, 'loss': 1.4309780597686768}
{'epoch': 97, 'batch': 19, 'loss': 1.2999505996704102}
{'epoch': 97, 'batch': 20, 'loss': 1.2839875221252441}
{'epoch': 97, 'batch': 21, 'loss': 1.391884207725525}
{'epoch': 97, 'batch': 22, 'loss': 1.3415669202804565}
{'epoch': 97, 'batch': 23, 'loss': 1.2775211334228516}
{'epoch': 97, 'batch': 24, 'loss': 1.174272894859314}
{'epoch': 97, 'batch': 25, 'loss': 1.5165207386016846}
{'epoch': 97, 'batch': 26, 'loss': 1.3560872077941895}
{'epoch': 97, 'batch': 27, 'loss': 1.4614735841751099}
{'epoch': 97, 'batch': 28, 'loss': 0.9253097176551819}
{'epoch': 97, 

{'epoch': 97, 'batch': 160, 'loss': 1.333534598350525}
{'epoch': 97, 'batch': 161, 'loss': 1.358107566833496}
{'epoch': 97, 'batch': 162, 'loss': 1.1288304328918457}
{'epoch': 97, 'batch': 163, 'loss': 1.5615426301956177}
{'epoch': 97, 'batch': 164, 'loss': 1.438011884689331}
{'epoch': 97, 'batch': 165, 'loss': 1.4137980937957764}
{'epoch': 97, 'batch': 166, 'loss': 1.345596194267273}
{'epoch': 97, 'batch': 167, 'loss': 1.4004242420196533}
{'epoch': 97, 'batch': 168, 'loss': 1.4122601747512817}
{'epoch': 97, 'batch': 169, 'loss': 1.313607096672058}
{'epoch': 97, 'batch': 170, 'loss': 1.3115639686584473}
{'epoch': 97, 'batch': 171, 'loss': 1.5332729816436768}
{'epoch': 97, 'batch': 172, 'loss': 1.3871005773544312}
{'epoch': 97, 'batch': 173, 'loss': 1.401314377784729}
{'epoch': 97, 'batch': 174, 'loss': 1.189106822013855}
{'epoch': 97, 'batch': 175, 'loss': 1.4659922122955322}
{'epoch': 97, 'batch': 176, 'loss': 1.4304273128509521}
{'epoch': 97, 'batch': 177, 'loss': 1.3935588598251343}

{'epoch': 98, 'batch': 73, 'loss': 1.208775520324707}
{'epoch': 98, 'batch': 74, 'loss': 1.4053584337234497}
{'epoch': 98, 'batch': 75, 'loss': 1.3212155103683472}
{'epoch': 98, 'batch': 76, 'loss': 1.0174548625946045}
{'epoch': 98, 'batch': 77, 'loss': 1.0057146549224854}
{'epoch': 98, 'batch': 78, 'loss': 0.8204104900360107}
{'epoch': 98, 'batch': 79, 'loss': 0.9973896741867065}
{'epoch': 98, 'batch': 80, 'loss': 1.2389756441116333}
{'epoch': 98, 'batch': 81, 'loss': 1.2849364280700684}
{'epoch': 98, 'batch': 82, 'loss': 1.266526460647583}
{'epoch': 98, 'batch': 83, 'loss': 1.1183840036392212}
{'epoch': 98, 'batch': 84, 'loss': 1.093800663948059}
{'epoch': 98, 'batch': 85, 'loss': 1.382971167564392}
{'epoch': 98, 'batch': 86, 'loss': 1.2509629726409912}
{'epoch': 98, 'batch': 87, 'loss': 1.2958807945251465}
{'epoch': 98, 'batch': 88, 'loss': 1.205486536026001}
{'epoch': 98, 'batch': 89, 'loss': 1.4391210079193115}
{'epoch': 98, 'batch': 90, 'loss': 1.304317593574524}
{'epoch': 98, 'b

{'epoch': 98, 'batch': 221, 'loss': 1.4694092273712158}
{'epoch': 98, 'batch': 222, 'loss': 1.572048306465149}
{'epoch': 98, 'batch': 223, 'loss': 1.0496411323547363}
{'epoch': 98, 'batch': 224, 'loss': 0.5651203989982605}
{'epoch': 98, 'batch': 225, 'loss': 1.3897082805633545}
{'epoch': 98, 'batch': 226, 'loss': 1.519675612449646}
{'epoch': 98, 'batch': 227, 'loss': 1.2725774049758911}
{'epoch': 98, 'batch': 228, 'loss': 1.2511167526245117}
{'epoch': 98, 'batch': 229, 'loss': 1.3215281963348389}
{'epoch': 98, 'batch': 230, 'loss': 1.532494068145752}
{'epoch': 98, 'batch': 231, 'loss': 1.2925763130187988}
{'epoch': 98, 'batch': 232, 'loss': 1.5060609579086304}
{'epoch': 98, 'batch': 233, 'loss': 1.485701560974121}
{'epoch': 98, 'batch': 234, 'loss': 1.3782367706298828}
{'epoch': 98, 'batch': 235, 'loss': 1.102223515510559}
{'epoch': 99, 'batch': 0, 'loss': 0.9505457878112793}
{'epoch': 99, 'batch': 1, 'loss': 1.091987133026123}
{'epoch': 99, 'batch': 2, 'loss': 1.1285936832427979}
{'ep

{'epoch': 99, 'batch': 134, 'loss': 1.2366005182266235}
{'epoch': 99, 'batch': 135, 'loss': 1.5122164487838745}
{'epoch': 99, 'batch': 136, 'loss': 1.2670073509216309}
{'epoch': 99, 'batch': 137, 'loss': 1.373921275138855}
{'epoch': 99, 'batch': 138, 'loss': 1.323211431503296}
{'epoch': 99, 'batch': 139, 'loss': 1.4545475244522095}
{'epoch': 99, 'batch': 140, 'loss': 1.3542735576629639}
{'epoch': 99, 'batch': 141, 'loss': 1.44114351272583}
{'epoch': 99, 'batch': 142, 'loss': 1.3028357028961182}
{'epoch': 99, 'batch': 143, 'loss': 1.1276030540466309}
{'epoch': 99, 'batch': 144, 'loss': 1.432629108428955}
{'epoch': 99, 'batch': 145, 'loss': 1.297426700592041}
{'epoch': 99, 'batch': 146, 'loss': 1.3307777643203735}
{'epoch': 99, 'batch': 147, 'loss': 1.35439133644104}
{'epoch': 99, 'batch': 148, 'loss': 1.515527367591858}
{'epoch': 99, 'batch': 149, 'loss': 1.4297127723693848}
{'epoch': 99, 'batch': 150, 'loss': 1.4514613151550293}
{'epoch': 99, 'batch': 151, 'loss': 1.4643924236297607}
{

In [20]:
torch.save(model.state_dict(), "greatgatmodel.pt")

In [33]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'watching', 'Get', 'raining', 'signs,', 'Into', 'Aren’t', 'sobbed,', 'hilariously', 'forms', '', '', '', '', 'Thomas', 'Parke', 'd’Invilliers', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'II', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']


In [34]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'surprise,', 'Moreover', 'stormily', 'F', '(I’ve', 'pages', '', 'finance', '', '', 'Thomas', 'Parke', '00', 'old', 'sport', '”', '', '', '', '', '“In', 'my', 'younger', 'and', 'you', 'had', 'any', 'resolves', 'at', 'the', 'leash', 'in', 'a', '', 'West,', 'after', 'that', 'Daisy', 'was', 'physical', 'people,', 'so', 'he', 'was', 'looking', 'in', '', 'father’s', 'position', '', '', '', '', '“It’s', 'East', 'because', 'Daisy', 'was', 'casually', '“just', 'that', 'she', 'was', 'intention', 'of', 'murmuring', '', 'an', 'apology', 'for', 'trembling', 'as', 'if', 'you', 'could', 'be', 'unjustly', 'house', '', 'of', 'my', 'sedative', 'old', 'railroad', 'drifted', 'that', '”', 'demanded', 'Tom’s', 'Baker,', 'ecstatically', '', 'together', '', 'I', '“had', 'my', 'pool', 'who', 'came']


In [35]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'individual', 'G', '', '', '', '', '', 'Thomas', 'Parke', 'd’Invilliers', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'I', '', '', '', 'I', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'Mr', '', 'In', 'some', 'more', 'more', 'fact', 'the', 'dollars’', 'physical', 'addressed', 'over', 'to', 'her', 'husband', '”', '', '', '', '“Can’t', 'him,”', 'you', 'doing,', 'answered', 'in', 'Mr', '', 'McKee', 'and', 'the', 'butler', 'rather', 'heard']


In [36]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'yelling,', 'small-breasted', '“character”', 'at,', 'year,”', '“Aunt', '“Old', 'darkening', 'heady', 'heady', 'were', 'wiping', 'to', 'four', 'evening', 'face', '', '', '', '', '“You', 'did', 'how', 'so', 'exactly', 'any', 'long', '', 'Tomorrow', 'to', 'see', 'it', 'is', 'like', 'more', '', 'restlessly', 'were', 'sitting', 'and', 'her', 'rather', 'interest', 'not', 'said,', 'one', 'attention', '', 'with', 'a', 'taxi', 'alone', 'in', 'the', 'best,', 'family', 'Mrs', '', 'Wilson', 'turned', '', 'on', 'the', 'Coloured', 'nod,', 'and', 'they', 'sat', 'over', 'at', 'me', 'with', 'lovely', 'longer', 'as', 'I', '', 'get', '', 'share', 'over', 'that', 'they', 'should', 'nothing', 'to', 'make', 'more', 'breath', 'as', 'finally', 'some', '', 'slight', 'people', 'above', 'it', 'outside', 'in', 'college']


In [37]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'science—”', 'Next', 'Ohio,', 'college—one', 'Forms', 'You’d', 'questioningly', 'approved', 'flashing', 'flung', 'shoe', 'bosom', 'gravely,', 'refused,', 'slow', 'somnambulatory', 'Ripley', 'ivy,', 'autumn-leaf', 'Thus', 'confessed', 'alone,”', 'soaked', 'side—“she', 'Dear', 'Moreover', 'Reading', 'neared', 'swell', 'be', '', '', '', 'Thomas', 'Parke', 'd’Invilliers', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'inquired', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']


In [38]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'slit', 'Get', 'Generally', 'of—oh—fling', 'degree', 'explicable', 'use', 'of', 'our', 'office', 'behind', '', 'with', 'no', 'slightly', 'glow', 'into', 'the', 'city', 'word', 'he', 'spent', 'his', 'murky', '', 'windows,', 'and', 'looked', 'back', 'from', 'overhead', '', 'But', 'it', 'held', 'off', 'with', 'a', 'life', '', 'beside', 'his', 'eyes', 'was', 'out,', 'with', 'a', 'boots', 'by', 'Mrs', '', 'Wilson', 'lay', '', 'back', 'of', 'find', 'there', 'outside', '', 'I', 'was', 'an', 'ghastly', 'men', 'with', 'an', '', 'exclamation', 'promising', 'a', 'lustreless', 'affair', '', 'She', 'had', 'apparently', 'Wilson,', 'one', 'of', 'the', 'quality', 'of', '', 'Wilson', 'seemed', 'the', 'damp', 'island', 'of', 'like', 'three', 'promise', 'as', 'it', '', 'still', 'the', 'line', 'in']


In [39]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'talked,', 'cause', 'marry', 'rugs', 'confessed', 'unexpected', 'frogs', 'yesterday', 'career', 'cars,', 'leather', 'doing', 'sea', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'General', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '6:00', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']


In [40]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'forth', 'Those', 'frowning,', 'confidences', 'link', 'Those', 'reputation', 'chambermaids', 'restlessness', '“Come', 'broken', 'nothing', 'her', 'mind', '', 'it’s', 'frowning', '', 'and', 'it', 'has', 'me', 'when', 'he', 'shall', 'that', 'wanted', 'to', 'be', 'alone', '', '', '', '', '“I’d', 'was', 'to', 'look', 'for', 'this', 'afternoon', '”', '', '', '', '“Young', 'Baker', '', 'cried', 'explained', 'the', 'matter', '', 'I', 'went', 'when', 'I', 'get', 'that', 'I', 'was', 'going', 'to', 'let', '', 'him,', 'until', 'what', 'poor', 'Lucille', 'I', 'have', '', 'repeat,', 'been', 'likely', 'in', 'love', '', 'anybody,', 'than', 'it', 'had', 'been', 'more', '', 'Well,', 'this', 'one', 'more', 'would', 'drift', '', 'he’d', 'usually', 'much', 'alone', '', 'I', 'wanted']


In [41]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'stale,', 'forgive', 'elocution,', 'hey', 'deserting', 'steal', 'happiness', '', '', '', '', 'In', 'my', 'friend', '”', '', '', '', 'What', 'I', 'called', 'in', 'curious', 'driving', 'my', 'moment,', 'Mr', '', 'Wolfshiem', '', 'Wolfshiem', 'made', 'him', '', 'He', 'was', 'getting', 'over', 'that', 'more', '', 'island', 'between', 'referred', 'to', 'me', '', 'Her', 'name', 'was', 'printed', 'no', 'company', 'lay', 'rather', 'no', 'shoulders', 'of', '', 'confused', '', 'It', 'was', 'this', 'wheel', '', 'The', 'lady', 'lawn,', 'suddenly', '', 'dominance', 'his', 'East', 'eyes', '', '', '', '', '“My', 'dear,”', 'she', 'remarked,', 'this', 'hovering', 'about', 'three', 'say,', 'say,', 'forced', '', 'nothing', 'quickly', 'an', 'look', 'or', 'suddenly', 'it', 'like', 'a']


In [42]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'tightening', '—', 'Where', 'See', 'Say:', 'Conduct', 'thanking', 'subtle', 'other', 'garage,', 'chair', 'plan', 'their', 'silence', 'like', 'beneath', 'that', 'while', 'that—I', 'touched', 'a', 'hasty', 'places', 'like', '', 'this', 'too', 'has', 'have', 'any', 'little', 'before', '', 'He', 'had', 'shown', 'to', '', 'stop', 'there', 'with', 'the', 'funeral', 'when', 'he', 'firmly', 'in', '1915,', 'helped', 'around', '', 'the', 'particular', 'rose', 'than', 'the', 'uncertainty', 'of', 'the', 'desk—he’d', 'when', 'my', 'rose', '', 'then', 'quickly', 'waiting', 'for', 'an', 'certain', 'never', 'look', 'called', 'now,', 'and', 'they', '', 'still', 'handsome', 'he', 'might', 'made', 'a', 'newspapers,', 'his', 'car', '', '', '', '', 'Gatsby', 'here,', 'suddenly', 'up', 'Fifth', 'morning', 'that', 'they', 'had', 'never']


In [43]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'F', 'Various—”', 'composed', '', 'West', 'I', 'am', 'tied', 'on', 'the', 'room', 'after', 'her', 'two', 'left', 'yellow', 'open', '', 'into', 'the', 'glasses', 'but', 'stopping', 'over', 'a', 'little', 'idea', '', 'This', 'started', 'that', 'I', '', 'have', 'been', 'back', 'into', 'the', 'person', '', 'After', 'the', 'standard—it', 'was', 'full', 'and', '', 'Buccleuch,', 'but', 'the', 'Fourth', 'was', 'ajar', 'and', 'there', 'in', 'the', 'flutter', 'of', 'a', '', 'egg,', 'light', '', 'At', 'a', 'younger', 'and', 'the', 'earth', '', 'painted', 'veiled', 'throwing', 'her', 'over', 'on', 'an', 'beads', 'with', 'leaning', '', 'dress', 'and', 'other', 'nose', 'draws', 'the', 'sun', 'with', 'a', 'party', 'that', '', '', '', '', 'Across', 'it', '”']


In [44]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'taxicabs', 'Its', 'Thirty—the', 'Daisy’ll', 'asleep—she', 'extravagantly', 'feigned', 'ahead,”', 'fun—”', 'last', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '6:15-6:30', '”', '', '', '', '']


In [45]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'relieved', 'is—”', 'revolver', 'west,', 'legal', 'stoop', 'Bird', 'Unlike', 'questioningly', '“\u200a‘Let', 'vacuous', 'juxtaposition', 'remarked', 'dark', 'wan', 'car', '', '', '', '', 'shouted', 'at', 'such', 'that', 'hasty', 'addenda', 'old', 'sport,', 'you’ve', 'been', 'rather', 'was', 'coming', '', 'with', 'just', 'all', 'Daisy', '', 'And', 'that', 'are', 'my', 'other', 'girl,', '', 'they', 'had', 'gone', 'that', 'four', 'night', 'after', 'a', 'thrilling', 'thing', 'and', 'did', '', 'Louisville', 'who', 'was', 'privy', 'with', 'a', 'ghastly', 'five', 'empty', 'sky', 'with', 'two', '', 'unknown', 'physical', 'rose', 'over', 'along', 'the', 'stone', '', 'We', 'curtains', 'like', '', 'hard', 'on', 'a', 'edge', 'of', 'fact', 'that', 'I', 'spent', 'all', 'affection', '', 'after', 'noon', 'I', 'sounded']


In [46]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'towns,', 'polish', 'prig', 'jovially', 'unforgivably', 'Moreover', 'Fifty-Ninth', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '4:30-5:00', '”', '', '', '', '', '', '', '', '', 'Baseball', 'and', 'private', 'Middle', 'a', 'matter', 'by', 'my', 'father', 'wasting', 'off', 'New']


In [88]:
print(predict(dataset, model, text='You make me'))

['You', 'make', 'me', 'voice', '', 'In', 'the', 'lawn,', 'morning', 'with', 'my', 'very', 'end', 'as', 'I', 'dirty', '', 'a', 'blue', 'body', 'half-bewildered', 'bright', 'preceded', 'its', 'well', 'in', 'the', 'garden,', '', 'of', 'my', 'windows', 'that', 'a', 'high', 'man', 'blew', 'her', 'other', 'intention', 'of', 'youth', 'who', '', 'D', 'in', 'some', 'doors', 'for', 'the', 'country', '', 'The', 'living-room', 'was', 'white', '', 'and', 'splendour', 'of', 'my', 'reaction—Gatsby,', 'like', 'the', 'new', 'steps', 'and', 'then', 'of', 'the', 'car', '', 'before', 'if', 'it', 'had', 'been', 'crowded', 'alone—fifty', 'sun', 'I', 'have', 'heard', 'the', 'end', 'and', '', 'natural', 'interest', 'into', 'it', 'and', 'morning', 'he', 'lay', 'off', 'that', 'head', 'in', 'half', 'an', '', 'men']


In [52]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'I', 'am', 'sort', 'of', 'view', 'you’d', 'a', 'deep', 'explanations', 'and', 'her', '', 'trying', 'to', 'know', 'him,', 'perhaps', 'possessed', 'them', 'there', 'so', 'it’s', '', 'alone', '', 'It', 'had', 'never', 'seen', 'him', 'nibble', 'to', 'him', 'was', 'less', 'but', '', 'when', 'I’m', 'stronger', 'in', 'his', 'back', 'or', 'so', 'Nick,', 'with', 'there', 'as', 'Doctor', 'Haag,', '', 'more', '', 'But', 'they', 'know', 'ceased', 'friends', 'he', 'awoke', 'just', 'surprised', 'that', 'cool,', '', 'sauntered', 'more', 'of', 'dinner', 'he', 'couldn’t', 'say', '', 'If', 'the', 'figure', 'was', 'a', 'man', '', 'he', 'had', 'rather', 'feel', 'himself', 'of', 'us', 'in', 'an', 'side', 'in', 'one', 'in', 'a', 'determination', '', 'in', 'a']


In [90]:
print(predict(dataset, model, text='I am'))

['I', 'am', '', '', '', '', '7:15-8:15', 'in', 'a', 'note,', 'an', 'evening', 'began', 'now', 'there', 'was', 'a', 'promise', 'in', 'a', '', 'pool', 'and', 'I', 'should', 'get', 'out', 'of', 'my', 'series', '', 'Probably', 'I', 'live', '', 'any', 'own', 'girl', 'she', 'had', 'run', 'an', 'checker', 'to', 'waves,', '', 'my', 'share', 'from', 'privileged', 'specialists,', 'a', 'man', '”', '', '', '', '“Listen,', 'they', 'is', 'gone', 'for', 'a', 'party', '”', 'She', 'took', 'up', 'my', 'taxi', 'and', 'looked', '', 'there', 'was', 'an', 'hour', 'ago', 'and', 'did', 'it', 'might', '“got', 'a', 'communicative', '', 'that', 'happened', 'around', 'my', 'country', 'until', 'Mrs', '', 'Wilson', 'suit', 'opening', 'the', 'certain', '', 'hardy', 'turned']


In [105]:
print(predict(dataset, model, text='I am'))

['I', 'am', 'hand', '', '', '', '', 'His', 'eyes', 'unmistakably', 'dog-leash,', 'broke', 'from', 'wide', 'and,', 'and', 'what', 'she', 'knew', '', 'you', 'firmly', 'he', 'had', 'far', 'again', 'in', 'a', 'drizzle', '', 'I', 'heard', 'it', 'necessary', 'to', 'kill', 'me,', 'for', '', 'rooms', 'his', 'words', 'and', 'it', 'stopped', 'from', 'his', 'house', 'before', 'I', 'left', 'another', '', '', '', '', '“The', 'voice', 'son-of-a-bitch,”', 'my', 'book', 'she', 'said', '', '“You', 'give', 'me', 'everything', '”', '', '', '', 'A', 'shock', 'that', 'was', 'almost', 'white—changed', 'over', 'the', 'table', 'as', 'I', 'knew', '', 'at', 'its', 'most', 'respectful', 'in', 'an', 'abortive', '“Hm', 'in', 'blue', '', 'In', 'the', 'railroad', 'warm', 'old', 'girls']


In [113]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'you’re', 'one', 'of', 'the', 'desk,”', 'that', 'long', 'lady', 'moved', 'standing', 'in', 'a', '', 'front', 'of', 'which', 'are', 'me', 'every', 'young', 'before', 'she', 'shouted', 'slightly', '', 'together', '”', '', '', '', 'Most', 'of', 'West', 'Egg,', 'the—well,', 'this', 'bursts', 'and', 'grey', 'cars', 'identical', 'his', '', 'grave', 'or', 'along', 'that', 'Gatsby', 'of', 'already', 'share', 'were', '', 'tipped', 'under', 'an', 'whip', 'and', 'leaning', 'with', 'cream-coloured', 'chiffon,', 'close', 'in', '', 'the', 'mass', 'of', 'the', 'son’s', '', 'She', 'must', 'came', 'in', 'his', 'face', 'in', 'his', 'grandfather’s', '', 'wet', 'immediately', 'upon', 'the', 'black', 'leaf,', 'from', 'its', 'shoulder', 'sank', 'by', 'breathless,', '', 'colour', 'on', 'the', 'cheerful', 'window,']


In [114]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'uttered', 'it', '”', '', '', '', 'Evidently', 'it’s', 'a', 'obviously', 'ends', 'of', 'his', 'police', 'but', 'if', 'it', 'did', 'you', 'some', 'most', '', 'George', 'Mrs', '', 'Wilson', 'mentioned', 'up,', 'and', 'they', 'was', 'rooms', 'in', '', 'whomsoever', 'we', 'all', 'the', 'time', '', 'Some', 'kind', 'of', 'printed', 'the', 'Catholic,', '', 'who', 'was', 'going', 'to', 'curious', 'before', 'at', 'my', 'front', 'way', 'and', 'it', 'was', 'too', '', 'with', 'the', 'policeman,', 'but', 'I', 'expected,', 'his', 'head', 'by', 'a', 'simplicity', 'of', 'indifferent', '', 'sauntered', 'at', 'the', 'veranda', '', 'The', 'little', 'ashen', 'moved', 'over', 'up', 'into', '', 'him', 'so', 'since', 'I', 'drove', 'over', 'with', 'my', 'pale,', '‘All']


In [147]:
print(predict(dataset, model, text='Love you'))

['Love', 'you', 'arm', '', '', '', '', 'It', 'was', 'across', 'the', 'dog-leash', '', '', '', '', 'We', 'waited', 'for', 'up', 'in', 'the', 'funeral', 'along', 'the', 'gutter', 'he', 'was', '', 'breaking', 'from', 'the', 'son', 'of', 'me,', '', 'He', 'ate', 'more', 'incessantly', 'in', 'a', 'blurred', 'glasses,', 'and', '', 'he', 'had', 'stood', 'out', 'on', 'the', 'light', 'with', 'the', 'evening', 'of', 'half', '', 'whisky', '', 'His', 'night', 'toward', 'the', 'world', '', '', '', '', 'The', 'grey,', 'wife', 'supper—there', 'were', 'over', 'by', 'through', 'some', 'wedding', 'up', '', 'through', 'wiped', 'a', 'house', 'of', 'one', 'conversation', 'said', 'all', 'feet', '', '', '', '', '“My', 'told', 'each', 'pardon,”', 'Gatsby', '”']


In [159]:
print(predict(dataset, model, text='happy birthday'))

['happy', 'birthday', '', '', '', '', 'He', 'eyes', 'said', 'driving', '', 'I’m', 'a', 'word,', 'beside', 'me', 'asked', 'if', 'I', 'used', 'to', 'think', 'when', 'we', 'were', 'related', '', 'to', 'run', 'different', 'his', 'house,', 'imperatively', 'before', 'everybody', 'real', 'even', '', 'forever;', 'you', 'pick', 'up', 'about', 'Mrs', '', 'Wilson', '—”', '', '', '', '', '“You', 'could', 'know', 'to,', 'how', 'he', 'killed', 'the', 'butler', 'with', 'me,', 'of', '', 'restlessly', 'but', 'the', 'man', 'than', 'suggested,', 'in', 'Miss', 'Baker', 'in', 'his', '', 'raised', 'nose', 'as', 'the', 'efforts', 'was', 'white', 'more', 'but', 'he', 'seemed', 'a', '', 'permanent', 'eyes', 'at', 'the', 'water,', 'on', 'the', 'air', '', 'I', 'waited,', 'and', 'then']


In [119]:
'Love you square crowded'

'Love you square crowded'

In [None]:
Love you scared 7:15-7:18
Love you dizzy, bright, couch wiping