In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import pandas as pd
import numpy as np
import torch
import requests
import os
import argparse
from torch.utils.data import DataLoader
from collections import Counter

In [3]:
class Model(nn.Module):
    def __init__(self, dataset):
        super(Model, self).__init__()
        self.lstm_size = 128
        self.embedding_dim = 128
        self.num_layers = 3

        n_vocab = len(dataset.uniq_words)
        self.embedding = nn.Embedding(
            num_embeddings=n_vocab,
            embedding_dim=self.embedding_dim,
        )
        self.lstm = nn.LSTM(
            input_size=self.lstm_size,
            hidden_size=self.lstm_size,
            num_layers=self.num_layers,
            dropout=0.2,
        )
        self.fc = nn.Linear(self.lstm_size, n_vocab)

    def forward(self, x, prev_state):
        embed = self.embedding(x)
        output, state = self.lstm(embed, prev_state)
        logits = self.fc(output)
        return logits, state

    def init_state(self, sequence_length):
        return (torch.zeros(self.num_layers, sequence_length, self.lstm_size),
                torch.zeros(self.num_layers, sequence_length, self.lstm_size))

In [4]:
class Dataset(torch.utils.data.Dataset):
    def __init__(
        self,
        args,
    ):
        self.args = args
        self.words = self.load_words()
        self.uniq_words = self.get_uniq_words()

        self.index_to_word = {index: word for index, word in enumerate(self.uniq_words)}
        self.word_to_index = {word: index for index, word in enumerate(self.uniq_words)}

        self.words_indexes = [self.word_to_index[w] for w in self.words]

    def load_words(self):
        train_df = pd.read_csv('mobydick.csv')
        #train_df = train_df[:3000]
        text = train_df['Line'].str.cat(sep=' ')
        return text.split(' ')

    def get_uniq_words(self):
        word_counts = Counter(self.words)
        return sorted(word_counts, key=word_counts.get, reverse=True)

    def __len__(self):
        return len(self.words_indexes) - self.args.sequence_length

    def __getitem__(self, index):
        return (
            torch.tensor(self.words_indexes[index:index+self.args.sequence_length]),
            torch.tensor(self.words_indexes[index+1:index+self.args.sequence_length+1]),
        )

In [5]:
def train(dataset, model, args):
    model.train()

    dataloader = DataLoader(dataset, batch_size=args.batch_size)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)

    for epoch in range(args.max_epochs):
        state_h, state_c = model.init_state(args.sequence_length)

        for batch, (x, y) in enumerate(dataloader):
            optimizer.zero_grad()

            y_pred, (state_h, state_c) = model(x, (state_h, state_c))
            loss = criterion(y_pred.transpose(1, 2), y)

            state_h = state_h.detach()
            state_c = state_c.detach()

            loss.backward()
            optimizer.step()

            print({ 'epoch': epoch, 'batch': batch, 'loss': loss.item() })

In [6]:
def predict(dataset, model, text, next_words=100):
    model.eval()

    words = text.split(' ')
    state_h, state_c = model.init_state(len(words))

    for i in range(0, next_words):
        x = torch.tensor([[dataset.word_to_index[w] for w in words[i:]]])
        y_pred, (state_h, state_c) = model(x, (state_h, state_c))

        last_word_logits = y_pred[0][-1]
        p = torch.nn.functional.softmax(last_word_logits, dim=0).detach().numpy()
        word_index = np.random.choice(len(last_word_logits), p=p)
        words.append(dataset.index_to_word[word_index])

    return words

In [8]:
parser = argparse.ArgumentParser()
parser.add_argument('--max-epochs', type=int, default=100)
parser.add_argument('--batch-size', type=int, default=256)
parser.add_argument('--sequence-length', type=int, default=4)
#args = parser.parse_args()
args, unknown = parser.parse_known_args()
dataset = Dataset(args)
model = Model(dataset)

In [11]:
train_df = pd.read_csv('mobydick.csv')
train_df.head(100)

Unnamed: 0.1,Unnamed: 0,Line
0,0,CHAPTER 2
1,1,The Carpet-Bag
2,2,CHAPTER 3
3,3,The Spouter-Inn
4,4,CHAPTER 4
...,...,...
95,95,The Hyena
96,96,CHAPTER 50
97,97,Ahab’s Boat and Crew
98,98,Fedallah


In [12]:
train(dataset, model, args)

{'epoch': 0, 'batch': 0, 'loss': 10.335919380187988}
{'epoch': 0, 'batch': 1, 'loss': 10.280003547668457}
{'epoch': 0, 'batch': 2, 'loss': 10.236092567443848}
{'epoch': 0, 'batch': 3, 'loss': 10.175676345825195}
{'epoch': 0, 'batch': 4, 'loss': 10.080366134643555}
{'epoch': 0, 'batch': 5, 'loss': 10.032454490661621}
{'epoch': 0, 'batch': 6, 'loss': 9.611031532287598}
{'epoch': 0, 'batch': 7, 'loss': 9.2224702835083}
{'epoch': 0, 'batch': 8, 'loss': 9.837698936462402}
{'epoch': 0, 'batch': 9, 'loss': 9.28374195098877}
{'epoch': 0, 'batch': 10, 'loss': 9.174955368041992}
{'epoch': 0, 'batch': 11, 'loss': 8.725141525268555}
{'epoch': 0, 'batch': 12, 'loss': 8.471175193786621}
{'epoch': 0, 'batch': 13, 'loss': 8.437949180603027}
{'epoch': 0, 'batch': 14, 'loss': 8.3910493850708}
{'epoch': 0, 'batch': 15, 'loss': 7.9011030197143555}
{'epoch': 0, 'batch': 16, 'loss': 7.97749662399292}
{'epoch': 0, 'batch': 17, 'loss': 7.654041290283203}
{'epoch': 0, 'batch': 18, 'loss': 7.4477009773254395}
{

{'epoch': 0, 'batch': 154, 'loss': 6.660232067108154}
{'epoch': 0, 'batch': 155, 'loss': 7.168051719665527}
{'epoch': 0, 'batch': 156, 'loss': 7.212050914764404}
{'epoch': 0, 'batch': 157, 'loss': 7.411373138427734}
{'epoch': 0, 'batch': 158, 'loss': 7.166880130767822}
{'epoch': 0, 'batch': 159, 'loss': 6.744512557983398}
{'epoch': 0, 'batch': 160, 'loss': 7.136436939239502}
{'epoch': 0, 'batch': 161, 'loss': 7.030271530151367}
{'epoch': 0, 'batch': 162, 'loss': 7.155222415924072}
{'epoch': 0, 'batch': 163, 'loss': 6.858227729797363}
{'epoch': 0, 'batch': 164, 'loss': 6.665462493896484}
{'epoch': 0, 'batch': 165, 'loss': 6.981253623962402}
{'epoch': 0, 'batch': 166, 'loss': 7.136292934417725}
{'epoch': 0, 'batch': 167, 'loss': 6.851579666137695}
{'epoch': 0, 'batch': 168, 'loss': 6.867325782775879}
{'epoch': 0, 'batch': 169, 'loss': 6.765490531921387}
{'epoch': 0, 'batch': 170, 'loss': 6.880496978759766}
{'epoch': 0, 'batch': 171, 'loss': 7.343597412109375}
{'epoch': 0, 'batch': 172, '

{'epoch': 0, 'batch': 306, 'loss': 7.2242817878723145}
{'epoch': 0, 'batch': 307, 'loss': 7.0748491287231445}
{'epoch': 0, 'batch': 308, 'loss': 7.018703937530518}
{'epoch': 0, 'batch': 309, 'loss': 7.035366058349609}
{'epoch': 0, 'batch': 310, 'loss': 7.201539993286133}
{'epoch': 0, 'batch': 311, 'loss': 7.155364036560059}
{'epoch': 0, 'batch': 312, 'loss': 7.457404613494873}
{'epoch': 0, 'batch': 313, 'loss': 7.635278224945068}
{'epoch': 0, 'batch': 314, 'loss': 7.448719501495361}
{'epoch': 0, 'batch': 315, 'loss': 7.018942832946777}
{'epoch': 0, 'batch': 316, 'loss': 7.0924859046936035}
{'epoch': 0, 'batch': 317, 'loss': 7.093681812286377}
{'epoch': 0, 'batch': 318, 'loss': 7.251557350158691}
{'epoch': 0, 'batch': 319, 'loss': 7.0964579582214355}
{'epoch': 0, 'batch': 320, 'loss': 7.186403751373291}
{'epoch': 0, 'batch': 321, 'loss': 7.280016899108887}
{'epoch': 0, 'batch': 322, 'loss': 7.165194988250732}
{'epoch': 0, 'batch': 323, 'loss': 6.996649265289307}
{'epoch': 0, 'batch': 32

{'epoch': 0, 'batch': 458, 'loss': 7.1430840492248535}
{'epoch': 0, 'batch': 459, 'loss': 6.90346622467041}
{'epoch': 0, 'batch': 460, 'loss': 6.81420373916626}
{'epoch': 0, 'batch': 461, 'loss': 6.644617557525635}
{'epoch': 0, 'batch': 462, 'loss': 6.767252445220947}
{'epoch': 0, 'batch': 463, 'loss': 7.016932010650635}
{'epoch': 0, 'batch': 464, 'loss': 6.708754539489746}
{'epoch': 0, 'batch': 465, 'loss': 6.987767219543457}
{'epoch': 0, 'batch': 466, 'loss': 7.319790363311768}
{'epoch': 0, 'batch': 467, 'loss': 7.278587341308594}
{'epoch': 0, 'batch': 468, 'loss': 7.139537334442139}
{'epoch': 0, 'batch': 469, 'loss': 7.045688629150391}
{'epoch': 0, 'batch': 470, 'loss': 6.968596935272217}
{'epoch': 0, 'batch': 471, 'loss': 6.992384433746338}
{'epoch': 0, 'batch': 472, 'loss': 6.957716464996338}
{'epoch': 0, 'batch': 473, 'loss': 7.021686553955078}
{'epoch': 0, 'batch': 474, 'loss': 6.834214210510254}
{'epoch': 0, 'batch': 475, 'loss': 7.176138401031494}
{'epoch': 0, 'batch': 476, 'l

{'epoch': 0, 'batch': 610, 'loss': 7.077310562133789}
{'epoch': 0, 'batch': 611, 'loss': 7.128796577453613}
{'epoch': 0, 'batch': 612, 'loss': 7.2265424728393555}
{'epoch': 0, 'batch': 613, 'loss': 6.866949081420898}
{'epoch': 0, 'batch': 614, 'loss': 7.692000389099121}
{'epoch': 0, 'batch': 615, 'loss': 7.081242561340332}
{'epoch': 0, 'batch': 616, 'loss': 7.01769495010376}
{'epoch': 0, 'batch': 617, 'loss': 7.14919900894165}
{'epoch': 0, 'batch': 618, 'loss': 6.826390743255615}
{'epoch': 0, 'batch': 619, 'loss': 6.728329181671143}
{'epoch': 0, 'batch': 620, 'loss': 6.750149726867676}
{'epoch': 0, 'batch': 621, 'loss': 6.742939472198486}
{'epoch': 0, 'batch': 622, 'loss': 6.864295959472656}
{'epoch': 0, 'batch': 623, 'loss': 7.1252264976501465}
{'epoch': 0, 'batch': 624, 'loss': 6.772565841674805}
{'epoch': 0, 'batch': 625, 'loss': 6.655148029327393}
{'epoch': 0, 'batch': 626, 'loss': 6.83991813659668}
{'epoch': 0, 'batch': 627, 'loss': 6.848410606384277}
{'epoch': 0, 'batch': 628, 'l

{'epoch': 0, 'batch': 762, 'loss': 6.7953619956970215}
{'epoch': 0, 'batch': 763, 'loss': 6.685155391693115}
{'epoch': 0, 'batch': 764, 'loss': 6.8741774559021}
{'epoch': 0, 'batch': 765, 'loss': 6.930112838745117}
{'epoch': 0, 'batch': 766, 'loss': 6.9910478591918945}
{'epoch': 0, 'batch': 767, 'loss': 6.98037576675415}
{'epoch': 0, 'batch': 768, 'loss': 6.9903411865234375}
{'epoch': 0, 'batch': 769, 'loss': 7.7235846519470215}
{'epoch': 0, 'batch': 770, 'loss': 7.45852518081665}
{'epoch': 0, 'batch': 771, 'loss': 6.691357612609863}
{'epoch': 0, 'batch': 772, 'loss': 6.871079444885254}
{'epoch': 0, 'batch': 773, 'loss': 7.307383060455322}
{'epoch': 0, 'batch': 774, 'loss': 7.371868133544922}
{'epoch': 0, 'batch': 775, 'loss': 7.619465351104736}
{'epoch': 0, 'batch': 776, 'loss': 7.1316022872924805}
{'epoch': 0, 'batch': 777, 'loss': 7.082862854003906}
{'epoch': 0, 'batch': 778, 'loss': 6.944540500640869}
{'epoch': 0, 'batch': 779, 'loss': 6.8359832763671875}
{'epoch': 0, 'batch': 780,

{'epoch': 0, 'batch': 914, 'loss': 6.8138604164123535}
{'epoch': 0, 'batch': 915, 'loss': 6.945840835571289}
{'epoch': 0, 'batch': 916, 'loss': 6.582479476928711}
{'epoch': 0, 'batch': 917, 'loss': 7.275150299072266}
{'epoch': 0, 'batch': 918, 'loss': 7.036743640899658}
{'epoch': 0, 'batch': 919, 'loss': 6.896518707275391}
{'epoch': 0, 'batch': 920, 'loss': 7.04201078414917}
{'epoch': 0, 'batch': 921, 'loss': 6.56638765335083}
{'epoch': 0, 'batch': 922, 'loss': 6.537940979003906}
{'epoch': 0, 'batch': 923, 'loss': 6.677292823791504}
{'epoch': 0, 'batch': 924, 'loss': 7.117734909057617}
{'epoch': 0, 'batch': 925, 'loss': 7.448008060455322}
{'epoch': 0, 'batch': 926, 'loss': 7.086103916168213}
{'epoch': 0, 'batch': 927, 'loss': 7.096948146820068}
{'epoch': 0, 'batch': 928, 'loss': 6.803118705749512}
{'epoch': 0, 'batch': 929, 'loss': 6.766688823699951}
{'epoch': 0, 'batch': 930, 'loss': 6.874302387237549}
{'epoch': 0, 'batch': 931, 'loss': 6.789408206939697}
{'epoch': 0, 'batch': 932, 'l

{'epoch': 1, 'batch': 93, 'loss': 6.1644463539123535}
{'epoch': 1, 'batch': 94, 'loss': 6.548094749450684}
{'epoch': 1, 'batch': 95, 'loss': 6.758894443511963}
{'epoch': 1, 'batch': 96, 'loss': 6.7803778648376465}
{'epoch': 1, 'batch': 97, 'loss': 6.696542739868164}
{'epoch': 1, 'batch': 98, 'loss': 6.989938735961914}
{'epoch': 1, 'batch': 99, 'loss': 6.635509967803955}
{'epoch': 1, 'batch': 100, 'loss': 6.684018611907959}
{'epoch': 1, 'batch': 101, 'loss': 6.644713401794434}
{'epoch': 1, 'batch': 102, 'loss': 6.594004154205322}
{'epoch': 1, 'batch': 103, 'loss': 6.452523231506348}
{'epoch': 1, 'batch': 104, 'loss': 6.288760662078857}
{'epoch': 1, 'batch': 105, 'loss': 6.516221523284912}
{'epoch': 1, 'batch': 106, 'loss': 6.277303695678711}
{'epoch': 1, 'batch': 107, 'loss': 6.38539981842041}
{'epoch': 1, 'batch': 108, 'loss': 6.270321369171143}
{'epoch': 1, 'batch': 109, 'loss': 6.576918601989746}
{'epoch': 1, 'batch': 110, 'loss': 6.471518516540527}
{'epoch': 1, 'batch': 111, 'loss':

{'epoch': 1, 'batch': 245, 'loss': 6.652339458465576}
{'epoch': 1, 'batch': 246, 'loss': 6.4165449142456055}
{'epoch': 1, 'batch': 247, 'loss': 6.954530239105225}
{'epoch': 1, 'batch': 248, 'loss': 6.655781269073486}
{'epoch': 1, 'batch': 249, 'loss': 6.478084087371826}
{'epoch': 1, 'batch': 250, 'loss': 6.414822101593018}
{'epoch': 1, 'batch': 251, 'loss': 6.418970108032227}
{'epoch': 1, 'batch': 252, 'loss': 6.735383033752441}
{'epoch': 1, 'batch': 253, 'loss': 6.9552717208862305}
{'epoch': 1, 'batch': 254, 'loss': 6.575913429260254}
{'epoch': 1, 'batch': 255, 'loss': 6.3178887367248535}
{'epoch': 1, 'batch': 256, 'loss': 6.719952583312988}
{'epoch': 1, 'batch': 257, 'loss': 6.694210052490234}
{'epoch': 1, 'batch': 258, 'loss': 6.827040195465088}
{'epoch': 1, 'batch': 259, 'loss': 6.512190341949463}
{'epoch': 1, 'batch': 260, 'loss': 6.824898719787598}
{'epoch': 1, 'batch': 261, 'loss': 6.276915550231934}
{'epoch': 1, 'batch': 262, 'loss': 6.754120826721191}
{'epoch': 1, 'batch': 263

{'epoch': 1, 'batch': 397, 'loss': 6.648495197296143}
{'epoch': 1, 'batch': 398, 'loss': 6.417148590087891}
{'epoch': 1, 'batch': 399, 'loss': 6.371631622314453}
{'epoch': 1, 'batch': 400, 'loss': 6.373317718505859}
{'epoch': 1, 'batch': 401, 'loss': 6.4127936363220215}
{'epoch': 1, 'batch': 402, 'loss': 6.246881484985352}
{'epoch': 1, 'batch': 403, 'loss': 6.554055690765381}
{'epoch': 1, 'batch': 404, 'loss': 6.249573707580566}
{'epoch': 1, 'batch': 405, 'loss': 6.211206912994385}
{'epoch': 1, 'batch': 406, 'loss': 6.164231300354004}
{'epoch': 1, 'batch': 407, 'loss': 6.076328754425049}
{'epoch': 1, 'batch': 408, 'loss': 6.218987941741943}
{'epoch': 1, 'batch': 409, 'loss': 6.282060623168945}
{'epoch': 1, 'batch': 410, 'loss': 6.605174541473389}
{'epoch': 1, 'batch': 411, 'loss': 6.510749340057373}
{'epoch': 1, 'batch': 412, 'loss': 6.621711730957031}
{'epoch': 1, 'batch': 413, 'loss': 6.551941871643066}
{'epoch': 1, 'batch': 414, 'loss': 6.477062702178955}
{'epoch': 1, 'batch': 415, 

{'epoch': 1, 'batch': 549, 'loss': 6.715019226074219}
{'epoch': 1, 'batch': 550, 'loss': 6.2604756355285645}
{'epoch': 1, 'batch': 551, 'loss': 6.225192070007324}
{'epoch': 1, 'batch': 552, 'loss': 6.44139289855957}
{'epoch': 1, 'batch': 553, 'loss': 6.604818820953369}
{'epoch': 1, 'batch': 554, 'loss': 6.244235515594482}
{'epoch': 1, 'batch': 555, 'loss': 6.483604431152344}
{'epoch': 1, 'batch': 556, 'loss': 6.489309310913086}
{'epoch': 1, 'batch': 557, 'loss': 5.903402805328369}
{'epoch': 1, 'batch': 558, 'loss': 6.33005952835083}
{'epoch': 1, 'batch': 559, 'loss': 6.870400905609131}
{'epoch': 1, 'batch': 560, 'loss': 6.263669013977051}
{'epoch': 1, 'batch': 561, 'loss': 6.306458473205566}
{'epoch': 1, 'batch': 562, 'loss': 6.678685665130615}
{'epoch': 1, 'batch': 563, 'loss': 6.5741658210754395}
{'epoch': 1, 'batch': 564, 'loss': 5.829837799072266}
{'epoch': 1, 'batch': 565, 'loss': 6.074321746826172}
{'epoch': 1, 'batch': 566, 'loss': 6.192436218261719}
{'epoch': 1, 'batch': 567, '

{'epoch': 1, 'batch': 701, 'loss': 6.428238391876221}
{'epoch': 1, 'batch': 702, 'loss': 6.511171340942383}
{'epoch': 1, 'batch': 703, 'loss': 6.341911792755127}
{'epoch': 1, 'batch': 704, 'loss': 6.125583171844482}
{'epoch': 1, 'batch': 705, 'loss': 6.1131911277771}
{'epoch': 1, 'batch': 706, 'loss': 6.39707612991333}
{'epoch': 1, 'batch': 707, 'loss': 6.623621940612793}
{'epoch': 1, 'batch': 708, 'loss': 6.460173606872559}
{'epoch': 1, 'batch': 709, 'loss': 6.442934513092041}
{'epoch': 1, 'batch': 710, 'loss': 6.567896842956543}
{'epoch': 1, 'batch': 711, 'loss': 6.270427227020264}
{'epoch': 1, 'batch': 712, 'loss': 6.608908653259277}
{'epoch': 1, 'batch': 713, 'loss': 6.935857772827148}
{'epoch': 1, 'batch': 714, 'loss': 6.176178455352783}
{'epoch': 1, 'batch': 715, 'loss': 6.758269786834717}
{'epoch': 1, 'batch': 716, 'loss': 6.402285575866699}
{'epoch': 1, 'batch': 717, 'loss': 6.269181251525879}
{'epoch': 1, 'batch': 718, 'loss': 6.518580436706543}
{'epoch': 1, 'batch': 719, 'los

{'epoch': 1, 'batch': 853, 'loss': 6.6262383460998535}
{'epoch': 1, 'batch': 854, 'loss': 6.254335403442383}
{'epoch': 1, 'batch': 855, 'loss': 6.228623867034912}
{'epoch': 1, 'batch': 856, 'loss': 6.153354167938232}
{'epoch': 1, 'batch': 857, 'loss': 6.119211673736572}
{'epoch': 1, 'batch': 858, 'loss': 6.288168907165527}
{'epoch': 1, 'batch': 859, 'loss': 6.496483325958252}
{'epoch': 1, 'batch': 860, 'loss': 6.5392584800720215}
{'epoch': 1, 'batch': 861, 'loss': 6.619375228881836}
{'epoch': 1, 'batch': 862, 'loss': 6.770121097564697}
{'epoch': 1, 'batch': 863, 'loss': 6.740189552307129}
{'epoch': 1, 'batch': 864, 'loss': 6.4979634284973145}
{'epoch': 1, 'batch': 865, 'loss': 6.129970550537109}
{'epoch': 1, 'batch': 866, 'loss': 6.546166896820068}
{'epoch': 1, 'batch': 867, 'loss': 6.505841255187988}
{'epoch': 1, 'batch': 868, 'loss': 6.725098609924316}
{'epoch': 1, 'batch': 869, 'loss': 6.254918098449707}
{'epoch': 1, 'batch': 870, 'loss': 6.219594478607178}
{'epoch': 1, 'batch': 871

{'epoch': 2, 'batch': 31, 'loss': 6.1718292236328125}
{'epoch': 2, 'batch': 32, 'loss': 6.478074550628662}
{'epoch': 2, 'batch': 33, 'loss': 6.235488414764404}
{'epoch': 2, 'batch': 34, 'loss': 6.303553104400635}
{'epoch': 2, 'batch': 35, 'loss': 6.475663185119629}
{'epoch': 2, 'batch': 36, 'loss': 6.257676601409912}
{'epoch': 2, 'batch': 37, 'loss': 6.495858669281006}
{'epoch': 2, 'batch': 38, 'loss': 6.5564069747924805}
{'epoch': 2, 'batch': 39, 'loss': 6.374903202056885}
{'epoch': 2, 'batch': 40, 'loss': 6.333466529846191}
{'epoch': 2, 'batch': 41, 'loss': 6.658592700958252}
{'epoch': 2, 'batch': 42, 'loss': 6.3128228187561035}
{'epoch': 2, 'batch': 43, 'loss': 6.39862585067749}
{'epoch': 2, 'batch': 44, 'loss': 6.603416919708252}
{'epoch': 2, 'batch': 45, 'loss': 6.837771892547607}
{'epoch': 2, 'batch': 46, 'loss': 7.042541980743408}
{'epoch': 2, 'batch': 47, 'loss': 6.3331708908081055}
{'epoch': 2, 'batch': 48, 'loss': 6.478879451751709}
{'epoch': 2, 'batch': 49, 'loss': 6.4113101

{'epoch': 2, 'batch': 184, 'loss': 5.914414882659912}
{'epoch': 2, 'batch': 185, 'loss': 5.778608798980713}
{'epoch': 2, 'batch': 186, 'loss': 6.175919055938721}
{'epoch': 2, 'batch': 187, 'loss': 6.214388847351074}
{'epoch': 2, 'batch': 188, 'loss': 6.068465709686279}
{'epoch': 2, 'batch': 189, 'loss': 5.711819648742676}
{'epoch': 2, 'batch': 190, 'loss': 5.7653350830078125}
{'epoch': 2, 'batch': 191, 'loss': 6.110199451446533}
{'epoch': 2, 'batch': 192, 'loss': 6.22351598739624}
{'epoch': 2, 'batch': 193, 'loss': 6.074518203735352}
{'epoch': 2, 'batch': 194, 'loss': 5.695709228515625}
{'epoch': 2, 'batch': 195, 'loss': 5.82639741897583}
{'epoch': 2, 'batch': 196, 'loss': 5.805387020111084}
{'epoch': 2, 'batch': 197, 'loss': 6.078313827514648}
{'epoch': 2, 'batch': 198, 'loss': 6.247896194458008}
{'epoch': 2, 'batch': 199, 'loss': 6.367629051208496}
{'epoch': 2, 'batch': 200, 'loss': 6.3066816329956055}
{'epoch': 2, 'batch': 201, 'loss': 6.691580772399902}
{'epoch': 2, 'batch': 202, '

{'epoch': 2, 'batch': 336, 'loss': 6.3199782371521}
{'epoch': 2, 'batch': 337, 'loss': 6.216451644897461}
{'epoch': 2, 'batch': 338, 'loss': 6.6779656410217285}
{'epoch': 2, 'batch': 339, 'loss': 6.192346572875977}
{'epoch': 2, 'batch': 340, 'loss': 6.365652561187744}
{'epoch': 2, 'batch': 341, 'loss': 6.1359663009643555}
{'epoch': 2, 'batch': 342, 'loss': 6.139327526092529}
{'epoch': 2, 'batch': 343, 'loss': 6.054029941558838}
{'epoch': 2, 'batch': 344, 'loss': 6.546485900878906}
{'epoch': 2, 'batch': 345, 'loss': 6.585634231567383}
{'epoch': 2, 'batch': 346, 'loss': 6.311122894287109}
{'epoch': 2, 'batch': 347, 'loss': 6.44575834274292}
{'epoch': 2, 'batch': 348, 'loss': 5.888539791107178}
{'epoch': 2, 'batch': 349, 'loss': 6.38872766494751}
{'epoch': 2, 'batch': 350, 'loss': 5.743622303009033}
{'epoch': 2, 'batch': 351, 'loss': 5.8059844970703125}
{'epoch': 2, 'batch': 352, 'loss': 6.3177056312561035}
{'epoch': 2, 'batch': 353, 'loss': 5.9927144050598145}
{'epoch': 2, 'batch': 354, 

{'epoch': 2, 'batch': 488, 'loss': 6.075680255889893}
{'epoch': 2, 'batch': 489, 'loss': 6.251200199127197}
{'epoch': 2, 'batch': 490, 'loss': 6.057116508483887}
{'epoch': 2, 'batch': 491, 'loss': 5.908731937408447}
{'epoch': 2, 'batch': 492, 'loss': 6.325166702270508}
{'epoch': 2, 'batch': 493, 'loss': 6.1072678565979}
{'epoch': 2, 'batch': 494, 'loss': 5.6932878494262695}
{'epoch': 2, 'batch': 495, 'loss': 6.164165019989014}
{'epoch': 2, 'batch': 496, 'loss': 6.146101474761963}
{'epoch': 2, 'batch': 497, 'loss': 5.897745132446289}
{'epoch': 2, 'batch': 498, 'loss': 6.2607927322387695}
{'epoch': 2, 'batch': 499, 'loss': 6.252042770385742}
{'epoch': 2, 'batch': 500, 'loss': 5.970746040344238}
{'epoch': 2, 'batch': 501, 'loss': 6.281947135925293}
{'epoch': 2, 'batch': 502, 'loss': 6.3406548500061035}
{'epoch': 2, 'batch': 503, 'loss': 6.0685930252075195}
{'epoch': 2, 'batch': 504, 'loss': 6.128519058227539}
{'epoch': 2, 'batch': 505, 'loss': 6.081819534301758}
{'epoch': 2, 'batch': 506,

{'epoch': 2, 'batch': 640, 'loss': 6.311192989349365}
{'epoch': 2, 'batch': 641, 'loss': 6.097634792327881}
{'epoch': 2, 'batch': 642, 'loss': 5.854513645172119}
{'epoch': 2, 'batch': 643, 'loss': 6.2658491134643555}
{'epoch': 2, 'batch': 644, 'loss': 6.165324687957764}
{'epoch': 2, 'batch': 645, 'loss': 5.789002418518066}
{'epoch': 2, 'batch': 646, 'loss': 5.6567182540893555}
{'epoch': 2, 'batch': 647, 'loss': 5.69035005569458}
{'epoch': 2, 'batch': 648, 'loss': 5.922977447509766}
{'epoch': 2, 'batch': 649, 'loss': 6.519774913787842}
{'epoch': 2, 'batch': 650, 'loss': 6.16123104095459}
{'epoch': 2, 'batch': 651, 'loss': 5.995272159576416}
{'epoch': 2, 'batch': 652, 'loss': 6.353593349456787}
{'epoch': 2, 'batch': 653, 'loss': 6.1063032150268555}
{'epoch': 2, 'batch': 654, 'loss': 5.931481838226318}
{'epoch': 2, 'batch': 655, 'loss': 5.811443328857422}
{'epoch': 2, 'batch': 656, 'loss': 5.757053852081299}
{'epoch': 2, 'batch': 657, 'loss': 5.840287685394287}
{'epoch': 2, 'batch': 658, 

{'epoch': 2, 'batch': 792, 'loss': 6.2156476974487305}
{'epoch': 2, 'batch': 793, 'loss': 6.481188774108887}
{'epoch': 2, 'batch': 794, 'loss': 6.13112211227417}
{'epoch': 2, 'batch': 795, 'loss': 6.130590438842773}
{'epoch': 2, 'batch': 796, 'loss': 6.081555366516113}
{'epoch': 2, 'batch': 797, 'loss': 6.34813928604126}
{'epoch': 2, 'batch': 798, 'loss': 6.207736015319824}
{'epoch': 2, 'batch': 799, 'loss': 5.944058418273926}
{'epoch': 2, 'batch': 800, 'loss': 6.146595478057861}
{'epoch': 2, 'batch': 801, 'loss': 6.562983512878418}
{'epoch': 2, 'batch': 802, 'loss': 6.5393967628479}
{'epoch': 2, 'batch': 803, 'loss': 6.471052646636963}
{'epoch': 2, 'batch': 804, 'loss': 5.89448881149292}
{'epoch': 2, 'batch': 805, 'loss': 6.611390590667725}
{'epoch': 2, 'batch': 806, 'loss': 5.789970397949219}
{'epoch': 2, 'batch': 807, 'loss': 6.247594356536865}
{'epoch': 2, 'batch': 808, 'loss': 6.207002639770508}
{'epoch': 2, 'batch': 809, 'loss': 6.095191478729248}
{'epoch': 2, 'batch': 810, 'loss

{'epoch': 2, 'batch': 944, 'loss': 6.108103275299072}
{'epoch': 2, 'batch': 945, 'loss': 6.071681499481201}
{'epoch': 2, 'batch': 946, 'loss': 6.0536909103393555}
{'epoch': 2, 'batch': 947, 'loss': 6.163371562957764}
{'epoch': 2, 'batch': 948, 'loss': 5.802353382110596}
{'epoch': 2, 'batch': 949, 'loss': 6.5758466720581055}
{'epoch': 2, 'batch': 950, 'loss': 6.3404669761657715}
{'epoch': 2, 'batch': 951, 'loss': 6.208310127258301}
{'epoch': 2, 'batch': 952, 'loss': 6.019814491271973}
{'epoch': 2, 'batch': 953, 'loss': 6.398345947265625}
{'epoch': 2, 'batch': 954, 'loss': 6.275044918060303}
{'epoch': 2, 'batch': 955, 'loss': 5.7470598220825195}
{'epoch': 2, 'batch': 956, 'loss': 6.256466865539551}
{'epoch': 2, 'batch': 957, 'loss': 5.680825710296631}
{'epoch': 2, 'batch': 958, 'loss': 5.677858829498291}
{'epoch': 2, 'batch': 959, 'loss': 6.095785140991211}
{'epoch': 2, 'batch': 960, 'loss': 6.385708332061768}
{'epoch': 2, 'batch': 961, 'loss': 6.163724899291992}
{'epoch': 2, 'batch': 96

{'epoch': 3, 'batch': 123, 'loss': 5.865065097808838}
{'epoch': 3, 'batch': 124, 'loss': 6.383993148803711}
{'epoch': 3, 'batch': 125, 'loss': 6.4117207527160645}
{'epoch': 3, 'batch': 126, 'loss': 6.135435581207275}
{'epoch': 3, 'batch': 127, 'loss': 5.90992546081543}
{'epoch': 3, 'batch': 128, 'loss': 5.825732707977295}
{'epoch': 3, 'batch': 129, 'loss': 5.840992450714111}
{'epoch': 3, 'batch': 130, 'loss': 6.346525192260742}
{'epoch': 3, 'batch': 131, 'loss': 6.215036869049072}
{'epoch': 3, 'batch': 132, 'loss': 6.395806789398193}
{'epoch': 3, 'batch': 133, 'loss': 5.725799083709717}
{'epoch': 3, 'batch': 134, 'loss': 5.855806827545166}
{'epoch': 3, 'batch': 135, 'loss': 5.811298847198486}
{'epoch': 3, 'batch': 136, 'loss': 6.2633137702941895}
{'epoch': 3, 'batch': 137, 'loss': 6.246237754821777}
{'epoch': 3, 'batch': 138, 'loss': 6.141484260559082}
{'epoch': 3, 'batch': 139, 'loss': 5.970004558563232}
{'epoch': 3, 'batch': 140, 'loss': 6.1968302726745605}
{'epoch': 3, 'batch': 141,

{'epoch': 3, 'batch': 275, 'loss': 5.812201023101807}
{'epoch': 3, 'batch': 276, 'loss': 6.1786627769470215}
{'epoch': 3, 'batch': 277, 'loss': 6.168055057525635}
{'epoch': 3, 'batch': 278, 'loss': 6.106355667114258}
{'epoch': 3, 'batch': 279, 'loss': 5.68568229675293}
{'epoch': 3, 'batch': 280, 'loss': 6.138625144958496}
{'epoch': 3, 'batch': 281, 'loss': 6.330448150634766}
{'epoch': 3, 'batch': 282, 'loss': 6.2619194984436035}
{'epoch': 3, 'batch': 283, 'loss': 6.352942943572998}
{'epoch': 3, 'batch': 284, 'loss': 6.100482940673828}
{'epoch': 3, 'batch': 285, 'loss': 5.991636753082275}
{'epoch': 3, 'batch': 286, 'loss': 6.057972431182861}
{'epoch': 3, 'batch': 287, 'loss': 6.173856258392334}
{'epoch': 3, 'batch': 288, 'loss': 6.291110515594482}
{'epoch': 3, 'batch': 289, 'loss': 6.265645503997803}
{'epoch': 3, 'batch': 290, 'loss': 6.3452067375183105}
{'epoch': 3, 'batch': 291, 'loss': 5.743527412414551}
{'epoch': 3, 'batch': 292, 'loss': 5.863327980041504}
{'epoch': 3, 'batch': 293,

{'epoch': 3, 'batch': 427, 'loss': 5.954967975616455}
{'epoch': 3, 'batch': 428, 'loss': 5.80207633972168}
{'epoch': 3, 'batch': 429, 'loss': 5.615940570831299}
{'epoch': 3, 'batch': 430, 'loss': 6.191298961639404}
{'epoch': 3, 'batch': 431, 'loss': 6.034038066864014}
{'epoch': 3, 'batch': 432, 'loss': 6.824764728546143}
{'epoch': 3, 'batch': 433, 'loss': 6.297305107116699}
{'epoch': 3, 'batch': 434, 'loss': 5.882212162017822}
{'epoch': 3, 'batch': 435, 'loss': 5.83601713180542}
{'epoch': 3, 'batch': 436, 'loss': 6.1204609870910645}
{'epoch': 3, 'batch': 437, 'loss': 6.012944221496582}
{'epoch': 3, 'batch': 438, 'loss': 5.895730495452881}
{'epoch': 3, 'batch': 439, 'loss': 6.098954200744629}
{'epoch': 3, 'batch': 440, 'loss': 6.05414342880249}
{'epoch': 3, 'batch': 441, 'loss': 6.01723051071167}
{'epoch': 3, 'batch': 442, 'loss': 6.607946395874023}
{'epoch': 3, 'batch': 443, 'loss': 6.385895252227783}
{'epoch': 3, 'batch': 444, 'loss': 5.9802327156066895}
{'epoch': 3, 'batch': 445, 'lo

{'epoch': 3, 'batch': 579, 'loss': 5.633480072021484}
{'epoch': 3, 'batch': 580, 'loss': 5.8831915855407715}
{'epoch': 3, 'batch': 581, 'loss': 5.966063976287842}
{'epoch': 3, 'batch': 582, 'loss': 5.979305744171143}
{'epoch': 3, 'batch': 583, 'loss': 6.053197383880615}
{'epoch': 3, 'batch': 584, 'loss': 6.073820114135742}
{'epoch': 3, 'batch': 585, 'loss': 5.7278151512146}
{'epoch': 3, 'batch': 586, 'loss': 5.477036952972412}
{'epoch': 3, 'batch': 587, 'loss': 5.546528339385986}
{'epoch': 3, 'batch': 588, 'loss': 5.598086357116699}
{'epoch': 3, 'batch': 589, 'loss': 6.004692554473877}
{'epoch': 3, 'batch': 590, 'loss': 6.014562606811523}
{'epoch': 3, 'batch': 591, 'loss': 5.635547161102295}
{'epoch': 3, 'batch': 592, 'loss': 6.082106590270996}
{'epoch': 3, 'batch': 593, 'loss': 5.415946006774902}
{'epoch': 3, 'batch': 594, 'loss': 5.8234758377075195}
{'epoch': 3, 'batch': 595, 'loss': 5.94652795791626}
{'epoch': 3, 'batch': 596, 'loss': 5.797362804412842}
{'epoch': 3, 'batch': 597, 'l

{'epoch': 3, 'batch': 731, 'loss': 5.884931564331055}
{'epoch': 3, 'batch': 732, 'loss': 6.094631671905518}
{'epoch': 3, 'batch': 733, 'loss': 5.958387851715088}
{'epoch': 3, 'batch': 734, 'loss': 6.28835391998291}
{'epoch': 3, 'batch': 735, 'loss': 5.72259521484375}
{'epoch': 3, 'batch': 736, 'loss': 5.728247165679932}
{'epoch': 3, 'batch': 737, 'loss': 5.770272254943848}
{'epoch': 3, 'batch': 738, 'loss': 5.941182613372803}
{'epoch': 3, 'batch': 739, 'loss': 6.10700798034668}
{'epoch': 3, 'batch': 740, 'loss': 6.006363391876221}
{'epoch': 3, 'batch': 741, 'loss': 5.979638576507568}
{'epoch': 3, 'batch': 742, 'loss': 6.157285213470459}
{'epoch': 3, 'batch': 743, 'loss': 6.282120704650879}
{'epoch': 3, 'batch': 744, 'loss': 6.312678813934326}
{'epoch': 3, 'batch': 745, 'loss': 6.315952777862549}
{'epoch': 3, 'batch': 746, 'loss': 6.408872604370117}
{'epoch': 3, 'batch': 747, 'loss': 6.386263370513916}
{'epoch': 3, 'batch': 748, 'loss': 5.977960109710693}
{'epoch': 3, 'batch': 749, 'los

{'epoch': 3, 'batch': 883, 'loss': 5.9284348487854}
{'epoch': 3, 'batch': 884, 'loss': 5.895592212677002}
{'epoch': 3, 'batch': 885, 'loss': 5.7879438400268555}
{'epoch': 3, 'batch': 886, 'loss': 6.086190700531006}
{'epoch': 3, 'batch': 887, 'loss': 5.789577960968018}
{'epoch': 3, 'batch': 888, 'loss': 5.46402645111084}
{'epoch': 3, 'batch': 889, 'loss': 5.233313083648682}
{'epoch': 3, 'batch': 890, 'loss': 5.77859354019165}
{'epoch': 3, 'batch': 891, 'loss': 6.075846195220947}
{'epoch': 3, 'batch': 892, 'loss': 5.18442964553833}
{'epoch': 3, 'batch': 893, 'loss': 5.5501837730407715}
{'epoch': 3, 'batch': 894, 'loss': 5.8216047286987305}
{'epoch': 3, 'batch': 895, 'loss': 5.6820173263549805}
{'epoch': 3, 'batch': 896, 'loss': 5.674793720245361}
{'epoch': 3, 'batch': 897, 'loss': 5.927699565887451}
{'epoch': 3, 'batch': 898, 'loss': 6.077657222747803}
{'epoch': 3, 'batch': 899, 'loss': 5.764062881469727}
{'epoch': 3, 'batch': 900, 'loss': 5.942456245422363}
{'epoch': 3, 'batch': 901, 'l

{'epoch': 4, 'batch': 61, 'loss': 5.594220161437988}
{'epoch': 4, 'batch': 62, 'loss': 5.592407703399658}
{'epoch': 4, 'batch': 63, 'loss': 5.5253143310546875}
{'epoch': 4, 'batch': 64, 'loss': 5.552615165710449}
{'epoch': 4, 'batch': 65, 'loss': 5.872292995452881}
{'epoch': 4, 'batch': 66, 'loss': 5.578512668609619}
{'epoch': 4, 'batch': 67, 'loss': 5.645379066467285}
{'epoch': 4, 'batch': 68, 'loss': 5.605221271514893}
{'epoch': 4, 'batch': 69, 'loss': 5.356546878814697}
{'epoch': 4, 'batch': 70, 'loss': 5.512678623199463}
{'epoch': 4, 'batch': 71, 'loss': 5.9360551834106445}
{'epoch': 4, 'batch': 72, 'loss': 5.851337909698486}
{'epoch': 4, 'batch': 73, 'loss': 5.867268085479736}
{'epoch': 4, 'batch': 74, 'loss': 5.769730091094971}
{'epoch': 4, 'batch': 75, 'loss': 5.719223976135254}
{'epoch': 4, 'batch': 76, 'loss': 5.3975443840026855}
{'epoch': 4, 'batch': 77, 'loss': 6.022533893585205}
{'epoch': 4, 'batch': 78, 'loss': 5.910704135894775}
{'epoch': 4, 'batch': 79, 'loss': 5.5688776

{'epoch': 4, 'batch': 214, 'loss': 5.8382110595703125}
{'epoch': 4, 'batch': 215, 'loss': 5.682613849639893}
{'epoch': 4, 'batch': 216, 'loss': 6.172520637512207}
{'epoch': 4, 'batch': 217, 'loss': 6.333005905151367}
{'epoch': 4, 'batch': 218, 'loss': 5.687230587005615}
{'epoch': 4, 'batch': 219, 'loss': 5.66881799697876}
{'epoch': 4, 'batch': 220, 'loss': 5.811617851257324}
{'epoch': 4, 'batch': 221, 'loss': 5.811025142669678}
{'epoch': 4, 'batch': 222, 'loss': 5.952812194824219}
{'epoch': 4, 'batch': 223, 'loss': 5.634312629699707}
{'epoch': 4, 'batch': 224, 'loss': 5.664553165435791}
{'epoch': 4, 'batch': 225, 'loss': 5.725430488586426}
{'epoch': 4, 'batch': 226, 'loss': 5.696373462677002}
{'epoch': 4, 'batch': 227, 'loss': 5.7712225914001465}
{'epoch': 4, 'batch': 228, 'loss': 6.248382091522217}
{'epoch': 4, 'batch': 229, 'loss': 5.839905261993408}
{'epoch': 4, 'batch': 230, 'loss': 5.8319926261901855}
{'epoch': 4, 'batch': 231, 'loss': 5.932123184204102}
{'epoch': 4, 'batch': 232,

{'epoch': 4, 'batch': 366, 'loss': 5.737401962280273}
{'epoch': 4, 'batch': 367, 'loss': 5.960427284240723}
{'epoch': 4, 'batch': 368, 'loss': 5.721567630767822}
{'epoch': 4, 'batch': 369, 'loss': 5.980604648590088}
{'epoch': 4, 'batch': 370, 'loss': 5.72703742980957}
{'epoch': 4, 'batch': 371, 'loss': 5.525871276855469}
{'epoch': 4, 'batch': 372, 'loss': 5.823896408081055}
{'epoch': 4, 'batch': 373, 'loss': 5.531863212585449}
{'epoch': 4, 'batch': 374, 'loss': 5.75607442855835}
{'epoch': 4, 'batch': 375, 'loss': 5.560700416564941}
{'epoch': 4, 'batch': 376, 'loss': 5.361013889312744}
{'epoch': 4, 'batch': 377, 'loss': 5.754694938659668}
{'epoch': 4, 'batch': 378, 'loss': 6.028116703033447}
{'epoch': 4, 'batch': 379, 'loss': 6.019371509552002}
{'epoch': 4, 'batch': 380, 'loss': 5.698944091796875}
{'epoch': 4, 'batch': 381, 'loss': 5.82410192489624}
{'epoch': 4, 'batch': 382, 'loss': 6.296632289886475}
{'epoch': 4, 'batch': 383, 'loss': 5.295477867126465}
{'epoch': 4, 'batch': 384, 'los

{'epoch': 4, 'batch': 518, 'loss': 6.0001726150512695}
{'epoch': 4, 'batch': 519, 'loss': 6.157184600830078}
{'epoch': 4, 'batch': 520, 'loss': 6.474505424499512}
{'epoch': 4, 'batch': 521, 'loss': 5.543265342712402}
{'epoch': 4, 'batch': 522, 'loss': 5.773364067077637}
{'epoch': 4, 'batch': 523, 'loss': 5.800015449523926}
{'epoch': 4, 'batch': 524, 'loss': 5.574952602386475}
{'epoch': 4, 'batch': 525, 'loss': 5.642404556274414}
{'epoch': 4, 'batch': 526, 'loss': 6.078878879547119}
{'epoch': 4, 'batch': 527, 'loss': 5.818556785583496}
{'epoch': 4, 'batch': 528, 'loss': 5.710712432861328}
{'epoch': 4, 'batch': 529, 'loss': 5.578837871551514}
{'epoch': 4, 'batch': 530, 'loss': 5.869999408721924}
{'epoch': 4, 'batch': 531, 'loss': 5.894840240478516}
{'epoch': 4, 'batch': 532, 'loss': 5.806839942932129}
{'epoch': 4, 'batch': 533, 'loss': 5.711419105529785}
{'epoch': 4, 'batch': 534, 'loss': 5.655920028686523}
{'epoch': 4, 'batch': 535, 'loss': 5.752889156341553}
{'epoch': 4, 'batch': 536, 

{'epoch': 4, 'batch': 670, 'loss': 5.5024003982543945}
{'epoch': 4, 'batch': 671, 'loss': 5.838493824005127}
{'epoch': 4, 'batch': 672, 'loss': 5.756592273712158}
{'epoch': 4, 'batch': 673, 'loss': 5.913301944732666}
{'epoch': 4, 'batch': 674, 'loss': 5.843502521514893}
{'epoch': 4, 'batch': 675, 'loss': 6.0141472816467285}
{'epoch': 4, 'batch': 676, 'loss': 5.456415176391602}
{'epoch': 4, 'batch': 677, 'loss': 5.946126461029053}
{'epoch': 4, 'batch': 678, 'loss': 5.959536075592041}
{'epoch': 4, 'batch': 679, 'loss': 5.464903354644775}
{'epoch': 4, 'batch': 680, 'loss': 5.691972255706787}
{'epoch': 4, 'batch': 681, 'loss': 6.151524066925049}
{'epoch': 4, 'batch': 682, 'loss': 6.191421985626221}
{'epoch': 4, 'batch': 683, 'loss': 5.9468255043029785}
{'epoch': 4, 'batch': 684, 'loss': 5.7428717613220215}
{'epoch': 4, 'batch': 685, 'loss': 5.98213529586792}
{'epoch': 4, 'batch': 686, 'loss': 5.684618949890137}
{'epoch': 4, 'batch': 687, 'loss': 5.615966796875}
{'epoch': 4, 'batch': 688, '

{'epoch': 4, 'batch': 822, 'loss': 5.628878593444824}
{'epoch': 4, 'batch': 823, 'loss': 6.230269908905029}
{'epoch': 4, 'batch': 824, 'loss': 5.800105094909668}
{'epoch': 4, 'batch': 825, 'loss': 5.639075756072998}
{'epoch': 4, 'batch': 826, 'loss': 5.77159309387207}
{'epoch': 4, 'batch': 827, 'loss': 6.282196044921875}
{'epoch': 4, 'batch': 828, 'loss': 6.127959251403809}
{'epoch': 4, 'batch': 829, 'loss': 5.664755344390869}
{'epoch': 4, 'batch': 830, 'loss': 6.108966827392578}
{'epoch': 4, 'batch': 831, 'loss': 6.07666015625}
{'epoch': 4, 'batch': 832, 'loss': 5.976590633392334}
{'epoch': 4, 'batch': 833, 'loss': 5.935724258422852}
{'epoch': 4, 'batch': 834, 'loss': 5.744195461273193}
{'epoch': 4, 'batch': 835, 'loss': 5.841160774230957}
{'epoch': 4, 'batch': 836, 'loss': 5.537203788757324}
{'epoch': 4, 'batch': 837, 'loss': 5.76322603225708}
{'epoch': 4, 'batch': 838, 'loss': 5.8581061363220215}
{'epoch': 4, 'batch': 839, 'loss': 6.193411350250244}
{'epoch': 4, 'batch': 840, 'loss'

{'epoch': 4, 'batch': 974, 'loss': 5.8883562088012695}
{'epoch': 5, 'batch': 0, 'loss': 3.106261730194092}
{'epoch': 5, 'batch': 1, 'loss': 3.1628050804138184}
{'epoch': 5, 'batch': 2, 'loss': 3.469930410385132}
{'epoch': 5, 'batch': 3, 'loss': 3.1284804344177246}
{'epoch': 5, 'batch': 4, 'loss': 2.833397150039673}
{'epoch': 5, 'batch': 5, 'loss': 4.433554649353027}
{'epoch': 5, 'batch': 6, 'loss': 3.7954814434051514}
{'epoch': 5, 'batch': 7, 'loss': 3.6673460006713867}
{'epoch': 5, 'batch': 8, 'loss': 5.786946773529053}
{'epoch': 5, 'batch': 9, 'loss': 5.080798625946045}
{'epoch': 5, 'batch': 10, 'loss': 5.331264495849609}
{'epoch': 5, 'batch': 11, 'loss': 5.07553768157959}
{'epoch': 5, 'batch': 12, 'loss': 5.250328540802002}
{'epoch': 5, 'batch': 13, 'loss': 5.06144905090332}
{'epoch': 5, 'batch': 14, 'loss': 5.321012020111084}
{'epoch': 5, 'batch': 15, 'loss': 5.110126495361328}
{'epoch': 5, 'batch': 16, 'loss': 5.176371097564697}
{'epoch': 5, 'batch': 17, 'loss': 5.276803493499756}

{'epoch': 5, 'batch': 153, 'loss': 5.246796607971191}
{'epoch': 5, 'batch': 154, 'loss': 5.263663291931152}
{'epoch': 5, 'batch': 155, 'loss': 5.632421016693115}
{'epoch': 5, 'batch': 156, 'loss': 5.485602855682373}
{'epoch': 5, 'batch': 157, 'loss': 5.681856155395508}
{'epoch': 5, 'batch': 158, 'loss': 5.475569248199463}
{'epoch': 5, 'batch': 159, 'loss': 5.382321357727051}
{'epoch': 5, 'batch': 160, 'loss': 5.643184185028076}
{'epoch': 5, 'batch': 161, 'loss': 5.472074508666992}
{'epoch': 5, 'batch': 162, 'loss': 5.595922470092773}
{'epoch': 5, 'batch': 163, 'loss': 5.442715644836426}
{'epoch': 5, 'batch': 164, 'loss': 5.417516708374023}
{'epoch': 5, 'batch': 165, 'loss': 5.605239391326904}
{'epoch': 5, 'batch': 166, 'loss': 5.606854438781738}
{'epoch': 5, 'batch': 167, 'loss': 5.45895528793335}
{'epoch': 5, 'batch': 168, 'loss': 5.349124431610107}
{'epoch': 5, 'batch': 169, 'loss': 5.4286980628967285}
{'epoch': 5, 'batch': 170, 'loss': 5.624688625335693}
{'epoch': 5, 'batch': 171, '

{'epoch': 5, 'batch': 305, 'loss': 5.8984503746032715}
{'epoch': 5, 'batch': 306, 'loss': 5.687646389007568}
{'epoch': 5, 'batch': 307, 'loss': 5.764061450958252}
{'epoch': 5, 'batch': 308, 'loss': 5.71074104309082}
{'epoch': 5, 'batch': 309, 'loss': 5.574991703033447}
{'epoch': 5, 'batch': 310, 'loss': 5.626431941986084}
{'epoch': 5, 'batch': 311, 'loss': 5.476076126098633}
{'epoch': 5, 'batch': 312, 'loss': 5.588667392730713}
{'epoch': 5, 'batch': 313, 'loss': 5.848083019256592}
{'epoch': 5, 'batch': 314, 'loss': 5.776460647583008}
{'epoch': 5, 'batch': 315, 'loss': 5.3963727951049805}
{'epoch': 5, 'batch': 316, 'loss': 4.943131446838379}
{'epoch': 5, 'batch': 317, 'loss': 5.710838794708252}
{'epoch': 5, 'batch': 318, 'loss': 5.839519500732422}
{'epoch': 5, 'batch': 319, 'loss': 5.583479881286621}
{'epoch': 5, 'batch': 320, 'loss': 5.875268459320068}
{'epoch': 5, 'batch': 321, 'loss': 5.739930629730225}
{'epoch': 5, 'batch': 322, 'loss': 5.566275119781494}
{'epoch': 5, 'batch': 323, 

{'epoch': 5, 'batch': 457, 'loss': 5.294997215270996}
{'epoch': 5, 'batch': 458, 'loss': 5.58715295791626}
{'epoch': 5, 'batch': 459, 'loss': 5.440733909606934}
{'epoch': 5, 'batch': 460, 'loss': 5.385645389556885}
{'epoch': 5, 'batch': 461, 'loss': 4.974338054656982}
{'epoch': 5, 'batch': 462, 'loss': 5.213438034057617}
{'epoch': 5, 'batch': 463, 'loss': 5.304075241088867}
{'epoch': 5, 'batch': 464, 'loss': 5.154387474060059}
{'epoch': 5, 'batch': 465, 'loss': 5.30042839050293}
{'epoch': 5, 'batch': 466, 'loss': 5.628339767456055}
{'epoch': 5, 'batch': 467, 'loss': 5.620588779449463}
{'epoch': 5, 'batch': 468, 'loss': 5.544991493225098}
{'epoch': 5, 'batch': 469, 'loss': 5.487704277038574}
{'epoch': 5, 'batch': 470, 'loss': 5.476789474487305}
{'epoch': 5, 'batch': 471, 'loss': 5.475522041320801}
{'epoch': 5, 'batch': 472, 'loss': 5.476332187652588}
{'epoch': 5, 'batch': 473, 'loss': 5.521472930908203}
{'epoch': 5, 'batch': 474, 'loss': 5.228226184844971}
{'epoch': 5, 'batch': 475, 'lo

{'epoch': 5, 'batch': 609, 'loss': 5.127912521362305}
{'epoch': 5, 'batch': 610, 'loss': 5.551815032958984}
{'epoch': 5, 'batch': 611, 'loss': 5.601987838745117}
{'epoch': 5, 'batch': 612, 'loss': 5.855318069458008}
{'epoch': 5, 'batch': 613, 'loss': 5.4481120109558105}
{'epoch': 5, 'batch': 614, 'loss': 6.185607433319092}
{'epoch': 5, 'batch': 615, 'loss': 5.4679999351501465}
{'epoch': 5, 'batch': 616, 'loss': 5.574184894561768}
{'epoch': 5, 'batch': 617, 'loss': 5.666652679443359}
{'epoch': 5, 'batch': 618, 'loss': 5.548617362976074}
{'epoch': 5, 'batch': 619, 'loss': 5.401046276092529}
{'epoch': 5, 'batch': 620, 'loss': 5.521267414093018}
{'epoch': 5, 'batch': 621, 'loss': 5.502347469329834}
{'epoch': 5, 'batch': 622, 'loss': 5.6341633796691895}
{'epoch': 5, 'batch': 623, 'loss': 5.64067268371582}
{'epoch': 5, 'batch': 624, 'loss': 5.3829569816589355}
{'epoch': 5, 'batch': 625, 'loss': 5.400269508361816}
{'epoch': 5, 'batch': 626, 'loss': 5.4149298667907715}
{'epoch': 5, 'batch': 62

{'epoch': 5, 'batch': 761, 'loss': 5.520956516265869}
{'epoch': 5, 'batch': 762, 'loss': 5.562631130218506}
{'epoch': 5, 'batch': 763, 'loss': 5.227321147918701}
{'epoch': 5, 'batch': 764, 'loss': 5.684952259063721}
{'epoch': 5, 'batch': 765, 'loss': 5.577970504760742}
{'epoch': 5, 'batch': 766, 'loss': 5.7187395095825195}
{'epoch': 5, 'batch': 767, 'loss': 5.743682384490967}
{'epoch': 5, 'batch': 768, 'loss': 5.576261520385742}
{'epoch': 5, 'batch': 769, 'loss': 5.861813068389893}
{'epoch': 5, 'batch': 770, 'loss': 5.962565898895264}
{'epoch': 5, 'batch': 771, 'loss': 5.319967269897461}
{'epoch': 5, 'batch': 772, 'loss': 5.443005561828613}
{'epoch': 5, 'batch': 773, 'loss': 5.771780014038086}
{'epoch': 5, 'batch': 774, 'loss': 5.8510870933532715}
{'epoch': 5, 'batch': 775, 'loss': 6.09466552734375}
{'epoch': 5, 'batch': 776, 'loss': 5.788514137268066}
{'epoch': 5, 'batch': 777, 'loss': 5.628184795379639}
{'epoch': 5, 'batch': 778, 'loss': 5.377233028411865}
{'epoch': 5, 'batch': 779, 

{'epoch': 5, 'batch': 914, 'loss': 5.436512470245361}
{'epoch': 5, 'batch': 915, 'loss': 5.531958103179932}
{'epoch': 5, 'batch': 916, 'loss': 5.357064247131348}
{'epoch': 5, 'batch': 917, 'loss': 6.063694477081299}
{'epoch': 5, 'batch': 918, 'loss': 5.961601257324219}
{'epoch': 5, 'batch': 919, 'loss': 5.640876293182373}
{'epoch': 5, 'batch': 920, 'loss': 5.8489179611206055}
{'epoch': 5, 'batch': 921, 'loss': 5.236344337463379}
{'epoch': 5, 'batch': 922, 'loss': 5.150366306304932}
{'epoch': 5, 'batch': 923, 'loss': 5.294885158538818}
{'epoch': 5, 'batch': 924, 'loss': 5.728029727935791}
{'epoch': 5, 'batch': 925, 'loss': 5.954988479614258}
{'epoch': 5, 'batch': 926, 'loss': 5.758540630340576}
{'epoch': 5, 'batch': 927, 'loss': 5.642226219177246}
{'epoch': 5, 'batch': 928, 'loss': 5.606903076171875}
{'epoch': 5, 'batch': 929, 'loss': 5.5325751304626465}
{'epoch': 5, 'batch': 930, 'loss': 5.490993022918701}
{'epoch': 5, 'batch': 931, 'loss': 5.6122212409973145}
{'epoch': 5, 'batch': 932

{'epoch': 6, 'batch': 93, 'loss': 5.345730304718018}
{'epoch': 6, 'batch': 94, 'loss': 5.383937358856201}
{'epoch': 6, 'batch': 95, 'loss': 5.672024726867676}
{'epoch': 6, 'batch': 96, 'loss': 5.796449661254883}
{'epoch': 6, 'batch': 97, 'loss': 5.644690990447998}
{'epoch': 6, 'batch': 98, 'loss': 5.884460926055908}
{'epoch': 6, 'batch': 99, 'loss': 5.5205302238464355}
{'epoch': 6, 'batch': 100, 'loss': 5.642359256744385}
{'epoch': 6, 'batch': 101, 'loss': 5.7150678634643555}
{'epoch': 6, 'batch': 102, 'loss': 5.589120388031006}
{'epoch': 6, 'batch': 103, 'loss': 5.387670993804932}
{'epoch': 6, 'batch': 104, 'loss': 5.432432174682617}
{'epoch': 6, 'batch': 105, 'loss': 5.534577369689941}
{'epoch': 6, 'batch': 106, 'loss': 5.386447429656982}
{'epoch': 6, 'batch': 107, 'loss': 5.4516119956970215}
{'epoch': 6, 'batch': 108, 'loss': 5.164824962615967}
{'epoch': 6, 'batch': 109, 'loss': 5.528536319732666}
{'epoch': 6, 'batch': 110, 'loss': 5.437538146972656}
{'epoch': 6, 'batch': 111, 'loss

{'epoch': 6, 'batch': 245, 'loss': 5.620887279510498}
{'epoch': 6, 'batch': 246, 'loss': 5.295068740844727}
{'epoch': 6, 'batch': 247, 'loss': 5.662541389465332}
{'epoch': 6, 'batch': 248, 'loss': 5.319178581237793}
{'epoch': 6, 'batch': 249, 'loss': 5.093481063842773}
{'epoch': 6, 'batch': 250, 'loss': 5.1823625564575195}
{'epoch': 6, 'batch': 251, 'loss': 5.1356916427612305}
{'epoch': 6, 'batch': 252, 'loss': 5.505756378173828}
{'epoch': 6, 'batch': 253, 'loss': 5.705870628356934}
{'epoch': 6, 'batch': 254, 'loss': 5.433773994445801}
{'epoch': 6, 'batch': 255, 'loss': 5.153642654418945}
{'epoch': 6, 'batch': 256, 'loss': 5.333853721618652}
{'epoch': 6, 'batch': 257, 'loss': 5.400223731994629}
{'epoch': 6, 'batch': 258, 'loss': 5.646239280700684}
{'epoch': 6, 'batch': 259, 'loss': 5.316488265991211}
{'epoch': 6, 'batch': 260, 'loss': 5.535977363586426}
{'epoch': 6, 'batch': 261, 'loss': 4.9172749519348145}
{'epoch': 6, 'batch': 262, 'loss': 5.579354763031006}
{'epoch': 6, 'batch': 263

{'epoch': 6, 'batch': 397, 'loss': 5.602202892303467}
{'epoch': 6, 'batch': 398, 'loss': 5.383496284484863}
{'epoch': 6, 'batch': 399, 'loss': 5.4075236320495605}
{'epoch': 6, 'batch': 400, 'loss': 5.459941864013672}
{'epoch': 6, 'batch': 401, 'loss': 5.430874824523926}
{'epoch': 6, 'batch': 402, 'loss': 5.279735565185547}
{'epoch': 6, 'batch': 403, 'loss': 5.45440673828125}
{'epoch': 6, 'batch': 404, 'loss': 5.301115036010742}
{'epoch': 6, 'batch': 405, 'loss': 5.266021728515625}
{'epoch': 6, 'batch': 406, 'loss': 5.159668445587158}
{'epoch': 6, 'batch': 407, 'loss': 5.094934463500977}
{'epoch': 6, 'batch': 408, 'loss': 5.344906330108643}
{'epoch': 6, 'batch': 409, 'loss': 5.36071252822876}
{'epoch': 6, 'batch': 410, 'loss': 5.601443767547607}
{'epoch': 6, 'batch': 411, 'loss': 5.478708744049072}
{'epoch': 6, 'batch': 412, 'loss': 5.483366012573242}
{'epoch': 6, 'batch': 413, 'loss': 5.6000237464904785}
{'epoch': 6, 'batch': 414, 'loss': 5.506774425506592}
{'epoch': 6, 'batch': 415, '

{'epoch': 6, 'batch': 549, 'loss': 5.682464122772217}
{'epoch': 6, 'batch': 550, 'loss': 5.298350811004639}
{'epoch': 6, 'batch': 551, 'loss': 5.160643577575684}
{'epoch': 6, 'batch': 552, 'loss': 5.430787086486816}
{'epoch': 6, 'batch': 553, 'loss': 5.566596508026123}
{'epoch': 6, 'batch': 554, 'loss': 5.282155990600586}
{'epoch': 6, 'batch': 555, 'loss': 5.396842956542969}
{'epoch': 6, 'batch': 556, 'loss': 5.451070308685303}
{'epoch': 6, 'batch': 557, 'loss': 5.099071979522705}
{'epoch': 6, 'batch': 558, 'loss': 5.447315692901611}
{'epoch': 6, 'batch': 559, 'loss': 5.829723834991455}
{'epoch': 6, 'batch': 560, 'loss': 5.340693473815918}
{'epoch': 6, 'batch': 561, 'loss': 5.430294990539551}
{'epoch': 6, 'batch': 562, 'loss': 5.744887351989746}
{'epoch': 6, 'batch': 563, 'loss': 5.587281703948975}
{'epoch': 6, 'batch': 564, 'loss': 4.92715311050415}
{'epoch': 6, 'batch': 565, 'loss': 5.177367687225342}
{'epoch': 6, 'batch': 566, 'loss': 5.40170955657959}
{'epoch': 6, 'batch': 567, 'lo

{'epoch': 6, 'batch': 701, 'loss': 5.53270149230957}
{'epoch': 6, 'batch': 702, 'loss': 5.507026195526123}
{'epoch': 6, 'batch': 703, 'loss': 5.359990119934082}
{'epoch': 6, 'batch': 704, 'loss': 5.2369513511657715}
{'epoch': 6, 'batch': 705, 'loss': 5.212989330291748}
{'epoch': 6, 'batch': 706, 'loss': 5.56710958480835}
{'epoch': 6, 'batch': 707, 'loss': 5.557892799377441}
{'epoch': 6, 'batch': 708, 'loss': 5.40318489074707}
{'epoch': 6, 'batch': 709, 'loss': 5.479196548461914}
{'epoch': 6, 'batch': 710, 'loss': 5.5233049392700195}
{'epoch': 6, 'batch': 711, 'loss': 5.380687713623047}
{'epoch': 6, 'batch': 712, 'loss': 5.578354358673096}
{'epoch': 6, 'batch': 713, 'loss': 5.782841205596924}
{'epoch': 6, 'batch': 714, 'loss': 5.248988628387451}
{'epoch': 6, 'batch': 715, 'loss': 5.735132217407227}
{'epoch': 6, 'batch': 716, 'loss': 5.493494510650635}
{'epoch': 6, 'batch': 717, 'loss': 5.390467643737793}
{'epoch': 6, 'batch': 718, 'loss': 5.557915210723877}
{'epoch': 6, 'batch': 719, 'l

{'epoch': 6, 'batch': 853, 'loss': 5.41452169418335}
{'epoch': 6, 'batch': 854, 'loss': 5.367453098297119}
{'epoch': 6, 'batch': 855, 'loss': 5.102972984313965}
{'epoch': 6, 'batch': 856, 'loss': 5.329615592956543}
{'epoch': 6, 'batch': 857, 'loss': 5.2264909744262695}
{'epoch': 6, 'batch': 858, 'loss': 5.303040981292725}
{'epoch': 6, 'batch': 859, 'loss': 5.501468181610107}
{'epoch': 6, 'batch': 860, 'loss': 5.458706855773926}
{'epoch': 6, 'batch': 861, 'loss': 5.555094242095947}
{'epoch': 6, 'batch': 862, 'loss': 5.538332462310791}
{'epoch': 6, 'batch': 863, 'loss': 5.710597991943359}
{'epoch': 6, 'batch': 864, 'loss': 5.588663101196289}
{'epoch': 6, 'batch': 865, 'loss': 4.9577226638793945}
{'epoch': 6, 'batch': 866, 'loss': 5.466291904449463}
{'epoch': 6, 'batch': 867, 'loss': 5.552836894989014}
{'epoch': 6, 'batch': 868, 'loss': 5.659745216369629}
{'epoch': 6, 'batch': 869, 'loss': 5.064737319946289}
{'epoch': 6, 'batch': 870, 'loss': 5.2086615562438965}
{'epoch': 6, 'batch': 871,

{'epoch': 7, 'batch': 31, 'loss': 5.368646144866943}
{'epoch': 7, 'batch': 32, 'loss': 5.567638397216797}
{'epoch': 7, 'batch': 33, 'loss': 5.312406539916992}
{'epoch': 7, 'batch': 34, 'loss': 5.607990741729736}
{'epoch': 7, 'batch': 35, 'loss': 5.4527435302734375}
{'epoch': 7, 'batch': 36, 'loss': 5.3915205001831055}
{'epoch': 7, 'batch': 37, 'loss': 5.616750240325928}
{'epoch': 7, 'batch': 38, 'loss': 5.601720333099365}
{'epoch': 7, 'batch': 39, 'loss': 5.596207141876221}
{'epoch': 7, 'batch': 40, 'loss': 5.2138566970825195}
{'epoch': 7, 'batch': 41, 'loss': 5.726541519165039}
{'epoch': 7, 'batch': 42, 'loss': 5.523845672607422}
{'epoch': 7, 'batch': 43, 'loss': 5.369882583618164}
{'epoch': 7, 'batch': 44, 'loss': 5.561310768127441}
{'epoch': 7, 'batch': 45, 'loss': 5.758429050445557}
{'epoch': 7, 'batch': 46, 'loss': 5.843497276306152}
{'epoch': 7, 'batch': 47, 'loss': 5.399738311767578}
{'epoch': 7, 'batch': 48, 'loss': 5.39428186416626}
{'epoch': 7, 'batch': 49, 'loss': 5.52700805

{'epoch': 7, 'batch': 184, 'loss': 5.070280075073242}
{'epoch': 7, 'batch': 185, 'loss': 5.058506965637207}
{'epoch': 7, 'batch': 186, 'loss': 5.2015910148620605}
{'epoch': 7, 'batch': 187, 'loss': 5.314937114715576}
{'epoch': 7, 'batch': 188, 'loss': 5.200470447540283}
{'epoch': 7, 'batch': 189, 'loss': 4.953909397125244}
{'epoch': 7, 'batch': 190, 'loss': 4.778165817260742}
{'epoch': 7, 'batch': 191, 'loss': 5.257801532745361}
{'epoch': 7, 'batch': 192, 'loss': 5.3201985359191895}
{'epoch': 7, 'batch': 193, 'loss': 5.150348663330078}
{'epoch': 7, 'batch': 194, 'loss': 4.7985992431640625}
{'epoch': 7, 'batch': 195, 'loss': 4.951499938964844}
{'epoch': 7, 'batch': 196, 'loss': 5.0404205322265625}
{'epoch': 7, 'batch': 197, 'loss': 5.146373748779297}
{'epoch': 7, 'batch': 198, 'loss': 5.328405380249023}
{'epoch': 7, 'batch': 199, 'loss': 5.436617851257324}
{'epoch': 7, 'batch': 200, 'loss': 5.452446460723877}
{'epoch': 7, 'batch': 201, 'loss': 5.647777557373047}
{'epoch': 7, 'batch': 20

{'epoch': 7, 'batch': 336, 'loss': 5.366384029388428}
{'epoch': 7, 'batch': 337, 'loss': 5.255463123321533}
{'epoch': 7, 'batch': 338, 'loss': 5.633374214172363}
{'epoch': 7, 'batch': 339, 'loss': 5.414351940155029}
{'epoch': 7, 'batch': 340, 'loss': 5.361397743225098}
{'epoch': 7, 'batch': 341, 'loss': 5.225407600402832}
{'epoch': 7, 'batch': 342, 'loss': 5.195789337158203}
{'epoch': 7, 'batch': 343, 'loss': 5.232515335083008}
{'epoch': 7, 'batch': 344, 'loss': 5.427796363830566}
{'epoch': 7, 'batch': 345, 'loss': 5.473665237426758}
{'epoch': 7, 'batch': 346, 'loss': 5.3612060546875}
{'epoch': 7, 'batch': 347, 'loss': 5.502806663513184}
{'epoch': 7, 'batch': 348, 'loss': 4.9386305809021}
{'epoch': 7, 'batch': 349, 'loss': 5.3643059730529785}
{'epoch': 7, 'batch': 350, 'loss': 4.77581787109375}
{'epoch': 7, 'batch': 351, 'loss': 4.902831554412842}
{'epoch': 7, 'batch': 352, 'loss': 5.476368427276611}
{'epoch': 7, 'batch': 353, 'loss': 5.040495872497559}
{'epoch': 7, 'batch': 354, 'loss

{'epoch': 7, 'batch': 488, 'loss': 5.309975624084473}
{'epoch': 7, 'batch': 489, 'loss': 5.44110107421875}
{'epoch': 7, 'batch': 490, 'loss': 5.301424503326416}
{'epoch': 7, 'batch': 491, 'loss': 5.039228916168213}
{'epoch': 7, 'batch': 492, 'loss': 5.364307403564453}
{'epoch': 7, 'batch': 493, 'loss': 5.307372093200684}
{'epoch': 7, 'batch': 494, 'loss': 4.941429615020752}
{'epoch': 7, 'batch': 495, 'loss': 5.333521842956543}
{'epoch': 7, 'batch': 496, 'loss': 5.175041675567627}
{'epoch': 7, 'batch': 497, 'loss': 5.092158317565918}
{'epoch': 7, 'batch': 498, 'loss': 5.338550567626953}
{'epoch': 7, 'batch': 499, 'loss': 5.452182292938232}
{'epoch': 7, 'batch': 500, 'loss': 5.224527835845947}
{'epoch': 7, 'batch': 501, 'loss': 5.325941562652588}
{'epoch': 7, 'batch': 502, 'loss': 5.430682182312012}
{'epoch': 7, 'batch': 503, 'loss': 5.246532440185547}
{'epoch': 7, 'batch': 504, 'loss': 5.255258083343506}
{'epoch': 7, 'batch': 505, 'loss': 5.258406639099121}
{'epoch': 7, 'batch': 506, 'l

{'epoch': 7, 'batch': 640, 'loss': 5.398054122924805}
{'epoch': 7, 'batch': 641, 'loss': 5.278061866760254}
{'epoch': 7, 'batch': 642, 'loss': 5.068625450134277}
{'epoch': 7, 'batch': 643, 'loss': 5.322482585906982}
{'epoch': 7, 'batch': 644, 'loss': 5.440463542938232}
{'epoch': 7, 'batch': 645, 'loss': 4.967382431030273}
{'epoch': 7, 'batch': 646, 'loss': 4.908818244934082}
{'epoch': 7, 'batch': 647, 'loss': 5.020698547363281}
{'epoch': 7, 'batch': 648, 'loss': 5.137080192565918}
{'epoch': 7, 'batch': 649, 'loss': 5.622641563415527}
{'epoch': 7, 'batch': 650, 'loss': 5.350048542022705}
{'epoch': 7, 'batch': 651, 'loss': 5.224160671234131}
{'epoch': 7, 'batch': 652, 'loss': 5.5382866859436035}
{'epoch': 7, 'batch': 653, 'loss': 5.229403018951416}
{'epoch': 7, 'batch': 654, 'loss': 5.099748611450195}
{'epoch': 7, 'batch': 655, 'loss': 4.9933342933654785}
{'epoch': 7, 'batch': 656, 'loss': 5.091861248016357}
{'epoch': 7, 'batch': 657, 'loss': 5.161166191101074}
{'epoch': 7, 'batch': 658,

{'epoch': 7, 'batch': 792, 'loss': 5.3558173179626465}
{'epoch': 7, 'batch': 793, 'loss': 5.5493059158325195}
{'epoch': 7, 'batch': 794, 'loss': 5.238877296447754}
{'epoch': 7, 'batch': 795, 'loss': 5.280876636505127}
{'epoch': 7, 'batch': 796, 'loss': 5.202879428863525}
{'epoch': 7, 'batch': 797, 'loss': 5.434887409210205}
{'epoch': 7, 'batch': 798, 'loss': 5.340140342712402}
{'epoch': 7, 'batch': 799, 'loss': 5.11393404006958}
{'epoch': 7, 'batch': 800, 'loss': 5.274241924285889}
{'epoch': 7, 'batch': 801, 'loss': 5.519392490386963}
{'epoch': 7, 'batch': 802, 'loss': 5.524641990661621}
{'epoch': 7, 'batch': 803, 'loss': 5.375168323516846}
{'epoch': 7, 'batch': 804, 'loss': 5.041984558105469}
{'epoch': 7, 'batch': 805, 'loss': 5.593566417694092}
{'epoch': 7, 'batch': 806, 'loss': 4.917026042938232}
{'epoch': 7, 'batch': 807, 'loss': 5.453989505767822}
{'epoch': 7, 'batch': 808, 'loss': 5.182945251464844}
{'epoch': 7, 'batch': 809, 'loss': 5.245912551879883}
{'epoch': 7, 'batch': 810, 

{'epoch': 7, 'batch': 944, 'loss': 5.277871608734131}
{'epoch': 7, 'batch': 945, 'loss': 5.147190093994141}
{'epoch': 7, 'batch': 946, 'loss': 5.175261974334717}
{'epoch': 7, 'batch': 947, 'loss': 5.374454498291016}
{'epoch': 7, 'batch': 948, 'loss': 5.065016746520996}
{'epoch': 7, 'batch': 949, 'loss': 5.632855415344238}
{'epoch': 7, 'batch': 950, 'loss': 5.366028308868408}
{'epoch': 7, 'batch': 951, 'loss': 5.30517053604126}
{'epoch': 7, 'batch': 952, 'loss': 5.184587001800537}
{'epoch': 7, 'batch': 953, 'loss': 5.479418754577637}
{'epoch': 7, 'batch': 954, 'loss': 5.300481796264648}
{'epoch': 7, 'batch': 955, 'loss': 5.012983798980713}
{'epoch': 7, 'batch': 956, 'loss': 5.522911071777344}
{'epoch': 7, 'batch': 957, 'loss': 5.040424823760986}
{'epoch': 7, 'batch': 958, 'loss': 4.905460357666016}
{'epoch': 7, 'batch': 959, 'loss': 5.311822414398193}
{'epoch': 7, 'batch': 960, 'loss': 5.446432590484619}
{'epoch': 7, 'batch': 961, 'loss': 5.230892658233643}
{'epoch': 7, 'batch': 962, 'l

{'epoch': 8, 'batch': 123, 'loss': 5.0407023429870605}
{'epoch': 8, 'batch': 124, 'loss': 5.443553924560547}
{'epoch': 8, 'batch': 125, 'loss': 5.528226852416992}
{'epoch': 8, 'batch': 126, 'loss': 5.20224142074585}
{'epoch': 8, 'batch': 127, 'loss': 5.10149621963501}
{'epoch': 8, 'batch': 128, 'loss': 5.189459800720215}
{'epoch': 8, 'batch': 129, 'loss': 5.031418800354004}
{'epoch': 8, 'batch': 130, 'loss': 5.385372161865234}
{'epoch': 8, 'batch': 131, 'loss': 5.395971775054932}
{'epoch': 8, 'batch': 132, 'loss': 5.529815673828125}
{'epoch': 8, 'batch': 133, 'loss': 4.954068183898926}
{'epoch': 8, 'batch': 134, 'loss': 5.079295635223389}
{'epoch': 8, 'batch': 135, 'loss': 5.023886203765869}
{'epoch': 8, 'batch': 136, 'loss': 5.261408805847168}
{'epoch': 8, 'batch': 137, 'loss': 5.379175186157227}
{'epoch': 8, 'batch': 138, 'loss': 5.221852779388428}
{'epoch': 8, 'batch': 139, 'loss': 5.121942043304443}
{'epoch': 8, 'batch': 140, 'loss': 5.244816303253174}
{'epoch': 8, 'batch': 141, 'l

{'epoch': 8, 'batch': 275, 'loss': 5.0920090675354}
{'epoch': 8, 'batch': 276, 'loss': 5.355805397033691}
{'epoch': 8, 'batch': 277, 'loss': 5.435830593109131}
{'epoch': 8, 'batch': 278, 'loss': 5.286475658416748}
{'epoch': 8, 'batch': 279, 'loss': 4.980172157287598}
{'epoch': 8, 'batch': 280, 'loss': 5.445353031158447}
{'epoch': 8, 'batch': 281, 'loss': 5.388961315155029}
{'epoch': 8, 'batch': 282, 'loss': 5.401348114013672}
{'epoch': 8, 'batch': 283, 'loss': 5.612991809844971}
{'epoch': 8, 'batch': 284, 'loss': 5.338844299316406}
{'epoch': 8, 'batch': 285, 'loss': 5.106756210327148}
{'epoch': 8, 'batch': 286, 'loss': 5.224405288696289}
{'epoch': 8, 'batch': 287, 'loss': 5.299851894378662}
{'epoch': 8, 'batch': 288, 'loss': 5.508985996246338}
{'epoch': 8, 'batch': 289, 'loss': 5.412582874298096}
{'epoch': 8, 'batch': 290, 'loss': 5.582720756530762}
{'epoch': 8, 'batch': 291, 'loss': 5.082365989685059}
{'epoch': 8, 'batch': 292, 'loss': 5.142473220825195}
{'epoch': 8, 'batch': 293, 'lo

{'epoch': 8, 'batch': 427, 'loss': 5.230484962463379}
{'epoch': 8, 'batch': 428, 'loss': 5.059716701507568}
{'epoch': 8, 'batch': 429, 'loss': 4.956541061401367}
{'epoch': 8, 'batch': 430, 'loss': 5.321699619293213}
{'epoch': 8, 'batch': 431, 'loss': 5.25579833984375}
{'epoch': 8, 'batch': 432, 'loss': 5.649707794189453}
{'epoch': 8, 'batch': 433, 'loss': 5.416004657745361}
{'epoch': 8, 'batch': 434, 'loss': 5.263007640838623}
{'epoch': 8, 'batch': 435, 'loss': 5.154439926147461}
{'epoch': 8, 'batch': 436, 'loss': 5.234734535217285}
{'epoch': 8, 'batch': 437, 'loss': 5.105063438415527}
{'epoch': 8, 'batch': 438, 'loss': 5.039233684539795}
{'epoch': 8, 'batch': 439, 'loss': 5.321713447570801}
{'epoch': 8, 'batch': 440, 'loss': 5.315918445587158}
{'epoch': 8, 'batch': 441, 'loss': 5.049609184265137}
{'epoch': 8, 'batch': 442, 'loss': 5.489130020141602}
{'epoch': 8, 'batch': 443, 'loss': 5.387256622314453}
{'epoch': 8, 'batch': 444, 'loss': 5.181158542633057}
{'epoch': 8, 'batch': 445, 'l

{'epoch': 8, 'batch': 579, 'loss': 5.081907749176025}
{'epoch': 8, 'batch': 580, 'loss': 5.163965702056885}
{'epoch': 8, 'batch': 581, 'loss': 5.242602825164795}
{'epoch': 8, 'batch': 582, 'loss': 5.241549968719482}
{'epoch': 8, 'batch': 583, 'loss': 5.347281455993652}
{'epoch': 8, 'batch': 584, 'loss': 5.266543388366699}
{'epoch': 8, 'batch': 585, 'loss': 5.069660663604736}
{'epoch': 8, 'batch': 586, 'loss': 4.917285919189453}
{'epoch': 8, 'batch': 587, 'loss': 4.86150598526001}
{'epoch': 8, 'batch': 588, 'loss': 4.932886123657227}
{'epoch': 8, 'batch': 589, 'loss': 5.3204145431518555}
{'epoch': 8, 'batch': 590, 'loss': 5.160610198974609}
{'epoch': 8, 'batch': 591, 'loss': 4.927022933959961}
{'epoch': 8, 'batch': 592, 'loss': 5.296149730682373}
{'epoch': 8, 'batch': 593, 'loss': 4.687005043029785}
{'epoch': 8, 'batch': 594, 'loss': 5.14664363861084}
{'epoch': 8, 'batch': 595, 'loss': 5.362277984619141}
{'epoch': 8, 'batch': 596, 'loss': 5.151681423187256}
{'epoch': 8, 'batch': 597, 'l

{'epoch': 8, 'batch': 731, 'loss': 5.140626430511475}
{'epoch': 8, 'batch': 732, 'loss': 5.355189800262451}
{'epoch': 8, 'batch': 733, 'loss': 5.136370658874512}
{'epoch': 8, 'batch': 734, 'loss': 5.347607135772705}
{'epoch': 8, 'batch': 735, 'loss': 4.927942752838135}
{'epoch': 8, 'batch': 736, 'loss': 4.987868785858154}
{'epoch': 8, 'batch': 737, 'loss': 5.044543743133545}
{'epoch': 8, 'batch': 738, 'loss': 5.133752822875977}
{'epoch': 8, 'batch': 739, 'loss': 5.315907001495361}
{'epoch': 8, 'batch': 740, 'loss': 5.345267295837402}
{'epoch': 8, 'batch': 741, 'loss': 5.163793563842773}
{'epoch': 8, 'batch': 742, 'loss': 5.257175922393799}
{'epoch': 8, 'batch': 743, 'loss': 5.443368911743164}
{'epoch': 8, 'batch': 744, 'loss': 5.43601655960083}
{'epoch': 8, 'batch': 745, 'loss': 5.35170841217041}
{'epoch': 8, 'batch': 746, 'loss': 5.464076042175293}
{'epoch': 8, 'batch': 747, 'loss': 5.495323657989502}
{'epoch': 8, 'batch': 748, 'loss': 5.240007400512695}
{'epoch': 8, 'batch': 749, 'lo

{'epoch': 8, 'batch': 883, 'loss': 5.052920341491699}
{'epoch': 8, 'batch': 884, 'loss': 5.054041862487793}
{'epoch': 8, 'batch': 885, 'loss': 5.055528163909912}
{'epoch': 8, 'batch': 886, 'loss': 5.180739402770996}
{'epoch': 8, 'batch': 887, 'loss': 5.071861267089844}
{'epoch': 8, 'batch': 888, 'loss': 4.763326168060303}
{'epoch': 8, 'batch': 889, 'loss': 4.496938228607178}
{'epoch': 8, 'batch': 890, 'loss': 5.062030792236328}
{'epoch': 8, 'batch': 891, 'loss': 5.179478168487549}
{'epoch': 8, 'batch': 892, 'loss': 4.465036392211914}
{'epoch': 8, 'batch': 893, 'loss': 4.827755451202393}
{'epoch': 8, 'batch': 894, 'loss': 4.86812162399292}
{'epoch': 8, 'batch': 895, 'loss': 5.012602806091309}
{'epoch': 8, 'batch': 896, 'loss': 4.910654067993164}
{'epoch': 8, 'batch': 897, 'loss': 5.242877006530762}
{'epoch': 8, 'batch': 898, 'loss': 5.148426055908203}
{'epoch': 8, 'batch': 899, 'loss': 5.131957530975342}
{'epoch': 8, 'batch': 900, 'loss': 5.114619731903076}
{'epoch': 8, 'batch': 901, 'l

{'epoch': 9, 'batch': 61, 'loss': 4.872925281524658}
{'epoch': 9, 'batch': 62, 'loss': 4.8987812995910645}
{'epoch': 9, 'batch': 63, 'loss': 4.732449531555176}
{'epoch': 9, 'batch': 64, 'loss': 4.844196319580078}
{'epoch': 9, 'batch': 65, 'loss': 5.051635265350342}
{'epoch': 9, 'batch': 66, 'loss': 4.8961615562438965}
{'epoch': 9, 'batch': 67, 'loss': 4.891046524047852}
{'epoch': 9, 'batch': 68, 'loss': 4.90737247467041}
{'epoch': 9, 'batch': 69, 'loss': 4.7148756980896}
{'epoch': 9, 'batch': 70, 'loss': 4.890135288238525}
{'epoch': 9, 'batch': 71, 'loss': 5.221409797668457}
{'epoch': 9, 'batch': 72, 'loss': 5.165778160095215}
{'epoch': 9, 'batch': 73, 'loss': 5.231548309326172}
{'epoch': 9, 'batch': 74, 'loss': 5.119075298309326}
{'epoch': 9, 'batch': 75, 'loss': 5.050693511962891}
{'epoch': 9, 'batch': 76, 'loss': 4.684886455535889}
{'epoch': 9, 'batch': 77, 'loss': 5.3447794914245605}
{'epoch': 9, 'batch': 78, 'loss': 5.169334888458252}
{'epoch': 9, 'batch': 79, 'loss': 4.9205760955

{'epoch': 9, 'batch': 214, 'loss': 5.124763488769531}
{'epoch': 9, 'batch': 215, 'loss': 5.100247859954834}
{'epoch': 9, 'batch': 216, 'loss': 5.32701301574707}
{'epoch': 9, 'batch': 217, 'loss': 5.390207767486572}
{'epoch': 9, 'batch': 218, 'loss': 4.8998565673828125}
{'epoch': 9, 'batch': 219, 'loss': 5.129340171813965}
{'epoch': 9, 'batch': 220, 'loss': 5.04141092300415}
{'epoch': 9, 'batch': 221, 'loss': 5.053971767425537}
{'epoch': 9, 'batch': 222, 'loss': 5.149992942810059}
{'epoch': 9, 'batch': 223, 'loss': 4.899288654327393}
{'epoch': 9, 'batch': 224, 'loss': 4.9744181632995605}
{'epoch': 9, 'batch': 225, 'loss': 5.05417013168335}
{'epoch': 9, 'batch': 226, 'loss': 4.9097418785095215}
{'epoch': 9, 'batch': 227, 'loss': 5.038970470428467}
{'epoch': 9, 'batch': 228, 'loss': 5.516577243804932}
{'epoch': 9, 'batch': 229, 'loss': 5.194329738616943}
{'epoch': 9, 'batch': 230, 'loss': 5.0674896240234375}
{'epoch': 9, 'batch': 231, 'loss': 5.111446857452393}
{'epoch': 9, 'batch': 232, 

{'epoch': 9, 'batch': 366, 'loss': 5.072819232940674}
{'epoch': 9, 'batch': 367, 'loss': 5.218296051025391}
{'epoch': 9, 'batch': 368, 'loss': 4.952751159667969}
{'epoch': 9, 'batch': 369, 'loss': 5.112036228179932}
{'epoch': 9, 'batch': 370, 'loss': 4.946918487548828}
{'epoch': 9, 'batch': 371, 'loss': 4.942944049835205}
{'epoch': 9, 'batch': 372, 'loss': 5.053993225097656}
{'epoch': 9, 'batch': 373, 'loss': 4.956165313720703}
{'epoch': 9, 'batch': 374, 'loss': 4.934020042419434}
{'epoch': 9, 'batch': 375, 'loss': 4.884350299835205}
{'epoch': 9, 'batch': 376, 'loss': 4.678051948547363}
{'epoch': 9, 'batch': 377, 'loss': 5.056449890136719}
{'epoch': 9, 'batch': 378, 'loss': 5.198497295379639}
{'epoch': 9, 'batch': 379, 'loss': 5.289976119995117}
{'epoch': 9, 'batch': 380, 'loss': 4.8968048095703125}
{'epoch': 9, 'batch': 381, 'loss': 5.12679386138916}
{'epoch': 9, 'batch': 382, 'loss': 5.523099899291992}
{'epoch': 9, 'batch': 383, 'loss': 4.683725833892822}
{'epoch': 9, 'batch': 384, '

{'epoch': 9, 'batch': 518, 'loss': 5.139899730682373}
{'epoch': 9, 'batch': 519, 'loss': 5.082080364227295}
{'epoch': 9, 'batch': 520, 'loss': 5.470364093780518}
{'epoch': 9, 'batch': 521, 'loss': 4.704705715179443}
{'epoch': 9, 'batch': 522, 'loss': 4.884731292724609}
{'epoch': 9, 'batch': 523, 'loss': 5.0582990646362305}
{'epoch': 9, 'batch': 524, 'loss': 4.890300273895264}
{'epoch': 9, 'batch': 525, 'loss': 4.8867082595825195}
{'epoch': 9, 'batch': 526, 'loss': 5.369941234588623}
{'epoch': 9, 'batch': 527, 'loss': 5.104321479797363}
{'epoch': 9, 'batch': 528, 'loss': 4.945540904998779}
{'epoch': 9, 'batch': 529, 'loss': 4.909214973449707}
{'epoch': 9, 'batch': 530, 'loss': 5.214095592498779}
{'epoch': 9, 'batch': 531, 'loss': 5.163644313812256}
{'epoch': 9, 'batch': 532, 'loss': 5.118963241577148}
{'epoch': 9, 'batch': 533, 'loss': 5.0132575035095215}
{'epoch': 9, 'batch': 534, 'loss': 5.011804580688477}
{'epoch': 9, 'batch': 535, 'loss': 5.042322635650635}
{'epoch': 9, 'batch': 536

{'epoch': 9, 'batch': 670, 'loss': 4.915217876434326}
{'epoch': 9, 'batch': 671, 'loss': 5.128294467926025}
{'epoch': 9, 'batch': 672, 'loss': 4.975713729858398}
{'epoch': 9, 'batch': 673, 'loss': 5.311114311218262}
{'epoch': 9, 'batch': 674, 'loss': 5.080745697021484}
{'epoch': 9, 'batch': 675, 'loss': 5.236074924468994}
{'epoch': 9, 'batch': 676, 'loss': 4.895711421966553}
{'epoch': 9, 'batch': 677, 'loss': 5.239235877990723}
{'epoch': 9, 'batch': 678, 'loss': 5.212350845336914}
{'epoch': 9, 'batch': 679, 'loss': 4.905445098876953}
{'epoch': 9, 'batch': 680, 'loss': 4.830902099609375}
{'epoch': 9, 'batch': 681, 'loss': 5.339824676513672}
{'epoch': 9, 'batch': 682, 'loss': 5.299116611480713}
{'epoch': 9, 'batch': 683, 'loss': 5.1179518699646}
{'epoch': 9, 'batch': 684, 'loss': 4.912450313568115}
{'epoch': 9, 'batch': 685, 'loss': 5.115554332733154}
{'epoch': 9, 'batch': 686, 'loss': 4.986286163330078}
{'epoch': 9, 'batch': 687, 'loss': 4.832836151123047}
{'epoch': 9, 'batch': 688, 'lo

{'epoch': 9, 'batch': 822, 'loss': 4.977807521820068}
{'epoch': 9, 'batch': 823, 'loss': 5.396447658538818}
{'epoch': 9, 'batch': 824, 'loss': 5.110488414764404}
{'epoch': 9, 'batch': 825, 'loss': 4.981927871704102}
{'epoch': 9, 'batch': 826, 'loss': 4.9540534019470215}
{'epoch': 9, 'batch': 827, 'loss': 5.34624719619751}
{'epoch': 9, 'batch': 828, 'loss': 5.196089744567871}
{'epoch': 9, 'batch': 829, 'loss': 4.87230920791626}
{'epoch': 9, 'batch': 830, 'loss': 5.259614944458008}
{'epoch': 9, 'batch': 831, 'loss': 5.184494972229004}
{'epoch': 9, 'batch': 832, 'loss': 5.107682704925537}
{'epoch': 9, 'batch': 833, 'loss': 5.0290207862854}
{'epoch': 9, 'batch': 834, 'loss': 4.970588207244873}
{'epoch': 9, 'batch': 835, 'loss': 5.162367820739746}
{'epoch': 9, 'batch': 836, 'loss': 4.833566188812256}
{'epoch': 9, 'batch': 837, 'loss': 4.840744495391846}
{'epoch': 9, 'batch': 838, 'loss': 5.027196884155273}
{'epoch': 9, 'batch': 839, 'loss': 5.496599197387695}
{'epoch': 9, 'batch': 840, 'los

{'epoch': 9, 'batch': 974, 'loss': 4.2395548820495605}
{'epoch': 10, 'batch': 0, 'loss': 2.116588592529297}
{'epoch': 10, 'batch': 1, 'loss': 2.137413501739502}
{'epoch': 10, 'batch': 2, 'loss': 2.4576995372772217}
{'epoch': 10, 'batch': 3, 'loss': 2.1095635890960693}
{'epoch': 10, 'batch': 4, 'loss': 1.9728623628616333}
{'epoch': 10, 'batch': 5, 'loss': 3.4957282543182373}
{'epoch': 10, 'batch': 6, 'loss': 3.1075799465179443}
{'epoch': 10, 'batch': 7, 'loss': 3.097275495529175}
{'epoch': 10, 'batch': 8, 'loss': 5.078138828277588}
{'epoch': 10, 'batch': 9, 'loss': 4.381319522857666}
{'epoch': 10, 'batch': 10, 'loss': 4.78659725189209}
{'epoch': 10, 'batch': 11, 'loss': 4.266960620880127}
{'epoch': 10, 'batch': 12, 'loss': 4.339601993560791}
{'epoch': 10, 'batch': 13, 'loss': 4.401705741882324}
{'epoch': 10, 'batch': 14, 'loss': 4.622575283050537}
{'epoch': 10, 'batch': 15, 'loss': 4.270784378051758}
{'epoch': 10, 'batch': 16, 'loss': 4.543361186981201}
{'epoch': 10, 'batch': 17, 'loss'

{'epoch': 10, 'batch': 150, 'loss': 5.177478790283203}
{'epoch': 10, 'batch': 151, 'loss': 4.975707530975342}
{'epoch': 10, 'batch': 152, 'loss': 4.928282737731934}
{'epoch': 10, 'batch': 153, 'loss': 4.534661769866943}
{'epoch': 10, 'batch': 154, 'loss': 4.745301723480225}
{'epoch': 10, 'batch': 155, 'loss': 4.978962421417236}
{'epoch': 10, 'batch': 156, 'loss': 4.731372833251953}
{'epoch': 10, 'batch': 157, 'loss': 4.889800071716309}
{'epoch': 10, 'batch': 158, 'loss': 4.789310932159424}
{'epoch': 10, 'batch': 159, 'loss': 4.786421298980713}
{'epoch': 10, 'batch': 160, 'loss': 5.068544864654541}
{'epoch': 10, 'batch': 161, 'loss': 4.724806785583496}
{'epoch': 10, 'batch': 162, 'loss': 4.92888879776001}
{'epoch': 10, 'batch': 163, 'loss': 4.694704532623291}
{'epoch': 10, 'batch': 164, 'loss': 4.817592620849609}
{'epoch': 10, 'batch': 165, 'loss': 4.815985202789307}
{'epoch': 10, 'batch': 166, 'loss': 4.895303249359131}
{'epoch': 10, 'batch': 167, 'loss': 4.805666446685791}
{'epoch': 1

{'epoch': 10, 'batch': 300, 'loss': 4.751264572143555}
{'epoch': 10, 'batch': 301, 'loss': 5.046585559844971}
{'epoch': 10, 'batch': 302, 'loss': 5.191761016845703}
{'epoch': 10, 'batch': 303, 'loss': 4.933132171630859}
{'epoch': 10, 'batch': 304, 'loss': 5.245583534240723}
{'epoch': 10, 'batch': 305, 'loss': 5.0235443115234375}
{'epoch': 10, 'batch': 306, 'loss': 4.8706865310668945}
{'epoch': 10, 'batch': 307, 'loss': 5.170110702514648}
{'epoch': 10, 'batch': 308, 'loss': 5.016255855560303}
{'epoch': 10, 'batch': 309, 'loss': 4.7117085456848145}
{'epoch': 10, 'batch': 310, 'loss': 4.785115718841553}
{'epoch': 10, 'batch': 311, 'loss': 4.528102874755859}
{'epoch': 10, 'batch': 312, 'loss': 4.572754859924316}
{'epoch': 10, 'batch': 313, 'loss': 4.770174026489258}
{'epoch': 10, 'batch': 314, 'loss': 4.928380966186523}
{'epoch': 10, 'batch': 315, 'loss': 4.678075313568115}
{'epoch': 10, 'batch': 316, 'loss': 3.9093194007873535}
{'epoch': 10, 'batch': 317, 'loss': 4.94647216796875}
{'epoch

{'epoch': 10, 'batch': 450, 'loss': 4.895473957061768}
{'epoch': 10, 'batch': 451, 'loss': 4.987414360046387}
{'epoch': 10, 'batch': 452, 'loss': 4.826362609863281}
{'epoch': 10, 'batch': 453, 'loss': 4.986863136291504}
{'epoch': 10, 'batch': 454, 'loss': 4.658819675445557}
{'epoch': 10, 'batch': 455, 'loss': 4.460487365722656}
{'epoch': 10, 'batch': 456, 'loss': 4.662276744842529}
{'epoch': 10, 'batch': 457, 'loss': 4.558447360992432}
{'epoch': 10, 'batch': 458, 'loss': 5.023160457611084}
{'epoch': 10, 'batch': 459, 'loss': 4.942968845367432}
{'epoch': 10, 'batch': 460, 'loss': 4.9259562492370605}
{'epoch': 10, 'batch': 461, 'loss': 4.457744598388672}
{'epoch': 10, 'batch': 462, 'loss': 4.666671276092529}
{'epoch': 10, 'batch': 463, 'loss': 4.701837539672852}
{'epoch': 10, 'batch': 464, 'loss': 4.620950222015381}
{'epoch': 10, 'batch': 465, 'loss': 4.634818077087402}
{'epoch': 10, 'batch': 466, 'loss': 4.871522903442383}
{'epoch': 10, 'batch': 467, 'loss': 4.882142066955566}
{'epoch':

{'epoch': 10, 'batch': 600, 'loss': 4.750715732574463}
{'epoch': 10, 'batch': 601, 'loss': 4.762966156005859}
{'epoch': 10, 'batch': 602, 'loss': 4.677271842956543}
{'epoch': 10, 'batch': 603, 'loss': 4.990848541259766}
{'epoch': 10, 'batch': 604, 'loss': 4.7807769775390625}
{'epoch': 10, 'batch': 605, 'loss': 4.551628112792969}
{'epoch': 10, 'batch': 606, 'loss': 4.659634590148926}
{'epoch': 10, 'batch': 607, 'loss': 4.611301898956299}
{'epoch': 10, 'batch': 608, 'loss': 4.820745944976807}
{'epoch': 10, 'batch': 609, 'loss': 4.516322612762451}
{'epoch': 10, 'batch': 610, 'loss': 4.840432167053223}
{'epoch': 10, 'batch': 611, 'loss': 4.9646687507629395}
{'epoch': 10, 'batch': 612, 'loss': 5.215052604675293}
{'epoch': 10, 'batch': 613, 'loss': 4.82097053527832}
{'epoch': 10, 'batch': 614, 'loss': 5.16888952255249}
{'epoch': 10, 'batch': 615, 'loss': 4.740525722503662}
{'epoch': 10, 'batch': 616, 'loss': 5.006458759307861}
{'epoch': 10, 'batch': 617, 'loss': 4.971978664398193}
{'epoch': 

{'epoch': 10, 'batch': 750, 'loss': 4.52205228805542}
{'epoch': 10, 'batch': 751, 'loss': 4.945539951324463}
{'epoch': 10, 'batch': 752, 'loss': 4.717977523803711}
{'epoch': 10, 'batch': 753, 'loss': 4.939061164855957}
{'epoch': 10, 'batch': 754, 'loss': 5.103781223297119}
{'epoch': 10, 'batch': 755, 'loss': 4.667891979217529}
{'epoch': 10, 'batch': 756, 'loss': 5.229787826538086}
{'epoch': 10, 'batch': 757, 'loss': 5.287716865539551}
{'epoch': 10, 'batch': 758, 'loss': 4.904854774475098}
{'epoch': 10, 'batch': 759, 'loss': 5.126594066619873}
{'epoch': 10, 'batch': 760, 'loss': 5.023011684417725}
{'epoch': 10, 'batch': 761, 'loss': 4.8764872550964355}
{'epoch': 10, 'batch': 762, 'loss': 5.032485485076904}
{'epoch': 10, 'batch': 763, 'loss': 4.758702754974365}
{'epoch': 10, 'batch': 764, 'loss': 5.148283004760742}
{'epoch': 10, 'batch': 765, 'loss': 4.987968444824219}
{'epoch': 10, 'batch': 766, 'loss': 5.138027191162109}
{'epoch': 10, 'batch': 767, 'loss': 5.041795253753662}
{'epoch': 

{'epoch': 10, 'batch': 899, 'loss': 4.92264986038208}
{'epoch': 10, 'batch': 900, 'loss': 4.880490779876709}
{'epoch': 10, 'batch': 901, 'loss': 4.733692646026611}
{'epoch': 10, 'batch': 902, 'loss': 4.837490081787109}
{'epoch': 10, 'batch': 903, 'loss': 4.877697467803955}
{'epoch': 10, 'batch': 904, 'loss': 5.04519510269165}
{'epoch': 10, 'batch': 905, 'loss': 4.992307186126709}
{'epoch': 10, 'batch': 906, 'loss': 5.203053951263428}
{'epoch': 10, 'batch': 907, 'loss': 5.220670700073242}
{'epoch': 10, 'batch': 908, 'loss': 4.934051036834717}
{'epoch': 10, 'batch': 909, 'loss': 4.957211017608643}
{'epoch': 10, 'batch': 910, 'loss': 4.94179630279541}
{'epoch': 10, 'batch': 911, 'loss': 4.948462963104248}
{'epoch': 10, 'batch': 912, 'loss': 4.5560688972473145}
{'epoch': 10, 'batch': 913, 'loss': 4.859809875488281}
{'epoch': 10, 'batch': 914, 'loss': 4.64680814743042}
{'epoch': 10, 'batch': 915, 'loss': 4.689695835113525}
{'epoch': 10, 'batch': 916, 'loss': 4.6645731925964355}
{'epoch': 10

{'epoch': 11, 'batch': 75, 'loss': 4.776101589202881}
{'epoch': 11, 'batch': 76, 'loss': 4.462071418762207}
{'epoch': 11, 'batch': 77, 'loss': 5.086358070373535}
{'epoch': 11, 'batch': 78, 'loss': 4.952317714691162}
{'epoch': 11, 'batch': 79, 'loss': 4.647273540496826}
{'epoch': 11, 'batch': 80, 'loss': 5.131350517272949}
{'epoch': 11, 'batch': 81, 'loss': 4.9552321434021}
{'epoch': 11, 'batch': 82, 'loss': 4.936285972595215}
{'epoch': 11, 'batch': 83, 'loss': 4.947927474975586}
{'epoch': 11, 'batch': 84, 'loss': 4.908427715301514}
{'epoch': 11, 'batch': 85, 'loss': 4.995296478271484}
{'epoch': 11, 'batch': 86, 'loss': 5.090216636657715}
{'epoch': 11, 'batch': 87, 'loss': 4.826268196105957}
{'epoch': 11, 'batch': 88, 'loss': 4.887836933135986}
{'epoch': 11, 'batch': 89, 'loss': 4.86851692199707}
{'epoch': 11, 'batch': 90, 'loss': 4.7786664962768555}
{'epoch': 11, 'batch': 91, 'loss': 5.0395050048828125}
{'epoch': 11, 'batch': 92, 'loss': 4.436573505401611}
{'epoch': 11, 'batch': 93, 'l

{'epoch': 11, 'batch': 225, 'loss': 4.843876361846924}
{'epoch': 11, 'batch': 226, 'loss': 4.7195844650268555}
{'epoch': 11, 'batch': 227, 'loss': 4.879567623138428}
{'epoch': 11, 'batch': 228, 'loss': 5.271816253662109}
{'epoch': 11, 'batch': 229, 'loss': 4.992687702178955}
{'epoch': 11, 'batch': 230, 'loss': 4.867661476135254}
{'epoch': 11, 'batch': 231, 'loss': 4.860628604888916}
{'epoch': 11, 'batch': 232, 'loss': 5.007463455200195}
{'epoch': 11, 'batch': 233, 'loss': 4.932098865509033}
{'epoch': 11, 'batch': 234, 'loss': 4.631021499633789}
{'epoch': 11, 'batch': 235, 'loss': 5.006275653839111}
{'epoch': 11, 'batch': 236, 'loss': 4.932444095611572}
{'epoch': 11, 'batch': 237, 'loss': 4.5530476570129395}
{'epoch': 11, 'batch': 238, 'loss': 4.8339972496032715}
{'epoch': 11, 'batch': 239, 'loss': 5.064907550811768}
{'epoch': 11, 'batch': 240, 'loss': 5.188757419586182}
{'epoch': 11, 'batch': 241, 'loss': 5.000464916229248}
{'epoch': 11, 'batch': 242, 'loss': 4.499324321746826}
{'epoch

{'epoch': 11, 'batch': 374, 'loss': 4.663187026977539}
{'epoch': 11, 'batch': 375, 'loss': 4.721490383148193}
{'epoch': 11, 'batch': 376, 'loss': 4.459304332733154}
{'epoch': 11, 'batch': 377, 'loss': 4.88171911239624}
{'epoch': 11, 'batch': 378, 'loss': 4.929471969604492}
{'epoch': 11, 'batch': 379, 'loss': 4.9982476234436035}
{'epoch': 11, 'batch': 380, 'loss': 4.636708736419678}
{'epoch': 11, 'batch': 381, 'loss': 4.892620086669922}
{'epoch': 11, 'batch': 382, 'loss': 5.268473148345947}
{'epoch': 11, 'batch': 383, 'loss': 4.503708839416504}
{'epoch': 11, 'batch': 384, 'loss': 4.863597393035889}
{'epoch': 11, 'batch': 385, 'loss': 4.809659004211426}
{'epoch': 11, 'batch': 386, 'loss': 4.723031520843506}
{'epoch': 11, 'batch': 387, 'loss': 5.047246932983398}
{'epoch': 11, 'batch': 388, 'loss': 4.904072284698486}
{'epoch': 11, 'batch': 389, 'loss': 4.917840957641602}
{'epoch': 11, 'batch': 390, 'loss': 4.87355375289917}
{'epoch': 11, 'batch': 391, 'loss': 4.843446731567383}
{'epoch': 1

{'epoch': 11, 'batch': 523, 'loss': 4.876055717468262}
{'epoch': 11, 'batch': 524, 'loss': 4.722763538360596}
{'epoch': 11, 'batch': 525, 'loss': 4.811958312988281}
{'epoch': 11, 'batch': 526, 'loss': 5.204040050506592}
{'epoch': 11, 'batch': 527, 'loss': 4.9718780517578125}
{'epoch': 11, 'batch': 528, 'loss': 4.815738677978516}
{'epoch': 11, 'batch': 529, 'loss': 4.771043300628662}
{'epoch': 11, 'batch': 530, 'loss': 5.067348957061768}
{'epoch': 11, 'batch': 531, 'loss': 4.962337970733643}
{'epoch': 11, 'batch': 532, 'loss': 4.949246406555176}
{'epoch': 11, 'batch': 533, 'loss': 4.864774227142334}
{'epoch': 11, 'batch': 534, 'loss': 4.852794170379639}
{'epoch': 11, 'batch': 535, 'loss': 4.871940612792969}
{'epoch': 11, 'batch': 536, 'loss': 5.00570011138916}
{'epoch': 11, 'batch': 537, 'loss': 4.7123236656188965}
{'epoch': 11, 'batch': 538, 'loss': 4.968456745147705}
{'epoch': 11, 'batch': 539, 'loss': 4.979814052581787}
{'epoch': 11, 'batch': 540, 'loss': 4.972995281219482}
{'epoch':

{'epoch': 11, 'batch': 672, 'loss': 4.687099933624268}
{'epoch': 11, 'batch': 673, 'loss': 5.067929744720459}
{'epoch': 11, 'batch': 674, 'loss': 4.807779788970947}
{'epoch': 11, 'batch': 675, 'loss': 4.945031642913818}
{'epoch': 11, 'batch': 676, 'loss': 4.692715644836426}
{'epoch': 11, 'batch': 677, 'loss': 5.004534721374512}
{'epoch': 11, 'batch': 678, 'loss': 4.95266580581665}
{'epoch': 11, 'batch': 679, 'loss': 4.630499362945557}
{'epoch': 11, 'batch': 680, 'loss': 4.529614448547363}
{'epoch': 11, 'batch': 681, 'loss': 5.067763328552246}
{'epoch': 11, 'batch': 682, 'loss': 4.953185558319092}
{'epoch': 11, 'batch': 683, 'loss': 4.8339524269104}
{'epoch': 11, 'batch': 684, 'loss': 4.629486560821533}
{'epoch': 11, 'batch': 685, 'loss': 4.821783065795898}
{'epoch': 11, 'batch': 686, 'loss': 4.772823333740234}
{'epoch': 11, 'batch': 687, 'loss': 4.60609245300293}
{'epoch': 11, 'batch': 688, 'loss': 4.634616851806641}
{'epoch': 11, 'batch': 689, 'loss': 4.72291374206543}
{'epoch': 11, '

{'epoch': 11, 'batch': 822, 'loss': 4.785816669464111}
{'epoch': 11, 'batch': 823, 'loss': 5.102338790893555}
{'epoch': 11, 'batch': 824, 'loss': 4.878796100616455}
{'epoch': 11, 'batch': 825, 'loss': 4.751022815704346}
{'epoch': 11, 'batch': 826, 'loss': 4.722017288208008}
{'epoch': 11, 'batch': 827, 'loss': 5.042490005493164}
{'epoch': 11, 'batch': 828, 'loss': 4.901451587677002}
{'epoch': 11, 'batch': 829, 'loss': 4.560717582702637}
{'epoch': 11, 'batch': 830, 'loss': 4.958300590515137}
{'epoch': 11, 'batch': 831, 'loss': 4.881572246551514}
{'epoch': 11, 'batch': 832, 'loss': 4.8221869468688965}
{'epoch': 11, 'batch': 833, 'loss': 4.690899848937988}
{'epoch': 11, 'batch': 834, 'loss': 4.750730991363525}
{'epoch': 11, 'batch': 835, 'loss': 4.949956893920898}
{'epoch': 11, 'batch': 836, 'loss': 4.60321044921875}
{'epoch': 11, 'batch': 837, 'loss': 4.5483222007751465}
{'epoch': 11, 'batch': 838, 'loss': 4.762001991271973}
{'epoch': 11, 'batch': 839, 'loss': 5.210618019104004}
{'epoch':

{'epoch': 11, 'batch': 972, 'loss': 4.6852006912231445}
{'epoch': 11, 'batch': 973, 'loss': 4.723285675048828}
{'epoch': 11, 'batch': 974, 'loss': 3.700183629989624}
{'epoch': 12, 'batch': 0, 'loss': 1.851125955581665}
{'epoch': 12, 'batch': 1, 'loss': 1.8821594715118408}
{'epoch': 12, 'batch': 2, 'loss': 2.2158873081207275}
{'epoch': 12, 'batch': 3, 'loss': 1.884223222732544}
{'epoch': 12, 'batch': 4, 'loss': 1.8459980487823486}
{'epoch': 12, 'batch': 5, 'loss': 3.2853639125823975}
{'epoch': 12, 'batch': 6, 'loss': 2.871311902999878}
{'epoch': 12, 'batch': 7, 'loss': 2.853515863418579}
{'epoch': 12, 'batch': 8, 'loss': 4.83474588394165}
{'epoch': 12, 'batch': 9, 'loss': 4.159057140350342}
{'epoch': 12, 'batch': 10, 'loss': 4.541449069976807}
{'epoch': 12, 'batch': 11, 'loss': 3.9857373237609863}
{'epoch': 12, 'batch': 12, 'loss': 4.054196834564209}
{'epoch': 12, 'batch': 13, 'loss': 4.155450344085693}
{'epoch': 12, 'batch': 14, 'loss': 4.428133010864258}
{'epoch': 12, 'batch': 15, 'lo

{'epoch': 12, 'batch': 148, 'loss': 4.685662269592285}
{'epoch': 12, 'batch': 149, 'loss': 5.041907787322998}
{'epoch': 12, 'batch': 150, 'loss': 5.061651706695557}
{'epoch': 12, 'batch': 151, 'loss': 4.8183369636535645}
{'epoch': 12, 'batch': 152, 'loss': 4.7630133628845215}
{'epoch': 12, 'batch': 153, 'loss': 4.362236022949219}
{'epoch': 12, 'batch': 154, 'loss': 4.588318824768066}
{'epoch': 12, 'batch': 155, 'loss': 4.720170021057129}
{'epoch': 12, 'batch': 156, 'loss': 4.521615028381348}
{'epoch': 12, 'batch': 157, 'loss': 4.7140913009643555}
{'epoch': 12, 'batch': 158, 'loss': 4.5824785232543945}
{'epoch': 12, 'batch': 159, 'loss': 4.652724742889404}
{'epoch': 12, 'batch': 160, 'loss': 4.869467258453369}
{'epoch': 12, 'batch': 161, 'loss': 4.582774639129639}
{'epoch': 12, 'batch': 162, 'loss': 4.87313175201416}
{'epoch': 12, 'batch': 163, 'loss': 4.54642391204834}
{'epoch': 12, 'batch': 164, 'loss': 4.648906230926514}
{'epoch': 12, 'batch': 165, 'loss': 4.640021324157715}
{'epoch'

{'epoch': 12, 'batch': 297, 'loss': 4.847063064575195}
{'epoch': 12, 'batch': 298, 'loss': 5.030318737030029}
{'epoch': 12, 'batch': 299, 'loss': 4.958827495574951}
{'epoch': 12, 'batch': 300, 'loss': 4.662588119506836}
{'epoch': 12, 'batch': 301, 'loss': 4.929034233093262}
{'epoch': 12, 'batch': 302, 'loss': 5.031332015991211}
{'epoch': 12, 'batch': 303, 'loss': 4.793552875518799}
{'epoch': 12, 'batch': 304, 'loss': 4.974934101104736}
{'epoch': 12, 'batch': 305, 'loss': 4.824507236480713}
{'epoch': 12, 'batch': 306, 'loss': 4.71190881729126}
{'epoch': 12, 'batch': 307, 'loss': 5.023472785949707}
{'epoch': 12, 'batch': 308, 'loss': 4.836521625518799}
{'epoch': 12, 'batch': 309, 'loss': 4.5197343826293945}
{'epoch': 12, 'batch': 310, 'loss': 4.594736576080322}
{'epoch': 12, 'batch': 311, 'loss': 4.26747465133667}
{'epoch': 12, 'batch': 312, 'loss': 4.352350234985352}
{'epoch': 12, 'batch': 313, 'loss': 4.46680212020874}
{'epoch': 12, 'batch': 314, 'loss': 4.72236442565918}
{'epoch': 12,

{'epoch': 12, 'batch': 446, 'loss': 4.713342666625977}
{'epoch': 12, 'batch': 447, 'loss': 4.809450626373291}
{'epoch': 12, 'batch': 448, 'loss': 4.729371547698975}
{'epoch': 12, 'batch': 449, 'loss': 4.430749893188477}
{'epoch': 12, 'batch': 450, 'loss': 4.740797519683838}
{'epoch': 12, 'batch': 451, 'loss': 4.731263637542725}
{'epoch': 12, 'batch': 452, 'loss': 4.569202423095703}
{'epoch': 12, 'batch': 453, 'loss': 4.729574680328369}
{'epoch': 12, 'batch': 454, 'loss': 4.4724650382995605}
{'epoch': 12, 'batch': 455, 'loss': 4.324635982513428}
{'epoch': 12, 'batch': 456, 'loss': 4.4504499435424805}
{'epoch': 12, 'batch': 457, 'loss': 4.315584182739258}
{'epoch': 12, 'batch': 458, 'loss': 4.829539775848389}
{'epoch': 12, 'batch': 459, 'loss': 4.7412214279174805}
{'epoch': 12, 'batch': 460, 'loss': 4.734732627868652}
{'epoch': 12, 'batch': 461, 'loss': 4.285036087036133}
{'epoch': 12, 'batch': 462, 'loss': 4.486098766326904}
{'epoch': 12, 'batch': 463, 'loss': 4.4695258140563965}
{'epoc

{'epoch': 12, 'batch': 595, 'loss': 4.886620998382568}
{'epoch': 12, 'batch': 596, 'loss': 4.755946159362793}
{'epoch': 12, 'batch': 597, 'loss': 4.68725061416626}
{'epoch': 12, 'batch': 598, 'loss': 4.908115863800049}
{'epoch': 12, 'batch': 599, 'loss': 4.828124046325684}
{'epoch': 12, 'batch': 600, 'loss': 4.572363376617432}
{'epoch': 12, 'batch': 601, 'loss': 4.530666351318359}
{'epoch': 12, 'batch': 602, 'loss': 4.535717010498047}
{'epoch': 12, 'batch': 603, 'loss': 4.8341522216796875}
{'epoch': 12, 'batch': 604, 'loss': 4.57871150970459}
{'epoch': 12, 'batch': 605, 'loss': 4.355040073394775}
{'epoch': 12, 'batch': 606, 'loss': 4.538917064666748}
{'epoch': 12, 'batch': 607, 'loss': 4.394009113311768}
{'epoch': 12, 'batch': 608, 'loss': 4.660532474517822}
{'epoch': 12, 'batch': 609, 'loss': 4.343439102172852}
{'epoch': 12, 'batch': 610, 'loss': 4.6662373542785645}
{'epoch': 12, 'batch': 611, 'loss': 4.8051958084106445}
{'epoch': 12, 'batch': 612, 'loss': 5.007376194000244}
{'epoch':

{'epoch': 12, 'batch': 745, 'loss': 4.8250041007995605}
{'epoch': 12, 'batch': 746, 'loss': 4.921100616455078}
{'epoch': 12, 'batch': 747, 'loss': 4.971334457397461}
{'epoch': 12, 'batch': 748, 'loss': 4.812127113342285}
{'epoch': 12, 'batch': 749, 'loss': 4.799506664276123}
{'epoch': 12, 'batch': 750, 'loss': 4.287282466888428}
{'epoch': 12, 'batch': 751, 'loss': 4.630931854248047}
{'epoch': 12, 'batch': 752, 'loss': 4.572048664093018}
{'epoch': 12, 'batch': 753, 'loss': 4.762600898742676}
{'epoch': 12, 'batch': 754, 'loss': 4.937749862670898}
{'epoch': 12, 'batch': 755, 'loss': 4.4805707931518555}
{'epoch': 12, 'batch': 756, 'loss': 5.007859230041504}
{'epoch': 12, 'batch': 757, 'loss': 5.123378276824951}
{'epoch': 12, 'batch': 758, 'loss': 4.731219291687012}
{'epoch': 12, 'batch': 759, 'loss': 4.871939659118652}
{'epoch': 12, 'batch': 760, 'loss': 4.843101978302002}
{'epoch': 12, 'batch': 761, 'loss': 4.711559295654297}
{'epoch': 12, 'batch': 762, 'loss': 4.879246711730957}
{'epoch'

{'epoch': 12, 'batch': 894, 'loss': 4.420201301574707}
{'epoch': 12, 'batch': 895, 'loss': 4.7276530265808105}
{'epoch': 12, 'batch': 896, 'loss': 4.543099880218506}
{'epoch': 12, 'batch': 897, 'loss': 4.937738418579102}
{'epoch': 12, 'batch': 898, 'loss': 4.799482345581055}
{'epoch': 12, 'batch': 899, 'loss': 4.786975383758545}
{'epoch': 12, 'batch': 900, 'loss': 4.707314968109131}
{'epoch': 12, 'batch': 901, 'loss': 4.600452899932861}
{'epoch': 12, 'batch': 902, 'loss': 4.696052551269531}
{'epoch': 12, 'batch': 903, 'loss': 4.705843448638916}
{'epoch': 12, 'batch': 904, 'loss': 4.848958492279053}
{'epoch': 12, 'batch': 905, 'loss': 4.82105016708374}
{'epoch': 12, 'batch': 906, 'loss': 5.033600807189941}
{'epoch': 12, 'batch': 907, 'loss': 5.0214619636535645}
{'epoch': 12, 'batch': 908, 'loss': 4.750933647155762}
{'epoch': 12, 'batch': 909, 'loss': 4.8308916091918945}
{'epoch': 12, 'batch': 910, 'loss': 4.750024795532227}
{'epoch': 12, 'batch': 911, 'loss': 4.7918701171875}
{'epoch': 

{'epoch': 13, 'batch': 70, 'loss': 4.5281805992126465}
{'epoch': 13, 'batch': 71, 'loss': 4.841521739959717}
{'epoch': 13, 'batch': 72, 'loss': 4.708751201629639}
{'epoch': 13, 'batch': 73, 'loss': 4.813945293426514}
{'epoch': 13, 'batch': 74, 'loss': 4.703009128570557}
{'epoch': 13, 'batch': 75, 'loss': 4.630011558532715}
{'epoch': 13, 'batch': 76, 'loss': 4.294419765472412}
{'epoch': 13, 'batch': 77, 'loss': 4.858613967895508}
{'epoch': 13, 'batch': 78, 'loss': 4.728626251220703}
{'epoch': 13, 'batch': 79, 'loss': 4.407271862030029}
{'epoch': 13, 'batch': 80, 'loss': 4.837653160095215}
{'epoch': 13, 'batch': 81, 'loss': 4.702697277069092}
{'epoch': 13, 'batch': 82, 'loss': 4.735262870788574}
{'epoch': 13, 'batch': 83, 'loss': 4.738961219787598}
{'epoch': 13, 'batch': 84, 'loss': 4.634767055511475}
{'epoch': 13, 'batch': 85, 'loss': 4.793463230133057}
{'epoch': 13, 'batch': 86, 'loss': 4.856258392333984}
{'epoch': 13, 'batch': 87, 'loss': 4.661919116973877}
{'epoch': 13, 'batch': 88, 

{'epoch': 13, 'batch': 220, 'loss': 4.617679595947266}
{'epoch': 13, 'batch': 221, 'loss': 4.686515808105469}
{'epoch': 13, 'batch': 222, 'loss': 4.669594764709473}
{'epoch': 13, 'batch': 223, 'loss': 4.46476936340332}
{'epoch': 13, 'batch': 224, 'loss': 4.606723308563232}
{'epoch': 13, 'batch': 225, 'loss': 4.636350154876709}
{'epoch': 13, 'batch': 226, 'loss': 4.532778739929199}
{'epoch': 13, 'batch': 227, 'loss': 4.6466522216796875}
{'epoch': 13, 'batch': 228, 'loss': 5.017090320587158}
{'epoch': 13, 'batch': 229, 'loss': 4.785440444946289}
{'epoch': 13, 'batch': 230, 'loss': 4.682163238525391}
{'epoch': 13, 'batch': 231, 'loss': 4.701460361480713}
{'epoch': 13, 'batch': 232, 'loss': 4.913671016693115}
{'epoch': 13, 'batch': 233, 'loss': 4.8205246925354}
{'epoch': 13, 'batch': 234, 'loss': 4.542031764984131}
{'epoch': 13, 'batch': 235, 'loss': 4.927184581756592}
{'epoch': 13, 'batch': 236, 'loss': 4.835226535797119}
{'epoch': 13, 'batch': 237, 'loss': 4.336709499359131}
{'epoch': 13

{'epoch': 13, 'batch': 370, 'loss': 4.527955055236816}
{'epoch': 13, 'batch': 371, 'loss': 4.657172679901123}
{'epoch': 13, 'batch': 372, 'loss': 4.644224166870117}
{'epoch': 13, 'batch': 373, 'loss': 4.629474639892578}
{'epoch': 13, 'batch': 374, 'loss': 4.480357646942139}
{'epoch': 13, 'batch': 375, 'loss': 4.526936054229736}
{'epoch': 13, 'batch': 376, 'loss': 4.2820940017700195}
{'epoch': 13, 'batch': 377, 'loss': 4.710509300231934}
{'epoch': 13, 'batch': 378, 'loss': 4.752710819244385}
{'epoch': 13, 'batch': 379, 'loss': 4.825063705444336}
{'epoch': 13, 'batch': 380, 'loss': 4.422121524810791}
{'epoch': 13, 'batch': 381, 'loss': 4.698828220367432}
{'epoch': 13, 'batch': 382, 'loss': 5.047851085662842}
{'epoch': 13, 'batch': 383, 'loss': 4.351614952087402}
{'epoch': 13, 'batch': 384, 'loss': 4.669507026672363}
{'epoch': 13, 'batch': 385, 'loss': 4.576226234436035}
{'epoch': 13, 'batch': 386, 'loss': 4.572868824005127}
{'epoch': 13, 'batch': 387, 'loss': 4.771636962890625}
{'epoch':

{'epoch': 13, 'batch': 520, 'loss': 4.948238372802734}
{'epoch': 13, 'batch': 521, 'loss': 4.344683647155762}
{'epoch': 13, 'batch': 522, 'loss': 4.401162624359131}
{'epoch': 13, 'batch': 523, 'loss': 4.606396198272705}
{'epoch': 13, 'batch': 524, 'loss': 4.539485454559326}
{'epoch': 13, 'batch': 525, 'loss': 4.486587047576904}
{'epoch': 13, 'batch': 526, 'loss': 4.92911958694458}
{'epoch': 13, 'batch': 527, 'loss': 4.662992477416992}
{'epoch': 13, 'batch': 528, 'loss': 4.544809341430664}
{'epoch': 13, 'batch': 529, 'loss': 4.555134296417236}
{'epoch': 13, 'batch': 530, 'loss': 4.922188758850098}
{'epoch': 13, 'batch': 531, 'loss': 4.777566909790039}
{'epoch': 13, 'batch': 532, 'loss': 4.7944512367248535}
{'epoch': 13, 'batch': 533, 'loss': 4.737521171569824}
{'epoch': 13, 'batch': 534, 'loss': 4.68998384475708}
{'epoch': 13, 'batch': 535, 'loss': 4.690005302429199}
{'epoch': 13, 'batch': 536, 'loss': 4.818364143371582}
{'epoch': 13, 'batch': 537, 'loss': 4.565487861633301}
{'epoch': 1

{'epoch': 13, 'batch': 669, 'loss': 4.75346565246582}
{'epoch': 13, 'batch': 670, 'loss': 4.519931793212891}
{'epoch': 13, 'batch': 671, 'loss': 4.72650671005249}
{'epoch': 13, 'batch': 672, 'loss': 4.510464668273926}
{'epoch': 13, 'batch': 673, 'loss': 4.8786115646362305}
{'epoch': 13, 'batch': 674, 'loss': 4.617610454559326}
{'epoch': 13, 'batch': 675, 'loss': 4.631843090057373}
{'epoch': 13, 'batch': 676, 'loss': 4.476398468017578}
{'epoch': 13, 'batch': 677, 'loss': 4.758368015289307}
{'epoch': 13, 'batch': 678, 'loss': 4.753916263580322}
{'epoch': 13, 'batch': 679, 'loss': 4.493954658508301}
{'epoch': 13, 'batch': 680, 'loss': 4.304584980010986}
{'epoch': 13, 'batch': 681, 'loss': 4.755904197692871}
{'epoch': 13, 'batch': 682, 'loss': 4.700332164764404}
{'epoch': 13, 'batch': 683, 'loss': 4.650023460388184}
{'epoch': 13, 'batch': 684, 'loss': 4.34943151473999}
{'epoch': 13, 'batch': 685, 'loss': 4.544712543487549}
{'epoch': 13, 'batch': 686, 'loss': 4.509608268737793}
{'epoch': 13

{'epoch': 13, 'batch': 818, 'loss': 4.8280768394470215}
{'epoch': 13, 'batch': 819, 'loss': 4.9917473793029785}
{'epoch': 13, 'batch': 820, 'loss': 4.641867637634277}
{'epoch': 13, 'batch': 821, 'loss': 4.704788684844971}
{'epoch': 13, 'batch': 822, 'loss': 4.673094272613525}
{'epoch': 13, 'batch': 823, 'loss': 4.898603916168213}
{'epoch': 13, 'batch': 824, 'loss': 4.717460632324219}
{'epoch': 13, 'batch': 825, 'loss': 4.590137004852295}
{'epoch': 13, 'batch': 826, 'loss': 4.467695713043213}
{'epoch': 13, 'batch': 827, 'loss': 4.7871527671813965}
{'epoch': 13, 'batch': 828, 'loss': 4.697841167449951}
{'epoch': 13, 'batch': 829, 'loss': 4.373448371887207}
{'epoch': 13, 'batch': 830, 'loss': 4.76060676574707}
{'epoch': 13, 'batch': 831, 'loss': 4.655417442321777}
{'epoch': 13, 'batch': 832, 'loss': 4.657456874847412}
{'epoch': 13, 'batch': 833, 'loss': 4.505550861358643}
{'epoch': 13, 'batch': 834, 'loss': 4.578793525695801}
{'epoch': 13, 'batch': 835, 'loss': 4.778838634490967}
{'epoch'

{'epoch': 13, 'batch': 967, 'loss': 4.639325141906738}
{'epoch': 13, 'batch': 968, 'loss': 4.920866966247559}
{'epoch': 13, 'batch': 969, 'loss': 4.7571024894714355}
{'epoch': 13, 'batch': 970, 'loss': 4.8189005851745605}
{'epoch': 13, 'batch': 971, 'loss': 4.374744415283203}
{'epoch': 13, 'batch': 972, 'loss': 4.543540000915527}
{'epoch': 13, 'batch': 973, 'loss': 4.556951999664307}
{'epoch': 13, 'batch': 974, 'loss': 3.3417882919311523}
{'epoch': 14, 'batch': 0, 'loss': 1.7316752672195435}
{'epoch': 14, 'batch': 1, 'loss': 1.7738683223724365}
{'epoch': 14, 'batch': 2, 'loss': 2.02984881401062}
{'epoch': 14, 'batch': 3, 'loss': 1.783142328262329}
{'epoch': 14, 'batch': 4, 'loss': 1.6969826221466064}
{'epoch': 14, 'batch': 5, 'loss': 3.047255039215088}
{'epoch': 14, 'batch': 6, 'loss': 2.65859055519104}
{'epoch': 14, 'batch': 7, 'loss': 2.6831002235412598}
{'epoch': 14, 'batch': 8, 'loss': 4.5734429359436035}
{'epoch': 14, 'batch': 9, 'loss': 3.941373586654663}
{'epoch': 14, 'batch': 1

{'epoch': 14, 'batch': 143, 'loss': 4.341918468475342}
{'epoch': 14, 'batch': 144, 'loss': 4.4013895988464355}
{'epoch': 14, 'batch': 145, 'loss': 4.233320713043213}
{'epoch': 14, 'batch': 146, 'loss': 4.560473442077637}
{'epoch': 14, 'batch': 147, 'loss': 4.500181198120117}
{'epoch': 14, 'batch': 148, 'loss': 4.534726619720459}
{'epoch': 14, 'batch': 149, 'loss': 4.792072772979736}
{'epoch': 14, 'batch': 150, 'loss': 4.906221389770508}
{'epoch': 14, 'batch': 151, 'loss': 4.660168170928955}
{'epoch': 14, 'batch': 152, 'loss': 4.669947147369385}
{'epoch': 14, 'batch': 153, 'loss': 4.286605358123779}
{'epoch': 14, 'batch': 154, 'loss': 4.510258674621582}
{'epoch': 14, 'batch': 155, 'loss': 4.711881637573242}
{'epoch': 14, 'batch': 156, 'loss': 4.485545635223389}
{'epoch': 14, 'batch': 157, 'loss': 4.611093521118164}
{'epoch': 14, 'batch': 158, 'loss': 4.557335376739502}
{'epoch': 14, 'batch': 159, 'loss': 4.555506229400635}
{'epoch': 14, 'batch': 160, 'loss': 4.716290473937988}
{'epoch':

{'epoch': 14, 'batch': 292, 'loss': 4.562239170074463}
{'epoch': 14, 'batch': 293, 'loss': 4.372438907623291}
{'epoch': 14, 'batch': 294, 'loss': 4.648482799530029}
{'epoch': 14, 'batch': 295, 'loss': 4.441340923309326}
{'epoch': 14, 'batch': 296, 'loss': 4.938501834869385}
{'epoch': 14, 'batch': 297, 'loss': 4.590655326843262}
{'epoch': 14, 'batch': 298, 'loss': 4.7543487548828125}
{'epoch': 14, 'batch': 299, 'loss': 4.682623863220215}
{'epoch': 14, 'batch': 300, 'loss': 4.4385247230529785}
{'epoch': 14, 'batch': 301, 'loss': 4.603341579437256}
{'epoch': 14, 'batch': 302, 'loss': 4.790537357330322}
{'epoch': 14, 'batch': 303, 'loss': 4.607870101928711}
{'epoch': 14, 'batch': 304, 'loss': 4.738491535186768}
{'epoch': 14, 'batch': 305, 'loss': 4.527653694152832}
{'epoch': 14, 'batch': 306, 'loss': 4.426381587982178}
{'epoch': 14, 'batch': 307, 'loss': 4.842323303222656}
{'epoch': 14, 'batch': 308, 'loss': 4.659030437469482}
{'epoch': 14, 'batch': 309, 'loss': 4.247452735900879}
{'epoch'

{'epoch': 14, 'batch': 441, 'loss': 4.3304524421691895}
{'epoch': 14, 'batch': 442, 'loss': 4.542288303375244}
{'epoch': 14, 'batch': 443, 'loss': 4.4665021896362305}
{'epoch': 14, 'batch': 444, 'loss': 4.52522087097168}
{'epoch': 14, 'batch': 445, 'loss': 4.295141220092773}
{'epoch': 14, 'batch': 446, 'loss': 4.586758136749268}
{'epoch': 14, 'batch': 447, 'loss': 4.673999309539795}
{'epoch': 14, 'batch': 448, 'loss': 4.606470108032227}
{'epoch': 14, 'batch': 449, 'loss': 4.2980637550354}
{'epoch': 14, 'batch': 450, 'loss': 4.647959232330322}
{'epoch': 14, 'batch': 451, 'loss': 4.621181488037109}
{'epoch': 14, 'batch': 452, 'loss': 4.456716537475586}
{'epoch': 14, 'batch': 453, 'loss': 4.633925437927246}
{'epoch': 14, 'batch': 454, 'loss': 4.341757774353027}
{'epoch': 14, 'batch': 455, 'loss': 4.234309196472168}
{'epoch': 14, 'batch': 456, 'loss': 4.264045238494873}
{'epoch': 14, 'batch': 457, 'loss': 4.126718997955322}
{'epoch': 14, 'batch': 458, 'loss': 4.688088893890381}
{'epoch': 1

{'epoch': 14, 'batch': 591, 'loss': 4.229660987854004}
{'epoch': 14, 'batch': 592, 'loss': 4.561456680297852}
{'epoch': 14, 'batch': 593, 'loss': 4.0816826820373535}
{'epoch': 14, 'batch': 594, 'loss': 4.555882453918457}
{'epoch': 14, 'batch': 595, 'loss': 4.746563911437988}
{'epoch': 14, 'batch': 596, 'loss': 4.611555576324463}
{'epoch': 14, 'batch': 597, 'loss': 4.544368267059326}
{'epoch': 14, 'batch': 598, 'loss': 4.768182277679443}
{'epoch': 14, 'batch': 599, 'loss': 4.645730018615723}
{'epoch': 14, 'batch': 600, 'loss': 4.383011341094971}
{'epoch': 14, 'batch': 601, 'loss': 4.325939655303955}
{'epoch': 14, 'batch': 602, 'loss': 4.317594528198242}
{'epoch': 14, 'batch': 603, 'loss': 4.695298671722412}
{'epoch': 14, 'batch': 604, 'loss': 4.3509602546691895}
{'epoch': 14, 'batch': 605, 'loss': 4.180956840515137}
{'epoch': 14, 'batch': 606, 'loss': 4.3822340965271}
{'epoch': 14, 'batch': 607, 'loss': 4.178768157958984}
{'epoch': 14, 'batch': 608, 'loss': 4.449929714202881}
{'epoch': 

{'epoch': 14, 'batch': 740, 'loss': 4.705063343048096}
{'epoch': 14, 'batch': 741, 'loss': 4.499945163726807}
{'epoch': 14, 'batch': 742, 'loss': 4.484875679016113}
{'epoch': 14, 'batch': 743, 'loss': 4.66901159286499}
{'epoch': 14, 'batch': 744, 'loss': 4.710776329040527}
{'epoch': 14, 'batch': 745, 'loss': 4.600205421447754}
{'epoch': 14, 'batch': 746, 'loss': 4.610865116119385}
{'epoch': 14, 'batch': 747, 'loss': 4.714392185211182}
{'epoch': 14, 'batch': 748, 'loss': 4.623791217803955}
{'epoch': 14, 'batch': 749, 'loss': 4.642374038696289}
{'epoch': 14, 'batch': 750, 'loss': 4.083356857299805}
{'epoch': 14, 'batch': 751, 'loss': 4.44885778427124}
{'epoch': 14, 'batch': 752, 'loss': 4.432224273681641}
{'epoch': 14, 'batch': 753, 'loss': 4.5691728591918945}
{'epoch': 14, 'batch': 754, 'loss': 4.781064033508301}
{'epoch': 14, 'batch': 755, 'loss': 4.323474407196045}
{'epoch': 14, 'batch': 756, 'loss': 4.768322467803955}
{'epoch': 14, 'batch': 757, 'loss': 4.8779191970825195}
{'epoch': 

{'epoch': 14, 'batch': 889, 'loss': 4.024588584899902}
{'epoch': 14, 'batch': 890, 'loss': 4.57684850692749}
{'epoch': 14, 'batch': 891, 'loss': 4.5780930519104}
{'epoch': 14, 'batch': 892, 'loss': 3.9878294467926025}
{'epoch': 14, 'batch': 893, 'loss': 4.205758094787598}
{'epoch': 14, 'batch': 894, 'loss': 4.180490970611572}
{'epoch': 14, 'batch': 895, 'loss': 4.570583820343018}
{'epoch': 14, 'batch': 896, 'loss': 4.383565425872803}
{'epoch': 14, 'batch': 897, 'loss': 4.79709529876709}
{'epoch': 14, 'batch': 898, 'loss': 4.5762858390808105}
{'epoch': 14, 'batch': 899, 'loss': 4.555269718170166}
{'epoch': 14, 'batch': 900, 'loss': 4.485921859741211}
{'epoch': 14, 'batch': 901, 'loss': 4.411210060119629}
{'epoch': 14, 'batch': 902, 'loss': 4.537392616271973}
{'epoch': 14, 'batch': 903, 'loss': 4.522756099700928}
{'epoch': 14, 'batch': 904, 'loss': 4.665890693664551}
{'epoch': 14, 'batch': 905, 'loss': 4.600811958312988}
{'epoch': 14, 'batch': 906, 'loss': 4.9106125831604}
{'epoch': 14, 

{'epoch': 15, 'batch': 65, 'loss': 4.390298366546631}
{'epoch': 15, 'batch': 66, 'loss': 4.406174659729004}
{'epoch': 15, 'batch': 67, 'loss': 4.291285037994385}
{'epoch': 15, 'batch': 68, 'loss': 4.361749649047852}
{'epoch': 15, 'batch': 69, 'loss': 4.186705112457275}
{'epoch': 15, 'batch': 70, 'loss': 4.383580207824707}
{'epoch': 15, 'batch': 71, 'loss': 4.697935581207275}
{'epoch': 15, 'batch': 72, 'loss': 4.55258846282959}
{'epoch': 15, 'batch': 73, 'loss': 4.704716682434082}
{'epoch': 15, 'batch': 74, 'loss': 4.606701374053955}
{'epoch': 15, 'batch': 75, 'loss': 4.514064311981201}
{'epoch': 15, 'batch': 76, 'loss': 4.100622653961182}
{'epoch': 15, 'batch': 77, 'loss': 4.689705848693848}
{'epoch': 15, 'batch': 78, 'loss': 4.553696155548096}
{'epoch': 15, 'batch': 79, 'loss': 4.253630638122559}
{'epoch': 15, 'batch': 80, 'loss': 4.6387786865234375}
{'epoch': 15, 'batch': 81, 'loss': 4.56254768371582}
{'epoch': 15, 'batch': 82, 'loss': 4.507467746734619}
{'epoch': 15, 'batch': 83, 'l

{'epoch': 15, 'batch': 215, 'loss': 4.56600284576416}
{'epoch': 15, 'batch': 216, 'loss': 4.587828636169434}
{'epoch': 15, 'batch': 217, 'loss': 4.463512420654297}
{'epoch': 15, 'batch': 218, 'loss': 4.189211845397949}
{'epoch': 15, 'batch': 219, 'loss': 4.69173002243042}
{'epoch': 15, 'batch': 220, 'loss': 4.431736469268799}
{'epoch': 15, 'batch': 221, 'loss': 4.568663120269775}
{'epoch': 15, 'batch': 222, 'loss': 4.474503040313721}
{'epoch': 15, 'batch': 223, 'loss': 4.293777942657471}
{'epoch': 15, 'batch': 224, 'loss': 4.418580532073975}
{'epoch': 15, 'batch': 225, 'loss': 4.568760871887207}
{'epoch': 15, 'batch': 226, 'loss': 4.3868327140808105}
{'epoch': 15, 'batch': 227, 'loss': 4.495591640472412}
{'epoch': 15, 'batch': 228, 'loss': 4.823718547821045}
{'epoch': 15, 'batch': 229, 'loss': 4.7366623878479}
{'epoch': 15, 'batch': 230, 'loss': 4.496485233306885}
{'epoch': 15, 'batch': 231, 'loss': 4.480189323425293}
{'epoch': 15, 'batch': 232, 'loss': 4.668087005615234}
{'epoch': 15,

{'epoch': 15, 'batch': 364, 'loss': 4.660861492156982}
{'epoch': 15, 'batch': 365, 'loss': 4.480794429779053}
{'epoch': 15, 'batch': 366, 'loss': 4.571841716766357}
{'epoch': 15, 'batch': 367, 'loss': 4.667877674102783}
{'epoch': 15, 'batch': 368, 'loss': 4.37313985824585}
{'epoch': 15, 'batch': 369, 'loss': 4.514454364776611}
{'epoch': 15, 'batch': 370, 'loss': 4.379312515258789}
{'epoch': 15, 'batch': 371, 'loss': 4.51699161529541}
{'epoch': 15, 'batch': 372, 'loss': 4.449958801269531}
{'epoch': 15, 'batch': 373, 'loss': 4.54559326171875}
{'epoch': 15, 'batch': 374, 'loss': 4.34729528427124}
{'epoch': 15, 'batch': 375, 'loss': 4.429002285003662}
{'epoch': 15, 'batch': 376, 'loss': 4.19920539855957}
{'epoch': 15, 'batch': 377, 'loss': 4.577991962432861}
{'epoch': 15, 'batch': 378, 'loss': 4.584832668304443}
{'epoch': 15, 'batch': 379, 'loss': 4.678938388824463}
{'epoch': 15, 'batch': 380, 'loss': 4.288569927215576}
{'epoch': 15, 'batch': 381, 'loss': 4.592675685882568}
{'epoch': 15, '

{'epoch': 15, 'batch': 513, 'loss': 4.391458034515381}
{'epoch': 15, 'batch': 514, 'loss': 4.561982154846191}
{'epoch': 15, 'batch': 515, 'loss': 4.533552169799805}
{'epoch': 15, 'batch': 516, 'loss': 4.469079494476318}
{'epoch': 15, 'batch': 517, 'loss': 4.784863471984863}
{'epoch': 15, 'batch': 518, 'loss': 4.6100544929504395}
{'epoch': 15, 'batch': 519, 'loss': 4.321803569793701}
{'epoch': 15, 'batch': 520, 'loss': 4.694284915924072}
{'epoch': 15, 'batch': 521, 'loss': 4.182765483856201}
{'epoch': 15, 'batch': 522, 'loss': 4.2255682945251465}
{'epoch': 15, 'batch': 523, 'loss': 4.451958656311035}
{'epoch': 15, 'batch': 524, 'loss': 4.420637130737305}
{'epoch': 15, 'batch': 525, 'loss': 4.341620922088623}
{'epoch': 15, 'batch': 526, 'loss': 4.751006603240967}
{'epoch': 15, 'batch': 527, 'loss': 4.47511625289917}
{'epoch': 15, 'batch': 528, 'loss': 4.361105442047119}
{'epoch': 15, 'batch': 529, 'loss': 4.346521854400635}
{'epoch': 15, 'batch': 530, 'loss': 4.730315208435059}
{'epoch':

{'epoch': 15, 'batch': 662, 'loss': 4.456329822540283}
{'epoch': 15, 'batch': 663, 'loss': 4.393134117126465}
{'epoch': 15, 'batch': 664, 'loss': 4.597050189971924}
{'epoch': 15, 'batch': 665, 'loss': 4.801686763763428}
{'epoch': 15, 'batch': 666, 'loss': 4.408927917480469}
{'epoch': 15, 'batch': 667, 'loss': 4.380917549133301}
{'epoch': 15, 'batch': 668, 'loss': 4.519063472747803}
{'epoch': 15, 'batch': 669, 'loss': 4.6389689445495605}
{'epoch': 15, 'batch': 670, 'loss': 4.461049556732178}
{'epoch': 15, 'batch': 671, 'loss': 4.605019569396973}
{'epoch': 15, 'batch': 672, 'loss': 4.312221050262451}
{'epoch': 15, 'batch': 673, 'loss': 4.733870506286621}
{'epoch': 15, 'batch': 674, 'loss': 4.472561836242676}
{'epoch': 15, 'batch': 675, 'loss': 4.4933061599731445}
{'epoch': 15, 'batch': 676, 'loss': 4.365678310394287}
{'epoch': 15, 'batch': 677, 'loss': 4.626445293426514}
{'epoch': 15, 'batch': 678, 'loss': 4.6000776290893555}
{'epoch': 15, 'batch': 679, 'loss': 4.386682987213135}
{'epoch

{'epoch': 15, 'batch': 811, 'loss': 4.557713508605957}
{'epoch': 15, 'batch': 812, 'loss': 4.248724460601807}
{'epoch': 15, 'batch': 813, 'loss': 4.210674285888672}
{'epoch': 15, 'batch': 814, 'loss': 4.500271320343018}
{'epoch': 15, 'batch': 815, 'loss': 4.454295635223389}
{'epoch': 15, 'batch': 816, 'loss': 4.3164448738098145}
{'epoch': 15, 'batch': 817, 'loss': 4.456735610961914}
{'epoch': 15, 'batch': 818, 'loss': 4.66532039642334}
{'epoch': 15, 'batch': 819, 'loss': 4.9055633544921875}
{'epoch': 15, 'batch': 820, 'loss': 4.506999492645264}
{'epoch': 15, 'batch': 821, 'loss': 4.611039638519287}
{'epoch': 15, 'batch': 822, 'loss': 4.605318069458008}
{'epoch': 15, 'batch': 823, 'loss': 4.779820919036865}
{'epoch': 15, 'batch': 824, 'loss': 4.596751689910889}
{'epoch': 15, 'batch': 825, 'loss': 4.445491790771484}
{'epoch': 15, 'batch': 826, 'loss': 4.350735664367676}
{'epoch': 15, 'batch': 827, 'loss': 4.591159343719482}
{'epoch': 15, 'batch': 828, 'loss': 4.4612932205200195}
{'epoch'

{'epoch': 15, 'batch': 960, 'loss': 4.527572154998779}
{'epoch': 15, 'batch': 961, 'loss': 4.284908771514893}
{'epoch': 15, 'batch': 962, 'loss': 4.507286071777344}
{'epoch': 15, 'batch': 963, 'loss': 4.358152866363525}
{'epoch': 15, 'batch': 964, 'loss': 4.363874435424805}
{'epoch': 15, 'batch': 965, 'loss': 4.4913225173950195}
{'epoch': 15, 'batch': 966, 'loss': 4.257275581359863}
{'epoch': 15, 'batch': 967, 'loss': 4.491012096405029}
{'epoch': 15, 'batch': 968, 'loss': 4.753003120422363}
{'epoch': 15, 'batch': 969, 'loss': 4.611318588256836}
{'epoch': 15, 'batch': 970, 'loss': 4.6493048667907715}
{'epoch': 15, 'batch': 971, 'loss': 4.189761161804199}
{'epoch': 15, 'batch': 972, 'loss': 4.339447975158691}
{'epoch': 15, 'batch': 973, 'loss': 4.42942476272583}
{'epoch': 15, 'batch': 974, 'loss': 3.1216325759887695}
{'epoch': 16, 'batch': 0, 'loss': 1.5939687490463257}
{'epoch': 16, 'batch': 1, 'loss': 1.686763882637024}
{'epoch': 16, 'batch': 2, 'loss': 1.9183028936386108}
{'epoch': 16

{'epoch': 16, 'batch': 136, 'loss': 4.29511833190918}
{'epoch': 16, 'batch': 137, 'loss': 4.585768222808838}
{'epoch': 16, 'batch': 138, 'loss': 4.427091121673584}
{'epoch': 16, 'batch': 139, 'loss': 4.376122951507568}
{'epoch': 16, 'batch': 140, 'loss': 4.41844367980957}
{'epoch': 16, 'batch': 141, 'loss': 4.550416946411133}
{'epoch': 16, 'batch': 142, 'loss': 4.510645866394043}
{'epoch': 16, 'batch': 143, 'loss': 4.14806604385376}
{'epoch': 16, 'batch': 144, 'loss': 4.23994255065918}
{'epoch': 16, 'batch': 145, 'loss': 4.079869747161865}
{'epoch': 16, 'batch': 146, 'loss': 4.4139628410339355}
{'epoch': 16, 'batch': 147, 'loss': 4.360839366912842}
{'epoch': 16, 'batch': 148, 'loss': 4.427059173583984}
{'epoch': 16, 'batch': 149, 'loss': 4.586904048919678}
{'epoch': 16, 'batch': 150, 'loss': 4.730862140655518}
{'epoch': 16, 'batch': 151, 'loss': 4.485618591308594}
{'epoch': 16, 'batch': 152, 'loss': 4.548673629760742}
{'epoch': 16, 'batch': 153, 'loss': 4.184222221374512}
{'epoch': 16,

{'epoch': 16, 'batch': 285, 'loss': 4.180868148803711}
{'epoch': 16, 'batch': 286, 'loss': 4.303431034088135}
{'epoch': 16, 'batch': 287, 'loss': 4.298137187957764}
{'epoch': 16, 'batch': 288, 'loss': 4.576480865478516}
{'epoch': 16, 'batch': 289, 'loss': 4.35865592956543}
{'epoch': 16, 'batch': 290, 'loss': 4.631359100341797}
{'epoch': 16, 'batch': 291, 'loss': 4.345788955688477}
{'epoch': 16, 'batch': 292, 'loss': 4.396340370178223}
{'epoch': 16, 'batch': 293, 'loss': 4.2052226066589355}
{'epoch': 16, 'batch': 294, 'loss': 4.484643459320068}
{'epoch': 16, 'batch': 295, 'loss': 4.244303226470947}
{'epoch': 16, 'batch': 296, 'loss': 4.817355632781982}
{'epoch': 16, 'batch': 297, 'loss': 4.381179332733154}
{'epoch': 16, 'batch': 298, 'loss': 4.539198398590088}
{'epoch': 16, 'batch': 299, 'loss': 4.528544902801514}
{'epoch': 16, 'batch': 300, 'loss': 4.304426193237305}
{'epoch': 16, 'batch': 301, 'loss': 4.418153762817383}
{'epoch': 16, 'batch': 302, 'loss': 4.575023651123047}
{'epoch': 

{'epoch': 16, 'batch': 434, 'loss': 4.722040176391602}
{'epoch': 16, 'batch': 435, 'loss': 4.514495372772217}
{'epoch': 16, 'batch': 436, 'loss': 4.425111293792725}
{'epoch': 16, 'batch': 437, 'loss': 4.395866870880127}
{'epoch': 16, 'batch': 438, 'loss': 4.389008045196533}
{'epoch': 16, 'batch': 439, 'loss': 4.6529998779296875}
{'epoch': 16, 'batch': 440, 'loss': 4.576961040496826}
{'epoch': 16, 'batch': 441, 'loss': 4.208888053894043}
{'epoch': 16, 'batch': 442, 'loss': 4.407775402069092}
{'epoch': 16, 'batch': 443, 'loss': 4.348349094390869}
{'epoch': 16, 'batch': 444, 'loss': 4.385915279388428}
{'epoch': 16, 'batch': 445, 'loss': 4.202152252197266}
{'epoch': 16, 'batch': 446, 'loss': 4.380685329437256}
{'epoch': 16, 'batch': 447, 'loss': 4.507511138916016}
{'epoch': 16, 'batch': 448, 'loss': 4.450700283050537}
{'epoch': 16, 'batch': 449, 'loss': 4.103357315063477}
{'epoch': 16, 'batch': 450, 'loss': 4.54081916809082}
{'epoch': 16, 'batch': 451, 'loss': 4.428962230682373}
{'epoch': 

{'epoch': 16, 'batch': 583, 'loss': 4.545104503631592}
{'epoch': 16, 'batch': 584, 'loss': 4.348721981048584}
{'epoch': 16, 'batch': 585, 'loss': 4.286556243896484}
{'epoch': 16, 'batch': 586, 'loss': 4.431044578552246}
{'epoch': 16, 'batch': 587, 'loss': 4.163482666015625}
{'epoch': 16, 'batch': 588, 'loss': 4.308547019958496}
{'epoch': 16, 'batch': 589, 'loss': 4.623332500457764}
{'epoch': 16, 'batch': 590, 'loss': 4.228769779205322}
{'epoch': 16, 'batch': 591, 'loss': 4.120491981506348}
{'epoch': 16, 'batch': 592, 'loss': 4.3802714347839355}
{'epoch': 16, 'batch': 593, 'loss': 4.007078170776367}
{'epoch': 16, 'batch': 594, 'loss': 4.39612340927124}
{'epoch': 16, 'batch': 595, 'loss': 4.6490631103515625}
{'epoch': 16, 'batch': 596, 'loss': 4.467281818389893}
{'epoch': 16, 'batch': 597, 'loss': 4.435733318328857}
{'epoch': 16, 'batch': 598, 'loss': 4.743647575378418}
{'epoch': 16, 'batch': 599, 'loss': 4.550454139709473}
{'epoch': 16, 'batch': 600, 'loss': 4.286529064178467}
{'epoch':

{'epoch': 16, 'batch': 732, 'loss': 4.635067939758301}
{'epoch': 16, 'batch': 733, 'loss': 4.26536750793457}
{'epoch': 16, 'batch': 734, 'loss': 4.341487884521484}
{'epoch': 16, 'batch': 735, 'loss': 4.102366924285889}
{'epoch': 16, 'batch': 736, 'loss': 4.254648208618164}
{'epoch': 16, 'batch': 737, 'loss': 4.35693359375}
{'epoch': 16, 'batch': 738, 'loss': 4.291101455688477}
{'epoch': 16, 'batch': 739, 'loss': 4.427127838134766}
{'epoch': 16, 'batch': 740, 'loss': 4.534091949462891}
{'epoch': 16, 'batch': 741, 'loss': 4.33429479598999}
{'epoch': 16, 'batch': 742, 'loss': 4.308981895446777}
{'epoch': 16, 'batch': 743, 'loss': 4.463051795959473}
{'epoch': 16, 'batch': 744, 'loss': 4.557345867156982}
{'epoch': 16, 'batch': 745, 'loss': 4.420740604400635}
{'epoch': 16, 'batch': 746, 'loss': 4.422668933868408}
{'epoch': 16, 'batch': 747, 'loss': 4.509345054626465}
{'epoch': 16, 'batch': 748, 'loss': 4.433382987976074}
{'epoch': 16, 'batch': 749, 'loss': 4.433684825897217}
{'epoch': 16, 'b

{'epoch': 16, 'batch': 881, 'loss': 4.090704917907715}
{'epoch': 16, 'batch': 882, 'loss': 4.304344177246094}
{'epoch': 16, 'batch': 883, 'loss': 4.274322986602783}
{'epoch': 16, 'batch': 884, 'loss': 4.203273773193359}
{'epoch': 16, 'batch': 885, 'loss': 4.326520919799805}
{'epoch': 16, 'batch': 886, 'loss': 4.319825172424316}
{'epoch': 16, 'batch': 887, 'loss': 4.457244396209717}
{'epoch': 16, 'batch': 888, 'loss': 4.194402694702148}
{'epoch': 16, 'batch': 889, 'loss': 3.902263879776001}
{'epoch': 16, 'batch': 890, 'loss': 4.415838241577148}
{'epoch': 16, 'batch': 891, 'loss': 4.409835338592529}
{'epoch': 16, 'batch': 892, 'loss': 3.80906343460083}
{'epoch': 16, 'batch': 893, 'loss': 4.053894519805908}
{'epoch': 16, 'batch': 894, 'loss': 4.031651020050049}
{'epoch': 16, 'batch': 895, 'loss': 4.422546863555908}
{'epoch': 16, 'batch': 896, 'loss': 4.236429691314697}
{'epoch': 16, 'batch': 897, 'loss': 4.652507305145264}
{'epoch': 16, 'batch': 898, 'loss': 4.409211158752441}
{'epoch': 1

{'epoch': 17, 'batch': 56, 'loss': 4.280482292175293}
{'epoch': 17, 'batch': 57, 'loss': 4.240427017211914}
{'epoch': 17, 'batch': 58, 'loss': 4.630369186401367}
{'epoch': 17, 'batch': 59, 'loss': 4.179734230041504}
{'epoch': 17, 'batch': 60, 'loss': 4.104619026184082}
{'epoch': 17, 'batch': 61, 'loss': 4.233397483825684}
{'epoch': 17, 'batch': 62, 'loss': 4.291476726531982}
{'epoch': 17, 'batch': 63, 'loss': 4.113799571990967}
{'epoch': 17, 'batch': 64, 'loss': 4.142472267150879}
{'epoch': 17, 'batch': 65, 'loss': 4.185191631317139}
{'epoch': 17, 'batch': 66, 'loss': 4.24360990524292}
{'epoch': 17, 'batch': 67, 'loss': 4.086330890655518}
{'epoch': 17, 'batch': 68, 'loss': 4.174369812011719}
{'epoch': 17, 'batch': 69, 'loss': 4.029069900512695}
{'epoch': 17, 'batch': 70, 'loss': 4.221117973327637}
{'epoch': 17, 'batch': 71, 'loss': 4.535054683685303}
{'epoch': 17, 'batch': 72, 'loss': 4.367712497711182}
{'epoch': 17, 'batch': 73, 'loss': 4.497560977935791}
{'epoch': 17, 'batch': 74, 'l

{'epoch': 17, 'batch': 206, 'loss': 4.290042400360107}
{'epoch': 17, 'batch': 207, 'loss': 4.405165672302246}
{'epoch': 17, 'batch': 208, 'loss': 4.0698699951171875}
{'epoch': 17, 'batch': 209, 'loss': 4.079549789428711}
{'epoch': 17, 'batch': 210, 'loss': 4.084794998168945}
{'epoch': 17, 'batch': 211, 'loss': 4.131357669830322}
{'epoch': 17, 'batch': 212, 'loss': 3.854100227355957}
{'epoch': 17, 'batch': 213, 'loss': 4.3477301597595215}
{'epoch': 17, 'batch': 214, 'loss': 4.233296871185303}
{'epoch': 17, 'batch': 215, 'loss': 4.41396427154541}
{'epoch': 17, 'batch': 216, 'loss': 4.372867584228516}
{'epoch': 17, 'batch': 217, 'loss': 4.219050407409668}
{'epoch': 17, 'batch': 218, 'loss': 4.02675199508667}
{'epoch': 17, 'batch': 219, 'loss': 4.570634841918945}
{'epoch': 17, 'batch': 220, 'loss': 4.211728096008301}
{'epoch': 17, 'batch': 221, 'loss': 4.400668144226074}
{'epoch': 17, 'batch': 222, 'loss': 4.235047817230225}
{'epoch': 17, 'batch': 223, 'loss': 4.130234718322754}
{'epoch': 

{'epoch': 17, 'batch': 355, 'loss': 4.507894992828369}
{'epoch': 17, 'batch': 356, 'loss': 4.422088623046875}
{'epoch': 17, 'batch': 357, 'loss': 4.475005626678467}
{'epoch': 17, 'batch': 358, 'loss': 4.089209079742432}
{'epoch': 17, 'batch': 359, 'loss': 4.410721778869629}
{'epoch': 17, 'batch': 360, 'loss': 4.422627925872803}
{'epoch': 17, 'batch': 361, 'loss': 4.288046360015869}
{'epoch': 17, 'batch': 362, 'loss': 4.620776176452637}
{'epoch': 17, 'batch': 363, 'loss': 4.485738277435303}
{'epoch': 17, 'batch': 364, 'loss': 4.423489570617676}
{'epoch': 17, 'batch': 365, 'loss': 4.297901153564453}
{'epoch': 17, 'batch': 366, 'loss': 4.460461616516113}
{'epoch': 17, 'batch': 367, 'loss': 4.539682388305664}
{'epoch': 17, 'batch': 368, 'loss': 4.273621559143066}
{'epoch': 17, 'batch': 369, 'loss': 4.341243267059326}
{'epoch': 17, 'batch': 370, 'loss': 4.207946300506592}
{'epoch': 17, 'batch': 371, 'loss': 4.450217247009277}
{'epoch': 17, 'batch': 372, 'loss': 4.2733283042907715}
{'epoch':

{'epoch': 17, 'batch': 504, 'loss': 4.502524375915527}
{'epoch': 17, 'batch': 505, 'loss': 4.526100158691406}
{'epoch': 17, 'batch': 506, 'loss': 4.129648685455322}
{'epoch': 17, 'batch': 507, 'loss': 4.661201477050781}
{'epoch': 17, 'batch': 508, 'loss': 4.512411594390869}
{'epoch': 17, 'batch': 509, 'loss': 4.121856212615967}
{'epoch': 17, 'batch': 510, 'loss': 4.295066833496094}
{'epoch': 17, 'batch': 511, 'loss': 4.396182537078857}
{'epoch': 17, 'batch': 512, 'loss': 4.527524471282959}
{'epoch': 17, 'batch': 513, 'loss': 4.267819881439209}
{'epoch': 17, 'batch': 514, 'loss': 4.332433700561523}
{'epoch': 17, 'batch': 515, 'loss': 4.38591194152832}
{'epoch': 17, 'batch': 516, 'loss': 4.227513313293457}
{'epoch': 17, 'batch': 517, 'loss': 4.662703514099121}
{'epoch': 17, 'batch': 518, 'loss': 4.408008575439453}
{'epoch': 17, 'batch': 519, 'loss': 4.120838165283203}
{'epoch': 17, 'batch': 520, 'loss': 4.497314453125}
{'epoch': 17, 'batch': 521, 'loss': 4.046323776245117}
{'epoch': 17, 

{'epoch': 17, 'batch': 654, 'loss': 4.14006233215332}
{'epoch': 17, 'batch': 655, 'loss': 4.117974281311035}
{'epoch': 17, 'batch': 656, 'loss': 4.153702259063721}
{'epoch': 17, 'batch': 657, 'loss': 4.319070339202881}
{'epoch': 17, 'batch': 658, 'loss': 4.19098424911499}
{'epoch': 17, 'batch': 659, 'loss': 3.9948935508728027}
{'epoch': 17, 'batch': 660, 'loss': 4.400491237640381}
{'epoch': 17, 'batch': 661, 'loss': 4.53562068939209}
{'epoch': 17, 'batch': 662, 'loss': 4.302757263183594}
{'epoch': 17, 'batch': 663, 'loss': 4.24785852432251}
{'epoch': 17, 'batch': 664, 'loss': 4.399280071258545}
{'epoch': 17, 'batch': 665, 'loss': 4.637412071228027}
{'epoch': 17, 'batch': 666, 'loss': 4.252745628356934}
{'epoch': 17, 'batch': 667, 'loss': 4.226351261138916}
{'epoch': 17, 'batch': 668, 'loss': 4.369571208953857}
{'epoch': 17, 'batch': 669, 'loss': 4.527346134185791}
{'epoch': 17, 'batch': 670, 'loss': 4.324013710021973}
{'epoch': 17, 'batch': 671, 'loss': 4.438983917236328}
{'epoch': 17,

{'epoch': 17, 'batch': 803, 'loss': 4.085794925689697}
{'epoch': 17, 'batch': 804, 'loss': 4.073575973510742}
{'epoch': 17, 'batch': 805, 'loss': 4.60828161239624}
{'epoch': 17, 'batch': 806, 'loss': 4.04964017868042}
{'epoch': 17, 'batch': 807, 'loss': 4.534953594207764}
{'epoch': 17, 'batch': 808, 'loss': 4.066781044006348}
{'epoch': 17, 'batch': 809, 'loss': 4.384398937225342}
{'epoch': 17, 'batch': 810, 'loss': 4.2187066078186035}
{'epoch': 17, 'batch': 811, 'loss': 4.498947620391846}
{'epoch': 17, 'batch': 812, 'loss': 4.105035305023193}
{'epoch': 17, 'batch': 813, 'loss': 4.1057538986206055}
{'epoch': 17, 'batch': 814, 'loss': 4.365632057189941}
{'epoch': 17, 'batch': 815, 'loss': 4.294729232788086}
{'epoch': 17, 'batch': 816, 'loss': 4.1314496994018555}
{'epoch': 17, 'batch': 817, 'loss': 4.291477203369141}
{'epoch': 17, 'batch': 818, 'loss': 4.4490742683410645}
{'epoch': 17, 'batch': 819, 'loss': 4.7143402099609375}
{'epoch': 17, 'batch': 820, 'loss': 4.336071968078613}
{'epoch

{'epoch': 17, 'batch': 952, 'loss': 4.1596503257751465}
{'epoch': 17, 'batch': 953, 'loss': 4.488556861877441}
{'epoch': 17, 'batch': 954, 'loss': 4.21459436416626}
{'epoch': 17, 'batch': 955, 'loss': 4.196760177612305}
{'epoch': 17, 'batch': 956, 'loss': 4.705336093902588}
{'epoch': 17, 'batch': 957, 'loss': 4.32722282409668}
{'epoch': 17, 'batch': 958, 'loss': 3.964690923690796}
{'epoch': 17, 'batch': 959, 'loss': 4.361876010894775}
{'epoch': 17, 'batch': 960, 'loss': 4.304937839508057}
{'epoch': 17, 'batch': 961, 'loss': 4.092316627502441}
{'epoch': 17, 'batch': 962, 'loss': 4.36323356628418}
{'epoch': 17, 'batch': 963, 'loss': 4.2556986808776855}
{'epoch': 17, 'batch': 964, 'loss': 4.173584461212158}
{'epoch': 17, 'batch': 965, 'loss': 4.317141532897949}
{'epoch': 17, 'batch': 966, 'loss': 4.085843563079834}
{'epoch': 17, 'batch': 967, 'loss': 4.295827865600586}
{'epoch': 17, 'batch': 968, 'loss': 4.539398193359375}
{'epoch': 17, 'batch': 969, 'loss': 4.4227519035339355}
{'epoch': 

{'epoch': 18, 'batch': 128, 'loss': 4.417235374450684}
{'epoch': 18, 'batch': 129, 'loss': 4.211186408996582}
{'epoch': 18, 'batch': 130, 'loss': 4.400851249694824}
{'epoch': 18, 'batch': 131, 'loss': 4.326099872589111}
{'epoch': 18, 'batch': 132, 'loss': 4.3970627784729}
{'epoch': 18, 'batch': 133, 'loss': 4.191756248474121}
{'epoch': 18, 'batch': 134, 'loss': 4.215273380279541}
{'epoch': 18, 'batch': 135, 'loss': 4.157217025756836}
{'epoch': 18, 'batch': 136, 'loss': 4.066208362579346}
{'epoch': 18, 'batch': 137, 'loss': 4.385983943939209}
{'epoch': 18, 'batch': 138, 'loss': 4.281676292419434}
{'epoch': 18, 'batch': 139, 'loss': 4.158657073974609}
{'epoch': 18, 'batch': 140, 'loss': 4.157614231109619}
{'epoch': 18, 'batch': 141, 'loss': 4.284189701080322}
{'epoch': 18, 'batch': 142, 'loss': 4.248321533203125}
{'epoch': 18, 'batch': 143, 'loss': 3.9745728969573975}
{'epoch': 18, 'batch': 144, 'loss': 4.032761573791504}
{'epoch': 18, 'batch': 145, 'loss': 3.921767473220825}
{'epoch': 1

{'epoch': 18, 'batch': 277, 'loss': 4.462283611297607}
{'epoch': 18, 'batch': 278, 'loss': 4.220669269561768}
{'epoch': 18, 'batch': 279, 'loss': 4.072977066040039}
{'epoch': 18, 'batch': 280, 'loss': 4.48764705657959}
{'epoch': 18, 'batch': 281, 'loss': 4.2047905921936035}
{'epoch': 18, 'batch': 282, 'loss': 4.199061393737793}
{'epoch': 18, 'batch': 283, 'loss': 4.5093607902526855}
{'epoch': 18, 'batch': 284, 'loss': 4.297750473022461}
{'epoch': 18, 'batch': 285, 'loss': 4.016937255859375}
{'epoch': 18, 'batch': 286, 'loss': 4.167679786682129}
{'epoch': 18, 'batch': 287, 'loss': 4.134974002838135}
{'epoch': 18, 'batch': 288, 'loss': 4.408980369567871}
{'epoch': 18, 'batch': 289, 'loss': 4.232384204864502}
{'epoch': 18, 'batch': 290, 'loss': 4.477476596832275}
{'epoch': 18, 'batch': 291, 'loss': 4.176882266998291}
{'epoch': 18, 'batch': 292, 'loss': 4.267533779144287}
{'epoch': 18, 'batch': 293, 'loss': 4.08134126663208}
{'epoch': 18, 'batch': 294, 'loss': 4.385539531707764}
{'epoch': 

{'epoch': 18, 'batch': 426, 'loss': 4.148900985717773}
{'epoch': 18, 'batch': 427, 'loss': 4.473931789398193}
{'epoch': 18, 'batch': 428, 'loss': 4.215851306915283}
{'epoch': 18, 'batch': 429, 'loss': 4.103738307952881}
{'epoch': 18, 'batch': 430, 'loss': 4.493862152099609}
{'epoch': 18, 'batch': 431, 'loss': 4.323304176330566}
{'epoch': 18, 'batch': 432, 'loss': 4.26198148727417}
{'epoch': 18, 'batch': 433, 'loss': 4.494965076446533}
{'epoch': 18, 'batch': 434, 'loss': 4.548145294189453}
{'epoch': 18, 'batch': 435, 'loss': 4.406490325927734}
{'epoch': 18, 'batch': 436, 'loss': 4.259709358215332}
{'epoch': 18, 'batch': 437, 'loss': 4.207177639007568}
{'epoch': 18, 'batch': 438, 'loss': 4.27553129196167}
{'epoch': 18, 'batch': 439, 'loss': 4.463477611541748}
{'epoch': 18, 'batch': 440, 'loss': 4.372071743011475}
{'epoch': 18, 'batch': 441, 'loss': 3.9803972244262695}
{'epoch': 18, 'batch': 442, 'loss': 4.170888900756836}
{'epoch': 18, 'batch': 443, 'loss': 4.116570472717285}
{'epoch': 1

{'epoch': 18, 'batch': 575, 'loss': 4.150865077972412}
{'epoch': 18, 'batch': 576, 'loss': 4.548019886016846}
{'epoch': 18, 'batch': 577, 'loss': 4.597506523132324}
{'epoch': 18, 'batch': 578, 'loss': 4.2939453125}
{'epoch': 18, 'batch': 579, 'loss': 4.388777732849121}
{'epoch': 18, 'batch': 580, 'loss': 4.176058769226074}
{'epoch': 18, 'batch': 581, 'loss': 4.1541571617126465}
{'epoch': 18, 'batch': 582, 'loss': 4.231811046600342}
{'epoch': 18, 'batch': 583, 'loss': 4.461813449859619}
{'epoch': 18, 'batch': 584, 'loss': 4.174415588378906}
{'epoch': 18, 'batch': 585, 'loss': 4.161982536315918}
{'epoch': 18, 'batch': 586, 'loss': 4.327494144439697}
{'epoch': 18, 'batch': 587, 'loss': 4.057705402374268}
{'epoch': 18, 'batch': 588, 'loss': 4.189788818359375}
{'epoch': 18, 'batch': 589, 'loss': 4.442683219909668}
{'epoch': 18, 'batch': 590, 'loss': 4.026922225952148}
{'epoch': 18, 'batch': 591, 'loss': 3.9563419818878174}
{'epoch': 18, 'batch': 592, 'loss': 4.234552383422852}
{'epoch': 18,

{'epoch': 18, 'batch': 724, 'loss': 4.053267002105713}
{'epoch': 18, 'batch': 725, 'loss': 4.407376289367676}
{'epoch': 18, 'batch': 726, 'loss': 4.151472091674805}
{'epoch': 18, 'batch': 727, 'loss': 4.376006126403809}
{'epoch': 18, 'batch': 728, 'loss': 4.203278064727783}
{'epoch': 18, 'batch': 729, 'loss': 4.109607696533203}
{'epoch': 18, 'batch': 730, 'loss': 4.259110450744629}
{'epoch': 18, 'batch': 731, 'loss': 4.177361965179443}
{'epoch': 18, 'batch': 732, 'loss': 4.5380682945251465}
{'epoch': 18, 'batch': 733, 'loss': 4.135220050811768}
{'epoch': 18, 'batch': 734, 'loss': 4.185268878936768}
{'epoch': 18, 'batch': 735, 'loss': 3.991314649581909}
{'epoch': 18, 'batch': 736, 'loss': 4.152453899383545}
{'epoch': 18, 'batch': 737, 'loss': 4.228961944580078}
{'epoch': 18, 'batch': 738, 'loss': 4.1791510581970215}
{'epoch': 18, 'batch': 739, 'loss': 4.2956695556640625}
{'epoch': 18, 'batch': 740, 'loss': 4.419253349304199}
{'epoch': 18, 'batch': 741, 'loss': 4.248105525970459}
{'epoch

{'epoch': 18, 'batch': 873, 'loss': 4.412633419036865}
{'epoch': 18, 'batch': 874, 'loss': 4.099518775939941}
{'epoch': 18, 'batch': 875, 'loss': 4.1268110275268555}
{'epoch': 18, 'batch': 876, 'loss': 4.119203567504883}
{'epoch': 18, 'batch': 877, 'loss': 4.340798377990723}
{'epoch': 18, 'batch': 878, 'loss': 4.064019680023193}
{'epoch': 18, 'batch': 879, 'loss': 4.290649890899658}
{'epoch': 18, 'batch': 880, 'loss': 4.126697063446045}
{'epoch': 18, 'batch': 881, 'loss': 3.944673776626587}
{'epoch': 18, 'batch': 882, 'loss': 4.140322208404541}
{'epoch': 18, 'batch': 883, 'loss': 4.096288681030273}
{'epoch': 18, 'batch': 884, 'loss': 4.023599624633789}
{'epoch': 18, 'batch': 885, 'loss': 4.219219207763672}
{'epoch': 18, 'batch': 886, 'loss': 4.14959716796875}
{'epoch': 18, 'batch': 887, 'loss': 4.327719688415527}
{'epoch': 18, 'batch': 888, 'loss': 4.048328399658203}
{'epoch': 18, 'batch': 889, 'loss': 3.75360369682312}
{'epoch': 18, 'batch': 890, 'loss': 4.235105037689209}
{'epoch': 1

{'epoch': 19, 'batch': 48, 'loss': 4.002283573150635}
{'epoch': 19, 'batch': 49, 'loss': 4.207662582397461}
{'epoch': 19, 'batch': 50, 'loss': 4.198464393615723}
{'epoch': 19, 'batch': 51, 'loss': 4.3179779052734375}
{'epoch': 19, 'batch': 52, 'loss': 4.2041497230529785}
{'epoch': 19, 'batch': 53, 'loss': 4.055735111236572}
{'epoch': 19, 'batch': 54, 'loss': 4.111014366149902}
{'epoch': 19, 'batch': 55, 'loss': 3.968719720840454}
{'epoch': 19, 'batch': 56, 'loss': 4.169886589050293}
{'epoch': 19, 'batch': 57, 'loss': 4.104178428649902}
{'epoch': 19, 'batch': 58, 'loss': 4.538728713989258}
{'epoch': 19, 'batch': 59, 'loss': 4.032729625701904}
{'epoch': 19, 'batch': 60, 'loss': 3.968120813369751}
{'epoch': 19, 'batch': 61, 'loss': 4.095553874969482}
{'epoch': 19, 'batch': 62, 'loss': 4.180449485778809}
{'epoch': 19, 'batch': 63, 'loss': 3.953709363937378}
{'epoch': 19, 'batch': 64, 'loss': 3.9863734245300293}
{'epoch': 19, 'batch': 65, 'loss': 4.012382984161377}
{'epoch': 19, 'batch': 66

{'epoch': 19, 'batch': 198, 'loss': 4.251762866973877}
{'epoch': 19, 'batch': 199, 'loss': 4.195888996124268}
{'epoch': 19, 'batch': 200, 'loss': 4.461245059967041}
{'epoch': 19, 'batch': 201, 'loss': 4.389373302459717}
{'epoch': 19, 'batch': 202, 'loss': 4.2240986824035645}
{'epoch': 19, 'batch': 203, 'loss': 4.4588704109191895}
{'epoch': 19, 'batch': 204, 'loss': 3.7975308895111084}
{'epoch': 19, 'batch': 205, 'loss': 4.084569454193115}
{'epoch': 19, 'batch': 206, 'loss': 4.174903392791748}
{'epoch': 19, 'batch': 207, 'loss': 4.1776251792907715}
{'epoch': 19, 'batch': 208, 'loss': 3.9136204719543457}
{'epoch': 19, 'batch': 209, 'loss': 4.000114917755127}
{'epoch': 19, 'batch': 210, 'loss': 3.963304281234741}
{'epoch': 19, 'batch': 211, 'loss': 4.008079528808594}
{'epoch': 19, 'batch': 212, 'loss': 3.736757278442383}
{'epoch': 19, 'batch': 213, 'loss': 4.177857398986816}
{'epoch': 19, 'batch': 214, 'loss': 4.1048994064331055}
{'epoch': 19, 'batch': 215, 'loss': 4.3137736320495605}
{'e

{'epoch': 19, 'batch': 347, 'loss': 4.309216022491455}
{'epoch': 19, 'batch': 348, 'loss': 4.022209167480469}
{'epoch': 19, 'batch': 349, 'loss': 4.104124546051025}
{'epoch': 19, 'batch': 350, 'loss': 3.7585415840148926}
{'epoch': 19, 'batch': 351, 'loss': 3.866814374923706}
{'epoch': 19, 'batch': 352, 'loss': 4.578474521636963}
{'epoch': 19, 'batch': 353, 'loss': 3.8791205883026123}
{'epoch': 19, 'batch': 354, 'loss': 4.169018268585205}
{'epoch': 19, 'batch': 355, 'loss': 4.444131851196289}
{'epoch': 19, 'batch': 356, 'loss': 4.341563701629639}
{'epoch': 19, 'batch': 357, 'loss': 4.36714506149292}
{'epoch': 19, 'batch': 358, 'loss': 3.994677782058716}
{'epoch': 19, 'batch': 359, 'loss': 4.327692985534668}
{'epoch': 19, 'batch': 360, 'loss': 4.261100769042969}
{'epoch': 19, 'batch': 361, 'loss': 4.212330341339111}
{'epoch': 19, 'batch': 362, 'loss': 4.43285608291626}
{'epoch': 19, 'batch': 363, 'loss': 4.388882637023926}
{'epoch': 19, 'batch': 364, 'loss': 4.2863993644714355}
{'epoch':

{'epoch': 19, 'batch': 496, 'loss': 3.9416987895965576}
{'epoch': 19, 'batch': 497, 'loss': 4.040747165679932}
{'epoch': 19, 'batch': 498, 'loss': 4.254199981689453}
{'epoch': 19, 'batch': 499, 'loss': 4.526301860809326}
{'epoch': 19, 'batch': 500, 'loss': 4.342406272888184}
{'epoch': 19, 'batch': 501, 'loss': 4.221202373504639}
{'epoch': 19, 'batch': 502, 'loss': 4.278754711151123}
{'epoch': 19, 'batch': 503, 'loss': 4.153009414672852}
{'epoch': 19, 'batch': 504, 'loss': 4.390736103057861}
{'epoch': 19, 'batch': 505, 'loss': 4.406917572021484}
{'epoch': 19, 'batch': 506, 'loss': 3.967186212539673}
{'epoch': 19, 'batch': 507, 'loss': 4.558637619018555}
{'epoch': 19, 'batch': 508, 'loss': 4.424805164337158}
{'epoch': 19, 'batch': 509, 'loss': 4.024532318115234}
{'epoch': 19, 'batch': 510, 'loss': 4.17683744430542}
{'epoch': 19, 'batch': 511, 'loss': 4.295345306396484}
{'epoch': 19, 'batch': 512, 'loss': 4.3792009353637695}
{'epoch': 19, 'batch': 513, 'loss': 4.137423515319824}
{'epoch':

{'epoch': 19, 'batch': 645, 'loss': 3.936230421066284}
{'epoch': 19, 'batch': 646, 'loss': 4.109168529510498}
{'epoch': 19, 'batch': 647, 'loss': 4.207751750946045}
{'epoch': 19, 'batch': 648, 'loss': 4.162267684936523}
{'epoch': 19, 'batch': 649, 'loss': 4.372893810272217}
{'epoch': 19, 'batch': 650, 'loss': 4.151794910430908}
{'epoch': 19, 'batch': 651, 'loss': 4.025148868560791}
{'epoch': 19, 'batch': 652, 'loss': 4.222938537597656}
{'epoch': 19, 'batch': 653, 'loss': 4.169326305389404}
{'epoch': 19, 'batch': 654, 'loss': 3.9950244426727295}
{'epoch': 19, 'batch': 655, 'loss': 4.026327610015869}
{'epoch': 19, 'batch': 656, 'loss': 4.011386871337891}
{'epoch': 19, 'batch': 657, 'loss': 4.195531845092773}
{'epoch': 19, 'batch': 658, 'loss': 4.1061482429504395}
{'epoch': 19, 'batch': 659, 'loss': 3.7799551486968994}
{'epoch': 19, 'batch': 660, 'loss': 4.296254634857178}
{'epoch': 19, 'batch': 661, 'loss': 4.395139694213867}
{'epoch': 19, 'batch': 662, 'loss': 4.168253421783447}
{'epoch

{'epoch': 19, 'batch': 794, 'loss': 4.011643409729004}
{'epoch': 19, 'batch': 795, 'loss': 4.075442314147949}
{'epoch': 19, 'batch': 796, 'loss': 4.177573204040527}
{'epoch': 19, 'batch': 797, 'loss': 4.161825656890869}
{'epoch': 19, 'batch': 798, 'loss': 4.382898330688477}
{'epoch': 19, 'batch': 799, 'loss': 4.120192527770996}
{'epoch': 19, 'batch': 800, 'loss': 4.010725498199463}
{'epoch': 19, 'batch': 801, 'loss': 4.163978099822998}
{'epoch': 19, 'batch': 802, 'loss': 4.226947784423828}
{'epoch': 19, 'batch': 803, 'loss': 4.017818927764893}
{'epoch': 19, 'batch': 804, 'loss': 3.9826056957244873}
{'epoch': 19, 'batch': 805, 'loss': 4.448825836181641}
{'epoch': 19, 'batch': 806, 'loss': 3.8573155403137207}
{'epoch': 19, 'batch': 807, 'loss': 4.477977752685547}
{'epoch': 19, 'batch': 808, 'loss': 3.903498888015747}
{'epoch': 19, 'batch': 809, 'loss': 4.240385055541992}
{'epoch': 19, 'batch': 810, 'loss': 4.05437707901001}
{'epoch': 19, 'batch': 811, 'loss': 4.36140251159668}
{'epoch': 

{'epoch': 19, 'batch': 943, 'loss': 3.931171417236328}
{'epoch': 19, 'batch': 944, 'loss': 4.233184337615967}
{'epoch': 19, 'batch': 945, 'loss': 3.942237377166748}
{'epoch': 19, 'batch': 946, 'loss': 4.058774948120117}
{'epoch': 19, 'batch': 947, 'loss': 4.248488903045654}
{'epoch': 19, 'batch': 948, 'loss': 4.137507915496826}
{'epoch': 19, 'batch': 949, 'loss': 4.119425296783447}
{'epoch': 19, 'batch': 950, 'loss': 4.077701568603516}
{'epoch': 19, 'batch': 951, 'loss': 4.078004360198975}
{'epoch': 19, 'batch': 952, 'loss': 4.061945915222168}
{'epoch': 19, 'batch': 953, 'loss': 4.336625099182129}
{'epoch': 19, 'batch': 954, 'loss': 4.045310974121094}
{'epoch': 19, 'batch': 955, 'loss': 4.064936637878418}
{'epoch': 19, 'batch': 956, 'loss': 4.568827152252197}
{'epoch': 19, 'batch': 957, 'loss': 4.271910190582275}
{'epoch': 19, 'batch': 958, 'loss': 3.837841033935547}
{'epoch': 19, 'batch': 959, 'loss': 4.207685470581055}
{'epoch': 19, 'batch': 960, 'loss': 4.133387088775635}
{'epoch': 

{'epoch': 20, 'batch': 119, 'loss': 4.046336650848389}
{'epoch': 20, 'batch': 120, 'loss': 4.335648059844971}
{'epoch': 20, 'batch': 121, 'loss': 4.272500991821289}
{'epoch': 20, 'batch': 122, 'loss': 4.038403511047363}
{'epoch': 20, 'batch': 123, 'loss': 4.171990871429443}
{'epoch': 20, 'batch': 124, 'loss': 4.18833065032959}
{'epoch': 20, 'batch': 125, 'loss': 4.160410404205322}
{'epoch': 20, 'batch': 126, 'loss': 3.936138153076172}
{'epoch': 20, 'batch': 127, 'loss': 4.174553871154785}
{'epoch': 20, 'batch': 128, 'loss': 4.265240669250488}
{'epoch': 20, 'batch': 129, 'loss': 4.088286876678467}
{'epoch': 20, 'batch': 130, 'loss': 4.248246192932129}
{'epoch': 20, 'batch': 131, 'loss': 4.123913764953613}
{'epoch': 20, 'batch': 132, 'loss': 4.254578590393066}
{'epoch': 20, 'batch': 133, 'loss': 4.017734050750732}
{'epoch': 20, 'batch': 134, 'loss': 4.085736274719238}
{'epoch': 20, 'batch': 135, 'loss': 4.049058437347412}
{'epoch': 20, 'batch': 136, 'loss': 3.8561625480651855}
{'epoch': 

{'epoch': 20, 'batch': 268, 'loss': 3.991917133331299}
{'epoch': 20, 'batch': 269, 'loss': 4.082962512969971}
{'epoch': 20, 'batch': 270, 'loss': 3.802311658859253}
{'epoch': 20, 'batch': 271, 'loss': 4.125406742095947}
{'epoch': 20, 'batch': 272, 'loss': 3.912830114364624}
{'epoch': 20, 'batch': 273, 'loss': 4.196260452270508}
{'epoch': 20, 'batch': 274, 'loss': 4.238827228546143}
{'epoch': 20, 'batch': 275, 'loss': 4.050027370452881}
{'epoch': 20, 'batch': 276, 'loss': 4.224567413330078}
{'epoch': 20, 'batch': 277, 'loss': 4.310608863830566}
{'epoch': 20, 'batch': 278, 'loss': 4.087878704071045}
{'epoch': 20, 'batch': 279, 'loss': 3.9703147411346436}
{'epoch': 20, 'batch': 280, 'loss': 4.28639030456543}
{'epoch': 20, 'batch': 281, 'loss': 4.017381191253662}
{'epoch': 20, 'batch': 282, 'loss': 4.102426528930664}
{'epoch': 20, 'batch': 283, 'loss': 4.296319007873535}
{'epoch': 20, 'batch': 284, 'loss': 4.184293270111084}
{'epoch': 20, 'batch': 285, 'loss': 3.8447885513305664}
{'epoch':

{'epoch': 20, 'batch': 417, 'loss': 4.131513595581055}
{'epoch': 20, 'batch': 418, 'loss': 4.2288970947265625}
{'epoch': 20, 'batch': 419, 'loss': 4.313443660736084}
{'epoch': 20, 'batch': 420, 'loss': 4.412965297698975}
{'epoch': 20, 'batch': 421, 'loss': 4.307201862335205}
{'epoch': 20, 'batch': 422, 'loss': 4.285979270935059}
{'epoch': 20, 'batch': 423, 'loss': 4.2085394859313965}
{'epoch': 20, 'batch': 424, 'loss': 4.210267543792725}
{'epoch': 20, 'batch': 425, 'loss': 4.037850856781006}
{'epoch': 20, 'batch': 426, 'loss': 3.962590456008911}
{'epoch': 20, 'batch': 427, 'loss': 4.4164228439331055}
{'epoch': 20, 'batch': 428, 'loss': 4.108578681945801}
{'epoch': 20, 'batch': 429, 'loss': 4.01045560836792}
{'epoch': 20, 'batch': 430, 'loss': 4.330621719360352}
{'epoch': 20, 'batch': 431, 'loss': 4.212576389312744}
{'epoch': 20, 'batch': 432, 'loss': 4.0113444328308105}
{'epoch': 20, 'batch': 433, 'loss': 4.305263519287109}
{'epoch': 20, 'batch': 434, 'loss': 4.45873498916626}
{'epoch'

{'epoch': 20, 'batch': 566, 'loss': 4.323017120361328}
{'epoch': 20, 'batch': 567, 'loss': 4.259962558746338}
{'epoch': 20, 'batch': 568, 'loss': 4.231013298034668}
{'epoch': 20, 'batch': 569, 'loss': 3.9484381675720215}
{'epoch': 20, 'batch': 570, 'loss': 4.086065292358398}
{'epoch': 20, 'batch': 571, 'loss': 4.07668924331665}
{'epoch': 20, 'batch': 572, 'loss': 3.956461191177368}
{'epoch': 20, 'batch': 573, 'loss': 4.3458967208862305}
{'epoch': 20, 'batch': 574, 'loss': 4.039492607116699}
{'epoch': 20, 'batch': 575, 'loss': 4.037842750549316}
{'epoch': 20, 'batch': 576, 'loss': 4.436476230621338}
{'epoch': 20, 'batch': 577, 'loss': 4.470373153686523}
{'epoch': 20, 'batch': 578, 'loss': 4.191773414611816}
{'epoch': 20, 'batch': 579, 'loss': 4.203437328338623}
{'epoch': 20, 'batch': 580, 'loss': 4.021739482879639}
{'epoch': 20, 'batch': 581, 'loss': 3.939091682434082}
{'epoch': 20, 'batch': 582, 'loss': 4.112836837768555}
{'epoch': 20, 'batch': 583, 'loss': 4.244076728820801}
{'epoch':

{'epoch': 20, 'batch': 715, 'loss': 4.282225131988525}
{'epoch': 20, 'batch': 716, 'loss': 4.321356773376465}
{'epoch': 20, 'batch': 717, 'loss': 4.209158897399902}
{'epoch': 20, 'batch': 718, 'loss': 4.168922424316406}
{'epoch': 20, 'batch': 719, 'loss': 4.011176586151123}
{'epoch': 20, 'batch': 720, 'loss': 4.152352333068848}
{'epoch': 20, 'batch': 721, 'loss': 4.055699825286865}
{'epoch': 20, 'batch': 722, 'loss': 3.81955623626709}
{'epoch': 20, 'batch': 723, 'loss': 3.9703757762908936}
{'epoch': 20, 'batch': 724, 'loss': 3.9054903984069824}
{'epoch': 20, 'batch': 725, 'loss': 4.243257522583008}
{'epoch': 20, 'batch': 726, 'loss': 3.9574546813964844}
{'epoch': 20, 'batch': 727, 'loss': 4.198280334472656}
{'epoch': 20, 'batch': 728, 'loss': 4.036618709564209}
{'epoch': 20, 'batch': 729, 'loss': 3.9450430870056152}
{'epoch': 20, 'batch': 730, 'loss': 4.11435079574585}
{'epoch': 20, 'batch': 731, 'loss': 4.059958457946777}
{'epoch': 20, 'batch': 732, 'loss': 4.438846588134766}
{'epoch'

{'epoch': 20, 'batch': 864, 'loss': 4.515450477600098}
{'epoch': 20, 'batch': 865, 'loss': 3.5802700519561768}
{'epoch': 20, 'batch': 866, 'loss': 4.119187355041504}
{'epoch': 20, 'batch': 867, 'loss': 4.3616180419921875}
{'epoch': 20, 'batch': 868, 'loss': 4.304903984069824}
{'epoch': 20, 'batch': 869, 'loss': 3.6328930854797363}
{'epoch': 20, 'batch': 870, 'loss': 3.9498517513275146}
{'epoch': 20, 'batch': 871, 'loss': 4.0087127685546875}
{'epoch': 20, 'batch': 872, 'loss': 4.284186840057373}
{'epoch': 20, 'batch': 873, 'loss': 4.260484218597412}
{'epoch': 20, 'batch': 874, 'loss': 4.002559661865234}
{'epoch': 20, 'batch': 875, 'loss': 4.017226219177246}
{'epoch': 20, 'batch': 876, 'loss': 4.021259307861328}
{'epoch': 20, 'batch': 877, 'loss': 4.255702495574951}
{'epoch': 20, 'batch': 878, 'loss': 3.960860013961792}
{'epoch': 20, 'batch': 879, 'loss': 4.195749282836914}
{'epoch': 20, 'batch': 880, 'loss': 4.055895805358887}
{'epoch': 20, 'batch': 881, 'loss': 3.82598876953125}
{'epoc

{'epoch': 21, 'batch': 39, 'loss': 4.341784954071045}
{'epoch': 21, 'batch': 40, 'loss': 3.783107042312622}
{'epoch': 21, 'batch': 41, 'loss': 4.275494575500488}
{'epoch': 21, 'batch': 42, 'loss': 4.207711219787598}
{'epoch': 21, 'batch': 43, 'loss': 3.7535157203674316}
{'epoch': 21, 'batch': 44, 'loss': 4.093358516693115}
{'epoch': 21, 'batch': 45, 'loss': 4.363609313964844}
{'epoch': 21, 'batch': 46, 'loss': 4.084344863891602}
{'epoch': 21, 'batch': 47, 'loss': 4.264854431152344}
{'epoch': 21, 'batch': 48, 'loss': 3.8534462451934814}
{'epoch': 21, 'batch': 49, 'loss': 4.1050333976745605}
{'epoch': 21, 'batch': 50, 'loss': 4.0976080894470215}
{'epoch': 21, 'batch': 51, 'loss': 4.297391891479492}
{'epoch': 21, 'batch': 52, 'loss': 4.083388328552246}
{'epoch': 21, 'batch': 53, 'loss': 3.9922473430633545}
{'epoch': 21, 'batch': 54, 'loss': 4.044931888580322}
{'epoch': 21, 'batch': 55, 'loss': 3.8451783657073975}
{'epoch': 21, 'batch': 56, 'loss': 4.080240249633789}
{'epoch': 21, 'batch':

{'epoch': 21, 'batch': 189, 'loss': 4.039905071258545}
{'epoch': 21, 'batch': 190, 'loss': 3.623082160949707}
{'epoch': 21, 'batch': 191, 'loss': 4.078372001647949}
{'epoch': 21, 'batch': 192, 'loss': 4.083047389984131}
{'epoch': 21, 'batch': 193, 'loss': 3.8190460205078125}
{'epoch': 21, 'batch': 194, 'loss': 3.724884271621704}
{'epoch': 21, 'batch': 195, 'loss': 3.991774320602417}
{'epoch': 21, 'batch': 196, 'loss': 4.036862373352051}
{'epoch': 21, 'batch': 197, 'loss': 4.056417465209961}
{'epoch': 21, 'batch': 198, 'loss': 4.138683319091797}
{'epoch': 21, 'batch': 199, 'loss': 4.027029991149902}
{'epoch': 21, 'batch': 200, 'loss': 4.3396196365356445}
{'epoch': 21, 'batch': 201, 'loss': 4.284550666809082}
{'epoch': 21, 'batch': 202, 'loss': 4.118974208831787}
{'epoch': 21, 'batch': 203, 'loss': 4.334989070892334}
{'epoch': 21, 'batch': 204, 'loss': 3.704711675643921}
{'epoch': 21, 'batch': 205, 'loss': 3.96992564201355}
{'epoch': 21, 'batch': 206, 'loss': 3.986611843109131}
{'epoch':

{'epoch': 21, 'batch': 338, 'loss': 4.117559432983398}
{'epoch': 21, 'batch': 339, 'loss': 4.257147312164307}
{'epoch': 21, 'batch': 340, 'loss': 3.6216139793395996}
{'epoch': 21, 'batch': 341, 'loss': 3.774670362472534}
{'epoch': 21, 'batch': 342, 'loss': 3.8449134826660156}
{'epoch': 21, 'batch': 343, 'loss': 4.0683088302612305}
{'epoch': 21, 'batch': 344, 'loss': 3.707895040512085}
{'epoch': 21, 'batch': 345, 'loss': 3.7779104709625244}
{'epoch': 21, 'batch': 346, 'loss': 4.220874309539795}
{'epoch': 21, 'batch': 347, 'loss': 4.150540828704834}
{'epoch': 21, 'batch': 348, 'loss': 3.8629045486450195}
{'epoch': 21, 'batch': 349, 'loss': 3.8695740699768066}
{'epoch': 21, 'batch': 350, 'loss': 3.5699832439422607}
{'epoch': 21, 'batch': 351, 'loss': 3.7655656337738037}
{'epoch': 21, 'batch': 352, 'loss': 4.5283732414245605}
{'epoch': 21, 'batch': 353, 'loss': 3.8432915210723877}
{'epoch': 21, 'batch': 354, 'loss': 4.092135906219482}
{'epoch': 21, 'batch': 355, 'loss': 4.367947578430176}


{'epoch': 21, 'batch': 487, 'loss': 4.057359218597412}
{'epoch': 21, 'batch': 488, 'loss': 4.153176784515381}
{'epoch': 21, 'batch': 489, 'loss': 4.300057411193848}
{'epoch': 21, 'batch': 490, 'loss': 4.258154392242432}
{'epoch': 21, 'batch': 491, 'loss': 3.7895545959472656}
{'epoch': 21, 'batch': 492, 'loss': 3.9553864002227783}
{'epoch': 21, 'batch': 493, 'loss': 4.163052558898926}
{'epoch': 21, 'batch': 494, 'loss': 4.033285140991211}
{'epoch': 21, 'batch': 495, 'loss': 4.087707996368408}
{'epoch': 21, 'batch': 496, 'loss': 3.828104019165039}
{'epoch': 21, 'batch': 497, 'loss': 3.942910671234131}
{'epoch': 21, 'batch': 498, 'loss': 4.138465881347656}
{'epoch': 21, 'batch': 499, 'loss': 4.39984130859375}
{'epoch': 21, 'batch': 500, 'loss': 4.260867118835449}
{'epoch': 21, 'batch': 501, 'loss': 4.061183452606201}
{'epoch': 21, 'batch': 502, 'loss': 4.085031986236572}
{'epoch': 21, 'batch': 503, 'loss': 4.02763557434082}
{'epoch': 21, 'batch': 504, 'loss': 4.2112345695495605}
{'epoch':

{'epoch': 21, 'batch': 636, 'loss': 3.9492263793945312}
{'epoch': 21, 'batch': 637, 'loss': 4.044508457183838}
{'epoch': 21, 'batch': 638, 'loss': 3.9201626777648926}
{'epoch': 21, 'batch': 639, 'loss': 4.232278823852539}
{'epoch': 21, 'batch': 640, 'loss': 3.9756240844726562}
{'epoch': 21, 'batch': 641, 'loss': 4.037262916564941}
{'epoch': 21, 'batch': 642, 'loss': 4.026684284210205}
{'epoch': 21, 'batch': 643, 'loss': 4.1889238357543945}
{'epoch': 21, 'batch': 644, 'loss': 4.354146480560303}
{'epoch': 21, 'batch': 645, 'loss': 3.8963189125061035}
{'epoch': 21, 'batch': 646, 'loss': 4.064569473266602}
{'epoch': 21, 'batch': 647, 'loss': 4.191059112548828}
{'epoch': 21, 'batch': 648, 'loss': 4.1141839027404785}
{'epoch': 21, 'batch': 649, 'loss': 4.301232814788818}
{'epoch': 21, 'batch': 650, 'loss': 4.038875102996826}
{'epoch': 21, 'batch': 651, 'loss': 3.9157588481903076}
{'epoch': 21, 'batch': 652, 'loss': 4.133505344390869}
{'epoch': 21, 'batch': 653, 'loss': 4.085023403167725}
{'e

{'epoch': 21, 'batch': 785, 'loss': 3.95859432220459}
{'epoch': 21, 'batch': 786, 'loss': 3.898920774459839}
{'epoch': 21, 'batch': 787, 'loss': 4.037604331970215}
{'epoch': 21, 'batch': 788, 'loss': 3.8244576454162598}
{'epoch': 21, 'batch': 789, 'loss': 3.6107382774353027}
{'epoch': 21, 'batch': 790, 'loss': 3.9463953971862793}
{'epoch': 21, 'batch': 791, 'loss': 3.944761276245117}
{'epoch': 21, 'batch': 792, 'loss': 3.980018138885498}
{'epoch': 21, 'batch': 793, 'loss': 4.116857528686523}
{'epoch': 21, 'batch': 794, 'loss': 3.849308729171753}
{'epoch': 21, 'batch': 795, 'loss': 3.9086976051330566}
{'epoch': 21, 'batch': 796, 'loss': 4.07657527923584}
{'epoch': 21, 'batch': 797, 'loss': 3.9863808155059814}
{'epoch': 21, 'batch': 798, 'loss': 4.238293647766113}
{'epoch': 21, 'batch': 799, 'loss': 3.9967238903045654}
{'epoch': 21, 'batch': 800, 'loss': 3.893404722213745}
{'epoch': 21, 'batch': 801, 'loss': 3.995551824569702}
{'epoch': 21, 'batch': 802, 'loss': 4.152576923370361}
{'epoc

{'epoch': 21, 'batch': 934, 'loss': 4.173336505889893}
{'epoch': 21, 'batch': 935, 'loss': 4.006317138671875}
{'epoch': 21, 'batch': 936, 'loss': 3.9455201625823975}
{'epoch': 21, 'batch': 937, 'loss': 3.9811558723449707}
{'epoch': 21, 'batch': 938, 'loss': 4.445338726043701}
{'epoch': 21, 'batch': 939, 'loss': 4.096064567565918}
{'epoch': 21, 'batch': 940, 'loss': 4.228966236114502}
{'epoch': 21, 'batch': 941, 'loss': 3.9613094329833984}
{'epoch': 21, 'batch': 942, 'loss': 3.8960001468658447}
{'epoch': 21, 'batch': 943, 'loss': 3.7764885425567627}
{'epoch': 21, 'batch': 944, 'loss': 4.151015281677246}
{'epoch': 21, 'batch': 945, 'loss': 3.814361333847046}
{'epoch': 21, 'batch': 946, 'loss': 3.895155906677246}
{'epoch': 21, 'batch': 947, 'loss': 4.180812835693359}
{'epoch': 21, 'batch': 948, 'loss': 3.9752607345581055}
{'epoch': 21, 'batch': 949, 'loss': 3.9326913356781006}
{'epoch': 21, 'batch': 950, 'loss': 3.9320387840270996}
{'epoch': 21, 'batch': 951, 'loss': 3.9110591411590576}
{

{'epoch': 22, 'batch': 110, 'loss': 4.251485824584961}
{'epoch': 22, 'batch': 111, 'loss': 4.354901313781738}
{'epoch': 22, 'batch': 112, 'loss': 4.187582015991211}
{'epoch': 22, 'batch': 113, 'loss': 4.109172821044922}
{'epoch': 22, 'batch': 114, 'loss': 4.055899143218994}
{'epoch': 22, 'batch': 115, 'loss': 4.2660088539123535}
{'epoch': 22, 'batch': 116, 'loss': 4.30616569519043}
{'epoch': 22, 'batch': 117, 'loss': 4.230226993560791}
{'epoch': 22, 'batch': 118, 'loss': 3.8938088417053223}
{'epoch': 22, 'batch': 119, 'loss': 3.984074115753174}
{'epoch': 22, 'batch': 120, 'loss': 4.280080795288086}
{'epoch': 22, 'batch': 121, 'loss': 4.1422014236450195}
{'epoch': 22, 'batch': 122, 'loss': 3.903790235519409}
{'epoch': 22, 'batch': 123, 'loss': 4.071840763092041}
{'epoch': 22, 'batch': 124, 'loss': 4.073093891143799}
{'epoch': 22, 'batch': 125, 'loss': 4.100592613220215}
{'epoch': 22, 'batch': 126, 'loss': 3.8398149013519287}
{'epoch': 22, 'batch': 127, 'loss': 4.044981479644775}
{'epoch

{'epoch': 22, 'batch': 259, 'loss': 3.803457260131836}
{'epoch': 22, 'batch': 260, 'loss': 3.6432390213012695}
{'epoch': 22, 'batch': 261, 'loss': 3.360919713973999}
{'epoch': 22, 'batch': 262, 'loss': 4.007322788238525}
{'epoch': 22, 'batch': 263, 'loss': 3.5744411945343018}
{'epoch': 22, 'batch': 264, 'loss': 3.8066065311431885}
{'epoch': 22, 'batch': 265, 'loss': 3.3392763137817383}
{'epoch': 22, 'batch': 266, 'loss': 3.8474957942962646}
{'epoch': 22, 'batch': 267, 'loss': 4.239789009094238}
{'epoch': 22, 'batch': 268, 'loss': 3.896740198135376}
{'epoch': 22, 'batch': 269, 'loss': 3.9431238174438477}
{'epoch': 22, 'batch': 270, 'loss': 3.6034328937530518}
{'epoch': 22, 'batch': 271, 'loss': 4.021547317504883}
{'epoch': 22, 'batch': 272, 'loss': 3.825653314590454}
{'epoch': 22, 'batch': 273, 'loss': 4.055564880371094}
{'epoch': 22, 'batch': 274, 'loss': 4.103059768676758}
{'epoch': 22, 'batch': 275, 'loss': 3.920776844024658}
{'epoch': 22, 'batch': 276, 'loss': 4.102165222167969}
{'e

{'epoch': 22, 'batch': 408, 'loss': 4.109973907470703}
{'epoch': 22, 'batch': 409, 'loss': 4.199538230895996}
{'epoch': 22, 'batch': 410, 'loss': 4.19941520690918}
{'epoch': 22, 'batch': 411, 'loss': 3.8781800270080566}
{'epoch': 22, 'batch': 412, 'loss': 4.077629566192627}
{'epoch': 22, 'batch': 413, 'loss': 4.336363792419434}
{'epoch': 22, 'batch': 414, 'loss': 4.218297481536865}
{'epoch': 22, 'batch': 415, 'loss': 4.180250644683838}
{'epoch': 22, 'batch': 416, 'loss': 4.2902445793151855}
{'epoch': 22, 'batch': 417, 'loss': 4.008835792541504}
{'epoch': 22, 'batch': 418, 'loss': 4.011944770812988}
{'epoch': 22, 'batch': 419, 'loss': 4.164388656616211}
{'epoch': 22, 'batch': 420, 'loss': 4.326374053955078}
{'epoch': 22, 'batch': 421, 'loss': 4.207103729248047}
{'epoch': 22, 'batch': 422, 'loss': 4.168234825134277}
{'epoch': 22, 'batch': 423, 'loss': 4.173463821411133}
{'epoch': 22, 'batch': 424, 'loss': 4.0861616134643555}
{'epoch': 22, 'batch': 425, 'loss': 3.9496536254882812}
{'epoch

{'epoch': 22, 'batch': 557, 'loss': 4.057562351226807}
{'epoch': 22, 'batch': 558, 'loss': 4.271168231964111}
{'epoch': 22, 'batch': 559, 'loss': 4.062816619873047}
{'epoch': 22, 'batch': 560, 'loss': 4.154653549194336}
{'epoch': 22, 'batch': 561, 'loss': 4.0986762046813965}
{'epoch': 22, 'batch': 562, 'loss': 4.196859359741211}
{'epoch': 22, 'batch': 563, 'loss': 3.954068183898926}
{'epoch': 22, 'batch': 564, 'loss': 3.829655408859253}
{'epoch': 22, 'batch': 565, 'loss': 4.212072372436523}
{'epoch': 22, 'batch': 566, 'loss': 4.229286193847656}
{'epoch': 22, 'batch': 567, 'loss': 4.168947219848633}
{'epoch': 22, 'batch': 568, 'loss': 4.160732269287109}
{'epoch': 22, 'batch': 569, 'loss': 3.8602166175842285}
{'epoch': 22, 'batch': 570, 'loss': 3.960644483566284}
{'epoch': 22, 'batch': 571, 'loss': 4.00527811050415}
{'epoch': 22, 'batch': 572, 'loss': 3.8479666709899902}
{'epoch': 22, 'batch': 573, 'loss': 4.248292922973633}
{'epoch': 22, 'batch': 574, 'loss': 3.9564647674560547}
{'epoch

{'epoch': 22, 'batch': 706, 'loss': 4.168858051300049}
{'epoch': 22, 'batch': 707, 'loss': 3.977583646774292}
{'epoch': 22, 'batch': 708, 'loss': 3.721846580505371}
{'epoch': 22, 'batch': 709, 'loss': 3.9379889965057373}
{'epoch': 22, 'batch': 710, 'loss': 3.9589271545410156}
{'epoch': 22, 'batch': 711, 'loss': 3.9824411869049072}
{'epoch': 22, 'batch': 712, 'loss': 3.9069230556488037}
{'epoch': 22, 'batch': 713, 'loss': 3.925969362258911}
{'epoch': 22, 'batch': 714, 'loss': 3.9976351261138916}
{'epoch': 22, 'batch': 715, 'loss': 4.143765926361084}
{'epoch': 22, 'batch': 716, 'loss': 4.156560897827148}
{'epoch': 22, 'batch': 717, 'loss': 4.105273246765137}
{'epoch': 22, 'batch': 718, 'loss': 3.9825351238250732}
{'epoch': 22, 'batch': 719, 'loss': 3.84982967376709}
{'epoch': 22, 'batch': 720, 'loss': 3.9481747150421143}
{'epoch': 22, 'batch': 721, 'loss': 3.8727574348449707}
{'epoch': 22, 'batch': 722, 'loss': 3.638838768005371}
{'epoch': 22, 'batch': 723, 'loss': 3.820096254348755}
{'e

KeyboardInterrupt: 

In [13]:
torch.save(model.state_dict(), "mobydickmodel.pt")

In [14]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'conscience', 'battle', '', 'They', '', 'now', 'straightway', 'men’s', 'oil', 'as', 'I', 'know', 'bones—beware,', 'traceable', 'into', 'her', 'like', 'another', '', 'country', 'heading', 'therefore,', 'they', 'may', 'let', 'him', 'a', 'distance', 'on', 'this', 'jets', '', 'Of', 'the', 'oil', 'of', 'the', 'Guernsey-man,', 'was', 'in', 'that', 'celestial', 'words', 'was', '', 'woe', 'upon', 'his', 'number,', 'I', 'distantly', 'it', 'in', 'a', 'long,', 'stranger', 'line', 'frankly', '', 'contains', 'distant', 'bundle', '', '', '', '', '', '', 'CHAPTER', '98', '', 'Surmises', '', '', '', '', '“De', 'aye,', 'ambergris', 'said', 'Stubb', 'in', 'this', 'mysterious,', 'oath;', 'that', 'this', 'doubloon', 'is', '', 'the', 'Pope', 'who', 'turned', 'or', 'apt', 'away', 'to', 'sustain', 'any']


In [18]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'firmly', 'leaves', '', 'that', 'that', 'boat', 'should', 'be', 'received', 'somewhat', 'courses', '', 'Likewise', 'that', 'that', '', 'hard,', 'devout', 'and', 'fragrant', 'and', 'significant', 'in', 'mincing', 'it', 'coercing', 'cleansed', '', 'thousands', 'of', 'chopping', 'indeed,', 'they', 'dodges', 'so', 'being', 'then', 'is', 'the', 'lavish', '', 'One', 'Whale', 'may', 'be', 'found', 'up', 'so,', 'and', 'fill', 'the', 'same', 'barbs', 'was', 'cut', '', 'to', 'that', 'celestial', 'voyage', 'and', 'nothing', 'accelerated,', 'in', 'the', 'boat,', 'and', 'secured', '', 'from', 'his', 'symmetrical', 'race', 'in', 'two', 'whale', 'must', 'be', 'really', 'cutting', 'it', 'would', 'call', '', 'themselves', 'out', 'in', 'the', 'cause', 'of', 'spears', 'and', 'lamps', 'their', 'objects', 'illumined', 'their', '', 'plain,', 'when,']


In [35]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'individual', 'G', '', '', '', '', '', 'Thomas', 'Parke', 'd’Invilliers', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'I', '', '', '', 'I', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'Mr', '', 'In', 'some', 'more', 'more', 'fact', 'the', 'dollars’', 'physical', 'addressed', 'over', 'to', 'her', 'husband', '”', '', '', '', '“Can’t', 'him,”', 'you', 'doing,', 'answered', 'in', 'Mr', '', 'McKee', 'and', 'the', 'butler', 'rather', 'heard']


In [36]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'yelling,', 'small-breasted', '“character”', 'at,', 'year,”', '“Aunt', '“Old', 'darkening', 'heady', 'heady', 'were', 'wiping', 'to', 'four', 'evening', 'face', '', '', '', '', '“You', 'did', 'how', 'so', 'exactly', 'any', 'long', '', 'Tomorrow', 'to', 'see', 'it', 'is', 'like', 'more', '', 'restlessly', 'were', 'sitting', 'and', 'her', 'rather', 'interest', 'not', 'said,', 'one', 'attention', '', 'with', 'a', 'taxi', 'alone', 'in', 'the', 'best,', 'family', 'Mrs', '', 'Wilson', 'turned', '', 'on', 'the', 'Coloured', 'nod,', 'and', 'they', 'sat', 'over', 'at', 'me', 'with', 'lovely', 'longer', 'as', 'I', '', 'get', '', 'share', 'over', 'that', 'they', 'should', 'nothing', 'to', 'make', 'more', 'breath', 'as', 'finally', 'some', '', 'slight', 'people', 'above', 'it', 'outside', 'in', 'college']


In [37]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'science—”', 'Next', 'Ohio,', 'college—one', 'Forms', 'You’d', 'questioningly', 'approved', 'flashing', 'flung', 'shoe', 'bosom', 'gravely,', 'refused,', 'slow', 'somnambulatory', 'Ripley', 'ivy,', 'autumn-leaf', 'Thus', 'confessed', 'alone,”', 'soaked', 'side—“she', 'Dear', 'Moreover', 'Reading', 'neared', 'swell', 'be', '', '', '', 'Thomas', 'Parke', 'd’Invilliers', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'inquired', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']


In [38]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'slit', 'Get', 'Generally', 'of—oh—fling', 'degree', 'explicable', 'use', 'of', 'our', 'office', 'behind', '', 'with', 'no', 'slightly', 'glow', 'into', 'the', 'city', 'word', 'he', 'spent', 'his', 'murky', '', 'windows,', 'and', 'looked', 'back', 'from', 'overhead', '', 'But', 'it', 'held', 'off', 'with', 'a', 'life', '', 'beside', 'his', 'eyes', 'was', 'out,', 'with', 'a', 'boots', 'by', 'Mrs', '', 'Wilson', 'lay', '', 'back', 'of', 'find', 'there', 'outside', '', 'I', 'was', 'an', 'ghastly', 'men', 'with', 'an', '', 'exclamation', 'promising', 'a', 'lustreless', 'affair', '', 'She', 'had', 'apparently', 'Wilson,', 'one', 'of', 'the', 'quality', 'of', '', 'Wilson', 'seemed', 'the', 'damp', 'island', 'of', 'like', 'three', 'promise', 'as', 'it', '', 'still', 'the', 'line', 'in']


In [39]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'talked,', 'cause', 'marry', 'rugs', 'confessed', 'unexpected', 'frogs', 'yesterday', 'career', 'cars,', 'leather', 'doing', 'sea', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'General', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '6:00', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']


In [40]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'forth', 'Those', 'frowning,', 'confidences', 'link', 'Those', 'reputation', 'chambermaids', 'restlessness', '“Come', 'broken', 'nothing', 'her', 'mind', '', 'it’s', 'frowning', '', 'and', 'it', 'has', 'me', 'when', 'he', 'shall', 'that', 'wanted', 'to', 'be', 'alone', '', '', '', '', '“I’d', 'was', 'to', 'look', 'for', 'this', 'afternoon', '”', '', '', '', '“Young', 'Baker', '', 'cried', 'explained', 'the', 'matter', '', 'I', 'went', 'when', 'I', 'get', 'that', 'I', 'was', 'going', 'to', 'let', '', 'him,', 'until', 'what', 'poor', 'Lucille', 'I', 'have', '', 'repeat,', 'been', 'likely', 'in', 'love', '', 'anybody,', 'than', 'it', 'had', 'been', 'more', '', 'Well,', 'this', 'one', 'more', 'would', 'drift', '', 'he’d', 'usually', 'much', 'alone', '', 'I', 'wanted']


In [41]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'stale,', 'forgive', 'elocution,', 'hey', 'deserting', 'steal', 'happiness', '', '', '', '', 'In', 'my', 'friend', '”', '', '', '', 'What', 'I', 'called', 'in', 'curious', 'driving', 'my', 'moment,', 'Mr', '', 'Wolfshiem', '', 'Wolfshiem', 'made', 'him', '', 'He', 'was', 'getting', 'over', 'that', 'more', '', 'island', 'between', 'referred', 'to', 'me', '', 'Her', 'name', 'was', 'printed', 'no', 'company', 'lay', 'rather', 'no', 'shoulders', 'of', '', 'confused', '', 'It', 'was', 'this', 'wheel', '', 'The', 'lady', 'lawn,', 'suddenly', '', 'dominance', 'his', 'East', 'eyes', '', '', '', '', '“My', 'dear,”', 'she', 'remarked,', 'this', 'hovering', 'about', 'three', 'say,', 'say,', 'forced', '', 'nothing', 'quickly', 'an', 'look', 'or', 'suddenly', 'it', 'like', 'a']


In [42]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'tightening', '—', 'Where', 'See', 'Say:', 'Conduct', 'thanking', 'subtle', 'other', 'garage,', 'chair', 'plan', 'their', 'silence', 'like', 'beneath', 'that', 'while', 'that—I', 'touched', 'a', 'hasty', 'places', 'like', '', 'this', 'too', 'has', 'have', 'any', 'little', 'before', '', 'He', 'had', 'shown', 'to', '', 'stop', 'there', 'with', 'the', 'funeral', 'when', 'he', 'firmly', 'in', '1915,', 'helped', 'around', '', 'the', 'particular', 'rose', 'than', 'the', 'uncertainty', 'of', 'the', 'desk—he’d', 'when', 'my', 'rose', '', 'then', 'quickly', 'waiting', 'for', 'an', 'certain', 'never', 'look', 'called', 'now,', 'and', 'they', '', 'still', 'handsome', 'he', 'might', 'made', 'a', 'newspapers,', 'his', 'car', '', '', '', '', 'Gatsby', 'here,', 'suddenly', 'up', 'Fifth', 'morning', 'that', 'they', 'had', 'never']


In [43]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'F', 'Various—”', 'composed', '', 'West', 'I', 'am', 'tied', 'on', 'the', 'room', 'after', 'her', 'two', 'left', 'yellow', 'open', '', 'into', 'the', 'glasses', 'but', 'stopping', 'over', 'a', 'little', 'idea', '', 'This', 'started', 'that', 'I', '', 'have', 'been', 'back', 'into', 'the', 'person', '', 'After', 'the', 'standard—it', 'was', 'full', 'and', '', 'Buccleuch,', 'but', 'the', 'Fourth', 'was', 'ajar', 'and', 'there', 'in', 'the', 'flutter', 'of', 'a', '', 'egg,', 'light', '', 'At', 'a', 'younger', 'and', 'the', 'earth', '', 'painted', 'veiled', 'throwing', 'her', 'over', 'on', 'an', 'beads', 'with', 'leaning', '', 'dress', 'and', 'other', 'nose', 'draws', 'the', 'sun', 'with', 'a', 'party', 'that', '', '', '', '', 'Across', 'it', '”']


In [44]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'taxicabs', 'Its', 'Thirty—the', 'Daisy’ll', 'asleep—she', 'extravagantly', 'feigned', 'ahead,”', 'fun—”', 'last', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '6:15-6:30', '”', '', '', '', '']


In [45]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'relieved', 'is—”', 'revolver', 'west,', 'legal', 'stoop', 'Bird', 'Unlike', 'questioningly', '“\u200a‘Let', 'vacuous', 'juxtaposition', 'remarked', 'dark', 'wan', 'car', '', '', '', '', 'shouted', 'at', 'such', 'that', 'hasty', 'addenda', 'old', 'sport,', 'you’ve', 'been', 'rather', 'was', 'coming', '', 'with', 'just', 'all', 'Daisy', '', 'And', 'that', 'are', 'my', 'other', 'girl,', '', 'they', 'had', 'gone', 'that', 'four', 'night', 'after', 'a', 'thrilling', 'thing', 'and', 'did', '', 'Louisville', 'who', 'was', 'privy', 'with', 'a', 'ghastly', 'five', 'empty', 'sky', 'with', 'two', '', 'unknown', 'physical', 'rose', 'over', 'along', 'the', 'stone', '', 'We', 'curtains', 'like', '', 'hard', 'on', 'a', 'edge', 'of', 'fact', 'that', 'I', 'spent', 'all', 'affection', '', 'after', 'noon', 'I', 'sounded']


In [46]:
print(predict(dataset, model, text='You are'))

['You', 'are', 'towns,', 'polish', 'prig', 'jovially', 'unforgivably', 'Moreover', 'Fifty-Ninth', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '4:30-5:00', '”', '', '', '', '', '', '', '', '', 'Baseball', 'and', 'private', 'Middle', 'a', 'matter', 'by', 'my', 'father', 'wasting', 'off', 'New']


In [88]:
print(predict(dataset, model, text='You make me'))

['You', 'make', 'me', 'voice', '', 'In', 'the', 'lawn,', 'morning', 'with', 'my', 'very', 'end', 'as', 'I', 'dirty', '', 'a', 'blue', 'body', 'half-bewildered', 'bright', 'preceded', 'its', 'well', 'in', 'the', 'garden,', '', 'of', 'my', 'windows', 'that', 'a', 'high', 'man', 'blew', 'her', 'other', 'intention', 'of', 'youth', 'who', '', 'D', 'in', 'some', 'doors', 'for', 'the', 'country', '', 'The', 'living-room', 'was', 'white', '', 'and', 'splendour', 'of', 'my', 'reaction—Gatsby,', 'like', 'the', 'new', 'steps', 'and', 'then', 'of', 'the', 'car', '', 'before', 'if', 'it', 'had', 'been', 'crowded', 'alone—fifty', 'sun', 'I', 'have', 'heard', 'the', 'end', 'and', '', 'natural', 'interest', 'into', 'it', 'and', 'morning', 'he', 'lay', 'off', 'that', 'head', 'in', 'half', 'an', '', 'men']


In [52]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'I', 'am', 'sort', 'of', 'view', 'you’d', 'a', 'deep', 'explanations', 'and', 'her', '', 'trying', 'to', 'know', 'him,', 'perhaps', 'possessed', 'them', 'there', 'so', 'it’s', '', 'alone', '', 'It', 'had', 'never', 'seen', 'him', 'nibble', 'to', 'him', 'was', 'less', 'but', '', 'when', 'I’m', 'stronger', 'in', 'his', 'back', 'or', 'so', 'Nick,', 'with', 'there', 'as', 'Doctor', 'Haag,', '', 'more', '', 'But', 'they', 'know', 'ceased', 'friends', 'he', 'awoke', 'just', 'surprised', 'that', 'cool,', '', 'sauntered', 'more', 'of', 'dinner', 'he', 'couldn’t', 'say', '', 'If', 'the', 'figure', 'was', 'a', 'man', '', 'he', 'had', 'rather', 'feel', 'himself', 'of', 'us', 'in', 'an', 'side', 'in', 'one', 'in', 'a', 'determination', '', 'in', 'a']


In [90]:
print(predict(dataset, model, text='I am'))

['I', 'am', '', '', '', '', '7:15-8:15', 'in', 'a', 'note,', 'an', 'evening', 'began', 'now', 'there', 'was', 'a', 'promise', 'in', 'a', '', 'pool', 'and', 'I', 'should', 'get', 'out', 'of', 'my', 'series', '', 'Probably', 'I', 'live', '', 'any', 'own', 'girl', 'she', 'had', 'run', 'an', 'checker', 'to', 'waves,', '', 'my', 'share', 'from', 'privileged', 'specialists,', 'a', 'man', '”', '', '', '', '“Listen,', 'they', 'is', 'gone', 'for', 'a', 'party', '”', 'She', 'took', 'up', 'my', 'taxi', 'and', 'looked', '', 'there', 'was', 'an', 'hour', 'ago', 'and', 'did', 'it', 'might', '“got', 'a', 'communicative', '', 'that', 'happened', 'around', 'my', 'country', 'until', 'Mrs', '', 'Wilson', 'suit', 'opening', 'the', 'certain', '', 'hardy', 'turned']


In [105]:
print(predict(dataset, model, text='I am'))

['I', 'am', 'hand', '', '', '', '', 'His', 'eyes', 'unmistakably', 'dog-leash,', 'broke', 'from', 'wide', 'and,', 'and', 'what', 'she', 'knew', '', 'you', 'firmly', 'he', 'had', 'far', 'again', 'in', 'a', 'drizzle', '', 'I', 'heard', 'it', 'necessary', 'to', 'kill', 'me,', 'for', '', 'rooms', 'his', 'words', 'and', 'it', 'stopped', 'from', 'his', 'house', 'before', 'I', 'left', 'another', '', '', '', '', '“The', 'voice', 'son-of-a-bitch,”', 'my', 'book', 'she', 'said', '', '“You', 'give', 'me', 'everything', '”', '', '', '', 'A', 'shock', 'that', 'was', 'almost', 'white—changed', 'over', 'the', 'table', 'as', 'I', 'knew', '', 'at', 'its', 'most', 'respectful', 'in', 'an', 'abortive', '“Hm', 'in', 'blue', '', 'In', 'the', 'railroad', 'warm', 'old', 'girls']


In [113]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'you’re', 'one', 'of', 'the', 'desk,”', 'that', 'long', 'lady', 'moved', 'standing', 'in', 'a', '', 'front', 'of', 'which', 'are', 'me', 'every', 'young', 'before', 'she', 'shouted', 'slightly', '', 'together', '”', '', '', '', 'Most', 'of', 'West', 'Egg,', 'the—well,', 'this', 'bursts', 'and', 'grey', 'cars', 'identical', 'his', '', 'grave', 'or', 'along', 'that', 'Gatsby', 'of', 'already', 'share', 'were', '', 'tipped', 'under', 'an', 'whip', 'and', 'leaning', 'with', 'cream-coloured', 'chiffon,', 'close', 'in', '', 'the', 'mass', 'of', 'the', 'son’s', '', 'She', 'must', 'came', 'in', 'his', 'face', 'in', 'his', 'grandfather’s', '', 'wet', 'immediately', 'upon', 'the', 'black', 'leaf,', 'from', 'its', 'shoulder', 'sank', 'by', 'breathless,', '', 'colour', 'on', 'the', 'cheerful', 'window,']


In [114]:
print(predict(dataset, model, text='I love'))

['I', 'love', '', 'uttered', 'it', '”', '', '', '', 'Evidently', 'it’s', 'a', 'obviously', 'ends', 'of', 'his', 'police', 'but', 'if', 'it', 'did', 'you', 'some', 'most', '', 'George', 'Mrs', '', 'Wilson', 'mentioned', 'up,', 'and', 'they', 'was', 'rooms', 'in', '', 'whomsoever', 'we', 'all', 'the', 'time', '', 'Some', 'kind', 'of', 'printed', 'the', 'Catholic,', '', 'who', 'was', 'going', 'to', 'curious', 'before', 'at', 'my', 'front', 'way', 'and', 'it', 'was', 'too', '', 'with', 'the', 'policeman,', 'but', 'I', 'expected,', 'his', 'head', 'by', 'a', 'simplicity', 'of', 'indifferent', '', 'sauntered', 'at', 'the', 'veranda', '', 'The', 'little', 'ashen', 'moved', 'over', 'up', 'into', '', 'him', 'so', 'since', 'I', 'drove', 'over', 'with', 'my', 'pale,', '‘All']


In [147]:
print(predict(dataset, model, text='Love you'))

['Love', 'you', 'arm', '', '', '', '', 'It', 'was', 'across', 'the', 'dog-leash', '', '', '', '', 'We', 'waited', 'for', 'up', 'in', 'the', 'funeral', 'along', 'the', 'gutter', 'he', 'was', '', 'breaking', 'from', 'the', 'son', 'of', 'me,', '', 'He', 'ate', 'more', 'incessantly', 'in', 'a', 'blurred', 'glasses,', 'and', '', 'he', 'had', 'stood', 'out', 'on', 'the', 'light', 'with', 'the', 'evening', 'of', 'half', '', 'whisky', '', 'His', 'night', 'toward', 'the', 'world', '', '', '', '', 'The', 'grey,', 'wife', 'supper—there', 'were', 'over', 'by', 'through', 'some', 'wedding', 'up', '', 'through', 'wiped', 'a', 'house', 'of', 'one', 'conversation', 'said', 'all', 'feet', '', '', '', '', '“My', 'told', 'each', 'pardon,”', 'Gatsby', '”']


In [159]:
print(predict(dataset, model, text='happy birthday'))

['happy', 'birthday', '', '', '', '', 'He', 'eyes', 'said', 'driving', '', 'I’m', 'a', 'word,', 'beside', 'me', 'asked', 'if', 'I', 'used', 'to', 'think', 'when', 'we', 'were', 'related', '', 'to', 'run', 'different', 'his', 'house,', 'imperatively', 'before', 'everybody', 'real', 'even', '', 'forever;', 'you', 'pick', 'up', 'about', 'Mrs', '', 'Wilson', '—”', '', '', '', '', '“You', 'could', 'know', 'to,', 'how', 'he', 'killed', 'the', 'butler', 'with', 'me,', 'of', '', 'restlessly', 'but', 'the', 'man', 'than', 'suggested,', 'in', 'Miss', 'Baker', 'in', 'his', '', 'raised', 'nose', 'as', 'the', 'efforts', 'was', 'white', 'more', 'but', 'he', 'seemed', 'a', '', 'permanent', 'eyes', 'at', 'the', 'water,', 'on', 'the', 'air', '', 'I', 'waited,', 'and', 'then']


In [119]:
'Love you square crowded'

'Love you square crowded'

In [None]:
Love you scared 7:15-7:18
Love you dizzy, bright, couch wiping