In [1]:
"""
Convolutional Neuroscience
Accademic year 2019-2020
Homework 3

Author: Tommaso Tabarelli
Period: december 2019
"""

# Importing libraries

import argparse
import torch
import json
import re
import numpy as np
from torch.utils.data import Dataset, DataLoader
from functools import reduce
from torch import optim, nn
from network import Network, train_batch
from torch.utils.data import DataLoader
from torchvision import transforms
from pathlib import Path

In [2]:
# Defining network class

class Network(nn.Module):
    
	def __init__(self, input_size, hidden_units, layers_num, dropout_prob=0):
		# Call the parent init function (required!)
		super().__init__()
		# Define recurrent layer
		self.rnn = nn.LSTM(input_size=input_size, 
						hidden_size=hidden_units,
						num_layers=layers_num,
						dropout=dropout_prob,
						batch_first=True)
		# Define output layer
		self.out = nn.Linear(hidden_units, input_size)

	def forward(self, x, state=None):
		# LSTM
		x, rnn_state = self.rnn(x, state)
		# Linear layer
		x = self.out(x)
		return x, rnn_state
    



def train_batch(net, batch_onehot, loss_fn, optimizer):

	### Prepare network input and labels
	# Get the labels (the last letter of each sequence)
	labels_onehot = batch_onehot[:, -1, :]
	labels_numbers = labels_onehot.argmax(dim=1)
	# Remove the labels from the input tensor
	net_input = batch_onehot[:, :-1, :]
	# batch_onehot.shape =   [50, 100, 38]
	# labels_onehot.shape =  [50, 38]
	# labels_numbers.shape = [50]
	# net_input.shape =      [50, 99, 38]

	### Forward pass
	# Eventually clear previous recorded gradients
	optimizer.zero_grad()
	# Forward pass
	net_out, _ = net(net_input)

	### Update network
	# Evaluate loss only for last output
	loss = loss_fn(net_out[:, -1, :], labels_numbers)
	# Backward pass
	loss.backward()
	# Update
	optimizer.step()
	# Return average batch loss
	return float(loss.data)

In [3]:
##############################
##############################
## PARAMETERS
##############################
parser = argparse.ArgumentParser(description='Train the Blake sonnet generator network.')

# Dataset
parser.add_argument('--datasetpath', type=str, default='Songs_of_innocence.txt',
                        help='Path of the train txt file')
parser.add_argument('--crop_len',    type=int, default=100,
                        help='Number of input letters')
#parser.add_argument('--alphabet_len',   type=int,   default=,                help='Number of letters in the alphabet')

# Network
parser.add_argument('--hidden_units',   type=int,   default=128,    help='Number of RNN hidden units')
parser.add_argument('--layers_num',     type=int,   default=2,      help='Number of RNN stacked layers')
parser.add_argument('--dropout_prob',   type=float, default=0.3,    help='Dropout probability')

# Training
parser.add_argument('--batchsize',  type=int, default=154,  help='Training batch size')
parser.add_argument('--num_epochs', type=int, default=1000, help='Number of training epochs')

# Save
parser.add_argument('--out_dir', type=str, default='model', help='Where to save models and params')

_StoreAction(option_strings=['--out_dir'], dest='out_dir', nargs=None, const=None, default='model', type=<class 'str'>, choices=None, help='Where to save models and params', metavar=None)

In [4]:
class WildeDataset(Dataset):
    
    def __init__(self, filepath, crop_len, transform=None):
        
        ### Load data
        text = open(filepath, 'r').read()

        # Removing titles
        text = re.split('\n{7}', text)[1]
        
        # Lowering all text
        text = text.lower()

        # Extract the chapters (divided by '\n{5}')
        chap_list = re.split('\n\n\n\n\n\n', text)
        
        # Remove double new lines
        chap_list = list(map(lambda s: re.sub('\n{2,3}', '\n', s), chap_list))
        # Saving only the chapters which are sufficiently long
        chap_list = [x for x in chap_list if len(x) > crop_len + 100]


        ### Char to number
        alphabet = list(set(text))		# "set" function divides the text in single characters (not ordered)
        alphabet.sort()				# sorting not ordered characters
        print('Found letters:', alphabet)
        # Building dictionaries
        char_to_number = {char: number for number, char in enumerate(alphabet)}
        number_to_char = {number: char for number, char in enumerate(alphabet)}

        ### Store data
        self.chap_list = chap_list
        self.transform = transform
        self.char_to_number = char_to_number
        self.number_to_char = number_to_char
        # In Wilde there are no "stange" chars to encode
        self.alphabet = alphabet
        
    def __len__(self):
        return len(self.chap_list)
        
    def __getitem__(self, idx):
        # Get sonnet text
        text = self.chap_list[idx]
        # Encode with numbers
        encoded = encode_text(self.char_to_number, text)

        # Create sample
        sample = {'text': text, 'encoded': encoded}
        # Transform (if defined)
        if self.transform:
            sample = self.transform(sample)
        return sample


def encode_text(char_to_number, text):
    i = -1
    for c in text:
        i+=1
        try:
            a = char_to_number[c]
        except:	# If the character is not in the char_to_number dictionary, then 
            s = list(text)
            # Encoding the not found characters (if any): "_" is not in the text
            s[i]='_'
            text=''.join(s)
    encoded = [char_to_number[c] for c in text]
    return encoded


def decode_text(number_to_char, encoded):
    text = [number_to_char[c] for c in encoded]
    # Building proper string from a list of strings (concatenating them)
    text = reduce(lambda s1, s2: s1 + s2, text)
    return text


class RandomCrop():
    
    def __init__(self, crop_len):
        self.crop_len = crop_len

    def __call__(self, sample):
        text = sample['text']
        encoded = sample['encoded']
        # Randomly choose an index
        tot_chars = len(text)
        start_idx = np.random.randint(0, tot_chars - self.crop_len)
        end_idx = start_idx + self.crop_len
        return {**sample,
            'text': text[start_idx: end_idx],
            'encoded': encoded[start_idx: end_idx]}
        

def create_one_hot_matrix(encoded, alphabet_len):
    # Create one hot matrix
    encoded_onehot = np.zeros([len(encoded), alphabet_len])
    tot_chars = len(encoded)
    # Placing ONEs at the respective position of the letters: "encoded" indeed have numbers that encode the letters,
    # 	and here it is used as index dimension
    encoded_onehot[np.arange(tot_chars), encoded] = 1
    return encoded_onehot


class OneHotEncoder():
    
    def __init__(self, alphabet_len):
        self.alphabet_len = alphabet_len
        
    def __call__(self, sample):
        # Load encoded text with numbers
        encoded = np.array(sample['encoded'])
        # Create one hot matrix
        encoded_onehot = create_one_hot_matrix(encoded, self.alphabet_len)
        return {**sample,
            'encoded_onehot': encoded_onehot}
        
                
class ToTensor():
    
    def __call__(self, sample):
        # Convert one hot encoded text to pytorch tensor
        encoded_onehot = torch.tensor(sample['encoded_onehot']).float()
        return {'encoded_onehot': encoded_onehot}


## Preparing training the net

In [5]:
# Parse input arguments
training_args = json.load(open('my_training_args_Wilde.json'))

#%% Check device
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
print('Selected device:', device)

dataset = WildeDataset(filepath=training_args['datasetpath'], crop_len=training_args['crop_len'],
                    transform=None)

#%% Create dataset
trans = transforms.Compose([RandomCrop(training_args['crop_len']),
                    OneHotEncoder(len(dataset.alphabet)),
                    ToTensor()
                    ])

dataset = WildeDataset(filepath=training_args['datasetpath'], crop_len=training_args['crop_len'],
                    transform=trans)

print("Alphabet length:", len(dataset.alphabet))

#%% Initialize network
net = Network(input_size=len(dataset.alphabet), 
            hidden_units=training_args['hidden_units'], 
            layers_num=training_args['layers_num'], 
            dropout_prob=training_args['dropout_prob'])

net.to(device)

Selected device: cpu
Found letters: ['\n', ' ', '!', '"', "'", ',', '-', '.', '0', '1', '2', '5', '8', ':', ';', '?', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '—']
Found letters: ['\n', ' ', '!', '"', "'", ',', '-', '.', '0', '1', '2', '5', '8', ':', ';', '?', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '—']
Alphabet length: 43


Network(
  (rnn): LSTM(43, 1024, num_layers=2, batch_first=True, dropout=0.2)
  (out): Linear(in_features=1024, out_features=43, bias=True)
)

In [6]:
print(training_args)

{'datasetpath': 'Picture_of_Dorian_Gray.txt', 'crop_len': 100, 'hidden_units': 1024, 'layers_num': 2, 'dropout_prob': 0.2, 'batchsize': 200, 'num_epochs': 5000, 'out_dir': 'model_Wilde'}


## Training the net

In [7]:
#%% Train network

# Define Dataloader
dataloader = DataLoader(dataset, batch_size=training_args['batchsize'], shuffle=True, num_workers=1)
# Define optimizer
optimizer = optim.Adam(net.parameters(), weight_decay=5e-4)
# Define loss function
loss_fn = nn.CrossEntropyLoss()

# Defining loss list to plot the losses
loss_list = []

# Start training
for epoch in range(int(training_args['num_epochs'])):
    print('##################################')
    print('## EPOCH '+str(epoch + 1)+"/"+str(int(training_args['num_epochs'])))
    print('##################################')
    # Iterate batches
    for batch_sample in dataloader:
        # Extract batch
        batch_onehot = batch_sample['encoded_onehot'].to(device)
        # Update network
        batch_loss = train_batch(net, batch_onehot, loss_fn, optimizer)
        print('\t Training loss (single batch):', batch_loss)
        loss_list.append(batch_loss)

### Save all needed parameters
# Create output dir
out_dir = Path(training_args['out_dir'])
out_dir.mkdir(parents=True, exist_ok=True)
# Save network parameters
torch.save(net.state_dict(), out_dir / 'net_params.pth')

# Adding alphabet length
training_args["alphabet_len"] = len(dataset.alphabet)
# Save training parameters
with open(out_dir / 'training_args.json', 'w') as f:
    json.dump(training_args, f, indent=4)
# Save encoder dictionary
with open(out_dir / 'char_to_number.json', 'w') as f:
    json.dump(dataset.char_to_number, f, indent=4)
# Save decoder dictionary
with open(out_dir / 'number_to_char.json', 'w') as f:
    json.dump(dataset.number_to_char, f, indent=4)

##################################
## EPOCH 1/5000
##################################
	 Training loss (single batch): 3.765955686569214
##################################
## EPOCH 2/5000
##################################
	 Training loss (single batch): 3.718623638153076
##################################
## EPOCH 3/5000
##################################
	 Training loss (single batch): 3.663015365600586
##################################
## EPOCH 4/5000
##################################
	 Training loss (single batch): 3.4303371906280518
##################################
## EPOCH 5/5000
##################################
	 Training loss (single batch): 3.4146065711975098
##################################
## EPOCH 6/5000
##################################
	 Training loss (single batch): 3.2878856658935547
##################################
## EPOCH 7/5000
##################################
	 Training loss (single batch): 3.0002031326293945
##################################
## EPOCH 

	 Training loss (single batch): 2.926687002182007
##################################
## EPOCH 62/5000
##################################
	 Training loss (single batch): 2.4514517784118652
##################################
## EPOCH 63/5000
##################################
	 Training loss (single batch): 2.9560656547546387
##################################
## EPOCH 64/5000
##################################
	 Training loss (single batch): 3.0464675426483154
##################################
## EPOCH 65/5000
##################################
	 Training loss (single batch): 3.2687103748321533
##################################
## EPOCH 66/5000
##################################
	 Training loss (single batch): 3.0822906494140625
##################################
## EPOCH 67/5000
##################################
	 Training loss (single batch): 2.5510449409484863
##################################
## EPOCH 68/5000
##################################
	 Training loss (single batch): 2.8

	 Training loss (single batch): 2.54964542388916
##################################
## EPOCH 122/5000
##################################
	 Training loss (single batch): 2.7518787384033203
##################################
## EPOCH 123/5000
##################################
	 Training loss (single batch): 2.8713619709014893
##################################
## EPOCH 124/5000
##################################
	 Training loss (single batch): 3.0155651569366455
##################################
## EPOCH 125/5000
##################################
	 Training loss (single batch): 2.803515911102295
##################################
## EPOCH 126/5000
##################################
	 Training loss (single batch): 2.557124376296997
##################################
## EPOCH 127/5000
##################################
	 Training loss (single batch): 2.5453438758850098
##################################
## EPOCH 128/5000
##################################
	 Training loss (single batch):

	 Training loss (single batch): 2.468228816986084
##################################
## EPOCH 182/5000
##################################
	 Training loss (single batch): 2.7270472049713135
##################################
## EPOCH 183/5000
##################################
	 Training loss (single batch): 2.7845311164855957
##################################
## EPOCH 184/5000
##################################
	 Training loss (single batch): 2.701932430267334
##################################
## EPOCH 185/5000
##################################
	 Training loss (single batch): 2.932307481765747
##################################
## EPOCH 186/5000
##################################
	 Training loss (single batch): 2.7267987728118896
##################################
## EPOCH 187/5000
##################################
	 Training loss (single batch): 2.852118492126465
##################################
## EPOCH 188/5000
##################################
	 Training loss (single batch):

	 Training loss (single batch): 2.701423168182373
##################################
## EPOCH 242/5000
##################################
	 Training loss (single batch): 2.3579533100128174
##################################
## EPOCH 243/5000
##################################
	 Training loss (single batch): 2.62373423576355
##################################
## EPOCH 244/5000
##################################
	 Training loss (single batch): 2.4021825790405273
##################################
## EPOCH 245/5000
##################################
	 Training loss (single batch): 2.4136428833007812
##################################
## EPOCH 246/5000
##################################
	 Training loss (single batch): 1.857513189315796
##################################
## EPOCH 247/5000
##################################
	 Training loss (single batch): 2.1860287189483643
##################################
## EPOCH 248/5000
##################################
	 Training loss (single batch):

	 Training loss (single batch): 2.555987596511841
##################################
## EPOCH 302/5000
##################################
	 Training loss (single batch): 2.5239768028259277
##################################
## EPOCH 303/5000
##################################
	 Training loss (single batch): 2.351240634918213
##################################
## EPOCH 304/5000
##################################
	 Training loss (single batch): 2.55896258354187
##################################
## EPOCH 305/5000
##################################
	 Training loss (single batch): 2.097625255584717
##################################
## EPOCH 306/5000
##################################
	 Training loss (single batch): 2.0866808891296387
##################################
## EPOCH 307/5000
##################################
	 Training loss (single batch): 2.1320652961730957
##################################
## EPOCH 308/5000
##################################
	 Training loss (single batch): 

	 Training loss (single batch): 2.7905685901641846
##################################
## EPOCH 362/5000
##################################
	 Training loss (single batch): 2.1157593727111816
##################################
## EPOCH 363/5000
##################################
	 Training loss (single batch): 2.186044692993164
##################################
## EPOCH 364/5000
##################################
	 Training loss (single batch): 2.4889883995056152
##################################
## EPOCH 365/5000
##################################
	 Training loss (single batch): 2.3872427940368652
##################################
## EPOCH 366/5000
##################################
	 Training loss (single batch): 2.241053819656372
##################################
## EPOCH 367/5000
##################################
	 Training loss (single batch): 2.171539545059204
##################################
## EPOCH 368/5000
##################################
	 Training loss (single batch)

	 Training loss (single batch): 1.7277300357818604
##################################
## EPOCH 422/5000
##################################
	 Training loss (single batch): 1.8561773300170898
##################################
## EPOCH 423/5000
##################################
	 Training loss (single batch): 2.051459550857544
##################################
## EPOCH 424/5000
##################################
	 Training loss (single batch): 1.422464370727539
##################################
## EPOCH 425/5000
##################################
	 Training loss (single batch): 1.9594972133636475
##################################
## EPOCH 426/5000
##################################
	 Training loss (single batch): 2.0011682510375977
##################################
## EPOCH 427/5000
##################################
	 Training loss (single batch): 1.965693473815918
##################################
## EPOCH 428/5000
##################################
	 Training loss (single batch)

	 Training loss (single batch): 1.52951180934906
##################################
## EPOCH 482/5000
##################################
	 Training loss (single batch): 2.0010759830474854
##################################
## EPOCH 483/5000
##################################
	 Training loss (single batch): 1.1177117824554443
##################################
## EPOCH 484/5000
##################################
	 Training loss (single batch): 1.6523220539093018
##################################
## EPOCH 485/5000
##################################
	 Training loss (single batch): 1.323866605758667
##################################
## EPOCH 486/5000
##################################
	 Training loss (single batch): 1.4275420904159546
##################################
## EPOCH 487/5000
##################################
	 Training loss (single batch): 1.4745724201202393
##################################
## EPOCH 488/5000
##################################
	 Training loss (single batch)

	 Training loss (single batch): 0.9076732397079468
##################################
## EPOCH 542/5000
##################################
	 Training loss (single batch): 1.486472249031067
##################################
## EPOCH 543/5000
##################################
	 Training loss (single batch): 1.0782735347747803
##################################
## EPOCH 544/5000
##################################
	 Training loss (single batch): 1.391765832901001
##################################
## EPOCH 545/5000
##################################
	 Training loss (single batch): 0.9474799036979675
##################################
## EPOCH 546/5000
##################################
	 Training loss (single batch): 0.7761174440383911
##################################
## EPOCH 547/5000
##################################
	 Training loss (single batch): 1.1922736167907715
##################################
## EPOCH 548/5000
##################################
	 Training loss (single batch

	 Training loss (single batch): 0.5530011057853699
##################################
## EPOCH 602/5000
##################################
	 Training loss (single batch): 1.009530782699585
##################################
## EPOCH 603/5000
##################################
	 Training loss (single batch): 0.7239000201225281
##################################
## EPOCH 604/5000
##################################
	 Training loss (single batch): 0.7574755549430847
##################################
## EPOCH 605/5000
##################################
	 Training loss (single batch): 0.9842448234558105
##################################
## EPOCH 606/5000
##################################
	 Training loss (single batch): 0.66644287109375
##################################
## EPOCH 607/5000
##################################
	 Training loss (single batch): 0.7637888193130493
##################################
## EPOCH 608/5000
##################################
	 Training loss (single batch)

	 Training loss (single batch): 0.30807751417160034
##################################
## EPOCH 662/5000
##################################
	 Training loss (single batch): 0.6990470886230469
##################################
## EPOCH 663/5000
##################################
	 Training loss (single batch): 0.3453027307987213
##################################
## EPOCH 664/5000
##################################
	 Training loss (single batch): 0.2781321704387665
##################################
## EPOCH 665/5000
##################################
	 Training loss (single batch): 0.6745411157608032
##################################
## EPOCH 666/5000
##################################
	 Training loss (single batch): 0.4199003577232361
##################################
## EPOCH 667/5000
##################################
	 Training loss (single batch): 0.3913498520851135
##################################
## EPOCH 668/5000
##################################
	 Training loss (single ba

	 Training loss (single batch): 0.16084888577461243
##################################
## EPOCH 721/5000
##################################
	 Training loss (single batch): 0.2356458604335785
##################################
## EPOCH 722/5000
##################################
	 Training loss (single batch): 0.28160756826400757
##################################
## EPOCH 723/5000
##################################
	 Training loss (single batch): 0.39329975843429565
##################################
## EPOCH 724/5000
##################################
	 Training loss (single batch): 0.16949838399887085
##################################
## EPOCH 725/5000
##################################
	 Training loss (single batch): 0.913286566734314
##################################
## EPOCH 726/5000
##################################
	 Training loss (single batch): 0.49299994111061096
##################################
## EPOCH 727/5000
##################################
	 Training loss (single

	 Training loss (single batch): 0.08739063888788223
##################################
## EPOCH 780/5000
##################################
	 Training loss (single batch): 0.19826988875865936
##################################
## EPOCH 781/5000
##################################
	 Training loss (single batch): 0.10884767770767212
##################################
## EPOCH 782/5000
##################################
	 Training loss (single batch): 0.049531225115060806
##################################
## EPOCH 783/5000
##################################
	 Training loss (single batch): 0.4852601885795593
##################################
## EPOCH 784/5000
##################################
	 Training loss (single batch): 0.14624980092048645
##################################
## EPOCH 785/5000
##################################
	 Training loss (single batch): 0.3178085386753082
##################################
## EPOCH 786/5000
##################################
	 Training loss (sing

	 Training loss (single batch): 0.1174660474061966
##################################
## EPOCH 839/5000
##################################
	 Training loss (single batch): 0.2533322274684906
##################################
## EPOCH 840/5000
##################################
	 Training loss (single batch): 0.08514933288097382
##################################
## EPOCH 841/5000
##################################
	 Training loss (single batch): 0.3669223189353943
##################################
## EPOCH 842/5000
##################################
	 Training loss (single batch): 0.38529545068740845
##################################
## EPOCH 843/5000
##################################
	 Training loss (single batch): 0.19340206682682037
##################################
## EPOCH 844/5000
##################################
	 Training loss (single batch): 0.04726263880729675
##################################
## EPOCH 845/5000
##################################
	 Training loss (single

	 Training loss (single batch): 0.23695075511932373
##################################
## EPOCH 898/5000
##################################
	 Training loss (single batch): 0.128117173910141
##################################
## EPOCH 899/5000
##################################
	 Training loss (single batch): 0.3138193190097809
##################################
## EPOCH 900/5000
##################################
	 Training loss (single batch): 0.4500759541988373
##################################
## EPOCH 901/5000
##################################
	 Training loss (single batch): 0.24942605197429657
##################################
## EPOCH 902/5000
##################################
	 Training loss (single batch): 0.1972874402999878
##################################
## EPOCH 903/5000
##################################
	 Training loss (single batch): 0.16536030173301697
##################################
## EPOCH 904/5000
##################################
	 Training loss (single b

	 Training loss (single batch): 0.18970134854316711
##################################
## EPOCH 957/5000
##################################
	 Training loss (single batch): 0.11544962227344513
##################################
## EPOCH 958/5000
##################################
	 Training loss (single batch): 0.21653170883655548
##################################
## EPOCH 959/5000
##################################
	 Training loss (single batch): 0.09602177888154984
##################################
## EPOCH 960/5000
##################################
	 Training loss (single batch): 0.07841624319553375
##################################
## EPOCH 961/5000
##################################
	 Training loss (single batch): 0.12967756390571594
##################################
## EPOCH 962/5000
##################################
	 Training loss (single batch): 0.24011436104774475
##################################
## EPOCH 963/5000
##################################
	 Training loss (sin

	 Training loss (single batch): 0.027930518612265587
##################################
## EPOCH 1016/5000
##################################
	 Training loss (single batch): 0.019469061866402626
##################################
## EPOCH 1017/5000
##################################
	 Training loss (single batch): 0.024656543508172035
##################################
## EPOCH 1018/5000
##################################
	 Training loss (single batch): 0.03461703658103943
##################################
## EPOCH 1019/5000
##################################
	 Training loss (single batch): 0.1968013495206833
##################################
## EPOCH 1020/5000
##################################
	 Training loss (single batch): 0.06676629930734634
##################################
## EPOCH 1021/5000
##################################
	 Training loss (single batch): 0.05304562300443649
##################################
## EPOCH 1022/5000
##################################
	 Training 

	 Training loss (single batch): 0.03520941734313965
##################################
## EPOCH 1075/5000
##################################
	 Training loss (single batch): 0.019390897825360298
##################################
## EPOCH 1076/5000
##################################
	 Training loss (single batch): 0.33965355157852173
##################################
## EPOCH 1077/5000
##################################
	 Training loss (single batch): 0.07347570359706879
##################################
## EPOCH 1078/5000
##################################
	 Training loss (single batch): 0.14877668023109436
##################################
## EPOCH 1079/5000
##################################
	 Training loss (single batch): 0.025138089433312416
##################################
## EPOCH 1080/5000
##################################
	 Training loss (single batch): 0.04446769878268242
##################################
## EPOCH 1081/5000
##################################
	 Training 

	 Training loss (single batch): 0.24911367893218994
##################################
## EPOCH 1134/5000
##################################
	 Training loss (single batch): 0.12436652183532715
##################################
## EPOCH 1135/5000
##################################
	 Training loss (single batch): 0.11237934976816177
##################################
## EPOCH 1136/5000
##################################
	 Training loss (single batch): 0.17409709095954895
##################################
## EPOCH 1137/5000
##################################
	 Training loss (single batch): 0.5516660213470459
##################################
## EPOCH 1138/5000
##################################
	 Training loss (single batch): 0.12230435758829117
##################################
## EPOCH 1139/5000
##################################
	 Training loss (single batch): 0.12483184039592743
##################################
## EPOCH 1140/5000
##################################
	 Training los

	 Training loss (single batch): 0.11074541509151459
##################################
## EPOCH 1193/5000
##################################
	 Training loss (single batch): 0.08983819931745529
##################################
## EPOCH 1194/5000
##################################
	 Training loss (single batch): 0.06668750196695328
##################################
## EPOCH 1195/5000
##################################
	 Training loss (single batch): 0.039193760603666306
##################################
## EPOCH 1196/5000
##################################
	 Training loss (single batch): 0.06680581718683243
##################################
## EPOCH 1197/5000
##################################
	 Training loss (single batch): 0.12806318700313568
##################################
## EPOCH 1198/5000
##################################
	 Training loss (single batch): 0.11828571557998657
##################################
## EPOCH 1199/5000
##################################
	 Training l

	 Training loss (single batch): 0.17087438702583313
##################################
## EPOCH 1252/5000
##################################
	 Training loss (single batch): 0.13999907672405243
##################################
## EPOCH 1253/5000
##################################
	 Training loss (single batch): 0.11843468248844147
##################################
## EPOCH 1254/5000
##################################
	 Training loss (single batch): 0.05991307646036148
##################################
## EPOCH 1255/5000
##################################
	 Training loss (single batch): 0.07711304724216461
##################################
## EPOCH 1256/5000
##################################
	 Training loss (single batch): 0.18396686017513275
##################################
## EPOCH 1257/5000
##################################
	 Training loss (single batch): 0.18868565559387207
##################################
## EPOCH 1258/5000
##################################
	 Training lo

	 Training loss (single batch): 0.06114382669329643
##################################
## EPOCH 1311/5000
##################################
	 Training loss (single batch): 0.03580261021852493
##################################
## EPOCH 1312/5000
##################################
	 Training loss (single batch): 0.02168019488453865
##################################
## EPOCH 1313/5000
##################################
	 Training loss (single batch): 0.07641357183456421
##################################
## EPOCH 1314/5000
##################################
	 Training loss (single batch): 0.034882552921772
##################################
## EPOCH 1315/5000
##################################
	 Training loss (single batch): 0.031818173825740814
##################################
## EPOCH 1316/5000
##################################
	 Training loss (single batch): 0.028344836086034775
##################################
## EPOCH 1317/5000
##################################
	 Training lo

	 Training loss (single batch): 0.18855497241020203
##################################
## EPOCH 1370/5000
##################################
	 Training loss (single batch): 0.34024691581726074
##################################
## EPOCH 1371/5000
##################################
	 Training loss (single batch): 0.08602476119995117
##################################
## EPOCH 1372/5000
##################################
	 Training loss (single batch): 0.043155163526535034
##################################
## EPOCH 1373/5000
##################################
	 Training loss (single batch): 0.08202499896287918
##################################
## EPOCH 1374/5000
##################################
	 Training loss (single batch): 0.09322918206453323
##################################
## EPOCH 1375/5000
##################################
	 Training loss (single batch): 0.5442245602607727
##################################
## EPOCH 1376/5000
##################################
	 Training lo

	 Training loss (single batch): 0.015306268818676472
##################################
## EPOCH 1429/5000
##################################
	 Training loss (single batch): 0.01897578313946724
##################################
## EPOCH 1430/5000
##################################
	 Training loss (single batch): 0.02892516925930977
##################################
## EPOCH 1431/5000
##################################
	 Training loss (single batch): 0.014075681567192078
##################################
## EPOCH 1432/5000
##################################
	 Training loss (single batch): 0.02175906114280224
##################################
## EPOCH 1433/5000
##################################
	 Training loss (single batch): 0.08091364800930023
##################################
## EPOCH 1434/5000
##################################
	 Training loss (single batch): 0.014066999778151512
##################################
## EPOCH 1435/5000
##################################
	 Training

	 Training loss (single batch): 0.03122992441058159
##################################
## EPOCH 1487/5000
##################################
	 Training loss (single batch): 0.04860161244869232
##################################
## EPOCH 1488/5000
##################################
	 Training loss (single batch): 0.037003275007009506
##################################
## EPOCH 1489/5000
##################################
	 Training loss (single batch): 0.48503702878952026
##################################
## EPOCH 1490/5000
##################################
	 Training loss (single batch): 0.06583556532859802
##################################
## EPOCH 1491/5000
##################################
	 Training loss (single batch): 0.4364864230155945
##################################
## EPOCH 1492/5000
##################################
	 Training loss (single batch): 0.0914628803730011
##################################
## EPOCH 1493/5000
##################################
	 Training los

	 Training loss (single batch): 0.0311594195663929
##################################
## EPOCH 1546/5000
##################################
	 Training loss (single batch): 0.04721401259303093
##################################
## EPOCH 1547/5000
##################################
	 Training loss (single batch): 0.038949236273765564
##################################
## EPOCH 1548/5000
##################################
	 Training loss (single batch): 0.016452606767416
##################################
## EPOCH 1549/5000
##################################
	 Training loss (single batch): 0.01784088835120201
##################################
## EPOCH 1550/5000
##################################
	 Training loss (single batch): 0.00960860401391983
##################################
## EPOCH 1551/5000
##################################
	 Training loss (single batch): 0.044420965015888214
##################################
## EPOCH 1552/5000
##################################
	 Training los

	 Training loss (single batch): 0.06837571412324905
##################################
## EPOCH 1605/5000
##################################
	 Training loss (single batch): 0.03545121103525162
##################################
## EPOCH 1606/5000
##################################
	 Training loss (single batch): 0.19474785029888153
##################################
## EPOCH 1607/5000
##################################
	 Training loss (single batch): 0.06872072070837021
##################################
## EPOCH 1608/5000
##################################
	 Training loss (single batch): 0.07373741269111633
##################################
## EPOCH 1609/5000
##################################
	 Training loss (single batch): 0.07632600516080856
##################################
## EPOCH 1610/5000
##################################
	 Training loss (single batch): 0.04469825699925423
##################################
## EPOCH 1611/5000
##################################
	 Training lo

	 Training loss (single batch): 0.016005393117666245
##################################
## EPOCH 1663/5000
##################################
	 Training loss (single batch): 0.017515083774924278
##################################
## EPOCH 1664/5000
##################################
	 Training loss (single batch): 0.0152467992156744
##################################
## EPOCH 1665/5000
##################################
	 Training loss (single batch): 0.25466033816337585
##################################
## EPOCH 1666/5000
##################################
	 Training loss (single batch): 0.07086274027824402
##################################
## EPOCH 1667/5000
##################################
	 Training loss (single batch): 0.0430973656475544
##################################
## EPOCH 1668/5000
##################################
	 Training loss (single batch): 0.04793967679142952
##################################
## EPOCH 1669/5000
##################################
	 Training lo

	 Training loss (single batch): 0.41142159700393677
##################################
## EPOCH 1722/5000
##################################
	 Training loss (single batch): 0.17906415462493896
##################################
## EPOCH 1723/5000
##################################
	 Training loss (single batch): 0.12943236529827118
##################################
## EPOCH 1724/5000
##################################
	 Training loss (single batch): 0.10394938290119171
##################################
## EPOCH 1725/5000
##################################
	 Training loss (single batch): 0.07916124165058136
##################################
## EPOCH 1726/5000
##################################
	 Training loss (single batch): 0.19297434389591217
##################################
## EPOCH 1727/5000
##################################
	 Training loss (single batch): 0.27707570791244507
##################################
## EPOCH 1728/5000
##################################
	 Training lo

	 Training loss (single batch): 0.09310434013605118
##################################
## EPOCH 1781/5000
##################################
	 Training loss (single batch): 0.08153383433818817
##################################
## EPOCH 1782/5000
##################################
	 Training loss (single batch): 0.3145264685153961
##################################
## EPOCH 1783/5000
##################################
	 Training loss (single batch): 0.1779567301273346
##################################
## EPOCH 1784/5000
##################################
	 Training loss (single batch): 0.14647725224494934
##################################
## EPOCH 1785/5000
##################################
	 Training loss (single batch): 0.10752018541097641
##################################
## EPOCH 1786/5000
##################################
	 Training loss (single batch): 0.07672308385372162
##################################
## EPOCH 1787/5000
##################################
	 Training loss

	 Training loss (single batch): 0.206831693649292
##################################
## EPOCH 1840/5000
##################################
	 Training loss (single batch): 0.20817866921424866
##################################
## EPOCH 1841/5000
##################################
	 Training loss (single batch): 0.09483703225851059
##################################
## EPOCH 1842/5000
##################################
	 Training loss (single batch): 0.06623194366693497
##################################
## EPOCH 1843/5000
##################################
	 Training loss (single batch): 0.04736263304948807
##################################
## EPOCH 1844/5000
##################################
	 Training loss (single batch): 0.0747615247964859
##################################
## EPOCH 1845/5000
##################################
	 Training loss (single batch): 0.057113420218229294
##################################
## EPOCH 1846/5000
##################################
	 Training loss

	 Training loss (single batch): 0.2610231935977936
##################################
## EPOCH 1899/5000
##################################
	 Training loss (single batch): 0.08982475101947784
##################################
## EPOCH 1900/5000
##################################
	 Training loss (single batch): 0.522354006767273
##################################
## EPOCH 1901/5000
##################################
	 Training loss (single batch): 0.4060850143432617
##################################
## EPOCH 1902/5000
##################################
	 Training loss (single batch): 0.030323859304189682
##################################
## EPOCH 1903/5000
##################################
	 Training loss (single batch): 0.04535501450300217
##################################
## EPOCH 1904/5000
##################################
	 Training loss (single batch): 0.053268782794475555
##################################
## EPOCH 1905/5000
##################################
	 Training loss

	 Training loss (single batch): 0.09353192150592804
##################################
## EPOCH 1958/5000
##################################
	 Training loss (single batch): 0.15999089181423187
##################################
## EPOCH 1959/5000
##################################
	 Training loss (single batch): 0.2861003279685974
##################################
## EPOCH 1960/5000
##################################
	 Training loss (single batch): 0.05105355381965637
##################################
## EPOCH 1961/5000
##################################
	 Training loss (single batch): 0.031011557206511497
##################################
## EPOCH 1962/5000
##################################
	 Training loss (single batch): 0.04612568020820618
##################################
## EPOCH 1963/5000
##################################
	 Training loss (single batch): 0.03614015877246857
##################################
## EPOCH 1964/5000
##################################
	 Training lo

	 Training loss (single batch): 0.03610317409038544
##################################
## EPOCH 2017/5000
##################################
	 Training loss (single batch): 0.019610591232776642
##################################
## EPOCH 2018/5000
##################################
	 Training loss (single batch): 0.06747090816497803
##################################
## EPOCH 2019/5000
##################################
	 Training loss (single batch): 0.02581613138318062
##################################
## EPOCH 2020/5000
##################################
	 Training loss (single batch): 0.008974585682153702
##################################
## EPOCH 2021/5000
##################################
	 Training loss (single batch): 0.016718357801437378
##################################
## EPOCH 2022/5000
##################################
	 Training loss (single batch): 0.00907360203564167
##################################
## EPOCH 2023/5000
##################################
	 Training

	 Training loss (single batch): 0.10671474784612656
##################################
## EPOCH 2075/5000
##################################
	 Training loss (single batch): 0.008969917893409729
##################################
## EPOCH 2076/5000
##################################
	 Training loss (single batch): 0.014379605650901794
##################################
## EPOCH 2077/5000
##################################
	 Training loss (single batch): 0.005822224076837301
##################################
## EPOCH 2078/5000
##################################
	 Training loss (single batch): 0.022849608212709427
##################################
## EPOCH 2079/5000
##################################
	 Training loss (single batch): 0.015207511372864246
##################################
## EPOCH 2080/5000
##################################
	 Training loss (single batch): 0.013889281079173088
##################################
## EPOCH 2081/5000
##################################
	 Train

	 Training loss (single batch): 0.014290806837379932
##################################
## EPOCH 2133/5000
##################################
	 Training loss (single batch): 0.031163226813077927
##################################
## EPOCH 2134/5000
##################################
	 Training loss (single batch): 0.012499663047492504
##################################
## EPOCH 2135/5000
##################################
	 Training loss (single batch): 0.06386473029851913
##################################
## EPOCH 2136/5000
##################################
	 Training loss (single batch): 0.018239593133330345
##################################
## EPOCH 2137/5000
##################################
	 Training loss (single batch): 0.012846587225794792
##################################
## EPOCH 2138/5000
##################################
	 Training loss (single batch): 0.04760157689452171
##################################
## EPOCH 2139/5000
##################################
	 Traini

	 Training loss (single batch): 0.018491538241505623
##################################
## EPOCH 2191/5000
##################################
	 Training loss (single batch): 0.2619074285030365
##################################
## EPOCH 2192/5000
##################################
	 Training loss (single batch): 0.044296324253082275
##################################
## EPOCH 2193/5000
##################################
	 Training loss (single batch): 0.02915375307202339
##################################
## EPOCH 2194/5000
##################################
	 Training loss (single batch): 0.03427524492144585
##################################
## EPOCH 2195/5000
##################################
	 Training loss (single batch): 0.06723767518997192
##################################
## EPOCH 2196/5000
##################################
	 Training loss (single batch): 0.02245357260107994
##################################
## EPOCH 2197/5000
##################################
	 Training l

	 Training loss (single batch): 0.021036718040704727
##################################
## EPOCH 2249/5000
##################################
	 Training loss (single batch): 0.02095729485154152
##################################
## EPOCH 2250/5000
##################################
	 Training loss (single batch): 0.051262952387332916
##################################
## EPOCH 2251/5000
##################################
	 Training loss (single batch): 0.01206954661756754
##################################
## EPOCH 2252/5000
##################################
	 Training loss (single batch): 0.020663540810346603
##################################
## EPOCH 2253/5000
##################################
	 Training loss (single batch): 0.015948107466101646
##################################
## EPOCH 2254/5000
##################################
	 Training loss (single batch): 0.006483898498117924
##################################
## EPOCH 2255/5000
##################################
	 Traini

	 Training loss (single batch): 0.041616491973400116
##################################
## EPOCH 2307/5000
##################################
	 Training loss (single batch): 0.02335434779524803
##################################
## EPOCH 2308/5000
##################################
	 Training loss (single batch): 0.3051738142967224
##################################
## EPOCH 2309/5000
##################################
	 Training loss (single batch): 0.16854014992713928
##################################
## EPOCH 2310/5000
##################################
	 Training loss (single batch): 0.19792486727237701
##################################
## EPOCH 2311/5000
##################################
	 Training loss (single batch): 0.06004192307591438
##################################
## EPOCH 2312/5000
##################################
	 Training loss (single batch): 0.04275621846318245
##################################
## EPOCH 2313/5000
##################################
	 Training lo

	 Training loss (single batch): 0.04177647456526756
##################################
## EPOCH 2366/5000
##################################
	 Training loss (single batch): 0.02478277124464512
##################################
## EPOCH 2367/5000
##################################
	 Training loss (single batch): 0.015480357222259045
##################################
## EPOCH 2368/5000
##################################
	 Training loss (single batch): 0.06378090381622314
##################################
## EPOCH 2369/5000
##################################
	 Training loss (single batch): 0.11046530306339264
##################################
## EPOCH 2370/5000
##################################
	 Training loss (single batch): 0.19030624628067017
##################################
## EPOCH 2371/5000
##################################
	 Training loss (single batch): 0.04543072357773781
##################################
## EPOCH 2372/5000
##################################
	 Training l

	 Training loss (single batch): 0.07873213291168213
##################################
## EPOCH 2425/5000
##################################
	 Training loss (single batch): 0.10504527390003204
##################################
## EPOCH 2426/5000
##################################
	 Training loss (single batch): 0.034850023686885834
##################################
## EPOCH 2427/5000
##################################
	 Training loss (single batch): 0.11544860899448395
##################################
## EPOCH 2428/5000
##################################
	 Training loss (single batch): 0.04463282972574234
##################################
## EPOCH 2429/5000
##################################
	 Training loss (single batch): 0.05240675061941147
##################################
## EPOCH 2430/5000
##################################
	 Training loss (single batch): 0.019442688673734665
##################################
## EPOCH 2431/5000
##################################
	 Training 

	 Training loss (single batch): 0.010159832425415516
##################################
## EPOCH 2484/5000
##################################
	 Training loss (single batch): 0.021292313933372498
##################################
## EPOCH 2485/5000
##################################
	 Training loss (single batch): 0.18371228873729706
##################################
## EPOCH 2486/5000
##################################
	 Training loss (single batch): 0.016629358753561974
##################################
## EPOCH 2487/5000
##################################
	 Training loss (single batch): 0.01919490471482277
##################################
## EPOCH 2488/5000
##################################
	 Training loss (single batch): 0.5793362855911255
##################################
## EPOCH 2489/5000
##################################
	 Training loss (single batch): 0.031161507591605186
##################################
## EPOCH 2490/5000
##################################
	 Training

	 Training loss (single batch): 0.011675429530441761
##################################
## EPOCH 2542/5000
##################################
	 Training loss (single batch): 0.008580033667385578
##################################
## EPOCH 2543/5000
##################################
	 Training loss (single batch): 0.0071965111419558525
##################################
## EPOCH 2544/5000
##################################
	 Training loss (single batch): 0.01393492054194212
##################################
## EPOCH 2545/5000
##################################
	 Training loss (single batch): 0.012419994920492172
##################################
## EPOCH 2546/5000
##################################
	 Training loss (single batch): 0.01518605649471283
##################################
## EPOCH 2547/5000
##################################
	 Training loss (single batch): 0.04816918075084686
##################################
## EPOCH 2548/5000
##################################
	 Traini

	 Training loss (single batch): 0.015915269032120705
##################################
## EPOCH 2600/5000
##################################
	 Training loss (single batch): 0.01879802718758583
##################################
## EPOCH 2601/5000
##################################
	 Training loss (single batch): 0.015322426334023476
##################################
## EPOCH 2602/5000
##################################
	 Training loss (single batch): 0.012409361079335213
##################################
## EPOCH 2603/5000
##################################
	 Training loss (single batch): 0.07163374125957489
##################################
## EPOCH 2604/5000
##################################
	 Training loss (single batch): 0.021286461502313614
##################################
## EPOCH 2605/5000
##################################
	 Training loss (single batch): 0.009128663688898087
##################################
## EPOCH 2606/5000
##################################
	 Traini

	 Training loss (single batch): 0.05327511951327324
##################################
## EPOCH 2658/5000
##################################
	 Training loss (single batch): 0.09918372333049774
##################################
## EPOCH 2659/5000
##################################
	 Training loss (single batch): 0.04111463576555252
##################################
## EPOCH 2660/5000
##################################
	 Training loss (single batch): 0.0979945957660675
##################################
## EPOCH 2661/5000
##################################
	 Training loss (single batch): 0.036894094198942184
##################################
## EPOCH 2662/5000
##################################
	 Training loss (single batch): 0.09001697599887848
##################################
## EPOCH 2663/5000
##################################
	 Training loss (single batch): 0.0552084743976593
##################################
## EPOCH 2664/5000
##################################
	 Training los

	 Training loss (single batch): 0.022319765761494637
##################################
## EPOCH 2717/5000
##################################
	 Training loss (single batch): 0.04911600798368454
##################################
## EPOCH 2718/5000
##################################
	 Training loss (single batch): 0.035054340958595276
##################################
## EPOCH 2719/5000
##################################
	 Training loss (single batch): 0.2729071080684662
##################################
## EPOCH 2720/5000
##################################
	 Training loss (single batch): 0.017665354534983635
##################################
## EPOCH 2721/5000
##################################
	 Training loss (single batch): 0.016654010862112045
##################################
## EPOCH 2722/5000
##################################
	 Training loss (single batch): 0.07218791544437408
##################################
## EPOCH 2723/5000
##################################
	 Training

	 Training loss (single batch): 0.03644069284200668
##################################
## EPOCH 2776/5000
##################################
	 Training loss (single batch): 0.06617855280637741
##################################
## EPOCH 2777/5000
##################################
	 Training loss (single batch): 0.19141057133674622
##################################
## EPOCH 2778/5000
##################################
	 Training loss (single batch): 0.141081303358078
##################################
## EPOCH 2779/5000
##################################
	 Training loss (single batch): 0.20616888999938965
##################################
## EPOCH 2780/5000
##################################
	 Training loss (single batch): 0.23543806374073029
##################################
## EPOCH 2781/5000
##################################
	 Training loss (single batch): 0.06487063318490982
##################################
## EPOCH 2782/5000
##################################
	 Training loss

	 Training loss (single batch): 0.015615086071193218
##################################
## EPOCH 2835/5000
##################################
	 Training loss (single batch): 0.04454465210437775
##################################
## EPOCH 2836/5000
##################################
	 Training loss (single batch): 0.22156579792499542
##################################
## EPOCH 2837/5000
##################################
	 Training loss (single batch): 0.013456764630973339
##################################
## EPOCH 2838/5000
##################################
	 Training loss (single batch): 0.061279989778995514
##################################
## EPOCH 2839/5000
##################################
	 Training loss (single batch): 0.05303124710917473
##################################
## EPOCH 2840/5000
##################################
	 Training loss (single batch): 0.03741759806871414
##################################
## EPOCH 2841/5000
##################################
	 Training

	 Training loss (single batch): 0.04402153566479683
##################################
## EPOCH 2894/5000
##################################
	 Training loss (single batch): 0.015903396531939507
##################################
## EPOCH 2895/5000
##################################
	 Training loss (single batch): 0.029865900054574013
##################################
## EPOCH 2896/5000
##################################
	 Training loss (single batch): 0.10493483394384384
##################################
## EPOCH 2897/5000
##################################
	 Training loss (single batch): 0.025461941957473755
##################################
## EPOCH 2898/5000
##################################
	 Training loss (single batch): 0.04089335352182388
##################################
## EPOCH 2899/5000
##################################
	 Training loss (single batch): 0.021328145638108253
##################################
## EPOCH 2900/5000
##################################
	 Trainin

	 Training loss (single batch): 0.01251194067299366
##################################
## EPOCH 2952/5000
##################################
	 Training loss (single batch): 0.008730417117476463
##################################
## EPOCH 2953/5000
##################################
	 Training loss (single batch): 0.010017948225140572
##################################
## EPOCH 2954/5000
##################################
	 Training loss (single batch): 0.007502678781747818
##################################
## EPOCH 2955/5000
##################################
	 Training loss (single batch): 0.008538169786334038
##################################
## EPOCH 2956/5000
##################################
	 Training loss (single batch): 0.01154374796897173
##################################
## EPOCH 2957/5000
##################################
	 Training loss (single batch): 0.015577191486954689
##################################
## EPOCH 2958/5000
##################################
	 Traini

	 Training loss (single batch): 0.008800582028925419
##################################
## EPOCH 3010/5000
##################################
	 Training loss (single batch): 0.007766248192638159
##################################
## EPOCH 3011/5000
##################################
	 Training loss (single batch): 0.006148880813270807
##################################
## EPOCH 3012/5000
##################################
	 Training loss (single batch): 0.008033310994505882
##################################
## EPOCH 3013/5000
##################################
	 Training loss (single batch): 0.009005091153085232
##################################
## EPOCH 3014/5000
##################################
	 Training loss (single batch): 0.006382330320775509
##################################
## EPOCH 3015/5000
##################################
	 Training loss (single batch): 0.010769644752144814
##################################
## EPOCH 3016/5000
##################################
	 Trai

	 Training loss (single batch): 0.014625275507569313
##################################
## EPOCH 3068/5000
##################################
	 Training loss (single batch): 0.02814331091940403
##################################
## EPOCH 3069/5000
##################################
	 Training loss (single batch): 0.027589920908212662
##################################
## EPOCH 3070/5000
##################################
	 Training loss (single batch): 0.022264089435338974
##################################
## EPOCH 3071/5000
##################################
	 Training loss (single batch): 0.012507803738117218
##################################
## EPOCH 3072/5000
##################################
	 Training loss (single batch): 0.030425231903791428
##################################
## EPOCH 3073/5000
##################################
	 Training loss (single batch): 0.007416953332722187
##################################
## EPOCH 3074/5000
##################################
	 Train

	 Training loss (single batch): 0.012621921487152576
##################################
## EPOCH 3126/5000
##################################
	 Training loss (single batch): 0.015406263060867786
##################################
## EPOCH 3127/5000
##################################
	 Training loss (single batch): 0.007226700894534588
##################################
## EPOCH 3128/5000
##################################
	 Training loss (single batch): 0.009405317716300488
##################################
## EPOCH 3129/5000
##################################
	 Training loss (single batch): 0.05131262540817261
##################################
## EPOCH 3130/5000
##################################
	 Training loss (single batch): 0.016527237370610237
##################################
## EPOCH 3131/5000
##################################
	 Training loss (single batch): 0.12757448852062225
##################################
## EPOCH 3132/5000
##################################
	 Traini

	 Training loss (single batch): 0.02933737076818943
##################################
## EPOCH 3184/5000
##################################
	 Training loss (single batch): 0.03628639504313469
##################################
## EPOCH 3185/5000
##################################
	 Training loss (single batch): 0.011528516188263893
##################################
## EPOCH 3186/5000
##################################
	 Training loss (single batch): 0.03415226191282272
##################################
## EPOCH 3187/5000
##################################
	 Training loss (single batch): 0.011930751614272594
##################################
## EPOCH 3188/5000
##################################
	 Training loss (single batch): 0.006036982871592045
##################################
## EPOCH 3189/5000
##################################
	 Training loss (single batch): 0.034775324165821075
##################################
## EPOCH 3190/5000
##################################
	 Trainin

	 Training loss (single batch): 0.06424178928136826
##################################
## EPOCH 3242/5000
##################################
	 Training loss (single batch): 0.05650191381573677
##################################
## EPOCH 3243/5000
##################################
	 Training loss (single batch): 0.019477983936667442
##################################
## EPOCH 3244/5000
##################################
	 Training loss (single batch): 0.05976880341768265
##################################
## EPOCH 3245/5000
##################################
	 Training loss (single batch): 0.024170715361833572
##################################
## EPOCH 3246/5000
##################################
	 Training loss (single batch): 0.018252719193696976
##################################
## EPOCH 3247/5000
##################################
	 Training loss (single batch): 0.015892375260591507
##################################
## EPOCH 3248/5000
##################################
	 Trainin

	 Training loss (single batch): 0.4511811137199402
##################################
## EPOCH 3300/5000
##################################
	 Training loss (single batch): 0.051647085696458817
##################################
## EPOCH 3301/5000
##################################
	 Training loss (single batch): 0.020843850448727608
##################################
## EPOCH 3302/5000
##################################
	 Training loss (single batch): 0.06755104660987854
##################################
## EPOCH 3303/5000
##################################
	 Training loss (single batch): 0.0370476134121418
##################################
## EPOCH 3304/5000
##################################
	 Training loss (single batch): 0.18917874991893768
##################################
## EPOCH 3305/5000
##################################
	 Training loss (single batch): 0.2837689518928528
##################################
## EPOCH 3306/5000
##################################
	 Training los

	 Training loss (single batch): 0.06401590257883072
##################################
## EPOCH 3359/5000
##################################
	 Training loss (single batch): 0.017594624310731888
##################################
## EPOCH 3360/5000
##################################
	 Training loss (single batch): 0.03382740542292595
##################################
## EPOCH 3361/5000
##################################
	 Training loss (single batch): 0.03732166811823845
##################################
## EPOCH 3362/5000
##################################
	 Training loss (single batch): 0.033099669963121414
##################################
## EPOCH 3363/5000
##################################
	 Training loss (single batch): 0.025531047955155373
##################################
## EPOCH 3364/5000
##################################
	 Training loss (single batch): 0.029388170689344406
##################################
## EPOCH 3365/5000
##################################
	 Trainin

	 Training loss (single batch): 0.11121354252099991
##################################
## EPOCH 3417/5000
##################################
	 Training loss (single batch): 0.035703375935554504
##################################
## EPOCH 3418/5000
##################################
	 Training loss (single batch): 0.22422774136066437
##################################
## EPOCH 3419/5000
##################################
	 Training loss (single batch): 0.011393563821911812
##################################
## EPOCH 3420/5000
##################################
	 Training loss (single batch): 0.021632669493556023
##################################
## EPOCH 3421/5000
##################################
	 Training loss (single batch): 0.07974638044834137
##################################
## EPOCH 3422/5000
##################################
	 Training loss (single batch): 0.08840267360210419
##################################
## EPOCH 3423/5000
##################################
	 Training

	 Training loss (single batch): 0.1636732965707779
##################################
## EPOCH 3476/5000
##################################
	 Training loss (single batch): 0.13484391570091248
##################################
## EPOCH 3477/5000
##################################
	 Training loss (single batch): 0.04487823694944382
##################################
## EPOCH 3478/5000
##################################
	 Training loss (single batch): 0.11219906806945801
##################################
## EPOCH 3479/5000
##################################
	 Training loss (single batch): 0.059638477861881256
##################################
## EPOCH 3480/5000
##################################
	 Training loss (single batch): 0.20046615600585938
##################################
## EPOCH 3481/5000
##################################
	 Training loss (single batch): 0.06276418268680573
##################################
## EPOCH 3482/5000
##################################
	 Training lo

	 Training loss (single batch): 0.39576056599617004
##################################
## EPOCH 3535/5000
##################################
	 Training loss (single batch): 0.12549954652786255
##################################
## EPOCH 3536/5000
##################################
	 Training loss (single batch): 0.08739650249481201
##################################
## EPOCH 3537/5000
##################################
	 Training loss (single batch): 0.11892559379339218
##################################
## EPOCH 3538/5000
##################################
	 Training loss (single batch): 0.16913576424121857
##################################
## EPOCH 3539/5000
##################################
	 Training loss (single batch): 0.10976582765579224
##################################
## EPOCH 3540/5000
##################################
	 Training loss (single batch): 0.051014285534620285
##################################
## EPOCH 3541/5000
##################################
	 Training l

	 Training loss (single batch): 0.08039499819278717
##################################
## EPOCH 3593/5000
##################################
	 Training loss (single batch): 0.017390359193086624
##################################
## EPOCH 3594/5000
##################################
	 Training loss (single batch): 0.02508242055773735
##################################
## EPOCH 3595/5000
##################################
	 Training loss (single batch): 0.08720046281814575
##################################
## EPOCH 3596/5000
##################################
	 Training loss (single batch): 0.011996612884104252
##################################
## EPOCH 3597/5000
##################################
	 Training loss (single batch): 0.0372103750705719
##################################
## EPOCH 3598/5000
##################################
	 Training loss (single batch): 0.03682650998234749
##################################
## EPOCH 3599/5000
##################################
	 Training l

	 Training loss (single batch): 0.03969992697238922
##################################
## EPOCH 3651/5000
##################################
	 Training loss (single batch): 0.028066134080290794
##################################
## EPOCH 3652/5000
##################################
	 Training loss (single batch): 0.10467846691608429
##################################
## EPOCH 3653/5000
##################################
	 Training loss (single batch): 0.014011135324835777
##################################
## EPOCH 3654/5000
##################################
	 Training loss (single batch): 0.010656683705747128
##################################
## EPOCH 3655/5000
##################################
	 Training loss (single batch): 0.026347467675805092
##################################
## EPOCH 3656/5000
##################################
	 Training loss (single batch): 0.013076084665954113
##################################
## EPOCH 3657/5000
##################################
	 Traini

	 Training loss (single batch): 0.01567073166370392
##################################
## EPOCH 3709/5000
##################################
	 Training loss (single batch): 0.014883169904351234
##################################
## EPOCH 3710/5000
##################################
	 Training loss (single batch): 0.009691532701253891
##################################
## EPOCH 3711/5000
##################################
	 Training loss (single batch): 0.005663820542395115
##################################
## EPOCH 3712/5000
##################################
	 Training loss (single batch): 0.005303860642015934
##################################
## EPOCH 3713/5000
##################################
	 Training loss (single batch): 0.0059608654119074345
##################################
## EPOCH 3714/5000
##################################
	 Training loss (single batch): 0.00670555979013443
##################################
## EPOCH 3715/5000
##################################
	 Train

	 Training loss (single batch): 0.12533925473690033
##################################
## EPOCH 3767/5000
##################################
	 Training loss (single batch): 0.03909709304571152
##################################
## EPOCH 3768/5000
##################################
	 Training loss (single batch): 0.016139643266797066
##################################
## EPOCH 3769/5000
##################################
	 Training loss (single batch): 0.01828983798623085
##################################
## EPOCH 3770/5000
##################################
	 Training loss (single batch): 0.04263982176780701
##################################
## EPOCH 3771/5000
##################################
	 Training loss (single batch): 0.02987716533243656
##################################
## EPOCH 3772/5000
##################################
	 Training loss (single batch): 0.02039392478764057
##################################
## EPOCH 3773/5000
##################################
	 Training l

	 Training loss (single batch): 0.009344955906271935
##################################
## EPOCH 3825/5000
##################################
	 Training loss (single batch): 0.007426562253385782
##################################
## EPOCH 3826/5000
##################################
	 Training loss (single batch): 0.010594448074698448
##################################
## EPOCH 3827/5000
##################################
	 Training loss (single batch): 0.009011444635689259
##################################
## EPOCH 3828/5000
##################################
	 Training loss (single batch): 0.0057861232198774815
##################################
## EPOCH 3829/5000
##################################
	 Training loss (single batch): 0.0061571323312819
##################################
## EPOCH 3830/5000
##################################
	 Training loss (single batch): 0.006198725663125515
##################################
## EPOCH 3831/5000
##################################
	 Train

	 Training loss (single batch): 0.011091054417192936
##################################
## EPOCH 3883/5000
##################################
	 Training loss (single batch): 0.008608144707977772
##################################
## EPOCH 3884/5000
##################################
	 Training loss (single batch): 0.007333674933761358
##################################
## EPOCH 3885/5000
##################################
	 Training loss (single batch): 0.017421673983335495
##################################
## EPOCH 3886/5000
##################################
	 Training loss (single batch): 0.012919631786644459
##################################
## EPOCH 3887/5000
##################################
	 Training loss (single batch): 0.016083599999547005
##################################
## EPOCH 3888/5000
##################################
	 Training loss (single batch): 0.026431122794747353
##################################
## EPOCH 3889/5000
##################################
	 Trai

	 Training loss (single batch): 0.10657420009374619
##################################
## EPOCH 3941/5000
##################################
	 Training loss (single batch): 0.09717144817113876
##################################
## EPOCH 3942/5000
##################################
	 Training loss (single batch): 0.02346828766167164
##################################
## EPOCH 3943/5000
##################################
	 Training loss (single batch): 0.07424341142177582
##################################
## EPOCH 3944/5000
##################################
	 Training loss (single batch): 0.0601235032081604
##################################
## EPOCH 3945/5000
##################################
	 Training loss (single batch): 0.04457955062389374
##################################
## EPOCH 3946/5000
##################################
	 Training loss (single batch): 0.038717664778232574
##################################
## EPOCH 3947/5000
##################################
	 Training lo

	 Training loss (single batch): 0.007596518844366074
##################################
## EPOCH 3999/5000
##################################
	 Training loss (single batch): 0.018841596320271492
##################################
## EPOCH 4000/5000
##################################
	 Training loss (single batch): 0.017574500292539597
##################################
## EPOCH 4001/5000
##################################
	 Training loss (single batch): 0.016273271292448044
##################################
## EPOCH 4002/5000
##################################
	 Training loss (single batch): 0.016179431229829788
##################################
## EPOCH 4003/5000
##################################
	 Training loss (single batch): 0.03873268887400627
##################################
## EPOCH 4004/5000
##################################
	 Training loss (single batch): 0.2050183266401291
##################################
## EPOCH 4005/5000
##################################
	 Trainin

	 Training loss (single batch): 0.011112409643828869
##################################
## EPOCH 4057/5000
##################################
	 Training loss (single batch): 0.022535543888807297
##################################
## EPOCH 4058/5000
##################################
	 Training loss (single batch): 0.023847011849284172
##################################
## EPOCH 4059/5000
##################################
	 Training loss (single batch): 0.014718671329319477
##################################
## EPOCH 4060/5000
##################################
	 Training loss (single batch): 0.01117024477571249
##################################
## EPOCH 4061/5000
##################################
	 Training loss (single batch): 0.01612999103963375
##################################
## EPOCH 4062/5000
##################################
	 Training loss (single batch): 0.019135108217597008
##################################
## EPOCH 4063/5000
##################################
	 Traini

	 Training loss (single batch): 0.008274167776107788
##################################
## EPOCH 4115/5000
##################################
	 Training loss (single batch): 0.008690664544701576
##################################
## EPOCH 4116/5000
##################################
	 Training loss (single batch): 0.0061558810994029045
##################################
## EPOCH 4117/5000
##################################
	 Training loss (single batch): 0.006883741356432438
##################################
## EPOCH 4118/5000
##################################
	 Training loss (single batch): 0.006204997655004263
##################################
## EPOCH 4119/5000
##################################
	 Training loss (single batch): 0.006747109349817038
##################################
## EPOCH 4120/5000
##################################
	 Training loss (single batch): 0.003968315664678812
##################################
## EPOCH 4121/5000
##################################
	 Tra

	 Training loss (single batch): 0.028310412541031837
##################################
## EPOCH 4173/5000
##################################
	 Training loss (single batch): 0.009122481569647789
##################################
## EPOCH 4174/5000
##################################
	 Training loss (single batch): 0.015415472909808159
##################################
## EPOCH 4175/5000
##################################
	 Training loss (single batch): 0.015116381458938122
##################################
## EPOCH 4176/5000
##################################
	 Training loss (single batch): 0.011083755642175674
##################################
## EPOCH 4177/5000
##################################
	 Training loss (single batch): 0.008549625985324383
##################################
## EPOCH 4178/5000
##################################
	 Training loss (single batch): 0.007808849215507507
##################################
## EPOCH 4179/5000
##################################
	 Trai

	 Training loss (single batch): 0.0069139497354626656
##################################
## EPOCH 4231/5000
##################################
	 Training loss (single batch): 0.007535344455391169
##################################
## EPOCH 4232/5000
##################################
	 Training loss (single batch): 0.16515155136585236
##################################
## EPOCH 4233/5000
##################################
	 Training loss (single batch): 0.008203846402466297
##################################
## EPOCH 4234/5000
##################################
	 Training loss (single batch): 0.00967242568731308
##################################
## EPOCH 4235/5000
##################################
	 Training loss (single batch): 0.007433298975229263
##################################
## EPOCH 4236/5000
##################################
	 Training loss (single batch): 0.010973998345434666
##################################
## EPOCH 4237/5000
##################################
	 Train

	 Training loss (single batch): 0.006877216510474682
##################################
## EPOCH 4289/5000
##################################
	 Training loss (single batch): 0.08731840550899506
##################################
## EPOCH 4290/5000
##################################
	 Training loss (single batch): 0.006070027127861977
##################################
## EPOCH 4291/5000
##################################
	 Training loss (single batch): 0.012273015454411507
##################################
## EPOCH 4292/5000
##################################
	 Training loss (single batch): 0.013823091983795166
##################################
## EPOCH 4293/5000
##################################
	 Training loss (single batch): 0.037158794701099396
##################################
## EPOCH 4294/5000
##################################
	 Training loss (single batch): 0.019577091559767723
##################################
## EPOCH 4295/5000
##################################
	 Train

	 Training loss (single batch): 0.016509784385561943
##################################
## EPOCH 4347/5000
##################################
	 Training loss (single batch): 0.01788998767733574
##################################
## EPOCH 4348/5000
##################################
	 Training loss (single batch): 0.02409067377448082
##################################
## EPOCH 4349/5000
##################################
	 Training loss (single batch): 0.01309962011873722
##################################
## EPOCH 4350/5000
##################################
	 Training loss (single batch): 0.010939900763332844
##################################
## EPOCH 4351/5000
##################################
	 Training loss (single batch): 0.012753969058394432
##################################
## EPOCH 4352/5000
##################################
	 Training loss (single batch): 0.011360138654708862
##################################
## EPOCH 4353/5000
##################################
	 Trainin

	 Training loss (single batch): 0.015132077038288116
##################################
## EPOCH 4405/5000
##################################
	 Training loss (single batch): 0.01799153909087181
##################################
## EPOCH 4406/5000
##################################
	 Training loss (single batch): 0.010551405139267445
##################################
## EPOCH 4407/5000
##################################
	 Training loss (single batch): 0.05499038100242615
##################################
## EPOCH 4408/5000
##################################
	 Training loss (single batch): 0.010307799093425274
##################################
## EPOCH 4409/5000
##################################
	 Training loss (single batch): 0.04831869155168533
##################################
## EPOCH 4410/5000
##################################
	 Training loss (single batch): 0.01597507670521736
##################################
## EPOCH 4411/5000
##################################
	 Training

	 Training loss (single batch): 0.004481229931116104
##################################
## EPOCH 4463/5000
##################################
	 Training loss (single batch): 0.0024359829258173704
##################################
## EPOCH 4464/5000
##################################
	 Training loss (single batch): 0.00512092188000679
##################################
## EPOCH 4465/5000
##################################
	 Training loss (single batch): 0.0029278816655278206
##################################
## EPOCH 4466/5000
##################################
	 Training loss (single batch): 0.025747234001755714
##################################
## EPOCH 4467/5000
##################################
	 Training loss (single batch): 0.004401367157697678
##################################
## EPOCH 4468/5000
##################################
	 Training loss (single batch): 0.00814575981348753
##################################
## EPOCH 4469/5000
##################################
	 Trai

	 Training loss (single batch): 0.007702940609306097
##################################
## EPOCH 4521/5000
##################################
	 Training loss (single batch): 0.02254427969455719
##################################
## EPOCH 4522/5000
##################################
	 Training loss (single batch): 0.004990852437913418
##################################
## EPOCH 4523/5000
##################################
	 Training loss (single batch): 0.014234967529773712
##################################
## EPOCH 4524/5000
##################################
	 Training loss (single batch): 0.008558833971619606
##################################
## EPOCH 4525/5000
##################################
	 Training loss (single batch): 0.01771337352693081
##################################
## EPOCH 4526/5000
##################################
	 Training loss (single batch): 0.006560092326253653
##################################
## EPOCH 4527/5000
##################################
	 Traini

	 Training loss (single batch): 0.008707599714398384
##################################
## EPOCH 4579/5000
##################################
	 Training loss (single batch): 0.023714035749435425
##################################
## EPOCH 4580/5000
##################################
	 Training loss (single batch): 0.05006479099392891
##################################
## EPOCH 4581/5000
##################################
	 Training loss (single batch): 0.026819676160812378
##################################
## EPOCH 4582/5000
##################################
	 Training loss (single batch): 0.01803252100944519
##################################
## EPOCH 4583/5000
##################################
	 Training loss (single batch): 0.08316190540790558
##################################
## EPOCH 4584/5000
##################################
	 Training loss (single batch): 0.04112708196043968
##################################
## EPOCH 4585/5000
##################################
	 Training

	 Training loss (single batch): 0.048931773751974106
##################################
## EPOCH 4637/5000
##################################
	 Training loss (single batch): 0.009893856942653656
##################################
## EPOCH 4638/5000
##################################
	 Training loss (single batch): 0.0034129819832742214
##################################
## EPOCH 4639/5000
##################################
	 Training loss (single batch): 0.01231999509036541
##################################
## EPOCH 4640/5000
##################################
	 Training loss (single batch): 0.009655078873038292
##################################
## EPOCH 4641/5000
##################################
	 Training loss (single batch): 0.04593511298298836
##################################
## EPOCH 4642/5000
##################################
	 Training loss (single batch): 0.016793591901659966
##################################
## EPOCH 4643/5000
##################################
	 Train

	 Training loss (single batch): 0.3907543420791626
##################################
## EPOCH 4696/5000
##################################
	 Training loss (single batch): 0.17998981475830078
##################################
## EPOCH 4697/5000
##################################
	 Training loss (single batch): 0.32947948575019836
##################################
## EPOCH 4698/5000
##################################
	 Training loss (single batch): 0.28184714913368225
##################################
## EPOCH 4699/5000
##################################
	 Training loss (single batch): 0.2059214860200882
##################################
## EPOCH 4700/5000
##################################
	 Training loss (single batch): 0.4755786061286926
##################################
## EPOCH 4701/5000
##################################
	 Training loss (single batch): 0.819527268409729
##################################
## EPOCH 4702/5000
##################################
	 Training loss (s

	 Training loss (single batch): 0.0747259333729744
##################################
## EPOCH 4755/5000
##################################
	 Training loss (single batch): 0.058172471821308136
##################################
## EPOCH 4756/5000
##################################
	 Training loss (single batch): 0.17617182433605194
##################################
## EPOCH 4757/5000
##################################
	 Training loss (single batch): 0.009794901125133038
##################################
## EPOCH 4758/5000
##################################
	 Training loss (single batch): 0.1454438716173172
##################################
## EPOCH 4759/5000
##################################
	 Training loss (single batch): 0.026608774438500404
##################################
## EPOCH 4760/5000
##################################
	 Training loss (single batch): 0.2382759302854538
##################################
## EPOCH 4761/5000
##################################
	 Training lo

	 Training loss (single batch): 0.027367662638425827
##################################
## EPOCH 4813/5000
##################################
	 Training loss (single batch): 0.025531843304634094
##################################
## EPOCH 4814/5000
##################################
	 Training loss (single batch): 0.012962890788912773
##################################
## EPOCH 4815/5000
##################################
	 Training loss (single batch): 0.006417549215257168
##################################
## EPOCH 4816/5000
##################################
	 Training loss (single batch): 0.017244640737771988
##################################
## EPOCH 4817/5000
##################################
	 Training loss (single batch): 0.031896840780973434
##################################
## EPOCH 4818/5000
##################################
	 Training loss (single batch): 0.02541325055062771
##################################
## EPOCH 4819/5000
##################################
	 Train

	 Training loss (single batch): 0.006588594522327185
##################################
## EPOCH 4871/5000
##################################
	 Training loss (single batch): 0.012614096514880657
##################################
## EPOCH 4872/5000
##################################
	 Training loss (single batch): 0.00897677056491375
##################################
## EPOCH 4873/5000
##################################
	 Training loss (single batch): 0.010423489846289158
##################################
## EPOCH 4874/5000
##################################
	 Training loss (single batch): 0.016414310783147812
##################################
## EPOCH 4875/5000
##################################
	 Training loss (single batch): 0.02566910907626152
##################################
## EPOCH 4876/5000
##################################
	 Training loss (single batch): 0.013465548865497112
##################################
## EPOCH 4877/5000
##################################
	 Traini

	 Training loss (single batch): 0.01545037142932415
##################################
## EPOCH 4929/5000
##################################
	 Training loss (single batch): 0.006631161086261272
##################################
## EPOCH 4930/5000
##################################
	 Training loss (single batch): 0.00445286650210619
##################################
## EPOCH 4931/5000
##################################
	 Training loss (single batch): 0.010524642653763294
##################################
## EPOCH 4932/5000
##################################
	 Training loss (single batch): 0.010808163322508335
##################################
## EPOCH 4933/5000
##################################
	 Training loss (single batch): 0.009401804767549038
##################################
## EPOCH 4934/5000
##################################
	 Training loss (single batch): 0.023239875212311745
##################################
## EPOCH 4935/5000
##################################
	 Traini

	 Training loss (single batch): 0.015553683042526245
##################################
## EPOCH 4987/5000
##################################
	 Training loss (single batch): 0.02379785105586052
##################################
## EPOCH 4988/5000
##################################
	 Training loss (single batch): 0.01825031079351902
##################################
## EPOCH 4989/5000
##################################
	 Training loss (single batch): 0.004986423533409834
##################################
## EPOCH 4990/5000
##################################
	 Training loss (single batch): 0.49803391098976135
##################################
## EPOCH 4991/5000
##################################
	 Training loss (single batch): 0.016660800203680992
##################################
## EPOCH 4992/5000
##################################
	 Training loss (single batch): 0.012721158564090729
##################################
## EPOCH 4993/5000
##################################
	 Trainin

### Plotting losses

In [None]:
loss_list = np.array(loss_list)

plt.plot(loss_list)

In [8]:
dataloader = DataLoader(dataset, batch_size=10, shuffle=True, num_workers=1)
for b in dataloader:
    print(b.keys())
print(len(dataset.chap_list[1]))

dict_keys(['encoded_onehot'])
dict_keys(['encoded_onehot'])
30095


In [71]:
### Save all needed parameters
# Create output dir
out_dir = Path(training_args['out_dir'])
out_dir.mkdir(parents=True, exist_ok=True)
# Save network parameters
torch.save(net.state_dict(), out_dir / 'net_params.pth')

# Adding alphabet length
training_args["alphabet_len"] = len(dataset.alphabet)
# Save training parameters
with open(out_dir / 'training_args.json', 'w') as f:
    json.dump(training_args, f, indent=4)
# Save encoder dictionary
with open(out_dir / 'char_to_number.json', 'w') as f:
    json.dump(dataset.char_to_number, f, indent=4)
# Save decoder dictionary
with open(out_dir / 'number_to_char.json', 'w') as f:
    json.dump(dataset.number_to_char, f, indent=4)

$$ \text{loss}(x, class) = -\log\left(\frac{\exp(x[class])}{\sum_j \exp(x[j])}\right)
                   = -x[class] + \log\left(\sum_j \exp(x[j])\right) $$

In [7]:
##############################
##############################
## PARAMETERS
##############################
#parser = argparse.ArgumentParser(description='Generate sonnet starting from a given text')

#parser.add_argument('--sonnet_seed', type=str, default='the', help='Initial text of the sonnet')
#parser.add_argument('--model_dir',   type=str, default='pretrained_models/model_3', help='Network model directory')

##############################
##############################
##############################

### Parse input arguments
#args = parser.parse_args()

model_dir = Path("model")
sonnet_seed = "the beautiful shape of him was glacing out the window"

#%% Load training parameters
model_dir = Path("model_Wilde_2019-12-05_17:38/")
print ('Loading model from: %s' % model_dir)
training_args = json.load(open(model_dir / 'training_args.json'))

#%% Load encoder and decoder dictionaries
number_to_char = json.load(open(model_dir / 'number_to_char.json'))
char_to_number = json.load(open(model_dir / 'char_to_number.json'))

#%% Initialize network
net = Network(input_size=training_args['alphabet_len'], 
            hidden_units=training_args['hidden_units'], 
            layers_num=training_args['layers_num'])

#%% Load network trained parameters
net.load_state_dict(torch.load(model_dir / 'net_params.pth', map_location='cpu'))
net.eval() # Evaluation mode (e.g. disable dropout)

#%% Find initial state of the RNN
with torch.no_grad():
    # Encode seed
    seed_encoded = encode_text(char_to_number, sonnet_seed)
    # One hot matrix
    seed_onehot = create_one_hot_matrix(seed_encoded, training_args['alphabet_len'])
    # To tensor
    seed_onehot = torch.tensor(seed_onehot).float()
    # Add batch axis
    seed_onehot = seed_onehot.unsqueeze(0)
    # Forward pass
    net_out, net_state = net(seed_onehot)
    # Get the most probable last output index
    # ---------- sampling using softmax ----------
    next_char_encoded = net_out[:, -1, :].argmax().item()
    # Print the seed letters
    print(sonnet_seed, end='', flush=True)
    print(number_to_char[str(next_char_encoded)])

#%% Generate sonnet
new_line_count = 0
tot_char_count = 0
while True:
    with torch.no_grad(): # No need to track the gradients
        # The new network input is the one hot encoding of the last chosen letter
        net_input = create_one_hot_matrix([next_char_encoded], len(dataset.alphabet))
        net_input = torch.tensor(net_input).float()
        net_input = net_input.unsqueeze(0)
        # Forward pass
        net_out, net_state = net(net_input, net_state)
        # Get the most probable letter index
        
        # Using softmax instead of argmax
        distrib = np.array(nn.functional.softmax(net_out, dim=-1))
        next_char_encoded = np.random.choice(len(distrib.ravel()), size=1, p=distrib.ravel())[0]
        
        # Get the most probable letter index
        next_char_encoded = net_out.argmax().item()
        # Decode the letter
        next_char = number_to_char[str(next_char_encoded)]
        #next_char_encoded = net_out.argmax().item()
        
        # Decode the letter
        #next_char = number_to_char[str(next_char_encoded)]
        
        print(next_char, end='', flush=True)
        # Count total letters
        tot_char_count += 1
        # Count new lines
        if next_char == '\n':
            new_line_count += 1
        # Break if 14 lines or 2000 letters
        if new_line_count == 14 or tot_char_count > 2000:
            break

Loading model from: model_Wilde_2019-12-05_17:38
the beautiful shape of him was glacing out the windown
 to sim int oo. it at ccfciden she seene sild hane wane hode oaee wae cofee coersn sil lhvn, an whechyde oaee wase hane hane ooe cofcion on mim heosy at an fe fifthon f he sensy atim ffffiden n sim hene wan oove fcfcine on fofchone panddhanddhe laee hane han hane wase ooee wae cofee sold ofee wane ooe cofcion on mom heoey at at. he siden sold heeey at at. fhfsinn phe wedey, thit ot it at ccfciden she seene sild hane wane hon hane fane ooee hane ooe cofee cold ofee fane ooee hane oae wofe oaee woe cofee sild ofee wane ooe cofcion on mim heosy at an fe fifcinn f fimen on soree an st.ce fisde tire fane hane hane ooe cofee cold lfee fane ooee han hoae fane ooe cofee cole onee han sove fafee one shene fase heee wate oofe hane wane ooe cofee cold ofee fane ooee hane oae wofe oaee woe cofee sild ofee wane ooe cofcion on mim heosy at an fe fifcinn f fimen on soree an st.ce fisde tire fane ha

In [108]:
np.random.choice(len(distrib.ravel()), size=1, p=distrib.ravel())

array([12])

In [107]:
next_char_encoded = net_out.argmax()
next_char_encoded

tensor(13)