In [1]:
# Install libraries for data_loader
!pip install pandas
!pip install sklearn
!pip install torchvision
!pip install tqdm
!pip install torchmetrics



In [2]:
# Import DataLoader and corresponding libraries
import pandas
import torchvision.transforms as TT
from torch.utils.data import DataLoader, Dataset, sampler
from sklearn.model_selection import StratifiedKFold
from torchvision import utils
from PIL import Image

In [3]:
# Import libraries for tensors
import random
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [4]:
# For fbeta-score
from torchmetrics.functional import fbeta_score

In [5]:
# For model construction
from collections import OrderedDict

In [6]:
# Import tqdm for progress bar construction
import tqdm

In [7]:
# from google.colab import drive
# drive.mount('/content/gdrive')

# Datatypes and Devices (from Assignment 2)
dtype = torch.float
ltype = torch.long

if torch.cuda.is_available():
    device = torch.device('cuda:0')
else:
    device = torch.device('cpu')

print('using device:', device)

using device: cuda:0


In [8]:
# Hyper-parameters for K-Fold Cross Validation
N = 8
seed = 42

torch.manual_seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False
random.seed(seed)

# Directories for Data
FF1010_Path = './data/'
AudioImage_Path = './image/'

In [9]:
# Call StratifiedKFold object
skf = StratifiedKFold(
    n_splits=N, shuffle=True, random_state=seed
)

In [10]:
# Modify dataframe for K-Fold Cross Validation (birdclef2021)
birdclef_csv = pandas.read_csv(AudioImage_Path + 'metadata.csv')
birdclef_csv.loc[birdclef_csv['label_id'] >= 0,'filepath'] = \
    AudioImage_Path + birdclef_csv.query('label_id >= 0')['primary_label'] + '/' + \
    birdclef_csv.query('label_id >= 0')['filename'] + '.npy'

birdclef_csv = birdclef_csv.dropna()
birdclef_csv = birdclef_csv.reset_index(drop=True)

# Add 'fold' attribute for dataset classification
birdclef_dataframe = birdclef_csv.copy()
for n, (_, nth_groups) in enumerate(
    skf.split(birdclef_dataframe, birdclef_dataframe['label_id'])):
    birdclef_dataframe.loc[nth_groups, 'fold'] = int(n)

In [11]:
# Class for Birdclef dataset
class birdclef(Dataset):
    def __init__(self, dataframe, process='train', labels='label_id'):
        self.dataframe = dataframe
        self.filepaths = dataframe['filepath'].values
        self.labels = dataframe[labels].values
        self.process = process
        self.batch_threshold = 64
        
        # Transforms for each train and validation
        self.train_transform = TT.Compose([
            TT.Resize([128, 281]),
            TT.RandomHorizontalFlip(p=0.5),
            TT.RandomVerticalFlip(p=0.5),
            TT.ToTensor(),
            TT.Normalize(
                mean=[0.485, 0.456, 0.406],
                std=[0.229, 0.224, 0.225],
            ),
        ])
        self.val_transform = TT.Compose([
            TT.Resize([128, 281]),
            TT.ToTensor(),
            TT.Normalize(
                mean=[0.485, 0.456, 0.406],
                std=[0.229, 0.224, 0.225],
            ),
        ])
    
    def __getitem__(self, idx):
        source = np.load(self.filepaths[idx])
        
        # Rearrange numpy arrays
        source = source.transpose(1, 2, 0)
        
        # Add RGB dimension
        source = np.stack((np.squeeze(source), ) * 3, -1)
        if len(source.shape) == 3:
            source = np.expand_dims(source, axis=2)
        source = source.transpose(2, 0, 1, 3)
        N, H, W, C = source.shape
        label_rp = N
        
        # Apply transform
        if self.process == 'train':
            source = torch.stack([self.train_transform(Image.fromarray(x)) for x in source])
        elif self.process == 'valid':
            source = torch.stack([self.val_transform(Image.fromarray(x)) for x in source])
        
        # Avoid CUDA OOM
        if N > self.batch_threshold:
            unit = (N - self.batch_threshold) // 2
            label_rp = self.batch_threshold
            if N % 2 == 0:
                source = source[unit : -unit]
            else:
                source = source[unit : -(unit + 1)]
        
        return source, torch.tensor(self.labels[idx], dtype=ltype).repeat(label_rp)
    
    def __len__(self):
        return len(self.dataframe)

This function evaluates model.

In [12]:
def evaluate_model(loader, model, beta=1.0):
    print("Checking accuracy score on validation set.")
    # TODO: extend this so that we can print that we evaluate test set.
    num_correct = 0
    num_samples = 0
    log_sum = 0
    fbeta_sum = 0
    model.eval()
    with torch.no_grad():
        for x, y in loader:
            x = x.to(device=device, dtype=torch.float)
            y = y.to(device=device, dtype=torch.long)
            y = torch.squeeze(y, 0)
            scores = model(torch.squeeze(x, 0))
            # scores means classfication class for each class. It should be the tensor with size of (Input size, Number of classes)

            # Checks naive accuracy.
            _, preds = scores.max(1)
            num_correct += (preds == y).sum()
            num_samples += preds.size(0)

            # Checks Log Loss.
            log_loss = F.cross_entropy(scores, y)
            log_sum += log_loss.sum() * preds.size(0)

            # Checks Fbeta-score.
            fbeta = fbeta_score(preds, y, beta=beta)
            fbeta_sum += fbeta * preds.size(0)
            
            # Erase memory caches
            del x, y, scores, log_loss
        
        acc = float(num_correct) / num_samples
        log_score = log_sum / num_samples
        f_score = fbeta_sum / num_samples
        print('\nAccuracy: %d / %d correct (%.2f)' % (num_correct, num_samples, 100 * acc))
        print('Log Loss score:\t%.2f' % (log_score))
        print('Fbeta-score (beta=%d): \t%.2f' % (beta , f_score))
    return acc, log_score, f_score

Let's train with model 2.

In [13]:
import os

# Print period for accuracy.
print_period = 1000

# Hyper-parameters for training 
birdclef_batch = 1
birdclef_epoch = 50

# Learning Rate.
learning_rate_2 = 0.0005
eta_min = 5e-6
momentum = 0.5

# L2 Regularization Hyperparamter
weight_decay_2 = 0.001

# Beta constant for Fbeta-score.
# If you want to give more weight to precision, use value smaller than 1.0.
# If you want to give more weight to recall, use value larger than 1.0.
beta = 1.0

# Prototype of model 2.
# ResNet50 outputs (Batchsize, 1000) tensor as output, so we reduce them to 397.
class Model2(nn.Module):
    def __init__(self, num_classes=397):
        super().__init__()
        self.resnet50 = torch.hub.load('pytorch/vision:v0.10.0', 'resnet50', pretrained=True).to(device)
        self.relu = nn.ReLU().to(device)
        self.linear = nn.Linear(1000, num_classes, bias=True).to(device)
    
    def forward (self, x):
        x = self.resnet50(x)
        x = self.relu(x)
        x = self.linear(x)
        return x

cur_model = Model2()
print(cur_model)

def checkpoint(model, optimizer, scheduler, train_losses, val_losses, log_scores, fbeta_scores, epoch):
    torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'scheduler_state_dict': scheduler.state_dict(),
            'train_losses': train_losses,
            'val_losses': val_losses,
            'log_scores': log_scores,
            'fbeta_scores': fbeta_scores,
            }, './bird_specificator.pt')

def train_model(model, train_loader, val_loader, optimizer, scheduler, beta=beta, epoch=birdclef_epoch, ckpt_enable=True):
    val_losses = []
    train_losses = []
    log_scores = []
    fbeta_scores = []
    
    loss = 0
    log_score = 0
    saved_epoch = -1
    
    # Load checkpoint
    if ckpt_enable and os.path.exists('./bird_specificator.pt'):
        ckpt = torch.load('./bird_specificator.pt')
        model.load_state_dict(ckpt['model_state_dict'])
        optimizer.load_state_dict(ckpt['optimizer_state_dict'])
        scheduler.load_state_dict(ckpt['scheduler_state_dict'])
        train_losses = ckpt['train_losses']
        val_losses = ckpt['val_losses']
        log_scores = ckpt['log_scores']
        fbeta_scores = ckpt['fbeta_scores']
        saved_epoch = ckpt['epoch']
    
    for e in range(epoch):
        if e <= saved_epoch:
            continue
            
        epoch_losses = []
        print(f"Training model 2, epoch {e+1}")
        for index, (source, label) in enumerate(tqdm.tqdm(train_loader)):          
            x = source.to(device=device, dtype=torch.float)  # move to device, e.g. GPU
            y = label.to(device=device, dtype=torch.long)
            y = torch.squeeze(y, 0)

            scores = model(torch.squeeze(x, 0))
            loss = F.cross_entropy(scores, y) # Log loss for our project.

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            epoch_losses.append(loss.item())

            # every print_period, print loss.
            if index % print_period == 0:
                print('Iteration %d, loss = %.4f' % (index, loss.item()))
                
            # Erase memory caches
            del source, label, x, y, scores, loss
            
        # Cosine LR Annealing Scheduler
        scheduler.step()
        
        # Append the score to lists
        acc, log_score, fbeta_score = evaluate_model(val_loader, model, beta=beta)
        val_losses.append(acc)
        train_losses.append(torch.tensor(sum(epoch_losses) / len(epoch_losses), dtype=dtype))
        log_scores.append(log_score)
        fbeta_scores.append(fbeta_score)
        
        # every epoch, save the model
        checkpoint(model, optimizer, scheduler, train_losses, val_losses, log_scores, fbeta_scores, e)

    return model, val_losses, train_losses, log_scores, fbeta_scores

Using cache found in C:\Users\youngrae/.cache\torch\hub\pytorch_vision_v0.10.0


Model2(
  (resnet50): ResNet(
    (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
    (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (relu): ReLU(inplace=True)
    (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
    (layer1): Sequential(
      (0): Bottleneck(
        (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
        (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
        (relu): ReLU(inplace=True)
        (downsample): Sequential(
          

In [15]:
# Train loop for bird specificator
def bird_train(model, train_dataframe, val_dataframe, test_dataframe):  
    train_data = birdclef(train_dataframe, process='train', labels='label_id')
    val_data = birdclef(val_dataframe, process='valid', labels='label_id')
    test_data = birdclef(test_dataframe, process='valid', labels='label_id')
    
    # Construct data loader for train and validation
    train_loader = DataLoader(train_data, batch_size=birdclef_batch,
                             sampler=sampler.SubsetRandomSampler(range(len(train_dataframe))), 
                             drop_last=True)
    val_loader = DataLoader(val_data, batch_size=birdclef_batch,
                             sampler=sampler.SubsetRandomSampler(range(len(val_dataframe))),
                             drop_last=False)
    test_loader = DataLoader(test_data, batch_size=birdclef_batch,
                              sampler=sampler.SubsetRandomSampler(range(len(test_dataframe))),
                              drop_last=False)
    
    optimizer = optim.SGD(model.parameters(), lr=learning_rate_2, weight_decay=weight_decay_2, momentum=momentum)
    scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=birdclef_epoch, eta_min=eta_min)
    trained_model, val_losses, train_losses, log_scores, fbeta_scores = train_model(
        model, train_loader, val_loader, optimizer, scheduler, beta=beta)
    test_acc, test_log_score, test_fbeta_score = evaluate_model(test_loader, trained_model, beta=beta)
    
    return val_losses, train_losses, log_scores, fbeta_scores, [test_acc, test_log_score, test_fbeta_score]

In [16]:
# Train, Validate and Test for nocall detector
def bird(model, dataframe, val_index, test_index):
    
    # Check that validation fold is not same as test fold
    assert val_index != test_index, \
        'Validation and test should be done on different fold.'
    print('Test set : %d, Validation set : %d' % (test_index, val_index))
    
    train_dataframe = dataframe.query(
        'fold != ' + str(val_index) + ' and fold != ' + str(test_index) 
    ).reset_index(drop=True)
    val_dataframe = dataframe.query(
        'fold == ' + str(val_index) 
    ).reset_index(drop=False)
    test_dataframe = dataframe.query(
        'fold == ' + str(test_index) 
    ).reset_index(drop=False)
    
    val_losses, train_losses, log_scores, fbeta_scores, test_scores = bird_train(
        model, train_dataframe, val_dataframe, test_dataframe)

    return val_losses, train_losses, log_scores, fbeta_scores, test_scores

In [17]:
val_losses, train_losses, log_scores, fbeta_scores, test_scores = \
    bird(cur_model, birdclef_dataframe, 1, 0)
del cur_model

# for i in range(2, 10):
#     cur_model = Model2()
#     cv_losses, ctr_losses, cl_scores, cf_scores, cte_scores = nocall(cur_model, birdclef_dataframe, i, 0)
#     val_losses = torch.mean(torch.stack((torch.tensor(val_losses), torch.tensor(cv_losses))), dim=0)
#     train_losses = torch.mean(torch.stack((torch.tensor(train_losses), torch.tensor(ctr_losses))), dim=0)
#     log_scores = torch.mean(torch.stack((torch.tensor(log_scores), torch.tensor(cl_scores))), dim=0)
#     fbeta_scores = torch.mean(torch.stack((torch.tensor(fbeta_scores), torch.tensor(cf_scores))), dim=0)
#     for j in range(len(test_scores)):
#         test_scores[j] = torch.mean(torch.stack((torch.tensor(test_scores[j]), torch.tensor(cte_scores[j]))), dim=0)

Test set : 0, Validation set : 1
Training model 2, epoch 1


  0%|                                                                             | 3/47154 [00:03<10:31:09,  1.25it/s]

Iteration 0, loss = 5.4682


  2%|█▌                                                                         | 1002/47154 [01:24<1:08:26, 11.24it/s]

Iteration 1000, loss = 5.3349


  4%|███▏                                                                       | 2000/47154 [02:47<1:10:29, 10.68it/s]

Iteration 2000, loss = 5.8360


  6%|████▊                                                                      | 3001/47154 [04:14<1:01:34, 11.95it/s]

Iteration 3000, loss = 5.8767


  8%|██████▌                                                                      | 4002/47154 [05:38<50:04, 14.36it/s]

Iteration 4000, loss = 6.5475


 11%|███████▉                                                                   | 5001/47154 [06:59<1:08:43, 10.22it/s]

Iteration 5000, loss = 6.7914


 13%|█████████▌                                                                 | 6001/47154 [08:21<1:20:16,  8.54it/s]

Iteration 6000, loss = 4.9994


 15%|███████████▍                                                                 | 7002/47154 [09:44<37:18, 17.94it/s]

Iteration 7000, loss = 6.4392


 17%|█████████████                                                                | 8003/47154 [11:07<41:55, 15.56it/s]

Iteration 8000, loss = 5.8350


 19%|██████████████▋                                                              | 9002/47154 [12:27<38:20, 16.58it/s]

Iteration 9000, loss = 5.2649


 21%|████████████████                                                            | 10003/47154 [13:52<42:31, 14.56it/s]

Iteration 10000, loss = 5.6617


 23%|█████████████████▋                                                          | 11004/47154 [15:16<39:08, 15.40it/s]

Iteration 11000, loss = 5.9103


 25%|███████████████████▎                                                        | 12003/47154 [16:38<54:33, 10.74it/s]

Iteration 12000, loss = 5.9247


 28%|████████████████████▉                                                       | 13003/47154 [17:58<39:42, 14.33it/s]

Iteration 13000, loss = 5.7589


 30%|██████████████████████▌                                                     | 14001/47154 [19:21<55:31,  9.95it/s]

Iteration 14000, loss = 5.2836


 32%|████████████████████████▏                                                   | 15003/47154 [20:47<41:20, 12.96it/s]

Iteration 15000, loss = 5.7875


 34%|█████████████████████████▊                                                  | 16002/47154 [22:10<51:10, 10.14it/s]

Iteration 16000, loss = 6.3375


 36%|███████████████████████████▍                                                | 17003/47154 [23:33<44:33, 11.28it/s]

Iteration 17000, loss = 5.1016


 38%|█████████████████████████████                                               | 18004/47154 [24:57<40:50, 11.90it/s]

Iteration 18000, loss = 5.2303


 40%|██████████████████████████████▋                                             | 19004/47154 [26:20<28:46, 16.30it/s]

Iteration 19000, loss = 5.8848


 42%|████████████████████████████████▏                                           | 20003/47154 [27:40<28:16, 16.01it/s]

Iteration 20000, loss = 6.7312


 45%|█████████████████████████████████▊                                          | 21002/47154 [28:57<34:59, 12.46it/s]

Iteration 21000, loss = 6.6604


 47%|███████████████████████████████████▍                                        | 22001/47154 [30:13<36:41, 11.43it/s]

Iteration 22000, loss = 5.9628


 49%|█████████████████████████████████████                                       | 23002/47154 [31:34<25:26, 15.82it/s]

Iteration 23000, loss = 6.1564


 51%|██████████████████████████████████████▋                                     | 24002/47154 [32:54<34:52, 11.06it/s]

Iteration 24000, loss = 4.7890


 53%|████████████████████████████████████████▎                                   | 25003/47154 [34:13<25:28, 14.49it/s]

Iteration 25000, loss = 6.3161


 55%|█████████████████████████████████████████▉                                  | 26001/47154 [35:38<32:17, 10.92it/s]

Iteration 26000, loss = 6.1626


 57%|███████████████████████████████████████████▌                                | 27003/47154 [36:57<24:17, 13.82it/s]

Iteration 27000, loss = 6.2160


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [38:13<26:32, 12.03it/s]

Iteration 28000, loss = 6.2352


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [39:36<25:31, 11.85it/s]

Iteration 29000, loss = 5.8261


 64%|████████████████████████████████████████████████▎                           | 30000/47154 [40:57<21:46, 13.13it/s]

Iteration 30000, loss = 4.0433


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [42:14<26:24, 10.19it/s]

Iteration 31000, loss = 6.2187


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [43:34<15:15, 16.55it/s]

Iteration 32000, loss = 5.0937


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [44:54<29:26,  8.01it/s]

Iteration 33000, loss = 4.4210


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [46:15<14:16, 15.36it/s]

Iteration 34000, loss = 5.9443


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [47:37<14:25, 14.05it/s]

Iteration 35000, loss = 6.2257


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [48:59<12:14, 15.18it/s]

Iteration 36000, loss = 5.2022


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [50:17<12:16, 13.78it/s]

Iteration 37000, loss = 5.9894


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [51:37<09:15, 16.48it/s]

Iteration 38000, loss = 6.9584


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [52:57<10:17, 13.21it/s]

Iteration 39000, loss = 5.8652


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [54:18<06:14, 19.11it/s]

Iteration 40000, loss = 6.1603


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [55:39<06:07, 16.75it/s]

Iteration 41000, loss = 5.9426


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [56:57<05:02, 17.01it/s]

Iteration 42000, loss = 5.6938


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [58:18<07:35,  9.12it/s]

Iteration 43000, loss = 5.5752


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [59:37<03:37, 14.48it/s]

Iteration 44000, loss = 6.2394


 95%|██████████████████████████████████████████████████████████████████████▋   | 45004/47154 [1:00:56<02:28, 14.45it/s]

Iteration 45000, loss = 4.5315


 98%|████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [1:02:16<01:21, 14.14it/s]

Iteration 46000, loss = 5.3858


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:03:33<00:09, 15.40it/s]

Iteration 47000, loss = 5.3776


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:03:45<00:00, 12.33it/s]


Checking accuracy score on validation set.

Accuracy: 1134 / 83918 correct (1.35)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 2


  0%|                                                                              | 4/47154 [00:00<1:02:12, 12.63it/s]

Iteration 0, loss = 6.5753


  2%|█▌                                                                         | 1002/47154 [01:13<1:16:02, 10.12it/s]

Iteration 1000, loss = 6.5145


  4%|███▎                                                                         | 2003/47154 [02:28<53:05, 14.17it/s]

Iteration 2000, loss = 4.8465


  6%|████▉                                                                        | 3003/47154 [03:44<59:09, 12.44it/s]

Iteration 3000, loss = 5.1416


  8%|██████▌                                                                      | 4001/47154 [04:59<59:13, 12.14it/s]

Iteration 4000, loss = 5.5783


 11%|████████▏                                                                    | 5005/47154 [06:18<40:30, 17.34it/s]

Iteration 5000, loss = 5.9355


 13%|█████████▊                                                                   | 6003/47154 [07:36<46:05, 14.88it/s]

Iteration 6000, loss = 6.6948


 15%|███████████▍                                                                 | 7004/47154 [08:52<38:58, 17.17it/s]

Iteration 7000, loss = 5.9508


 17%|████████████▋                                                              | 8001/47154 [10:08<1:01:32, 10.60it/s]

Iteration 8000, loss = 6.6421


 19%|██████████████▋                                                              | 9002/47154 [11:24<43:34, 14.59it/s]

Iteration 9000, loss = 6.0700


 21%|███████████████▋                                                          | 10002/47154 [12:41<1:03:21,  9.77it/s]

Iteration 10000, loss = 6.1651


 23%|█████████████████▎                                                        | 11002/47154 [13:58<1:00:11, 10.01it/s]

Iteration 11000, loss = 6.2713


 25%|███████████████████▎                                                        | 12002/47154 [15:13<43:51, 13.36it/s]

Iteration 12000, loss = 4.8948


 28%|████████████████████▍                                                     | 13002/47154 [16:32<1:03:06,  9.02it/s]

Iteration 13000, loss = 6.0575


 30%|██████████████████████▌                                                     | 14002/47154 [17:49<35:17, 15.66it/s]

Iteration 14000, loss = 6.1455


 32%|████████████████████████▏                                                   | 15001/47154 [19:06<43:19, 12.37it/s]

Iteration 15000, loss = 6.4972


 34%|█████████████████████████▊                                                  | 16002/47154 [20:21<38:09, 13.60it/s]

Iteration 16000, loss = 6.1650


 36%|███████████████████████████▍                                                | 17003/47154 [21:41<35:20, 14.22it/s]

Iteration 17000, loss = 6.2508


 38%|█████████████████████████████                                               | 18002/47154 [22:57<46:28, 10.46it/s]

Iteration 18000, loss = 5.5755


 40%|██████████████████████████████▋                                             | 19003/47154 [24:14<29:00, 16.17it/s]

Iteration 19000, loss = 6.0618


 42%|████████████████████████████████▏                                           | 20003/47154 [25:29<31:53, 14.19it/s]

Iteration 20000, loss = 6.6108


 45%|█████████████████████████████████▊                                          | 21001/47154 [26:44<38:03, 11.45it/s]

Iteration 21000, loss = 6.1951


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:04<38:31, 10.88it/s]

Iteration 22000, loss = 6.1678


 49%|█████████████████████████████████████                                       | 23004/47154 [29:21<26:50, 15.00it/s]

Iteration 23000, loss = 6.1994


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:37<28:21, 13.60it/s]

Iteration 24000, loss = 5.5670


 53%|████████████████████████████████████████▎                                   | 25003/47154 [31:56<23:51, 15.48it/s]

Iteration 25000, loss = 4.9797


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:10<25:03, 14.07it/s]

Iteration 26000, loss = 5.7150


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:28<22:06, 15.19it/s]

Iteration 27000, loss = 5.4248


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:44<21:00, 15.20it/s]

Iteration 28000, loss = 5.4784


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [37:02<21:56, 13.79it/s]

Iteration 29000, loss = 5.7842


 64%|████████████████████████████████████████████████▎                           | 30001/47154 [38:19<21:58, 13.01it/s]

Iteration 30000, loss = 5.6339


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:34<21:25, 12.56it/s]

Iteration 31000, loss = 6.1437


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:47<19:25, 13.00it/s]

Iteration 32000, loss = 5.4803


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:08<28:39,  8.23it/s]

Iteration 33000, loss = 5.2767


 72%|██████████████████████████████████████████████████████▊                     | 34005/47154 [43:27<11:33, 18.96it/s]

Iteration 34000, loss = 6.4577


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:45<13:11, 15.34it/s]

Iteration 35000, loss = 6.0718


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:02<13:11, 14.09it/s]

Iteration 36000, loss = 5.9276


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:16<15:25, 10.97it/s]

Iteration 37000, loss = 6.3501


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:35<10:44, 14.21it/s]

Iteration 38000, loss = 5.4772


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:49<07:13, 18.80it/s]

Iteration 39000, loss = 5.5893


 85%|████████████████████████████████████████████████████████████████▍           | 40001/47154 [51:07<11:30, 10.36it/s]

Iteration 40000, loss = 4.9150


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:26<06:23, 16.05it/s]

Iteration 41000, loss = 5.5417


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:40<10:39,  8.05it/s]

Iteration 42000, loss = 5.9999


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [54:55<04:16, 16.18it/s]

Iteration 43000, loss = 6.3300


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:12<03:29, 15.01it/s]

Iteration 44000, loss = 6.3838


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:28<02:07, 16.91it/s]

Iteration 45000, loss = 6.3910


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:44<01:46, 10.84it/s]

Iteration 46000, loss = 5.7503


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:00<00:10, 14.93it/s]

Iteration 47000, loss = 5.7918


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:11<00:00, 13.06it/s]


Checking accuracy score on validation set.

Accuracy: 728 / 83918 correct (0.87)
Log Loss score:	5.80
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 3


  0%|                                                                              | 1/47154 [00:00<1:35:05,  8.26it/s]

Iteration 0, loss = 5.0883


  2%|█▋                                                                           | 1003/47154 [01:17<53:22, 14.41it/s]

Iteration 1000, loss = 4.4664


  4%|███▎                                                                         | 2002/47154 [02:35<44:44, 16.82it/s]

Iteration 2000, loss = 6.4602


  6%|████▉                                                                        | 3004/47154 [03:55<49:54, 14.75it/s]

Iteration 3000, loss = 5.9378


  8%|██████▌                                                                      | 4005/47154 [05:16<46:24, 15.50it/s]

Iteration 4000, loss = 6.4790


 11%|███████▉                                                                   | 5000/47154 [06:35<1:05:23, 10.74it/s]

Iteration 5000, loss = 5.7198


 13%|█████████▌                                                                 | 6002/47154 [07:47<1:00:25, 11.35it/s]

Iteration 6000, loss = 5.6370


 15%|███████████▍                                                                 | 7004/47154 [09:08<47:36, 14.06it/s]

Iteration 7000, loss = 5.2754


 17%|█████████████                                                                | 8003/47154 [10:26<35:19, 18.47it/s]

Iteration 8000, loss = 6.6394


 19%|██████████████▎                                                            | 9000/47154 [11:41<1:15:16,  8.45it/s]

Iteration 9000, loss = 6.6171


 21%|███████████████▋                                                          | 10002/47154 [12:57<1:02:23,  9.93it/s]

Iteration 10000, loss = 5.9633


 23%|█████████████████▋                                                          | 11002/47154 [14:19<43:43, 13.78it/s]

Iteration 11000, loss = 5.9942


 25%|███████████████████▎                                                        | 12002/47154 [15:40<47:36, 12.31it/s]

Iteration 12000, loss = 5.2950


 28%|████████████████████▉                                                       | 13002/47154 [16:58<49:02, 11.61it/s]

Iteration 13000, loss = 5.7450


 30%|██████████████████████▌                                                     | 14003/47154 [18:14<40:32, 13.63it/s]

Iteration 14000, loss = 4.6866


 32%|████████████████████████▏                                                   | 15003/47154 [19:33<38:31, 13.91it/s]

Iteration 15000, loss = 6.4528


 34%|█████████████████████████▊                                                  | 16004/47154 [20:57<34:45, 14.94it/s]

Iteration 16000, loss = 5.6694


 36%|███████████████████████████▍                                                | 17004/47154 [22:13<28:59, 17.33it/s]

Iteration 17000, loss = 6.1834


 38%|█████████████████████████████                                               | 18004/47154 [23:31<36:56, 13.15it/s]

Iteration 18000, loss = 5.4893


 40%|██████████████████████████████▋                                             | 19003/47154 [24:47<35:34, 13.19it/s]

Iteration 19000, loss = 5.1253


 42%|████████████████████████████████▏                                           | 20003/47154 [26:01<34:37, 13.07it/s]

Iteration 20000, loss = 6.5303


 45%|█████████████████████████████████▊                                          | 21002/47154 [27:19<30:19, 14.37it/s]

Iteration 21000, loss = 5.5668


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:40<32:33, 12.87it/s]

Iteration 22000, loss = 5.3796


 49%|█████████████████████████████████████                                       | 23003/47154 [29:56<24:38, 16.33it/s]

Iteration 23000, loss = 5.3251


 51%|██████████████████████████████████████▋                                     | 24000/47154 [31:12<26:13, 14.72it/s]

Iteration 24000, loss = 5.7657


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:32<24:22, 15.15it/s]

Iteration 25000, loss = 5.5823


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:47<21:21, 16.51it/s]

Iteration 26000, loss = 5.2364


 57%|███████████████████████████████████████████▌                                | 27004/47154 [35:04<20:19, 16.52it/s]

Iteration 27000, loss = 6.6403


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [36:27<28:29, 11.20it/s]

Iteration 28000, loss = 5.9915


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:43<22:12, 13.63it/s]

Iteration 29000, loss = 6.1575


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [39:03<22:30, 12.70it/s]

Iteration 30000, loss = 5.2159


 66%|█████████████████████████████████████████████████▉                          | 31001/47154 [40:21<19:15, 13.98it/s]

Iteration 31000, loss = 5.8540


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:41<16:05, 15.69it/s]

Iteration 32000, loss = 5.6153


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:58<18:00, 13.10it/s]

Iteration 33000, loss = 6.2828


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [44:14<13:09, 16.66it/s]

Iteration 34000, loss = 5.5542


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:29<16:55, 11.96it/s]

Iteration 35000, loss = 4.6619


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:47<10:54, 17.04it/s]

Iteration 36000, loss = 6.1037


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [48:07<10:12, 16.57it/s]

Iteration 37000, loss = 5.5513


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [49:24<10:07, 15.06it/s]

Iteration 38000, loss = 5.9602


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:41<07:50, 17.31it/s]

Iteration 39000, loss = 6.0254


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [52:00<10:28, 11.37it/s]

Iteration 40000, loss = 5.4063


 87%|██████████████████████████████████████████████████████████████████          | 41001/47154 [53:20<09:26, 10.86it/s]

Iteration 41000, loss = 5.9206


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:37<07:26, 11.53it/s]

Iteration 42000, loss = 5.0872


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:55<06:00, 11.50it/s]

Iteration 43000, loss = 6.3665


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [57:17<03:47, 13.87it/s]

Iteration 44000, loss = 5.9335


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [58:35<02:41, 13.28it/s]

Iteration 45000, loss = 5.0348


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:53<01:11, 16.13it/s]

Iteration 46000, loss = 6.1121


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:01:14<00:11, 13.08it/s]

Iteration 47000, loss = 6.4589


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:26<00:00, 12.79it/s]


Checking accuracy score on validation set.

Accuracy: 651 / 83918 correct (0.78)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 4


  0%|                                                                                | 2/47154 [00:00<44:24, 17.70it/s]

Iteration 0, loss = 5.4699


  2%|█▌                                                                         | 1002/47154 [01:17<1:14:40, 10.30it/s]

Iteration 1000, loss = 5.5584


  4%|███▏                                                                       | 2003/47154 [02:34<1:05:24, 11.51it/s]

Iteration 2000, loss = 4.6902


  6%|████▉                                                                        | 3002/47154 [03:50<57:38, 12.77it/s]

Iteration 3000, loss = 6.5480


  8%|██████▌                                                                      | 4002/47154 [05:06<52:58, 13.58it/s]

Iteration 4000, loss = 5.6356


 11%|████████▏                                                                    | 5004/47154 [06:22<40:01, 17.55it/s]

Iteration 5000, loss = 5.0191


 13%|█████████▊                                                                   | 6002/47154 [07:39<59:10, 11.59it/s]

Iteration 6000, loss = 6.7612


 15%|███████████▍                                                                 | 7003/47154 [08:56<50:08, 13.35it/s]

Iteration 7000, loss = 6.2301


 17%|█████████████                                                                | 8003/47154 [10:13<51:42, 12.62it/s]

Iteration 8000, loss = 4.9495


 19%|██████████████▎                                                            | 9003/47154 [11:28<1:08:34,  9.27it/s]

Iteration 9000, loss = 5.8627


 21%|████████████████                                                            | 10002/47154 [12:45<49:05, 12.61it/s]

Iteration 10000, loss = 6.1116


 23%|█████████████████▋                                                          | 11004/47154 [13:59<33:57, 17.74it/s]

Iteration 11000, loss = 6.6635


 25%|███████████████████▎                                                        | 12003/47154 [15:20<53:47, 10.89it/s]

Iteration 12000, loss = 6.2848


 28%|████████████████████▉                                                       | 13004/47154 [16:38<38:29, 14.79it/s]

Iteration 13000, loss = 5.5205


 30%|██████████████████████▌                                                     | 14004/47154 [17:52<32:10, 17.17it/s]

Iteration 14000, loss = 5.6365


 32%|████████████████████████▏                                                   | 15002/47154 [19:09<31:42, 16.90it/s]

Iteration 15000, loss = 5.8254


 34%|█████████████████████████▊                                                  | 16004/47154 [20:27<34:54, 14.87it/s]

Iteration 16000, loss = 5.5586


 36%|███████████████████████████▍                                                | 17004/47154 [21:46<38:55, 12.91it/s]

Iteration 17000, loss = 6.8174


 38%|█████████████████████████████                                               | 18003/47154 [23:02<40:42, 11.93it/s]

Iteration 18000, loss = 6.0931


 40%|██████████████████████████████▋                                             | 19004/47154 [24:17<26:59, 17.38it/s]

Iteration 19000, loss = 6.1450


 42%|████████████████████████████████▏                                           | 20004/47154 [25:34<28:22, 15.95it/s]

Iteration 20000, loss = 5.1039


 45%|█████████████████████████████████▊                                          | 21004/47154 [26:53<40:26, 10.78it/s]

Iteration 21000, loss = 5.0791


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:12<27:11, 15.42it/s]

Iteration 22000, loss = 6.4659


 49%|█████████████████████████████████████                                       | 23003/47154 [29:30<24:35, 16.36it/s]

Iteration 23000, loss = 6.1828


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:46<24:08, 15.98it/s]

Iteration 24000, loss = 5.0547


 53%|████████████████████████████████████████▎                                   | 25004/47154 [32:02<25:44, 14.34it/s]

Iteration 25000, loss = 6.0011


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:19<29:12, 12.07it/s]

Iteration 26000, loss = 6.1644


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:36<23:29, 14.30it/s]

Iteration 27000, loss = 5.2681


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:52<18:15, 17.49it/s]

Iteration 28000, loss = 6.1600


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:10<20:29, 14.76it/s]

Iteration 29000, loss = 4.7631


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:23<19:33, 14.62it/s]

Iteration 30000, loss = 5.8405


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:38<21:07, 12.74it/s]

Iteration 31000, loss = 5.4596


 68%|███████████████████████████████████████████████████▌                        | 32005/47154 [40:56<22:56, 11.00it/s]

Iteration 32000, loss = 5.6516


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:15<14:34, 16.18it/s]

Iteration 33000, loss = 6.1152


 72%|██████████████████████████████████████████████████████▊                     | 34001/47154 [43:33<21:19, 10.28it/s]

Iteration 34000, loss = 6.7663


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:52<11:56, 16.97it/s]

Iteration 35000, loss = 6.0012


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [46:10<13:39, 13.61it/s]

Iteration 36000, loss = 5.9817


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:27<13:10, 12.84it/s]

Iteration 37000, loss = 6.1172


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:39<11:02, 13.81it/s]

Iteration 38000, loss = 5.3675


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:55<10:47, 12.59it/s]

Iteration 39000, loss = 6.2082


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:13<09:35, 12.42it/s]

Iteration 40000, loss = 6.5065


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:29<07:19, 13.98it/s]

Iteration 41000, loss = 5.4457


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:43<06:20, 13.52it/s]

Iteration 42000, loss = 5.4828


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [54:59<05:15, 13.16it/s]

Iteration 43000, loss = 6.7965


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:16<04:27, 11.77it/s]

Iteration 44000, loss = 6.5085


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [57:35<02:45, 12.98it/s]

Iteration 45000, loss = 4.8681


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [58:51<01:12, 15.78it/s]

Iteration 46000, loss = 5.1062


100%|█████████████████████████████████████████████████████████████████████████▊| 47001/47154 [1:00:10<00:11, 13.45it/s]

Iteration 47000, loss = 6.9298


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:21<00:00, 13.02it/s]


Checking accuracy score on validation set.

Accuracy: 569 / 83918 correct (0.68)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 5


  0%|                                                                              | 1/47154 [00:00<1:37:27,  8.06it/s]

Iteration 0, loss = 6.3945


  2%|█▋                                                                           | 1002/47154 [01:16<58:16, 13.20it/s]

Iteration 1000, loss = 5.3527


  4%|███▎                                                                         | 2003/47154 [02:30<44:33, 16.89it/s]

Iteration 2000, loss = 5.0086


  6%|████▊                                                                      | 3004/47154 [03:43<1:01:55, 11.88it/s]

Iteration 3000, loss = 6.0031


  8%|██████▌                                                                      | 4005/47154 [05:00<49:02, 14.66it/s]

Iteration 4000, loss = 4.8330


 11%|████████▏                                                                    | 4999/47154 [06:15<53:43, 13.08it/s]

Iteration 5000, loss = 5.9363


 13%|█████████▊                                                                   | 6003/47154 [07:30<44:37, 15.37it/s]

Iteration 6000, loss = 6.1226


 15%|███████████▍                                                                 | 7001/47154 [08:47<47:09, 14.19it/s]

Iteration 7000, loss = 6.1728


 17%|█████████████                                                                | 8003/47154 [10:03<36:38, 17.81it/s]

Iteration 8000, loss = 5.8878


 19%|██████████████▋                                                              | 9001/47154 [11:21<46:35, 13.65it/s]

Iteration 9000, loss = 6.3614


 21%|████████████████                                                            | 10004/47154 [12:37<56:48, 10.90it/s]

Iteration 10000, loss = 6.3007


 23%|█████████████████▋                                                          | 11003/47154 [13:54<45:19, 13.29it/s]

Iteration 11000, loss = 6.0777


 25%|███████████████████▎                                                        | 12003/47154 [15:11<39:26, 14.85it/s]

Iteration 12000, loss = 6.5531


 28%|████████████████████▉                                                       | 13004/47154 [16:27<37:37, 15.13it/s]

Iteration 13000, loss = 6.0683


 30%|██████████████████████▌                                                     | 14004/47154 [17:45<36:38, 15.08it/s]

Iteration 14000, loss = 5.1625


 32%|████████████████████████▏                                                   | 15001/47154 [18:58<37:05, 14.45it/s]

Iteration 15000, loss = 5.3626


 34%|█████████████████████████▊                                                  | 16003/47154 [20:16<38:14, 13.57it/s]

Iteration 16000, loss = 4.9552


 36%|██████████████████████████▋                                               | 17003/47154 [21:33<1:00:47,  8.27it/s]

Iteration 17000, loss = 6.1748


 38%|█████████████████████████████                                               | 18004/47154 [22:50<27:34, 17.62it/s]

Iteration 18000, loss = 6.6126


 40%|██████████████████████████████▋                                             | 19003/47154 [24:08<31:27, 14.92it/s]

Iteration 19000, loss = 5.6516


 42%|████████████████████████████████▏                                           | 20004/47154 [25:23<25:40, 17.63it/s]

Iteration 20000, loss = 5.8454


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:40<29:16, 14.89it/s]

Iteration 21000, loss = 5.9133


 47%|███████████████████████████████████▍                                        | 22003/47154 [27:56<22:46, 18.40it/s]

Iteration 22000, loss = 4.5238


 49%|█████████████████████████████████████                                       | 23002/47154 [29:12<41:03,  9.80it/s]

Iteration 23000, loss = 6.1098


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:29<35:27, 10.88it/s]

Iteration 24000, loss = 5.6510


 53%|████████████████████████████████████████▎                                   | 25003/47154 [31:48<28:02, 13.16it/s]

Iteration 25000, loss = 5.7451


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:04<28:22, 12.43it/s]

Iteration 26000, loss = 6.4801


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:19<25:50, 13.00it/s]

Iteration 27000, loss = 5.7167


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:39<17:38, 18.10it/s]

Iteration 28000, loss = 6.2795


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [36:56<18:48, 16.09it/s]

Iteration 29000, loss = 5.4406


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:12<20:42, 13.80it/s]

Iteration 30000, loss = 6.0712


 66%|█████████████████████████████████████████████████▉                          | 31001/47154 [39:30<23:18, 11.55it/s]

Iteration 31000, loss = 5.6931


 68%|███████████████████████████████████████████████████▌                        | 32001/47154 [40:44<17:45, 14.23it/s]

Iteration 32000, loss = 5.9521


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [41:58<11:45, 20.06it/s]

Iteration 33000, loss = 4.8079


 72%|██████████████████████████████████████████████████████▊                     | 34001/47154 [43:17<16:31, 13.27it/s]

Iteration 34000, loss = 6.1460


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:35<13:38, 14.84it/s]

Iteration 35000, loss = 5.9999


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [45:55<12:22, 15.03it/s]

Iteration 36000, loss = 6.7450


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:12<09:55, 17.04it/s]

Iteration 37000, loss = 5.9462


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:25<13:28, 11.31it/s]

Iteration 38000, loss = 5.9400


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:44<11:06, 12.22it/s]

Iteration 39000, loss = 5.5439


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:00<07:04, 16.84it/s]

Iteration 40000, loss = 6.4229


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:20<09:52, 10.39it/s]

Iteration 41000, loss = 6.6878


 89%|███████████████████████████████████████████████████████████████████▋        | 42005/47154 [53:41<05:21, 16.00it/s]

Iteration 42000, loss = 4.6902


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:01<04:34, 15.10it/s]

Iteration 43000, loss = 5.3261


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:21<05:11, 10.14it/s]

Iteration 44000, loss = 5.6630


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:41<02:35, 13.83it/s]

Iteration 45000, loss = 6.0013


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:00<01:22, 14.03it/s]

Iteration 46000, loss = 5.4300


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:20<00:13, 11.09it/s]

Iteration 47000, loss = 5.1477


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:32<00:00, 12.98it/s]


Checking accuracy score on validation set.

Accuracy: 672 / 83918 correct (0.80)
Log Loss score:	5.80
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 6


  0%|                                                                              | 1/47154 [00:00<1:24:52,  9.26it/s]

Iteration 0, loss = 5.7151


  2%|█▋                                                                           | 1002/47154 [01:17<49:38, 15.50it/s]

Iteration 1000, loss = 6.2144


  4%|███▎                                                                         | 2001/47154 [02:37<57:32, 13.08it/s]

Iteration 2000, loss = 6.6961


  6%|████▊                                                                      | 3002/47154 [03:59<1:01:18, 12.00it/s]

Iteration 3000, loss = 6.2498


  8%|██████▌                                                                      | 4003/47154 [05:19<40:52, 17.59it/s]

Iteration 4000, loss = 5.9117


 11%|████████▏                                                                    | 5002/47154 [06:35<57:36, 12.19it/s]

Iteration 5000, loss = 5.8720


 13%|█████████▊                                                                   | 6004/47154 [07:52<45:38, 15.03it/s]

Iteration 6000, loss = 5.8072


 15%|███████████▍                                                                 | 7003/47154 [09:09<51:25, 13.01it/s]

Iteration 7000, loss = 6.6267


 17%|█████████████                                                                | 8005/47154 [10:26<54:55, 11.88it/s]

Iteration 8000, loss = 5.8326


 19%|██████████████▋                                                              | 9003/47154 [11:45<48:54, 13.00it/s]

Iteration 9000, loss = 5.9696


 21%|███████████████▋                                                          | 10001/47154 [13:03<1:10:12,  8.82it/s]

Iteration 10000, loss = 6.1595


 23%|█████████████████▋                                                          | 11003/47154 [14:22<50:47, 11.86it/s]

Iteration 11000, loss = 5.5044


 25%|███████████████████▎                                                        | 12003/47154 [15:37<40:44, 14.38it/s]

Iteration 12000, loss = 4.8598


 28%|████████████████████▉                                                       | 13001/47154 [16:53<37:39, 15.12it/s]

Iteration 13000, loss = 4.8155


 30%|██████████████████████▌                                                     | 14003/47154 [18:13<54:00, 10.23it/s]

Iteration 14000, loss = 6.8342


 32%|████████████████████████▏                                                   | 15002/47154 [19:31<41:15, 12.99it/s]

Iteration 15000, loss = 5.8874


 34%|█████████████████████████▊                                                  | 16003/47154 [20:49<37:37, 13.80it/s]

Iteration 16000, loss = 6.3664


 36%|███████████████████████████▍                                                | 17002/47154 [22:02<40:04, 12.54it/s]

Iteration 17000, loss = 6.0363


 38%|█████████████████████████████                                               | 18001/47154 [23:20<29:20, 16.56it/s]

Iteration 18000, loss = 6.2723


 40%|██████████████████████████████▋                                             | 19003/47154 [24:39<45:29, 10.31it/s]

Iteration 19000, loss = 6.0148


 42%|████████████████████████████████▏                                           | 20002/47154 [25:56<26:58, 16.77it/s]

Iteration 20000, loss = 5.9256


 45%|█████████████████████████████████▊                                          | 21004/47154 [27:14<29:15, 14.89it/s]

Iteration 21000, loss = 6.1070


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:34<23:47, 17.62it/s]

Iteration 22000, loss = 6.2454


 49%|█████████████████████████████████████                                       | 23004/47154 [29:55<22:35, 17.81it/s]

Iteration 23000, loss = 5.8318


 51%|██████████████████████████████████████▋                                     | 24003/47154 [31:14<27:10, 14.20it/s]

Iteration 24000, loss = 6.8582


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:29<30:25, 12.14it/s]

Iteration 25000, loss = 5.0732


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:44<22:06, 15.95it/s]

Iteration 26000, loss = 6.6626


 57%|███████████████████████████████████████████▌                                | 27002/47154 [35:03<31:34, 10.64it/s]

Iteration 27000, loss = 5.7436


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:20<18:35, 17.16it/s]

Iteration 28000, loss = 5.7927


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:39<19:06, 15.83it/s]

Iteration 29000, loss = 5.9137


 64%|████████████████████████████████████████████████▎                           | 30001/47154 [38:59<19:01, 15.02it/s]

Iteration 30000, loss = 5.7109


 66%|█████████████████████████████████████████████████▉                          | 31001/47154 [40:17<17:40, 15.23it/s]

Iteration 31000, loss = 6.3942


 68%|███████████████████████████████████████████████████▌                        | 32000/47154 [41:38<17:45, 14.22it/s]

Iteration 32000, loss = 5.5650


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:55<16:33, 14.25it/s]

Iteration 33000, loss = 6.1274


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [44:09<17:16, 12.69it/s]

Iteration 34000, loss = 6.4814


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:27<14:48, 13.67it/s]

Iteration 35000, loss = 6.5047


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [46:47<17:14, 10.77it/s]

Iteration 36000, loss = 5.6497


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [48:03<15:00, 11.28it/s]

Iteration 37000, loss = 6.5428


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [49:19<10:03, 15.17it/s]

Iteration 38000, loss = 5.2132


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:37<08:43, 15.56it/s]

Iteration 39000, loss = 6.8147


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:53<12:42,  9.38it/s]

Iteration 40000, loss = 6.0688


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [53:11<07:31, 13.62it/s]

Iteration 41000, loss = 5.8360


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:29<05:47, 14.82it/s]

Iteration 42000, loss = 6.0494


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:46<04:12, 16.41it/s]

Iteration 43000, loss = 5.5009


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [57:06<04:07, 12.74it/s]

Iteration 44000, loss = 6.5117


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [58:27<02:33, 13.98it/s]

Iteration 45000, loss = 4.8943


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:47<01:26, 13.30it/s]

Iteration 46000, loss = 5.7824


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:01:08<00:12, 12.15it/s]

Iteration 47000, loss = 5.9573


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:19<00:00, 12.81it/s]


Checking accuracy score on validation set.

Accuracy: 701 / 83918 correct (0.84)
Log Loss score:	5.80
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 7


  0%|                                                                              | 1/47154 [00:00<2:37:10,  5.00it/s]

Iteration 0, loss = 5.6488


  2%|█▋                                                                           | 1005/47154 [01:17<52:53, 14.54it/s]

Iteration 1000, loss = 6.0474


  4%|███▎                                                                         | 2005/47154 [02:32<50:30, 14.90it/s]

Iteration 2000, loss = 6.0642


  6%|████▉                                                                        | 3004/47154 [03:48<45:03, 16.33it/s]

Iteration 3000, loss = 5.8428


  8%|██████▌                                                                      | 4004/47154 [05:04<38:13, 18.81it/s]

Iteration 4000, loss = 5.6763


 11%|████████▏                                                                    | 5005/47154 [06:22<42:11, 16.65it/s]

Iteration 5000, loss = 5.7588


 13%|█████████▊                                                                   | 6004/47154 [07:36<43:59, 15.59it/s]

Iteration 6000, loss = 5.3790


 15%|███████████▏                                                               | 7002/47154 [08:48<1:02:30, 10.70it/s]

Iteration 7000, loss = 5.7263


 17%|█████████████                                                                | 8004/47154 [10:04<39:01, 16.72it/s]

Iteration 8000, loss = 6.3688


 19%|██████████████▎                                                            | 9003/47154 [11:22<1:02:07, 10.23it/s]

Iteration 9000, loss = 6.0219


 21%|████████████████                                                            | 10004/47154 [12:39<44:29, 13.92it/s]

Iteration 10000, loss = 6.2226


 23%|█████████████████▋                                                          | 11003/47154 [13:55<54:48, 10.99it/s]

Iteration 11000, loss = 6.2019


 25%|██████████████████▊                                                       | 12001/47154 [15:10<1:01:15,  9.57it/s]

Iteration 12000, loss = 4.9317


 28%|████████████████████▉                                                       | 13003/47154 [16:30<41:47, 13.62it/s]

Iteration 13000, loss = 5.8019


 30%|██████████████████████▌                                                     | 14002/47154 [17:45<48:14, 11.45it/s]

Iteration 14000, loss = 5.5949


 32%|████████████████████████▏                                                   | 15003/47154 [19:05<43:10, 12.41it/s]

Iteration 15000, loss = 6.1236


 34%|█████████████████████████▊                                                  | 16003/47154 [20:27<44:16, 11.72it/s]

Iteration 16000, loss = 5.5761


 36%|███████████████████████████▍                                                | 17004/47154 [21:44<33:45, 14.88it/s]

Iteration 17000, loss = 5.5641


 38%|█████████████████████████████                                               | 18004/47154 [23:01<37:55, 12.81it/s]

Iteration 18000, loss = 6.1299


 40%|██████████████████████████████▋                                             | 19003/47154 [24:19<56:55,  8.24it/s]

Iteration 19000, loss = 5.4773


 42%|████████████████████████████████▏                                           | 20004/47154 [25:35<31:29, 14.37it/s]

Iteration 20000, loss = 5.7806


 45%|█████████████████████████████████▊                                          | 21001/47154 [26:49<27:11, 16.03it/s]

Iteration 21000, loss = 5.4629


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:08<28:17, 14.82it/s]

Iteration 22000, loss = 7.0466


 49%|█████████████████████████████████████                                       | 23003/47154 [29:23<38:28, 10.46it/s]

Iteration 23000, loss = 5.1208


 51%|██████████████████████████████████████▋                                     | 24001/47154 [30:40<23:08, 16.68it/s]

Iteration 24000, loss = 5.9271


 53%|████████████████████████████████████████▎                                   | 25004/47154 [31:57<25:17, 14.60it/s]

Iteration 25000, loss = 5.8495


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:12<21:23, 16.48it/s]

Iteration 26000, loss = 5.2856


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:29<20:18, 16.54it/s]

Iteration 27000, loss = 5.9873


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:44<25:42, 12.42it/s]

Iteration 28000, loss = 6.1051


 62%|██████████████████████████████████████████████▋                             | 29005/47154 [37:03<16:46, 18.04it/s]

Iteration 29000, loss = 6.3863


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:20<21:56, 13.03it/s]

Iteration 30000, loss = 6.0458


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:36<23:45, 11.33it/s]

Iteration 31000, loss = 5.3480


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:51<18:30, 13.64it/s]

Iteration 32000, loss = 5.6465


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:05<13:57, 16.90it/s]

Iteration 33000, loss = 6.5258


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:20<15:58, 13.72it/s]

Iteration 34000, loss = 6.1666


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:36<14:54, 13.58it/s]

Iteration 35000, loss = 5.9587


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [45:50<11:38, 15.97it/s]

Iteration 36000, loss = 6.6042


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:08<11:49, 14.30it/s]

Iteration 37000, loss = 5.3647


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:25<11:48, 12.92it/s]

Iteration 38000, loss = 6.2998


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:41<09:29, 14.32it/s]

Iteration 39000, loss = 5.1893


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [50:59<12:14,  9.73it/s]

Iteration 40000, loss = 6.0698


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:15<06:52, 14.90it/s]

Iteration 41000, loss = 5.7005


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:30<05:51, 14.68it/s]

Iteration 42000, loss = 5.8378


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [54:44<08:43,  7.93it/s]

Iteration 43000, loss = 6.0389


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:01<03:56, 13.29it/s]

Iteration 44000, loss = 5.9140


 95%|████████████████████████████████████████████████████████████████████████▌   | 45001/47154 [57:17<02:44, 13.05it/s]

Iteration 45000, loss = 5.8102


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:36<01:49, 10.56it/s]

Iteration 46000, loss = 6.0437


100%|███████████████████████████████████████████████████████████████████████████▊| 47004/47154 [59:50<00:09, 15.58it/s]

Iteration 47000, loss = 6.0769


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:01<00:00, 13.09it/s]


Checking accuracy score on validation set.

Accuracy: 786 / 83918 correct (0.94)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 8


  0%|                                                                              | 3/47154 [00:00<1:28:42,  8.86it/s]

Iteration 0, loss = 5.9718


  2%|█▋                                                                           | 1005/47154 [01:16<48:31, 15.85it/s]

Iteration 1000, loss = 6.0141


  4%|███▎                                                                         | 2004/47154 [02:30<46:28, 16.19it/s]

Iteration 2000, loss = 5.7268


  6%|████▉                                                                        | 3003/47154 [03:48<54:57, 13.39it/s]

Iteration 3000, loss = 6.2763


  8%|██████▌                                                                      | 4003/47154 [05:04<46:43, 15.39it/s]

Iteration 4000, loss = 5.8403


 11%|████████▏                                                                    | 5003/47154 [06:19<39:09, 17.94it/s]

Iteration 5000, loss = 5.6198


 13%|█████████▊                                                                   | 6002/47154 [07:36<58:11, 11.79it/s]

Iteration 6000, loss = 6.1327


 15%|███████████▍                                                                 | 7003/47154 [08:50<40:02, 16.71it/s]

Iteration 7000, loss = 6.3875


 17%|█████████████                                                                | 8002/47154 [10:07<45:20, 14.39it/s]

Iteration 8000, loss = 5.2741


 19%|██████████████▋                                                              | 9002/47154 [11:22<42:38, 14.91it/s]

Iteration 9000, loss = 6.5506


 21%|████████████████                                                            | 10003/47154 [12:39<46:36, 13.28it/s]

Iteration 10000, loss = 5.7418


 23%|█████████████████▋                                                          | 11003/47154 [13:56<37:20, 16.13it/s]

Iteration 11000, loss = 6.4748


 25%|███████████████████▎                                                        | 12004/47154 [15:11<35:59, 16.28it/s]

Iteration 12000, loss = 4.8113


 28%|████████████████████▉                                                       | 13002/47154 [16:30<46:32, 12.23it/s]

Iteration 13000, loss = 5.6315


 30%|██████████████████████▌                                                     | 14004/47154 [17:44<29:24, 18.79it/s]

Iteration 14000, loss = 6.1682


 32%|████████████████████████▏                                                   | 15002/47154 [19:01<42:27, 12.62it/s]

Iteration 15000, loss = 4.7956


 34%|█████████████████████████▊                                                  | 16001/47154 [20:17<35:03, 14.81it/s]

Iteration 16000, loss = 5.6040


 36%|███████████████████████████▍                                                | 17003/47154 [21:34<26:52, 18.70it/s]

Iteration 17000, loss = 5.9838


 38%|█████████████████████████████                                               | 18003/47154 [22:53<28:26, 17.08it/s]

Iteration 18000, loss = 6.4306


 40%|██████████████████████████████▋                                             | 19003/47154 [24:07<30:28, 15.40it/s]

Iteration 19000, loss = 6.2115


 42%|████████████████████████████████▏                                           | 20004/47154 [25:25<33:31, 13.50it/s]

Iteration 20000, loss = 4.5278


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:41<41:48, 10.43it/s]

Iteration 21000, loss = 5.3731


 47%|███████████████████████████████████▍                                        | 22004/47154 [27:59<32:11, 13.02it/s]

Iteration 22000, loss = 5.6465


 49%|█████████████████████████████████████                                       | 23004/47154 [29:19<22:02, 18.25it/s]

Iteration 23000, loss = 5.2450


 51%|██████████████████████████████████████▋                                     | 24005/47154 [30:36<23:33, 16.38it/s]

Iteration 24000, loss = 4.8896


 53%|████████████████████████████████████████▎                                   | 25003/47154 [31:48<22:01, 16.76it/s]

Iteration 25000, loss = 5.4202


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:05<23:50, 14.79it/s]

Iteration 26000, loss = 5.6639


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:21<23:44, 14.15it/s]

Iteration 27000, loss = 5.3221


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:37<16:58, 18.81it/s]

Iteration 28000, loss = 5.2492


 62%|██████████████████████████████████████████████▋                             | 29000/47154 [36:53<20:33, 14.72it/s]

Iteration 29000, loss = 5.8450


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:08<20:35, 13.89it/s]

Iteration 30000, loss = 6.5776


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:22<17:15, 15.59it/s]

Iteration 31000, loss = 6.5053


 68%|███████████████████████████████████████████████████▌                        | 32000/47154 [40:41<16:02, 15.74it/s]

Iteration 32000, loss = 6.2368


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:01<19:39, 11.99it/s]

Iteration 33000, loss = 5.8372


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:21<13:36, 16.11it/s]

Iteration 34000, loss = 5.8621


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:38<14:41, 13.78it/s]

Iteration 35000, loss = 5.5168


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [45:55<13:45, 13.50it/s]

Iteration 36000, loss = 5.0047


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:10<10:48, 15.65it/s]

Iteration 37000, loss = 4.9660


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:30<11:58, 12.74it/s]

Iteration 38000, loss = 6.6333


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:50<11:20, 11.97it/s]

Iteration 39000, loss = 4.7726


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [51:06<09:48, 12.15it/s]

Iteration 40000, loss = 6.6797


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:22<07:48, 13.13it/s]

Iteration 41000, loss = 7.0271


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:39<05:35, 15.34it/s]

Iteration 42000, loss = 5.9010


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:00<08:31,  8.12it/s]

Iteration 43000, loss = 6.0716


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:21<04:44, 11.07it/s]

Iteration 44000, loss = 6.9050


 95%|████████████████████████████████████████████████████████████████████████▌   | 45001/47154 [57:42<02:27, 14.64it/s]

Iteration 45000, loss = 5.0116


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:02<01:27, 13.17it/s]

Iteration 46000, loss = 6.3496


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:23<00:10, 14.66it/s]

Iteration 47000, loss = 6.6955


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:36<00:00, 12.97it/s]


Checking accuracy score on validation set.

Accuracy: 545 / 83918 correct (0.65)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 9


  0%|                                                                              | 1/47154 [00:00<1:42:55,  7.64it/s]

Iteration 0, loss = 6.0155


  2%|█▋                                                                           | 1001/47154 [01:18<50:19, 15.29it/s]

Iteration 1000, loss = 5.9531


  4%|███▎                                                                         | 2002/47154 [02:35<50:01, 15.04it/s]

Iteration 2000, loss = 6.3823


  6%|████▉                                                                        | 3003/47154 [03:49<55:49, 13.18it/s]

Iteration 3000, loss = 6.9048


  8%|██████▌                                                                      | 4003/47154 [05:07<45:46, 15.71it/s]

Iteration 4000, loss = 6.1694


 11%|████████▏                                                                    | 5001/47154 [06:22<57:25, 12.24it/s]

Iteration 5000, loss = 5.8471


 13%|█████████▊                                                                   | 6003/47154 [07:39<48:40, 14.09it/s]

Iteration 6000, loss = 5.7513


 15%|███████████▍                                                                 | 7003/47154 [08:55<52:18, 12.79it/s]

Iteration 7000, loss = 4.9910


 17%|█████████████                                                                | 8002/47154 [10:15<56:37, 11.52it/s]

Iteration 8000, loss = 6.2892


 19%|██████████████▋                                                              | 9004/47154 [11:30<42:37, 14.92it/s]

Iteration 9000, loss = 6.0134


 21%|████████████████                                                            | 10003/47154 [12:48<45:16, 13.67it/s]

Iteration 10000, loss = 5.3324


 23%|█████████████████▋                                                          | 11004/47154 [14:06<40:42, 14.80it/s]

Iteration 11000, loss = 6.3647


 25%|███████████████████▎                                                        | 12004/47154 [15:23<47:24, 12.36it/s]

Iteration 12000, loss = 6.5904


 28%|████████████████████▉                                                       | 13001/47154 [16:41<34:16, 16.60it/s]

Iteration 13000, loss = 5.7471


 30%|██████████████████████▌                                                     | 14002/47154 [17:57<35:10, 15.71it/s]

Iteration 14000, loss = 5.4204


 32%|████████████████████████▏                                                   | 15001/47154 [19:15<38:50, 13.80it/s]

Iteration 15000, loss = 6.5667


 34%|█████████████████████████▊                                                  | 16003/47154 [20:32<37:35, 13.81it/s]

Iteration 16000, loss = 6.3486


 36%|███████████████████████████▍                                                | 17004/47154 [21:48<32:56, 15.26it/s]

Iteration 17000, loss = 5.0083


 38%|█████████████████████████████                                               | 18002/47154 [23:08<34:22, 14.13it/s]

Iteration 18000, loss = 6.0091


 40%|██████████████████████████████▋                                             | 19003/47154 [24:24<36:43, 12.78it/s]

Iteration 19000, loss = 5.7713


 42%|████████████████████████████████▏                                           | 20004/47154 [25:38<26:42, 16.95it/s]

Iteration 20000, loss = 5.7040


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:54<32:28, 13.42it/s]

Iteration 21000, loss = 5.3778


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:13<30:55, 13.55it/s]

Iteration 22000, loss = 6.1043


 49%|█████████████████████████████████████                                       | 23003/47154 [29:33<30:17, 13.29it/s]

Iteration 23000, loss = 6.2640


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:52<25:23, 15.20it/s]

Iteration 24000, loss = 5.8897


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:07<25:20, 14.57it/s]

Iteration 25000, loss = 6.4684


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:24<23:46, 14.83it/s]

Iteration 26000, loss = 5.0871


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:43<21:08, 15.88it/s]

Iteration 27000, loss = 5.3107


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:00<23:07, 13.80it/s]

Iteration 28000, loss = 5.8424


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:18<20:36, 14.68it/s]

Iteration 29000, loss = 6.0398


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:34<17:28, 16.36it/s]

Iteration 30000, loss = 5.0515


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:53<22:12, 12.12it/s]

Iteration 31000, loss = 5.3123


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:09<23:55, 10.56it/s]

Iteration 32000, loss = 4.9466


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:26<16:18, 14.46it/s]

Iteration 33000, loss = 6.0998


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:47<18:49, 11.64it/s]

Iteration 34000, loss = 6.1974


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [45:06<15:54, 12.73it/s]

Iteration 35000, loss = 5.5634


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:25<10:16, 18.08it/s]

Iteration 36000, loss = 6.1387


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:45<12:26, 13.60it/s]

Iteration 37000, loss = 5.7111


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [49:05<10:48, 14.12it/s]

Iteration 38000, loss = 6.1207


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:23<09:49, 13.83it/s]

Iteration 39000, loss = 6.2060


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:41<09:05, 13.10it/s]

Iteration 40000, loss = 5.8852


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:57<07:56, 12.91it/s]

Iteration 41000, loss = 6.1977


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:13<06:41, 12.82it/s]

Iteration 42000, loss = 6.1268


 91%|█████████████████████████████████████████████████████████████████████▎      | 43005/47154 [55:29<04:54, 14.07it/s]

Iteration 43000, loss = 5.8773


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:47<04:51, 10.82it/s]

Iteration 44000, loss = 5.1705


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [58:03<02:31, 14.17it/s]

Iteration 45000, loss = 6.5658


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:20<01:29, 12.80it/s]

Iteration 46000, loss = 5.4158


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:42<00:12, 11.91it/s]

Iteration 47000, loss = 6.4067


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:54<00:00, 12.90it/s]


Checking accuracy score on validation set.

Accuracy: 784 / 83918 correct (0.93)
Log Loss score:	5.80
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 10


  0%|                                                                              | 1/47154 [00:00<1:30:21,  8.70it/s]

Iteration 0, loss = 6.7617


  2%|█▋                                                                           | 1003/47154 [01:15<45:31, 16.90it/s]

Iteration 1000, loss = 5.2403


  4%|███▎                                                                         | 2004/47154 [02:33<37:12, 20.22it/s]

Iteration 2000, loss = 6.2087


  6%|████▊                                                                      | 3003/47154 [03:51<1:03:58, 11.50it/s]

Iteration 3000, loss = 6.0358


  8%|██████▌                                                                      | 4003/47154 [05:04<47:15, 15.22it/s]

Iteration 4000, loss = 5.9401


 11%|████████▏                                                                    | 5005/47154 [06:19<38:48, 18.10it/s]

Iteration 5000, loss = 5.2106


 13%|█████████▊                                                                   | 6004/47154 [07:34<40:51, 16.79it/s]

Iteration 6000, loss = 6.1970


 15%|███████████▍                                                                 | 7002/47154 [08:49<51:58, 12.88it/s]

Iteration 7000, loss = 6.0473


 17%|█████████████                                                                | 8004/47154 [10:05<37:43, 17.29it/s]

Iteration 8000, loss = 6.3226


 19%|██████████████▋                                                              | 9003/47154 [11:22<44:44, 14.21it/s]

Iteration 9000, loss = 5.8738


 21%|████████████████                                                            | 10004/47154 [12:39<53:23, 11.60it/s]

Iteration 10000, loss = 6.6688


 23%|█████████████████▋                                                          | 11003/47154 [13:56<45:25, 13.26it/s]

Iteration 11000, loss = 5.5636


 25%|███████████████████▎                                                        | 12002/47154 [15:11<55:50, 10.49it/s]

Iteration 12000, loss = 5.3108


 28%|████████████████████▉                                                       | 13005/47154 [16:27<36:17, 15.69it/s]

Iteration 13000, loss = 5.6031


 30%|██████████████████████▌                                                     | 14001/47154 [17:43<57:09,  9.67it/s]

Iteration 14000, loss = 6.3145


 32%|████████████████████████▏                                                   | 15002/47154 [19:01<55:10,  9.71it/s]

Iteration 15000, loss = 5.5715


 34%|█████████████████████████▊                                                  | 16001/47154 [20:19<51:46, 10.03it/s]

Iteration 16000, loss = 6.4680


 36%|███████████████████████████▍                                                | 17002/47154 [21:38<45:37, 11.02it/s]

Iteration 17000, loss = 5.9377


 38%|█████████████████████████████                                               | 18004/47154 [22:56<33:35, 14.46it/s]

Iteration 18000, loss = 5.2373


 40%|██████████████████████████████▋                                             | 19004/47154 [24:15<33:19, 14.08it/s]

Iteration 19000, loss = 5.8983


 42%|████████████████████████████████▏                                           | 20001/47154 [25:30<36:35, 12.37it/s]

Iteration 20000, loss = 6.7007


 45%|█████████████████████████████████▊                                          | 21005/47154 [26:47<25:02, 17.41it/s]

Iteration 21000, loss = 6.1204


 47%|███████████████████████████████████▍                                        | 22004/47154 [27:59<31:08, 13.46it/s]

Iteration 22000, loss = 6.4681


 49%|█████████████████████████████████████                                       | 23002/47154 [29:13<27:28, 14.65it/s]

Iteration 23000, loss = 5.6684


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:28<23:54, 16.14it/s]

Iteration 24000, loss = 6.7625


 53%|████████████████████████████████████████▎                                   | 25005/47154 [31:43<21:44, 16.98it/s]

Iteration 25000, loss = 4.7775


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:00<24:03, 14.65it/s]

Iteration 26000, loss = 6.5854


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:14<20:54, 16.07it/s]

Iteration 27000, loss = 5.1626


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:30<24:11, 13.19it/s]

Iteration 28000, loss = 4.8339


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [36:49<22:38, 13.36it/s]

Iteration 29000, loss = 6.1885


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:02<18:00, 15.87it/s]

Iteration 30000, loss = 5.2233


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:20<26:32, 10.14it/s]

Iteration 31000, loss = 6.4126


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:37<21:26, 11.78it/s]

Iteration 32000, loss = 4.9087


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [41:52<16:28, 14.32it/s]

Iteration 33000, loss = 6.9102


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:09<25:32,  8.58it/s]

Iteration 34000, loss = 6.3092


 74%|████████████████████████████████████████████████████████▍                   | 35001/47154 [44:26<13:58, 14.50it/s]

Iteration 35000, loss = 6.3380


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [45:42<11:56, 15.57it/s]

Iteration 36000, loss = 5.6634


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [46:56<12:47, 13.23it/s]

Iteration 37000, loss = 5.7064


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [48:14<17:17,  8.82it/s]

Iteration 38000, loss = 5.4938


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:29<08:35, 15.82it/s]

Iteration 39000, loss = 5.2738


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [50:46<06:49, 17.47it/s]

Iteration 40000, loss = 5.9245


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:04<06:39, 15.41it/s]

Iteration 41000, loss = 6.0277


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:21<05:45, 14.89it/s]

Iteration 42000, loss = 6.2644


 91%|█████████████████████████████████████████████████████████████████████▎      | 43005/47154 [54:35<05:43, 12.06it/s]

Iteration 43000, loss = 4.9692


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [55:52<02:54, 18.05it/s]

Iteration 44000, loss = 5.7458


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:09<02:35, 13.82it/s]

Iteration 45000, loss = 6.3012


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:29<01:20, 14.34it/s]

Iteration 46000, loss = 6.0956


100%|███████████████████████████████████████████████████████████████████████████▊| 47002/47154 [59:45<00:10, 14.90it/s]

Iteration 47000, loss = 6.0716


100%|████████████████████████████████████████████████████████████████████████████| 47154/47154 [59:57<00:00, 13.11it/s]


Checking accuracy score on validation set.

Accuracy: 528 / 83918 correct (0.63)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 11


  0%|                                                                                        | 0/47154 [00:00<?, ?it/s]

Iteration 0, loss = 5.0961

  0%|                                                                              | 4/47154 [00:00<1:10:10, 11.20it/s]




  2%|█▌                                                                         | 1002/47154 [01:14<1:16:58,  9.99it/s]

Iteration 1000, loss = 5.9944


  4%|███▎                                                                         | 2001/47154 [02:29<50:25, 14.92it/s]

Iteration 2000, loss = 5.3688


  6%|████▉                                                                        | 3003/47154 [03:45<51:10, 14.38it/s]

Iteration 3000, loss = 5.2749


  8%|██████▌                                                                      | 4002/47154 [05:04<49:11, 14.62it/s]

Iteration 4000, loss = 6.0997


 11%|████████▏                                                                    | 5002/47154 [06:20<50:10, 14.00it/s]

Iteration 5000, loss = 6.4572


 13%|█████████▊                                                                   | 6002/47154 [07:37<48:47, 14.06it/s]

Iteration 6000, loss = 6.3293


 15%|███████████▍                                                                 | 7003/47154 [08:56<54:22, 12.31it/s]

Iteration 7000, loss = 6.0058


 17%|█████████████                                                                | 8003/47154 [10:11<55:24, 11.78it/s]

Iteration 8000, loss = 6.0552


 19%|██████████████▎                                                            | 9003/47154 [11:31<1:06:37,  9.54it/s]

Iteration 9000, loss = 5.3086


 21%|████████████████                                                            | 10003/47154 [12:48<40:52, 15.15it/s]

Iteration 10000, loss = 5.5755


 23%|█████████████████▋                                                          | 11003/47154 [14:02<35:11, 17.12it/s]

Iteration 11000, loss = 6.4173


 25%|███████████████████▎                                                        | 12004/47154 [15:19<46:22, 12.63it/s]

Iteration 12000, loss = 5.3033


 28%|████████████████████▉                                                       | 13004/47154 [16:36<43:59, 12.94it/s]

Iteration 13000, loss = 4.7153


 30%|██████████████████████▌                                                     | 14001/47154 [17:53<38:24, 14.39it/s]

Iteration 14000, loss = 5.0578


 32%|████████████████████████▏                                                   | 15003/47154 [19:06<33:48, 15.85it/s]

Iteration 15000, loss = 6.0915


 34%|█████████████████████████▊                                                  | 16004/47154 [20:21<29:50, 17.39it/s]

Iteration 16000, loss = 6.0425


 36%|███████████████████████████▍                                                | 17002/47154 [21:37<32:15, 15.58it/s]

Iteration 17000, loss = 6.2797


 38%|████████████████████████████▏                                             | 18000/47154 [22:56<1:01:02,  7.96it/s]

Iteration 18000, loss = 5.3118


 40%|██████████████████████████████▋                                             | 19005/47154 [24:09<26:30, 17.70it/s]

Iteration 19000, loss = 5.5591


 42%|████████████████████████████████▏                                           | 20001/47154 [25:24<25:17, 17.90it/s]

Iteration 20000, loss = 5.8310


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:38<25:10, 17.31it/s]

Iteration 21000, loss = 5.7471


 47%|███████████████████████████████████▍                                        | 22003/47154 [27:58<21:28, 19.52it/s]

Iteration 22000, loss = 6.3552


 49%|█████████████████████████████████████                                       | 23005/47154 [29:16<26:15, 15.33it/s]

Iteration 23000, loss = 5.5913


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:33<26:56, 14.32it/s]

Iteration 24000, loss = 5.0383


 53%|████████████████████████████████████████▎                                   | 25002/47154 [31:46<23:57, 15.41it/s]

Iteration 25000, loss = 5.9165


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:01<20:38, 17.07it/s]

Iteration 26000, loss = 5.7033


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:16<22:48, 14.72it/s]

Iteration 27000, loss = 5.9668


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:32<22:08, 14.41it/s]

Iteration 28000, loss = 6.0775


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [36:50<20:51, 14.51it/s]

Iteration 29000, loss = 6.4715


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:11<18:14, 15.67it/s]

Iteration 30000, loss = 5.4419


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:30<26:06, 10.31it/s]

Iteration 31000, loss = 4.7429


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:48<17:20, 14.56it/s]

Iteration 32000, loss = 6.0846


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:06<18:44, 12.58it/s]

Iteration 33000, loss = 6.2995


 72%|██████████████████████████████████████████████████████▊                     | 34005/47154 [43:22<12:35, 17.41it/s]

Iteration 34000, loss = 6.5859


 74%|████████████████████████████████████████████████████████▍                   | 35005/47154 [44:37<14:43, 13.75it/s]

Iteration 35000, loss = 6.3439


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [45:55<11:33, 16.08it/s]

Iteration 36000, loss = 6.0264


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:11<11:40, 14.49it/s]

Iteration 37000, loss = 5.9472


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [48:27<09:25, 16.18it/s]

Iteration 38000, loss = 5.9187


 83%|██████████████████████████████████████████████████████████████▊             | 39001/47154 [49:42<13:25, 10.12it/s]

Iteration 39000, loss = 5.8686


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:02<07:49, 15.24it/s]

Iteration 40000, loss = 5.2447


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:16<07:47, 13.17it/s]

Iteration 41000, loss = 6.0938


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:33<04:40, 18.34it/s]

Iteration 42000, loss = 6.3548


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [54:48<03:49, 18.09it/s]

Iteration 43000, loss = 5.9476


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:08<03:08, 16.75it/s]

Iteration 44000, loss = 6.8260


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:22<03:16, 10.93it/s]

Iteration 45000, loss = 5.6884


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:38<01:32, 12.43it/s]

Iteration 46000, loss = 5.9525


100%|███████████████████████████████████████████████████████████████████████████▊| 47003/47154 [59:54<00:11, 12.70it/s]

Iteration 47000, loss = 5.4947


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:06<00:00, 13.08it/s]


Checking accuracy score on validation set.

Accuracy: 811 / 83918 correct (0.97)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 12


  0%|                                                                              | 1/47154 [00:00<1:54:44,  6.85it/s]

Iteration 0, loss = 5.6911


  2%|█▋                                                                           | 1005/47154 [01:19<54:10, 14.20it/s]

Iteration 1000, loss = 5.9755


  4%|███▎                                                                         | 2000/47154 [02:36<54:34, 13.79it/s]

Iteration 2000, loss = 5.8910


  6%|████▉                                                                        | 3002/47154 [03:52<39:17, 18.73it/s]

Iteration 3000, loss = 5.9084


  8%|██████▌                                                                      | 4004/47154 [05:07<46:32, 15.45it/s]

Iteration 4000, loss = 6.1186


 11%|████████▏                                                                    | 5002/47154 [06:21<43:29, 16.15it/s]

Iteration 5000, loss = 6.1770


 13%|█████████▊                                                                   | 6002/47154 [07:38<44:33, 15.39it/s]

Iteration 6000, loss = 5.4371


 15%|███████████▍                                                                 | 7002/47154 [08:53<49:32, 13.51it/s]

Iteration 7000, loss = 5.4016


 17%|████████████▋                                                              | 8003/47154 [10:07<1:00:35, 10.77it/s]

Iteration 8000, loss = 5.9412


 19%|██████████████▋                                                              | 9001/47154 [11:24<52:06, 12.20it/s]

Iteration 9000, loss = 4.8095


 21%|████████████████                                                            | 10003/47154 [12:37<41:07, 15.06it/s]

Iteration 10000, loss = 5.3962


 23%|█████████████████▋                                                          | 11001/47154 [13:54<35:00, 17.21it/s]

Iteration 11000, loss = 5.7217


 25%|███████████████████▎                                                        | 12004/47154 [15:12<34:15, 17.10it/s]

Iteration 12000, loss = 6.6291


 28%|████████████████████▉                                                       | 13003/47154 [16:28<39:11, 14.52it/s]

Iteration 13000, loss = 5.0630


 30%|██████████████████████▌                                                     | 14003/47154 [17:45<41:19, 13.37it/s]

Iteration 14000, loss = 5.9434


 32%|████████████████████████▏                                                   | 15003/47154 [19:02<40:36, 13.19it/s]

Iteration 15000, loss = 5.6420


 34%|█████████████████████████▊                                                  | 16002/47154 [20:19<41:08, 12.62it/s]

Iteration 16000, loss = 6.4209


 36%|███████████████████████████▍                                                | 17001/47154 [21:36<40:20, 12.45it/s]

Iteration 17000, loss = 5.0807


 38%|█████████████████████████████                                               | 18004/47154 [22:53<32:16, 15.05it/s]

Iteration 18000, loss = 5.2827


 40%|██████████████████████████████▋                                             | 19002/47154 [24:09<36:40, 12.80it/s]

Iteration 19000, loss = 5.9632


 42%|████████████████████████████████▏                                           | 20004/47154 [25:25<30:34, 14.80it/s]

Iteration 20000, loss = 5.8008


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:40<27:32, 15.83it/s]

Iteration 21000, loss = 6.3015


 47%|███████████████████████████████████▍                                        | 22004/47154 [27:58<27:46, 15.10it/s]

Iteration 22000, loss = 6.5178


 49%|█████████████████████████████████████                                       | 23001/47154 [29:16<30:18, 13.28it/s]

Iteration 23000, loss = 5.8397


 51%|██████████████████████████████████████▋                                     | 24000/47154 [30:34<26:14, 14.70it/s]

Iteration 24000, loss = 6.0789


 53%|████████████████████████████████████████▎                                   | 25001/47154 [31:51<24:17, 15.19it/s]

Iteration 25000, loss = 5.3020


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:07<20:00, 17.62it/s]

Iteration 26000, loss = 6.0542


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:23<22:20, 15.04it/s]

Iteration 27000, loss = 5.4931


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:44<19:50, 16.09it/s]

Iteration 28000, loss = 7.2682


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [36:59<19:10, 15.78it/s]

Iteration 29000, loss = 4.9196


 64%|████████████████████████████████████████████████▎                           | 30001/47154 [38:16<21:45, 13.14it/s]

Iteration 30000, loss = 5.7007


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:32<22:42, 11.85it/s]

Iteration 31000, loss = 6.5262


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:50<16:13, 15.56it/s]

Iteration 32000, loss = 5.5823


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:05<15:43, 15.01it/s]

Iteration 33000, loss = 6.0638


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:19<16:39, 13.15it/s]

Iteration 34000, loss = 5.4626


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:37<17:02, 11.88it/s]

Iteration 35000, loss = 5.2998


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [45:52<10:41, 17.38it/s]

Iteration 36000, loss = 5.5808


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:06<11:18, 14.95it/s]

Iteration 37000, loss = 5.1355


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [48:24<13:18, 11.46it/s]

Iteration 38000, loss = 6.1688


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:41<08:53, 15.28it/s]

Iteration 39000, loss = 5.7196


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [50:59<10:00, 11.90it/s]

Iteration 40000, loss = 4.3603


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:16<07:07, 14.40it/s]

Iteration 41000, loss = 5.7384


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:35<05:30, 15.57it/s]

Iteration 42000, loss = 6.7092


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [54:52<08:07,  8.51it/s]

Iteration 43000, loss = 5.4983


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:06<04:07, 12.73it/s]

Iteration 44000, loss = 6.4654


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:26<02:33, 13.98it/s]

Iteration 45000, loss = 5.2703


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [58:47<01:32, 12.44it/s]

Iteration 46000, loss = 6.4242


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:05<00:10, 14.26it/s]

Iteration 47000, loss = 5.9223


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:16<00:00, 13.04it/s]


Checking accuracy score on validation set.

Accuracy: 811 / 83918 correct (0.97)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 13


  0%|                                                                              | 1/47154 [00:00<1:40:37,  7.81it/s]

Iteration 0, loss = 5.4001


  2%|█▋                                                                           | 1003/47154 [01:19<58:34, 13.13it/s]

Iteration 1000, loss = 6.3589


  4%|███▏                                                                       | 2002/47154 [02:35<1:02:54, 11.96it/s]

Iteration 2000, loss = 6.2615


  6%|████▉                                                                        | 3005/47154 [03:50<45:42, 16.10it/s]

Iteration 3000, loss = 6.0667


  8%|██████▎                                                                    | 4003/47154 [05:10<1:01:50, 11.63it/s]

Iteration 4000, loss = 4.7211


 11%|███████▉                                                                   | 5004/47154 [06:29<1:11:32,  9.82it/s]

Iteration 5000, loss = 5.8413


 13%|█████████▊                                                                   | 6004/47154 [07:48<46:19, 14.80it/s]

Iteration 6000, loss = 5.9384


 15%|███████████▍                                                                 | 7002/47154 [09:03<46:30, 14.39it/s]

Iteration 7000, loss = 5.6551


 17%|████████████▋                                                              | 8003/47154 [10:22<1:08:03,  9.59it/s]

Iteration 8000, loss = 5.1027


 19%|██████████████▋                                                              | 9001/47154 [11:38<45:27, 13.99it/s]

Iteration 9000, loss = 6.1424


 21%|████████████████                                                            | 10004/47154 [12:56<48:31, 12.76it/s]

Iteration 10000, loss = 5.7329


 23%|█████████████████▋                                                          | 11003/47154 [14:12<41:16, 14.60it/s]

Iteration 11000, loss = 6.5820


 25%|███████████████████▎                                                        | 12003/47154 [15:29<44:26, 13.18it/s]

Iteration 12000, loss = 5.7576


 28%|████████████████████▉                                                       | 13004/47154 [16:49<37:45, 15.08it/s]

Iteration 13000, loss = 6.5194


 30%|██████████████████████▌                                                     | 14003/47154 [18:04<41:41, 13.25it/s]

Iteration 14000, loss = 5.7330


 32%|████████████████████████▏                                                   | 15003/47154 [19:23<32:02, 16.73it/s]

Iteration 15000, loss = 5.5771


 34%|█████████████████████████▊                                                  | 16002/47154 [20:38<38:01, 13.65it/s]

Iteration 16000, loss = 5.7131


 36%|███████████████████████████▍                                                | 17004/47154 [21:56<37:15, 13.49it/s]

Iteration 17000, loss = 5.0150


 38%|█████████████████████████████                                               | 18001/47154 [23:15<45:06, 10.77it/s]

Iteration 18000, loss = 6.3883


 40%|██████████████████████████████▌                                             | 19001/47154 [24:29<32:40, 14.36it/s]

Iteration 19000, loss = 5.9104


 42%|████████████████████████████████▏                                           | 20003/47154 [25:44<36:44, 12.31it/s]

Iteration 20000, loss = 6.1639


 45%|█████████████████████████████████▊                                          | 21004/47154 [27:04<33:21, 13.06it/s]

Iteration 21000, loss = 6.3855


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:22<42:47,  9.80it/s]

Iteration 22000, loss = 6.7927


 49%|█████████████████████████████████████                                       | 23003/47154 [29:39<26:02, 15.46it/s]

Iteration 23000, loss = 6.1446


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:59<25:34, 15.09it/s]

Iteration 24000, loss = 6.3933


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:14<26:11, 14.10it/s]

Iteration 25000, loss = 5.6184


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:31<31:28, 11.20it/s]

Iteration 26000, loss = 5.9532


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:47<27:27, 12.23it/s]

Iteration 27000, loss = 4.3806


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [36:05<22:18, 14.30it/s]

Iteration 28000, loss = 6.2703


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:21<27:46, 10.89it/s]

Iteration 29000, loss = 5.8157


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:35<15:34, 18.36it/s]

Iteration 30000, loss = 5.0057


 66%|█████████████████████████████████████████████████▉                          | 31001/47154 [39:49<13:06, 20.54it/s]

Iteration 31000, loss = 6.3518


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:04<17:05, 14.77it/s]

Iteration 32000, loss = 6.0669


 70%|█████████████████████████████████████████████████████▏                      | 33000/47154 [42:20<13:33, 17.41it/s]

Iteration 33000, loss = 6.3871


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:37<14:55, 14.68it/s]

Iteration 34000, loss = 6.3410


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:56<16:26, 12.32it/s]

Iteration 35000, loss = 6.3932


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [46:14<12:36, 14.74it/s]

Iteration 36000, loss = 6.0281


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:30<18:40,  9.06it/s]

Iteration 37000, loss = 6.5434


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [48:47<11:32, 13.21it/s]

Iteration 38000, loss = 6.3347


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:03<13:53,  9.79it/s]

Iteration 39000, loss = 6.6524


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:22<07:04, 16.83it/s]

Iteration 40000, loss = 6.5140


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:39<07:17, 14.05it/s]

Iteration 41000, loss = 6.0711


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:56<07:39, 11.21it/s]

Iteration 42000, loss = 4.7983


 91%|█████████████████████████████████████████████████████████████████████▎      | 43000/47154 [55:14<06:25, 10.76it/s]

Iteration 43000, loss = 5.8166


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:28<04:49, 10.87it/s]

Iteration 44000, loss = 6.1854


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:44<02:28, 14.53it/s]

Iteration 45000, loss = 6.4897


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46005/47154 [58:58<01:15, 15.27it/s]

Iteration 46000, loss = 6.2127


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:13<00:12, 11.99it/s]

Iteration 47000, loss = 6.1800


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:24<00:00, 13.01it/s]


Checking accuracy score on validation set.

Accuracy: 651 / 83918 correct (0.78)
Log Loss score:	5.81
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 14


  0%|                                                                              | 1/47154 [00:00<1:38:13,  8.00it/s]

Iteration 0, loss = 5.6605


  2%|█▌                                                                         | 1002/47154 [01:18<1:06:59, 11.48it/s]

Iteration 1000, loss = 5.6498


  4%|███▎                                                                         | 2003/47154 [02:32<47:22, 15.89it/s]

Iteration 2000, loss = 6.5440


  6%|████▉                                                                        | 3004/47154 [03:53<48:43, 15.10it/s]

Iteration 3000, loss = 6.2276


  8%|██████▌                                                                      | 4004/47154 [05:12<39:22, 18.26it/s]

Iteration 4000, loss = 5.7373


 11%|████████▏                                                                    | 5002/47154 [06:28<59:45, 11.76it/s]

Iteration 5000, loss = 4.9778


 13%|█████████▊                                                                   | 6004/47154 [07:46<38:18, 17.90it/s]

Iteration 6000, loss = 5.8231


 15%|███████████▍                                                                 | 7002/47154 [09:01<43:32, 15.37it/s]

Iteration 7000, loss = 6.7570


 17%|████████████▋                                                              | 8001/47154 [10:18<1:14:01,  8.81it/s]

Iteration 8000, loss = 5.0830


 19%|██████████████▋                                                              | 9005/47154 [11:37<37:49, 16.81it/s]

Iteration 9000, loss = 6.1924


 21%|████████████████                                                            | 10004/47154 [12:51<35:56, 17.22it/s]

Iteration 10000, loss = 6.1856


 23%|█████████████████▋                                                          | 11003/47154 [14:10<36:50, 16.35it/s]

Iteration 11000, loss = 6.2761


 25%|███████████████████▎                                                        | 12002/47154 [15:25<43:12, 13.56it/s]

Iteration 12000, loss = 5.7375


 28%|████████████████████▉                                                       | 13003/47154 [16:43<34:53, 16.32it/s]

Iteration 13000, loss = 5.3232


 30%|██████████████████████▌                                                     | 14002/47154 [17:58<42:01, 13.15it/s]

Iteration 14000, loss = 6.3720


 32%|████████████████████████▏                                                   | 15004/47154 [19:14<29:51, 17.94it/s]

Iteration 15000, loss = 6.0473


 34%|█████████████████████████▊                                                  | 16002/47154 [20:31<32:30, 15.97it/s]

Iteration 16000, loss = 6.0819


 36%|███████████████████████████▍                                                | 17002/47154 [21:48<40:44, 12.33it/s]

Iteration 17000, loss = 5.6941


 38%|█████████████████████████████                                               | 18000/47154 [23:05<35:43, 13.60it/s]

Iteration 18000, loss = 6.4599


 40%|██████████████████████████████▋                                             | 19005/47154 [24:23<28:48, 16.28it/s]

Iteration 19000, loss = 5.9707


 42%|████████████████████████████████▏                                           | 20001/47154 [25:37<28:18, 15.99it/s]

Iteration 20000, loss = 5.8849


 45%|█████████████████████████████████▊                                          | 21000/47154 [26:50<39:16, 11.10it/s]

Iteration 21000, loss = 5.9587


 47%|███████████████████████████████████▍                                        | 22005/47154 [28:09<24:18, 17.24it/s]

Iteration 22000, loss = 5.7377


 49%|█████████████████████████████████████                                       | 23003/47154 [29:28<27:28, 14.65it/s]

Iteration 23000, loss = 6.5719


 51%|██████████████████████████████████████▋                                     | 24001/47154 [30:48<40:04,  9.63it/s]

Iteration 24000, loss = 5.7642


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:06<31:15, 11.81it/s]

Iteration 25000, loss = 6.4207


 55%|█████████████████████████████████████████▉                                  | 26000/47154 [33:25<28:33, 12.35it/s]

Iteration 26000, loss = 5.7725


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:41<19:15, 17.43it/s]

Iteration 27000, loss = 5.1423


 59%|█████████████████████████████████████████████▏                              | 28005/47154 [35:59<21:29, 14.85it/s]

Iteration 28000, loss = 5.7020


 62%|██████████████████████████████████████████████▋                             | 29000/47154 [37:16<29:37, 10.22it/s]

Iteration 29000, loss = 6.1745


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:33<17:56, 15.94it/s]

Iteration 30000, loss = 5.4049


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:51<15:05, 17.83it/s]

Iteration 31000, loss = 6.2414


 68%|███████████████████████████████████████████████████▌                        | 32001/47154 [41:09<28:34,  8.84it/s]

Iteration 32000, loss = 6.0715


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:25<15:20, 15.38it/s]

Iteration 33000, loss = 6.9089


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:43<14:58, 14.64it/s]

Iteration 34000, loss = 5.8603


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [45:00<16:32, 12.24it/s]

Iteration 35000, loss = 6.4053


 76%|██████████████████████████████████████████████████████████                  | 36000/47154 [46:14<09:50, 18.90it/s]

Iteration 36000, loss = 6.4800


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:30<13:22, 12.64it/s]

Iteration 37000, loss = 5.8683


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:45<12:08, 12.56it/s]

Iteration 38000, loss = 5.3342


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:02<11:42, 11.60it/s]

Iteration 39000, loss = 6.5541


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [51:19<12:13,  9.75it/s]

Iteration 40000, loss = 6.0650


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:35<06:34, 15.61it/s]

Iteration 41000, loss = 6.3419


 89%|███████████████████████████████████████████████████████████████████▋        | 42006/47154 [53:50<04:09, 20.66it/s]

Iteration 42000, loss = 5.3774


 91%|█████████████████████████████████████████████████████████████████████▎      | 43001/47154 [55:07<05:32, 12.51it/s]

Iteration 43000, loss = 5.1745


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:25<03:34, 14.66it/s]

Iteration 44000, loss = 5.9559


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:43<02:04, 17.32it/s]

Iteration 45000, loss = 5.7756


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:00<01:20, 14.37it/s]

Iteration 46000, loss = 5.9445


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:17<00:09, 16.39it/s]

Iteration 47000, loss = 5.4067


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:28<00:00, 13.00it/s]


Checking accuracy score on validation set.

Accuracy: 545 / 83918 correct (0.65)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 15


  0%|                                                                              | 1/47154 [00:00<1:23:17,  9.43it/s]

Iteration 0, loss = 6.5389


  2%|█▋                                                                           | 1003/47154 [01:17<58:33, 13.14it/s]

Iteration 1000, loss = 5.4532


  4%|███▎                                                                         | 2003/47154 [02:32<52:13, 14.41it/s]

Iteration 2000, loss = 6.1732


  6%|████▉                                                                        | 3003/47154 [03:48<46:39, 15.77it/s]

Iteration 3000, loss = 5.8911


  8%|██████▌                                                                      | 4003/47154 [05:05<59:37, 12.06it/s]

Iteration 4000, loss = 5.9485


 11%|███████▉                                                                   | 5003/47154 [06:27<1:16:53,  9.14it/s]

Iteration 5000, loss = 4.5029


 13%|█████████▊                                                                   | 6004/47154 [07:40<49:54, 13.74it/s]

Iteration 6000, loss = 5.6427


 15%|███████████▍                                                                 | 7002/47154 [08:56<46:43, 14.32it/s]

Iteration 7000, loss = 5.4052


 17%|█████████████                                                                | 8004/47154 [10:11<42:57, 15.19it/s]

Iteration 8000, loss = 6.0038


 19%|██████████████▋                                                              | 9004/47154 [11:29<33:59, 18.70it/s]

Iteration 9000, loss = 4.9453


 21%|████████████████                                                            | 10003/47154 [12:43<49:03, 12.62it/s]

Iteration 10000, loss = 5.7075


 23%|█████████████████▋                                                          | 11003/47154 [14:04<47:41, 12.63it/s]

Iteration 11000, loss = 5.4132


 25%|███████████████████▎                                                        | 12003/47154 [15:16<46:23, 12.63it/s]

Iteration 12000, loss = 6.0015


 28%|████████████████████▉                                                       | 13003/47154 [16:35<35:45, 15.91it/s]

Iteration 13000, loss = 5.8124


 30%|██████████████████████▌                                                     | 14004/47154 [17:52<38:27, 14.37it/s]

Iteration 14000, loss = 6.2891


 32%|████████████████████████▏                                                   | 15003/47154 [19:06<39:35, 13.54it/s]

Iteration 15000, loss = 6.1930


 34%|█████████████████████████▊                                                  | 16004/47154 [20:22<30:22, 17.10it/s]

Iteration 16000, loss = 6.0673


 36%|███████████████████████████▍                                                | 17003/47154 [21:44<45:16, 11.10it/s]

Iteration 17000, loss = 5.4652


 38%|█████████████████████████████                                               | 18004/47154 [23:01<27:23, 17.74it/s]

Iteration 18000, loss = 5.8831


 40%|██████████████████████████████▋                                             | 19004/47154 [24:18<32:46, 14.32it/s]

Iteration 19000, loss = 5.4908


 42%|████████████████████████████████▏                                           | 20003/47154 [25:36<45:23,  9.97it/s]

Iteration 20000, loss = 5.6304


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:52<30:38, 14.23it/s]

Iteration 21000, loss = 4.8278


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:13<52:01,  8.06it/s]

Iteration 22000, loss = 5.5799


 49%|█████████████████████████████████████                                       | 23003/47154 [29:29<24:13, 16.62it/s]

Iteration 23000, loss = 6.8217


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:47<25:38, 15.05it/s]

Iteration 24000, loss = 5.2856


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:02<26:45, 13.80it/s]

Iteration 25000, loss = 7.0051


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:17<35:58,  9.80it/s]

Iteration 26000, loss = 6.7048


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:35<26:21, 12.74it/s]

Iteration 27000, loss = 4.9761


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:53<21:52, 14.59it/s]

Iteration 28000, loss = 5.1418


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:09<16:34, 18.24it/s]

Iteration 29000, loss = 5.1668


 64%|████████████████████████████████████████████████▎                           | 30005/47154 [38:29<22:03, 12.95it/s]

Iteration 30000, loss = 6.1788


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:47<22:50, 11.78it/s]

Iteration 31000, loss = 6.2863


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:05<19:04, 13.23it/s]

Iteration 32000, loss = 5.8657


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [42:20<13:11, 17.87it/s]

Iteration 33000, loss = 5.6021


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:37<11:41, 18.74it/s]

Iteration 34000, loss = 6.0796


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:53<15:07, 13.39it/s]

Iteration 35000, loss = 6.2670


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [46:10<13:59, 13.28it/s]

Iteration 36000, loss = 5.5322


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:24<14:27, 11.70it/s]

Iteration 37000, loss = 5.0499


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [48:44<10:32, 14.46it/s]

Iteration 38000, loss = 5.9145


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:01<10:20, 13.14it/s]

Iteration 39000, loss = 6.1711


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:18<07:15, 16.40it/s]

Iteration 40000, loss = 6.4239


 87%|██████████████████████████████████████████████████████████████████          | 41005/47154 [52:36<07:46, 13.19it/s]

Iteration 41000, loss = 5.9167


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:49<04:36, 18.61it/s]

Iteration 42000, loss = 5.9331


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [55:10<06:00, 11.50it/s]

Iteration 43000, loss = 6.2717


 93%|██████████████████████████████████████████████████████████████████████▉     | 43999/47154 [56:27<02:55, 18.02it/s]

Iteration 44000, loss = 6.5386


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:45<02:11, 16.31it/s]

Iteration 45000, loss = 6.1895


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:02<01:28, 13.07it/s]

Iteration 46000, loss = 5.4401


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:19<00:10, 14.29it/s]

Iteration 47000, loss = 6.1545


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:31<00:00, 12.99it/s]


Checking accuracy score on validation set.

Accuracy: 569 / 83918 correct (0.68)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 16


  0%|                                                                              | 1/47154 [00:00<2:44:14,  4.78it/s]

Iteration 0, loss = 4.7660


  2%|█▋                                                                           | 1005/47154 [01:17<50:51, 15.12it/s]

Iteration 1000, loss = 5.3036


  4%|███▎                                                                         | 2003/47154 [02:37<50:43, 14.84it/s]

Iteration 2000, loss = 5.9105


  6%|████▉                                                                        | 3002/47154 [03:53<47:06, 15.62it/s]

Iteration 3000, loss = 6.3455


  8%|██████▌                                                                      | 4002/47154 [05:12<47:17, 15.21it/s]

Iteration 4000, loss = 6.3468


 11%|████████▏                                                                    | 5003/47154 [06:27<43:16, 16.23it/s]

Iteration 5000, loss = 5.5421


 13%|█████████▊                                                                   | 6002/47154 [07:41<51:39, 13.28it/s]

Iteration 6000, loss = 5.8259


 15%|███████████▍                                                                 | 7002/47154 [08:59<39:23, 16.99it/s]

Iteration 7000, loss = 6.5060


 17%|█████████████                                                                | 8004/47154 [10:17<45:04, 14.48it/s]

Iteration 8000, loss = 6.2837


 19%|██████████████▋                                                              | 9004/47154 [11:30<40:02, 15.88it/s]

Iteration 9000, loss = 5.9976


 21%|████████████████                                                            | 10000/47154 [12:48<51:48, 11.95it/s]

Iteration 10000, loss = 4.7047


 23%|█████████████████▋                                                          | 11003/47154 [14:04<42:38, 14.13it/s]

Iteration 11000, loss = 5.9927


 25%|███████████████████▎                                                        | 12002/47154 [15:22<44:19, 13.22it/s]

Iteration 12000, loss = 5.7716


 28%|████████████████████▉                                                       | 13002/47154 [16:39<37:49, 15.05it/s]

Iteration 13000, loss = 5.8571


 30%|██████████████████████▌                                                     | 14002/47154 [17:57<26:46, 20.63it/s]

Iteration 14000, loss = 6.3670


 32%|████████████████████████▏                                                   | 15004/47154 [19:15<29:42, 18.03it/s]

Iteration 15000, loss = 5.7926


 34%|█████████████████████████▊                                                  | 16002/47154 [20:31<44:57, 11.55it/s]

Iteration 16000, loss = 4.9154


 36%|███████████████████████████▍                                                | 17001/47154 [21:47<42:30, 11.82it/s]

Iteration 17000, loss = 6.7653


 38%|█████████████████████████████                                               | 18003/47154 [23:03<38:08, 12.74it/s]

Iteration 18000, loss = 6.1372


 40%|██████████████████████████████▋                                             | 19004/47154 [24:20<31:20, 14.97it/s]

Iteration 19000, loss = 4.8658


 42%|████████████████████████████████▏                                           | 20002/47154 [25:39<39:42, 11.39it/s]

Iteration 20000, loss = 6.3236


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:54<44:34,  9.78it/s]

Iteration 21000, loss = 5.6070


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:09<26:38, 15.73it/s]

Iteration 22000, loss = 5.4987


 49%|█████████████████████████████████████                                       | 23001/47154 [29:28<23:45, 16.94it/s]

Iteration 23000, loss = 5.1442


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:47<36:55, 10.45it/s]

Iteration 24000, loss = 7.0780


 53%|████████████████████████████████████████▎                                   | 25004/47154 [32:08<22:00, 16.78it/s]

Iteration 25000, loss = 6.1093


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:26<20:13, 17.43it/s]

Iteration 26000, loss = 6.0698


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:40<29:59, 11.20it/s]

Iteration 27000, loss = 5.8725


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:58<20:10, 15.82it/s]

Iteration 28000, loss = 5.0205


 62%|██████████████████████████████████████████████▋                             | 29000/47154 [37:13<18:26, 16.41it/s]

Iteration 29000, loss = 5.7765


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:27<19:22, 14.75it/s]

Iteration 30000, loss = 5.0376


 66%|█████████████████████████████████████████████████▉                          | 30999/47154 [39:46<23:27, 11.48it/s]

Iteration 31000, loss = 5.9527


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:02<17:16, 14.62it/s]

Iteration 32000, loss = 6.3769


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:15<18:44, 12.58it/s]

Iteration 33000, loss = 5.2816


 72%|██████████████████████████████████████████████████████▊                     | 34001/47154 [43:31<22:51,  9.59it/s]

Iteration 34000, loss = 6.0649


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:50<12:46, 15.84it/s]

Iteration 35000, loss = 5.4189


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:09<12:41, 14.64it/s]

Iteration 36000, loss = 4.9854


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:27<19:13,  8.80it/s]

Iteration 37000, loss = 6.8412


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:48<16:56,  9.00it/s]

Iteration 38000, loss = 6.5635


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:03<09:24, 14.45it/s]

Iteration 39000, loss = 5.2152


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:20<07:53, 15.10it/s]

Iteration 40000, loss = 5.3492


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:37<07:23, 13.88it/s]

Iteration 41000, loss = 5.3526


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:53<06:52, 12.48it/s]

Iteration 42000, loss = 5.0930


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:08<05:31, 12.52it/s]

Iteration 43000, loss = 5.9316


 93%|██████████████████████████████████████████████████████████████████████▉     | 44000/47154 [56:22<03:29, 15.06it/s]

Iteration 44000, loss = 5.7627


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:40<02:19, 15.48it/s]

Iteration 45000, loss = 5.6960


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:57<02:28,  7.78it/s]

Iteration 46000, loss = 5.9733


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:14<00:09, 15.51it/s]

Iteration 47000, loss = 5.6928


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:24<00:00, 13.01it/s]


Checking accuracy score on validation set.

Accuracy: 505 / 83918 correct (0.60)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 17


  0%|                                                                              | 1/47154 [00:00<1:28:48,  8.85it/s]

Iteration 0, loss = 6.5108


  2%|█▋                                                                           | 1003/47154 [01:16<53:41, 14.33it/s]

Iteration 1000, loss = 5.7209


  4%|███▏                                                                       | 2001/47154 [02:33<1:00:20, 12.47it/s]

Iteration 2000, loss = 4.9146


  6%|████▊                                                                      | 2999/47154 [03:52<1:18:12,  9.41it/s]

Iteration 3000, loss = 5.7192


  8%|██████▌                                                                      | 4003/47154 [05:08<50:11, 14.33it/s]

Iteration 4000, loss = 6.1638


 11%|████████▏                                                                    | 5004/47154 [06:23<52:51, 13.29it/s]

Iteration 5000, loss = 5.1026


 13%|█████████▌                                                                 | 6002/47154 [07:44<1:05:50, 10.42it/s]

Iteration 6000, loss = 5.9048


 15%|███████████▍                                                                 | 7001/47154 [09:00<43:39, 15.33it/s]

Iteration 7000, loss = 6.0754


 17%|█████████████                                                                | 8003/47154 [10:23<45:20, 14.39it/s]

Iteration 8000, loss = 5.8843


 19%|██████████████▋                                                              | 9003/47154 [11:41<46:27, 13.69it/s]

Iteration 9000, loss = 5.8857


 21%|████████████████                                                            | 10003/47154 [12:59<57:12, 10.82it/s]

Iteration 10000, loss = 5.2370


 23%|█████████████████▋                                                          | 11004/47154 [14:18<49:18, 12.22it/s]

Iteration 11000, loss = 6.0393


 25%|███████████████████▎                                                        | 12003/47154 [15:36<39:03, 15.00it/s]

Iteration 12000, loss = 5.8378


 28%|████████████████████▉                                                       | 13003/47154 [16:54<39:01, 14.58it/s]

Iteration 13000, loss = 5.8654


 30%|██████████████████████▌                                                     | 14002/47154 [18:10<34:17, 16.11it/s]

Iteration 14000, loss = 5.5777


 32%|████████████████████████▏                                                   | 15003/47154 [19:27<38:43, 13.84it/s]

Iteration 15000, loss = 6.1188


 34%|█████████████████████████▊                                                  | 16004/47154 [20:41<31:59, 16.23it/s]

Iteration 16000, loss = 5.9932


 36%|███████████████████████████▍                                                | 17004/47154 [21:57<35:40, 14.09it/s]

Iteration 17000, loss = 5.4653


 38%|█████████████████████████████                                               | 18003/47154 [23:12<32:44, 14.84it/s]

Iteration 18000, loss = 5.8917


 40%|██████████████████████████████▌                                             | 19001/47154 [24:27<42:37, 11.01it/s]

Iteration 19000, loss = 5.2862


 42%|████████████████████████████████▏                                           | 20001/47154 [25:46<27:11, 16.64it/s]

Iteration 20000, loss = 5.6596


 45%|█████████████████████████████████▊                                          | 21004/47154 [27:00<26:26, 16.48it/s]

Iteration 21000, loss = 5.1853


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:19<30:52, 13.57it/s]

Iteration 22000, loss = 6.2047


 49%|█████████████████████████████████████                                       | 23003/47154 [29:36<25:21, 15.87it/s]

Iteration 23000, loss = 6.2445


 51%|██████████████████████████████████████▋                                     | 23999/47154 [30:51<25:54, 14.90it/s]

Iteration 24000, loss = 5.5296


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:07<24:54, 14.82it/s]

Iteration 25000, loss = 5.9769


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:25<19:16, 18.29it/s]

Iteration 26000, loss = 6.3811


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:42<24:52, 13.50it/s]

Iteration 27000, loss = 5.6684


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:59<30:03, 10.62it/s]

Iteration 28000, loss = 4.9995


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:15<18:57, 15.96it/s]

Iteration 29000, loss = 5.7122


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:31<21:56, 13.03it/s]

Iteration 30000, loss = 4.8689


 66%|█████████████████████████████████████████████████▉                          | 31005/47154 [39:49<19:04, 14.11it/s]

Iteration 31000, loss = 5.0697


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:04<17:42, 14.26it/s]

Iteration 32000, loss = 6.2709


 70%|█████████████████████████████████████████████████████▏                      | 33005/47154 [42:20<14:17, 16.49it/s]

Iteration 33000, loss = 6.3516


 72%|██████████████████████████████████████████████████████▊                     | 34005/47154 [43:38<14:00, 15.64it/s]

Iteration 34000, loss = 4.9593


 74%|████████████████████████████████████████████████████████▍                   | 35005/47154 [44:52<11:36, 17.43it/s]

Iteration 35000, loss = 6.2488


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:05<13:22, 13.90it/s]

Iteration 36000, loss = 5.6023


 78%|███████████████████████████████████████████████████████████▋                | 37001/47154 [47:27<12:53, 13.12it/s]

Iteration 37000, loss = 6.5312


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:49<15:38,  9.75it/s]

Iteration 38000, loss = 5.7215


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:04<10:12, 13.31it/s]

Iteration 39000, loss = 5.0994


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:18<08:11, 14.56it/s]

Iteration 40000, loss = 6.1398


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:34<08:28, 12.09it/s]

Iteration 41000, loss = 5.4790


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:54<06:51, 12.52it/s]

Iteration 42000, loss = 6.5542


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:11<07:23,  9.35it/s]

Iteration 43000, loss = 6.2041


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:26<03:43, 14.10it/s]

Iteration 44000, loss = 5.7600


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:45<03:06, 11.53it/s]

Iteration 45000, loss = 5.7089


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:01<01:18, 14.59it/s]

Iteration 46000, loss = 6.4739


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:15<00:08, 18.51it/s]

Iteration 47000, loss = 5.8548


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:28<00:00, 13.00it/s]


Checking accuracy score on validation set.

Accuracy: 545 / 83918 correct (0.65)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 18


  0%|                                                                              | 1/47154 [00:00<1:24:03,  9.35it/s]

Iteration 0, loss = 5.1585


  2%|█▌                                                                         | 1004/47154 [01:16<1:02:48, 12.25it/s]

Iteration 1000, loss = 6.1275


  4%|███▎                                                                         | 2003/47154 [02:32<58:43, 12.82it/s]

Iteration 2000, loss = 6.3884


  6%|████▊                                                                      | 3002/47154 [03:48<1:05:48, 11.18it/s]

Iteration 3000, loss = 4.6094


  8%|██████▎                                                                    | 4002/47154 [05:03<1:18:23,  9.18it/s]

Iteration 4000, loss = 5.0501


 11%|████████▏                                                                    | 5003/47154 [06:21<47:09, 14.90it/s]

Iteration 5000, loss = 5.6769


 13%|█████████▌                                                                 | 6003/47154 [07:34<1:04:48, 10.58it/s]

Iteration 6000, loss = 6.7298


 15%|███████████▍                                                                 | 7002/47154 [08:49<48:43, 13.73it/s]

Iteration 7000, loss = 6.4128


 17%|█████████████                                                                | 8002/47154 [10:06<51:28, 12.68it/s]

Iteration 8000, loss = 4.5304


 19%|██████████████▎                                                            | 9002/47154 [11:23<1:07:56,  9.36it/s]

Iteration 9000, loss = 4.5640


 21%|████████████████                                                            | 10001/47154 [12:41<56:25, 10.97it/s]

Iteration 10000, loss = 6.9329


 23%|█████████████████▋                                                          | 11001/47154 [13:59<34:01, 17.71it/s]

Iteration 11000, loss = 6.2339


 25%|███████████████████▎                                                        | 12002/47154 [15:16<41:25, 14.14it/s]

Iteration 12000, loss = 6.0342


 28%|████████████████████▉                                                       | 13004/47154 [16:32<34:44, 16.39it/s]

Iteration 13000, loss = 5.3262


 30%|██████████████████████▌                                                     | 14004/47154 [17:48<46:08, 11.97it/s]

Iteration 14000, loss = 5.5229


 32%|████████████████████████▏                                                   | 15002/47154 [19:07<41:20, 12.96it/s]

Iteration 15000, loss = 6.5860


 34%|█████████████████████████▊                                                  | 16003/47154 [20:22<29:15, 17.75it/s]

Iteration 16000, loss = 5.5280


 36%|███████████████████████████▍                                                | 17003/47154 [21:38<37:09, 13.52it/s]

Iteration 17000, loss = 6.5692


 38%|█████████████████████████████                                               | 18004/47154 [22:54<30:40, 15.84it/s]

Iteration 18000, loss = 5.9909


 40%|██████████████████████████████▌                                             | 19001/47154 [24:11<30:41, 15.29it/s]

Iteration 19000, loss = 6.2972


 42%|████████████████████████████████▏                                           | 20003/47154 [25:29<43:41, 10.36it/s]

Iteration 20000, loss = 6.3898


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:44<20:47, 20.96it/s]

Iteration 21000, loss = 4.8626


 47%|███████████████████████████████████▍                                        | 22001/47154 [28:03<29:16, 14.32it/s]

Iteration 22000, loss = 5.6121


 49%|█████████████████████████████████████                                       | 23002/47154 [29:20<27:25, 14.68it/s]

Iteration 23000, loss = 6.0041


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:39<29:49, 12.94it/s]

Iteration 24000, loss = 5.8395


 53%|████████████████████████████████████████▎                                   | 25002/47154 [31:55<43:13,  8.54it/s]

Iteration 25000, loss = 6.4624


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:14<29:02, 12.14it/s]

Iteration 26000, loss = 5.7785


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:31<19:43, 17.03it/s]

Iteration 27000, loss = 6.0593


 59%|█████████████████████████████████████████████▏                              | 28005/47154 [35:49<23:35, 13.53it/s]

Iteration 28000, loss = 6.0595


 62%|██████████████████████████████████████████████▋                             | 29000/47154 [37:06<20:25, 14.81it/s]

Iteration 29000, loss = 5.7780


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:22<18:05, 15.79it/s]

Iteration 30000, loss = 6.1896


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:32<15:09, 17.75it/s]

Iteration 31000, loss = 4.4773


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:48<17:31, 14.41it/s]

Iteration 32000, loss = 4.6367


 70%|█████████████████████████████████████████████████████▏                      | 33005/47154 [42:03<12:34, 18.75it/s]

Iteration 33000, loss = 5.7445


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:19<17:22, 12.61it/s]

Iteration 34000, loss = 6.3217


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:35<12:20, 16.40it/s]

Iteration 35000, loss = 5.1882


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [45:52<16:52, 11.01it/s]

Iteration 36000, loss = 6.3508


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:11<14:19, 11.81it/s]

Iteration 37000, loss = 5.0194


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:29<09:25, 16.18it/s]

Iteration 38000, loss = 6.9659


 83%|██████████████████████████████████████████████████████████████▊             | 39000/47154 [49:46<11:07, 12.22it/s]

Iteration 39000, loss = 5.1048


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:04<10:57, 10.87it/s]

Iteration 40000, loss = 6.2094


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:21<07:04, 14.48it/s]

Iteration 41000, loss = 6.4090


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:39<04:43, 18.15it/s]

Iteration 42000, loss = 5.9328


 91%|█████████████████████████████████████████████████████████████████████▎      | 43001/47154 [54:54<04:42, 14.70it/s]

Iteration 43000, loss = 4.8326


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:14<03:46, 13.94it/s]

Iteration 44000, loss = 5.7096


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:32<03:13, 11.14it/s]

Iteration 45000, loss = 5.7798


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:49<02:09,  8.92it/s]

Iteration 46000, loss = 6.4022


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:06<00:10, 14.58it/s]

Iteration 47000, loss = 6.8138


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:17<00:00, 13.03it/s]


Checking accuracy score on validation set.

Accuracy: 701 / 83918 correct (0.84)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 19


  0%|                                                                              | 1/47154 [00:00<1:31:08,  8.62it/s]

Iteration 0, loss = 6.3867


  2%|█▌                                                                         | 1002/47154 [01:15<1:09:44, 11.03it/s]

Iteration 1000, loss = 6.7842


  4%|███▎                                                                         | 2003/47154 [02:31<50:27, 14.91it/s]

Iteration 2000, loss = 5.8153


  6%|████▉                                                                        | 3003/47154 [03:46<50:50, 14.48it/s]

Iteration 3000, loss = 6.1194


  8%|██████▌                                                                      | 4002/47154 [05:02<51:54, 13.86it/s]

Iteration 4000, loss = 6.4901


 11%|███████▉                                                                   | 5001/47154 [06:18<1:01:18, 11.46it/s]

Iteration 5000, loss = 5.8013


 13%|█████████▊                                                                   | 6002/47154 [07:34<46:55, 14.62it/s]

Iteration 6000, loss = 5.7374


 15%|███████████▍                                                                 | 7004/47154 [08:51<58:33, 11.43it/s]

Iteration 7000, loss = 6.9386


 17%|█████████████                                                                | 8002/47154 [10:08<43:55, 14.85it/s]

Iteration 8000, loss = 6.5498


 19%|██████████████▋                                                              | 9004/47154 [11:27<39:30, 16.09it/s]

Iteration 9000, loss = 5.9495


 21%|████████████████                                                            | 10002/47154 [12:48<35:11, 17.59it/s]

Iteration 10000, loss = 5.9962


 23%|█████████████████▋                                                          | 11003/47154 [14:04<35:41, 16.88it/s]

Iteration 11000, loss = 6.1992


 25%|███████████████████▎                                                        | 12002/47154 [15:23<30:47, 19.02it/s]

Iteration 12000, loss = 5.4893


 28%|████████████████████▉                                                       | 13002/47154 [16:39<46:38, 12.20it/s]

Iteration 13000, loss = 5.9614


 30%|██████████████████████▌                                                     | 14001/47154 [17:55<35:41, 15.48it/s]

Iteration 14000, loss = 5.4454


 32%|████████████████████████▏                                                   | 15003/47154 [19:12<40:52, 13.11it/s]

Iteration 15000, loss = 6.1486


 34%|█████████████████████████▊                                                  | 16004/47154 [20:29<35:14, 14.73it/s]

Iteration 16000, loss = 6.1500


 36%|███████████████████████████▍                                                | 17003/47154 [21:47<25:56, 19.37it/s]

Iteration 17000, loss = 5.4393


 38%|█████████████████████████████                                               | 18001/47154 [23:05<46:20, 10.49it/s]

Iteration 18000, loss = 6.4421


 40%|██████████████████████████████▋                                             | 19002/47154 [24:21<46:08, 10.17it/s]

Iteration 19000, loss = 5.4574


 42%|████████████████████████████████▏                                           | 20003/47154 [25:38<49:47,  9.09it/s]

Iteration 20000, loss = 5.5485


 45%|█████████████████████████████████▊                                          | 21001/47154 [26:53<33:44, 12.92it/s]

Iteration 21000, loss = 7.0654


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:09<24:41, 16.98it/s]

Iteration 22000, loss = 5.7894


 49%|█████████████████████████████████████                                       | 23004/47154 [29:27<30:05, 13.38it/s]

Iteration 23000, loss = 4.8993


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:44<26:23, 14.62it/s]

Iteration 24000, loss = 6.3240


 53%|████████████████████████████████████████▎                                   | 25004/47154 [32:02<19:03, 19.37it/s]

Iteration 25000, loss = 5.3532


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:19<24:29, 14.39it/s]

Iteration 26000, loss = 6.6979


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:37<20:03, 16.74it/s]

Iteration 27000, loss = 4.7510


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:53<22:43, 14.05it/s]

Iteration 28000, loss = 5.9313


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:11<26:24, 11.46it/s]

Iteration 29000, loss = 5.6069


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:30<18:16, 15.64it/s]

Iteration 30000, loss = 6.3702


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:46<15:58, 16.84it/s]

Iteration 31000, loss = 6.0620


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:04<18:42, 13.50it/s]

Iteration 32000, loss = 5.2338


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:23<19:21, 12.18it/s]

Iteration 33000, loss = 6.8344


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:39<15:43, 13.94it/s]

Iteration 34000, loss = 5.4872


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:57<12:38, 16.03it/s]

Iteration 35000, loss = 5.2775


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:16<11:32, 16.10it/s]

Iteration 36000, loss = 6.0176


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:31<11:51, 14.28it/s]

Iteration 37000, loss = 5.7384


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:46<09:53, 15.42it/s]

Iteration 38000, loss = 5.7381


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:02<09:35, 14.17it/s]

Iteration 39000, loss = 6.0494


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:20<08:57, 13.31it/s]

Iteration 40000, loss = 5.6346


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:37<06:26, 15.90it/s]

Iteration 41000, loss = 5.5964


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:54<07:50, 10.96it/s]

Iteration 42000, loss = 7.0274


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:12<06:30, 10.64it/s]

Iteration 43000, loss = 6.6393


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:29<04:07, 12.72it/s]

Iteration 44000, loss = 5.2329


 95%|████████████████████████████████████████████████████████████████████████▌   | 45005/47154 [57:47<02:01, 17.73it/s]

Iteration 45000, loss = 5.9718


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46005/47154 [59:06<01:13, 15.68it/s]

Iteration 46000, loss = 5.7812


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:26<00:10, 14.57it/s]

Iteration 47000, loss = 6.8414


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:38<00:00, 12.96it/s]


Checking accuracy score on validation set.

Accuracy: 672 / 83918 correct (0.80)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 20


  0%|                                                                              | 1/47154 [00:00<1:31:09,  8.62it/s]

Iteration 0, loss = 5.7887


  2%|█▋                                                                           | 1004/47154 [01:16<40:32, 18.97it/s]

Iteration 1000, loss = 5.6949


  4%|███▏                                                                       | 2003/47154 [02:36<1:06:58, 11.24it/s]

Iteration 2000, loss = 5.9905


  6%|████▉                                                                        | 3003/47154 [03:54<55:24, 13.28it/s]

Iteration 3000, loss = 6.7048


  8%|██████▌                                                                      | 4004/47154 [05:11<50:44, 14.17it/s]

Iteration 4000, loss = 7.0208


 11%|████████▏                                                                    | 5002/47154 [06:31<48:58, 14.34it/s]

Iteration 5000, loss = 5.9385


 13%|█████████▊                                                                   | 6003/47154 [07:51<37:53, 18.10it/s]

Iteration 6000, loss = 6.3515


 15%|███████████▍                                                                 | 7000/47154 [09:06<42:04, 15.91it/s]

Iteration 7000, loss = 6.3502


 17%|█████████████                                                                | 8004/47154 [10:22<37:56, 17.20it/s]

Iteration 8000, loss = 6.2738


 19%|██████████████▋                                                              | 9004/47154 [11:40<51:41, 12.30it/s]

Iteration 9000, loss = 6.4024


 21%|████████████████                                                            | 10002/47154 [12:57<50:25, 12.28it/s]

Iteration 10000, loss = 5.7027


 23%|█████████████████▋                                                          | 11002/47154 [14:17<40:16, 14.96it/s]

Iteration 11000, loss = 5.4763


 25%|███████████████████▎                                                        | 12002/47154 [15:36<35:45, 16.39it/s]

Iteration 12000, loss = 6.4816


 28%|████████████████████▉                                                       | 12999/47154 [16:51<33:24, 17.04it/s]

Iteration 13000, loss = 5.9223


 30%|██████████████████████▌                                                     | 14001/47154 [18:13<35:26, 15.59it/s]

Iteration 14000, loss = 5.2304


 32%|███████████████████████▌                                                  | 15001/47154 [19:32<1:01:30,  8.71it/s]

Iteration 15000, loss = 4.6647


 34%|█████████████████████████▊                                                  | 16002/47154 [20:49<48:13, 10.77it/s]

Iteration 16000, loss = 5.4177


 36%|███████████████████████████▍                                                | 17002/47154 [22:12<29:49, 16.85it/s]

Iteration 17000, loss = 6.5133


 38%|█████████████████████████████                                               | 18002/47154 [23:29<32:11, 15.09it/s]

Iteration 18000, loss = 5.6669


 40%|██████████████████████████████▋                                             | 19002/47154 [24:48<35:24, 13.25it/s]

Iteration 19000, loss = 5.5026


 42%|████████████████████████████████▏                                           | 20003/47154 [26:04<26:30, 17.08it/s]

Iteration 20000, loss = 4.9497


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:22<41:34, 10.48it/s]

Iteration 21000, loss = 6.0028


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:37<24:53, 16.84it/s]

Iteration 22000, loss = 6.2688


 49%|█████████████████████████████████████                                       | 23000/47154 [29:55<23:56, 16.81it/s]

Iteration 23000, loss = 6.3080


 51%|██████████████████████████████████████▋                                     | 24003/47154 [31:11<30:04, 12.83it/s]

Iteration 24000, loss = 6.3378


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:30<27:42, 13.32it/s]

Iteration 25000, loss = 5.9366


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:45<27:07, 13.00it/s]

Iteration 26000, loss = 5.5625


 57%|███████████████████████████████████████████▌                                | 27002/47154 [35:01<31:23, 10.70it/s]

Iteration 27000, loss = 5.2201


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:19<27:41, 11.53it/s]

Iteration 28000, loss = 5.8131


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:35<20:39, 14.64it/s]

Iteration 29000, loss = 5.4969


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:52<19:38, 14.56it/s]

Iteration 30000, loss = 4.7356


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [40:06<15:20, 17.54it/s]

Iteration 31000, loss = 5.7876


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:26<21:02, 12.00it/s]

Iteration 32000, loss = 5.9771


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [42:48<17:45, 13.28it/s]

Iteration 33000, loss = 6.0543


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [44:10<14:51, 14.75it/s]

Iteration 34000, loss = 6.3860


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [45:26<16:01, 12.64it/s]

Iteration 35000, loss = 6.6981


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [46:41<10:29, 17.70it/s]

Iteration 36000, loss = 5.7143


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [48:01<14:25, 11.73it/s]

Iteration 37000, loss = 6.4595


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [49:17<10:51, 14.05it/s]

Iteration 38000, loss = 5.3360


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:36<11:23, 11.92it/s]

Iteration 39000, loss = 5.3031


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:52<09:51, 12.09it/s]

Iteration 40000, loss = 6.1087


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [53:09<07:41, 13.34it/s]

Iteration 41000, loss = 6.1565


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [54:30<06:58, 12.30it/s]

Iteration 42000, loss = 6.0949


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:50<03:54, 17.70it/s]

Iteration 43000, loss = 5.4719


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [57:11<03:57, 13.29it/s]

Iteration 44000, loss = 6.8328


 95%|████████████████████████████████████████████████████████████████████████▌   | 45001/47154 [58:31<02:44, 13.10it/s]

Iteration 45000, loss = 6.4674


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46000/47154 [59:52<01:25, 13.42it/s]

Iteration 46000, loss = 5.6300


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:01:12<00:09, 15.46it/s]

Iteration 47000, loss = 6.4101


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:24<00:00, 12.80it/s]


Checking accuracy score on validation set.

Accuracy: 1192 / 83918 correct (1.42)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 21


  0%|                                                                              | 1/47154 [00:00<1:41:22,  7.75it/s]

Iteration 0, loss = 5.9521


  2%|█▋                                                                           | 1002/47154 [01:21<44:45, 17.18it/s]

Iteration 1000, loss = 6.7263


  4%|███▎                                                                         | 2005/47154 [02:37<46:46, 16.08it/s]

Iteration 2000, loss = 5.4200


  6%|████▉                                                                        | 3004/47154 [03:57<44:36, 16.49it/s]

Iteration 3000, loss = 6.0729


  8%|██████▌                                                                      | 4002/47154 [05:13<38:21, 18.75it/s]

Iteration 4000, loss = 6.2573


 11%|████████▏                                                                    | 5004/47154 [06:29<45:40, 15.38it/s]

Iteration 5000, loss = 6.2385


 13%|█████████▊                                                                   | 6003/47154 [07:45<46:00, 14.91it/s]

Iteration 6000, loss = 5.6480


 15%|███████████▍                                                                 | 7002/47154 [08:56<40:55, 16.35it/s]

Iteration 7000, loss = 5.8486


 17%|█████████████                                                                | 8004/47154 [10:14<43:26, 15.02it/s]

Iteration 8000, loss = 5.2439


 19%|██████████████▋                                                              | 9001/47154 [11:28<41:47, 15.22it/s]

Iteration 9000, loss = 6.1232


 21%|████████████████▏                                                           | 10005/47154 [12:42<48:51, 12.67it/s]

Iteration 10000, loss = 5.8463


 23%|█████████████████▋                                                          | 11003/47154 [14:01<50:09, 12.01it/s]

Iteration 11000, loss = 6.3946


 25%|███████████████████▎                                                        | 12002/47154 [15:19<47:48, 12.26it/s]

Iteration 12000, loss = 5.4119


 28%|████████████████████▉                                                       | 13004/47154 [16:35<38:36, 14.74it/s]

Iteration 13000, loss = 5.1685


 30%|██████████████████████▌                                                     | 14001/47154 [17:50<44:30, 12.42it/s]

Iteration 14000, loss = 6.3385


 32%|████████████████████████▏                                                   | 15003/47154 [19:07<38:56, 13.76it/s]

Iteration 15000, loss = 5.6741


 34%|█████████████████████████▊                                                  | 16003/47154 [20:24<35:44, 14.52it/s]

Iteration 16000, loss = 6.0161


 36%|███████████████████████████▍                                                | 17002/47154 [21:43<39:22, 12.76it/s]

Iteration 17000, loss = 5.9670


 38%|█████████████████████████████                                               | 18003/47154 [23:00<29:55, 16.23it/s]

Iteration 18000, loss = 4.9099


 40%|██████████████████████████████▋                                             | 19003/47154 [24:16<34:05, 13.76it/s]

Iteration 19000, loss = 6.2092


 42%|████████████████████████████████▏                                           | 20002/47154 [25:28<26:48, 16.88it/s]

Iteration 20000, loss = 5.6868


 45%|█████████████████████████████████▊                                          | 21005/47154 [26:47<30:12, 14.43it/s]

Iteration 21000, loss = 6.7922


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:07<27:27, 15.26it/s]

Iteration 22000, loss = 4.6235


 49%|█████████████████████████████████████                                       | 23004/47154 [29:21<26:27, 15.22it/s]

Iteration 23000, loss = 5.1433


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:39<33:13, 11.61it/s]

Iteration 24000, loss = 6.1953


 53%|████████████████████████████████████████▎                                   | 25002/47154 [31:54<24:09, 15.28it/s]

Iteration 25000, loss = 6.2798


 55%|█████████████████████████████████████████▉                                  | 26001/47154 [33:11<21:50, 16.14it/s]

Iteration 26000, loss = 5.8253


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:30<19:16, 17.43it/s]

Iteration 27000, loss = 5.3530


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:47<18:51, 16.92it/s]

Iteration 28000, loss = 6.6967


 62%|██████████████████████████████████████████████▋                             | 29005/47154 [37:02<17:18, 17.47it/s]

Iteration 29000, loss = 6.5304


 64%|████████████████████████████████████████████████▎                           | 30005/47154 [38:19<14:51, 19.23it/s]

Iteration 30000, loss = 5.1639


 66%|█████████████████████████████████████████████████▉                          | 31005/47154 [39:35<16:09, 16.66it/s]

Iteration 31000, loss = 5.6387


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:51<17:08, 14.73it/s]

Iteration 32000, loss = 5.4849


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:06<21:34, 10.93it/s]

Iteration 33000, loss = 6.4584


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:21<18:30, 11.84it/s]

Iteration 34000, loss = 6.7277


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:36<13:31, 14.97it/s]

Iteration 35000, loss = 5.3027


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [45:52<16:36, 11.19it/s]

Iteration 36000, loss = 5.9385


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:07<10:50, 15.60it/s]

Iteration 37000, loss = 5.5314


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:23<15:05, 10.11it/s]

Iteration 38000, loss = 6.6988


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [49:40<09:57, 13.63it/s]

Iteration 39000, loss = 5.3982


 85%|████████████████████████████████████████████████████████████████▍           | 40005/47154 [50:57<09:03, 13.16it/s]

Iteration 40000, loss = 5.9736


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:16<07:11, 14.25it/s]

Iteration 41000, loss = 5.9884


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:33<05:31, 15.52it/s]

Iteration 42000, loss = 5.3418


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [54:48<05:05, 13.57it/s]

Iteration 43000, loss = 6.8931


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:05<05:02, 10.41it/s]

Iteration 44000, loss = 5.0019


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:22<03:17, 10.92it/s]

Iteration 45000, loss = 6.2055


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46000/47154 [58:39<01:40, 11.46it/s]

Iteration 46000, loss = 6.2298


100%|███████████████████████████████████████████████████████████████████████████▊| 47001/47154 [59:58<00:08, 17.23it/s]

Iteration 47000, loss = 5.3821


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:10<00:00, 13.06it/s]


Checking accuracy score on validation set.

Accuracy: 1192 / 83918 correct (1.42)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 22


  0%|                                                                              | 1/47154 [00:00<1:20:56,  9.71it/s]

Iteration 0, loss = 5.9295


  2%|█▋                                                                           | 1004/47154 [01:19<51:42, 14.88it/s]

Iteration 1000, loss = 5.9547


  4%|███▎                                                                         | 2002/47154 [02:37<50:57, 14.77it/s]

Iteration 2000, loss = 6.0359


  6%|████▉                                                                        | 3004/47154 [03:55<47:26, 15.51it/s]

Iteration 3000, loss = 6.4171


  8%|██████▌                                                                      | 4003/47154 [05:14<54:20, 13.24it/s]

Iteration 4000, loss = 6.3437


 11%|████████▏                                                                    | 5005/47154 [06:31<41:04, 17.10it/s]

Iteration 5000, loss = 4.9550


 13%|█████████▊                                                                   | 6005/47154 [07:46<48:54, 14.02it/s]

Iteration 6000, loss = 5.7534


 15%|███████████▏                                                               | 7001/47154 [09:01<1:00:24, 11.08it/s]

Iteration 7000, loss = 6.3019


 17%|█████████████                                                                | 8004/47154 [10:17<42:47, 15.25it/s]

Iteration 8000, loss = 5.1423


 19%|██████████████▋                                                              | 9003/47154 [11:37<33:39, 18.89it/s]

Iteration 9000, loss = 5.6197


 21%|████████████████                                                            | 10004/47154 [12:54<42:32, 14.55it/s]

Iteration 10000, loss = 6.3764


 23%|█████████████████▋                                                          | 11003/47154 [14:11<33:10, 18.17it/s]

Iteration 11000, loss = 6.4356


 25%|███████████████████▎                                                        | 12003/47154 [15:26<31:20, 18.69it/s]

Iteration 12000, loss = 5.8877


 28%|████████████████████▉                                                       | 13002/47154 [16:41<55:21, 10.28it/s]

Iteration 13000, loss = 6.4810


 30%|██████████████████████▌                                                     | 14003/47154 [18:02<41:49, 13.21it/s]

Iteration 14000, loss = 6.0658


 32%|████████████████████████▏                                                   | 15002/47154 [19:19<52:06, 10.28it/s]

Iteration 15000, loss = 5.7942


 34%|█████████████████████████▊                                                  | 16002/47154 [20:35<47:48, 10.86it/s]

Iteration 16000, loss = 6.8346


 36%|███████████████████████████▍                                                | 17003/47154 [21:54<34:05, 14.74it/s]

Iteration 17000, loss = 5.4479


 38%|█████████████████████████████                                               | 18002/47154 [23:09<38:43, 12.54it/s]

Iteration 18000, loss = 5.0253


 40%|██████████████████████████████▋                                             | 19004/47154 [24:30<28:15, 16.60it/s]

Iteration 19000, loss = 6.2245


 42%|████████████████████████████████▏                                           | 20003/47154 [25:46<28:55, 15.65it/s]

Iteration 20000, loss = 5.5874


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:01<28:21, 15.37it/s]

Iteration 21000, loss = 5.5871


 47%|███████████████████████████████████▍                                        | 22001/47154 [28:16<26:02, 16.10it/s]

Iteration 22000, loss = 5.8674


 49%|█████████████████████████████████████                                       | 23001/47154 [29:34<28:49, 13.96it/s]

Iteration 23000, loss = 6.2312


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:51<28:42, 13.44it/s]

Iteration 24000, loss = 6.4424


 53%|████████████████████████████████████████▎                                   | 25005/47154 [32:06<22:30, 16.41it/s]

Iteration 25000, loss = 5.4662


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:21<29:57, 11.77it/s]

Iteration 26000, loss = 6.8995


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:39<20:15, 16.58it/s]

Iteration 27000, loss = 5.1035


 59%|█████████████████████████████████████████████▏                              | 28000/47154 [35:55<20:30, 15.57it/s]

Iteration 28000, loss = 4.8111


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:14<18:33, 16.30it/s]

Iteration 29000, loss = 5.1495


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:33<25:06, 11.38it/s]

Iteration 30000, loss = 6.1724


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:49<19:02, 14.14it/s]

Iteration 31000, loss = 6.4638


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:05<21:05, 11.98it/s]

Iteration 32000, loss = 6.5757


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:19<15:31, 15.19it/s]

Iteration 33000, loss = 6.0864


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:37<15:20, 14.29it/s]

Iteration 34000, loss = 6.1754


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:55<11:49, 17.14it/s]

Iteration 35000, loss = 6.5083


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [46:17<17:50, 10.42it/s]

Iteration 36000, loss = 5.8403


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:32<11:50, 14.28it/s]

Iteration 37000, loss = 5.6945


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:46<09:51, 15.47it/s]

Iteration 38000, loss = 6.1072


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:00<07:09, 19.00it/s]

Iteration 39000, loss = 5.7261


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:15<08:11, 14.56it/s]

Iteration 40000, loss = 6.6608


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:33<06:49, 15.04it/s]

Iteration 41000, loss = 6.7207


 89%|███████████████████████████████████████████████████████████████████▋        | 42005/47154 [53:49<07:14, 11.86it/s]

Iteration 42000, loss = 6.2652


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [55:02<05:36, 12.33it/s]

Iteration 43000, loss = 6.2797


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:20<03:09, 16.65it/s]

Iteration 44000, loss = 4.9052


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:33<02:29, 14.42it/s]

Iteration 45000, loss = 5.6384


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:49<00:57, 19.92it/s]

Iteration 46000, loss = 6.3361


100%|█████████████████████████████████████████████████████████████████████████▊| 47001/47154 [1:00:07<00:14, 10.36it/s]

Iteration 47000, loss = 5.5856


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:20<00:00, 13.03it/s]


Checking accuracy score on validation set.

Accuracy: 784 / 83918 correct (0.93)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 23


  0%|                                                                              | 1/47154 [00:00<2:00:14,  6.54it/s]

Iteration 0, loss = 5.7547


  2%|█▋                                                                           | 1003/47154 [01:14<51:16, 15.00it/s]

Iteration 1000, loss = 5.4833


  4%|███▎                                                                         | 2000/47154 [02:29<57:22, 13.12it/s]

Iteration 2000, loss = 4.5929


  6%|████▉                                                                        | 3004/47154 [03:46<49:38, 14.82it/s]

Iteration 3000, loss = 5.9700


  8%|██████▌                                                                      | 4004/47154 [05:01<44:00, 16.34it/s]

Iteration 4000, loss = 6.2937


 11%|████████▏                                                                    | 5004/47154 [06:19<48:10, 14.58it/s]

Iteration 5000, loss = 6.1116


 13%|█████████▊                                                                   | 6001/47154 [07:37<44:23, 15.45it/s]

Iteration 6000, loss = 6.3308


 15%|███████████▏                                                               | 7002/47154 [08:52<1:09:57,  9.56it/s]

Iteration 7000, loss = 5.2666


 17%|█████████████                                                                | 8003/47154 [10:09<51:27, 12.68it/s]

Iteration 8000, loss = 5.5444


 19%|██████████████▋                                                              | 9002/47154 [11:27<53:36, 11.86it/s]

Iteration 9000, loss = 4.9563


 21%|████████████████                                                            | 10003/47154 [12:43<50:54, 12.16it/s]

Iteration 10000, loss = 5.7631


 23%|█████████████████▋                                                          | 11003/47154 [13:59<43:09, 13.96it/s]

Iteration 11000, loss = 6.5250


 25%|███████████████████▎                                                        | 12002/47154 [15:12<49:34, 11.82it/s]

Iteration 12000, loss = 6.1348


 28%|████████████████████▉                                                       | 13002/47154 [16:32<35:36, 15.98it/s]

Iteration 13000, loss = 5.2702


 30%|██████████████████████▌                                                     | 14002/47154 [17:49<37:30, 14.73it/s]

Iteration 14000, loss = 5.8603


 32%|████████████████████████▏                                                   | 15002/47154 [19:08<43:13, 12.40it/s]

Iteration 15000, loss = 6.4954


 34%|█████████████████████████▊                                                  | 16001/47154 [20:22<25:33, 20.31it/s]

Iteration 16000, loss = 5.6102


 36%|███████████████████████████▍                                                | 17002/47154 [21:36<33:52, 14.84it/s]

Iteration 17000, loss = 5.7019


 38%|█████████████████████████████                                               | 18001/47154 [22:53<36:25, 13.34it/s]

Iteration 18000, loss = 6.2999


 40%|██████████████████████████████▋                                             | 19002/47154 [24:08<55:52,  8.40it/s]

Iteration 19000, loss = 5.7072


 42%|████████████████████████████████▏                                           | 20004/47154 [25:24<31:52, 14.19it/s]

Iteration 20000, loss = 5.5908


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:38<34:27, 12.65it/s]

Iteration 21000, loss = 6.0912


 47%|███████████████████████████████████▍                                        | 22003/47154 [27:54<36:35, 11.45it/s]

Iteration 22000, loss = 5.6031


 49%|█████████████████████████████████████                                       | 23001/47154 [29:10<30:09, 13.35it/s]

Iteration 23000, loss = 5.7458


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:28<35:03, 11.00it/s]

Iteration 24000, loss = 4.7124


 53%|████████████████████████████████████████▎                                   | 25003/47154 [31:47<24:08, 15.30it/s]

Iteration 25000, loss = 6.4456


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:04<25:18, 13.93it/s]

Iteration 26000, loss = 6.4573


 57%|███████████████████████████████████████████▌                                | 27005/47154 [34:20<20:44, 16.18it/s]

Iteration 27000, loss = 4.7811


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:37<28:12, 11.31it/s]

Iteration 28000, loss = 4.8974


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [36:57<24:24, 12.40it/s]

Iteration 29000, loss = 6.1825


 64%|████████████████████████████████████████████████▎                           | 29999/47154 [38:14<18:24, 15.53it/s]

Iteration 30000, loss = 5.5382


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:31<16:22, 16.44it/s]

Iteration 31000, loss = 6.4722


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:49<20:32, 12.30it/s]

Iteration 32000, loss = 5.6838


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:06<14:47, 15.94it/s]

Iteration 33000, loss = 5.5076


 72%|██████████████████████████████████████████████████████▊                     | 34001/47154 [43:23<18:37, 11.77it/s]

Iteration 34000, loss = 5.7773


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:42<17:32, 11.54it/s]

Iteration 35000, loss = 5.0741


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [45:59<16:46, 11.08it/s]

Iteration 36000, loss = 5.8863


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:16<12:18, 13.74it/s]

Iteration 37000, loss = 5.8651


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:35<11:26, 13.32it/s]

Iteration 38000, loss = 5.5718


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:50<07:36, 17.86it/s]

Iteration 39000, loss = 4.9713


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:04<10:06, 11.80it/s]

Iteration 40000, loss = 6.3757


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:22<06:13, 16.47it/s]

Iteration 41000, loss = 6.3208


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:39<07:05, 12.10it/s]

Iteration 42000, loss = 6.4165


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [54:56<04:24, 15.71it/s]

Iteration 43000, loss = 5.6857


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:16<04:14, 12.37it/s]

Iteration 44000, loss = 5.5326


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [57:35<03:10, 11.28it/s]

Iteration 45000, loss = 6.1063


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:50<02:09,  8.89it/s]

Iteration 46000, loss = 5.2768


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:06<00:10, 15.20it/s]

Iteration 47000, loss = 6.4250


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:17<00:00, 13.04it/s]


Checking accuracy score on validation set.

Accuracy: 811 / 83918 correct (0.97)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 24


  0%|                                                                                | 2/47154 [00:00<56:58, 13.79it/s]

Iteration 0, loss = 5.3204


  2%|█▌                                                                         | 1003/47154 [01:15<1:08:45, 11.19it/s]

Iteration 1000, loss = 6.6976


  4%|███▎                                                                         | 2004/47154 [02:33<51:19, 14.66it/s]

Iteration 2000, loss = 5.9594


  6%|████▉                                                                        | 3004/47154 [03:47<54:18, 13.55it/s]

Iteration 3000, loss = 5.8350


  8%|██████▌                                                                      | 4002/47154 [05:05<45:27, 15.82it/s]

Iteration 4000, loss = 5.6583


 11%|████████▏                                                                    | 5001/47154 [06:23<54:32, 12.88it/s]

Iteration 5000, loss = 5.5095


 13%|█████████▊                                                                   | 6002/47154 [07:36<39:26, 17.39it/s]

Iteration 6000, loss = 6.0197


 15%|███████████▍                                                                 | 7002/47154 [08:51<45:12, 14.80it/s]

Iteration 7000, loss = 5.6265


 17%|█████████████                                                                | 8004/47154 [10:07<40:09, 16.25it/s]

Iteration 8000, loss = 5.6626


 19%|██████████████▋                                                              | 9002/47154 [11:25<59:36, 10.67it/s]

Iteration 9000, loss = 6.2837


 21%|████████████████                                                            | 10004/47154 [12:40<58:06, 10.66it/s]

Iteration 10000, loss = 6.2639


 23%|█████████████████▋                                                          | 11003/47154 [13:56<54:47, 11.00it/s]

Iteration 11000, loss = 4.8625


 25%|███████████████████▎                                                        | 12004/47154 [15:13<41:35, 14.09it/s]

Iteration 12000, loss = 5.7099


 28%|████████████████████▍                                                     | 13003/47154 [16:29<1:00:57,  9.34it/s]

Iteration 13000, loss = 5.8457


 30%|██████████████████████▌                                                     | 14002/47154 [17:44<41:58, 13.16it/s]

Iteration 14000, loss = 6.3590


 32%|████████████████████████▏                                                   | 15005/47154 [19:02<30:36, 17.51it/s]

Iteration 15000, loss = 6.5607


 34%|█████████████████████████▊                                                  | 16000/47154 [20:17<46:03, 11.27it/s]

Iteration 16000, loss = 5.2350


 36%|███████████████████████████▍                                                | 17003/47154 [21:33<38:37, 13.01it/s]

Iteration 17000, loss = 6.0522


 38%|█████████████████████████████                                               | 18004/47154 [22:50<34:14, 14.19it/s]

Iteration 18000, loss = 5.9447


 40%|██████████████████████████████▋                                             | 19004/47154 [24:08<34:40, 13.53it/s]

Iteration 19000, loss = 5.7808


 42%|████████████████████████████████▏                                           | 20003/47154 [25:21<36:49, 12.29it/s]

Iteration 20000, loss = 5.3639


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:42<37:12, 11.71it/s]

Iteration 21000, loss = 6.3780


 47%|███████████████████████████████████▍                                        | 22004/47154 [27:59<32:51, 12.76it/s]

Iteration 22000, loss = 5.8032


 49%|█████████████████████████████████████                                       | 23002/47154 [29:14<27:15, 14.76it/s]

Iteration 23000, loss = 5.7802


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:32<29:33, 13.05it/s]

Iteration 24000, loss = 5.4853


 53%|████████████████████████████████████████▎                                   | 25004/47154 [31:49<28:26, 12.98it/s]

Iteration 25000, loss = 5.2281


 55%|█████████████████████████████████████████▉                                  | 26005/47154 [33:05<23:11, 15.20it/s]

Iteration 26000, loss = 5.6589


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:23<21:33, 15.58it/s]

Iteration 27000, loss = 6.2312


 59%|█████████████████████████████████████████████▏                              | 28000/47154 [35:41<24:13, 13.17it/s]

Iteration 28000, loss = 5.6873


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [36:57<17:20, 17.44it/s]

Iteration 29000, loss = 5.0644


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:14<19:52, 14.39it/s]

Iteration 30000, loss = 5.3454


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:30<22:34, 11.92it/s]

Iteration 31000, loss = 6.7575


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:49<14:13, 17.75it/s]

Iteration 32000, loss = 6.0894


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:04<15:47, 14.94it/s]

Iteration 33000, loss = 5.7965


 72%|██████████████████████████████████████████████████████▊                     | 34000/47154 [43:21<17:54, 12.24it/s]

Iteration 34000, loss = 5.4783


 74%|████████████████████████████████████████████████████████▍                   | 35001/47154 [44:41<16:22, 12.37it/s]

Iteration 35000, loss = 5.1039


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [45:59<10:53, 17.07it/s]

Iteration 36000, loss = 5.2324


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:15<13:06, 12.90it/s]

Iteration 37000, loss = 5.9452


 81%|█████████████████████████████████████████████████████████████▎              | 38005/47154 [48:32<10:42, 14.24it/s]

Iteration 38000, loss = 6.6375


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [49:52<07:15, 18.72it/s]

Iteration 39000, loss = 5.7724


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:07<07:49, 15.22it/s]

Iteration 40000, loss = 5.1915


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:24<05:55, 17.30it/s]

Iteration 41000, loss = 5.3377


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:41<05:23, 15.91it/s]

Iteration 42000, loss = 6.5151


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [54:56<04:17, 16.13it/s]

Iteration 43000, loss = 6.2018


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:14<05:45,  9.12it/s]

Iteration 44000, loss = 6.6774


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:34<01:50, 19.40it/s]

Iteration 45000, loss = 6.0943


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:51<01:46, 10.86it/s]

Iteration 46000, loss = 6.4562


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:07<00:10, 13.89it/s]

Iteration 47000, loss = 5.9716


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:18<00:00, 13.03it/s]


Checking accuracy score on validation set.

Accuracy: 364 / 83918 correct (0.43)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.00
Training model 2, epoch 25


  0%|                                                                              | 1/47154 [00:00<1:28:47,  8.85it/s]

Iteration 0, loss = 5.9189


  2%|█▋                                                                           | 1004/47154 [01:15<44:43, 17.20it/s]

Iteration 1000, loss = 6.4706


  4%|███▎                                                                         | 2003/47154 [02:31<46:44, 16.10it/s]

Iteration 2000, loss = 5.5404


  6%|████▉                                                                        | 3004/47154 [03:50<53:07, 13.85it/s]

Iteration 3000, loss = 6.3222


  8%|██████▌                                                                      | 4003/47154 [05:11<50:24, 14.27it/s]

Iteration 4000, loss = 5.8874


 11%|████████▏                                                                    | 5004/47154 [06:24<42:22, 16.58it/s]

Iteration 5000, loss = 6.5519


 13%|█████████▊                                                                   | 6000/47154 [07:38<57:04, 12.02it/s]

Iteration 6000, loss = 5.7164


 15%|███████████▍                                                                 | 7004/47154 [08:57<46:49, 14.29it/s]

Iteration 7000, loss = 6.6358


 17%|█████████████                                                                | 8003/47154 [10:13<43:34, 14.98it/s]

Iteration 8000, loss = 5.8802


 19%|██████████████▋                                                              | 9002/47154 [11:29<43:03, 14.77it/s]

Iteration 9000, loss = 5.1402


 21%|████████████████                                                            | 10003/47154 [12:45<37:05, 16.69it/s]

Iteration 10000, loss = 6.0720


 23%|█████████████████▋                                                          | 11001/47154 [14:00<37:53, 15.90it/s]

Iteration 11000, loss = 5.5370


 25%|███████████████████▎                                                        | 12004/47154 [15:16<49:05, 11.93it/s]

Iteration 12000, loss = 5.2376


 28%|████████████████████▉                                                       | 13002/47154 [16:36<40:24, 14.08it/s]

Iteration 13000, loss = 6.1033


 30%|██████████████████████▌                                                     | 14003/47154 [17:54<39:51, 13.86it/s]

Iteration 14000, loss = 5.1863


 32%|████████████████████████▏                                                   | 15002/47154 [19:09<35:38, 15.03it/s]

Iteration 15000, loss = 6.0561


 34%|█████████████████████████▊                                                  | 16000/47154 [20:21<34:19, 15.13it/s]

Iteration 16000, loss = 5.3994


 36%|███████████████████████████▍                                                | 17004/47154 [21:39<31:35, 15.91it/s]

Iteration 17000, loss = 6.4137


 38%|█████████████████████████████                                               | 18003/47154 [22:54<50:22,  9.65it/s]

Iteration 18000, loss = 4.9019


 40%|██████████████████████████████▋                                             | 19003/47154 [24:11<35:30, 13.21it/s]

Iteration 19000, loss = 5.0477


 42%|████████████████████████████████▏                                           | 20003/47154 [25:28<26:11, 17.27it/s]

Iteration 20000, loss = 5.7661


 45%|█████████████████████████████████▊                                          | 21001/47154 [26:48<29:19, 14.87it/s]

Iteration 21000, loss = 5.7102


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:05<31:07, 13.47it/s]

Iteration 22000, loss = 5.8380


 49%|█████████████████████████████████████                                       | 23002/47154 [29:20<31:10, 12.91it/s]

Iteration 23000, loss = 5.8041


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:37<25:44, 14.99it/s]

Iteration 24000, loss = 5.8982


 53%|████████████████████████████████████████▎                                   | 25004/47154 [31:55<39:00,  9.46it/s]

Iteration 25000, loss = 4.7578


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:13<27:44, 12.70it/s]

Iteration 26000, loss = 6.3350


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:34<27:27, 12.23it/s]

Iteration 27000, loss = 4.8669


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:52<23:10, 13.77it/s]

Iteration 28000, loss = 5.3644


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:13<26:00, 11.63it/s]

Iteration 29000, loss = 4.5301


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:32<23:16, 12.28it/s]

Iteration 30000, loss = 5.7413


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:51<24:35, 10.94it/s]

Iteration 31000, loss = 5.6431


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:14<15:15, 16.55it/s]

Iteration 32000, loss = 4.7625


 70%|█████████████████████████████████████████████████████▏                      | 33000/47154 [42:33<26:21,  8.95it/s]

Iteration 33000, loss = 5.3688


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:55<17:02, 12.86it/s]

Iteration 34000, loss = 5.9012


 74%|████████████████████████████████████████████████████████▍                   | 35001/47154 [45:14<14:19, 14.14it/s]

Iteration 35000, loss = 6.5588


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:34<15:21, 12.10it/s]

Iteration 36000, loss = 5.3531


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:50<12:23, 13.65it/s]

Iteration 37000, loss = 6.2378


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [49:09<13:22, 11.40it/s]

Iteration 38000, loss = 6.3023


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:27<08:15, 16.45it/s]

Iteration 39000, loss = 5.8552


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:46<06:56, 17.15it/s]

Iteration 40000, loss = 5.8870


 87%|██████████████████████████████████████████████████████████████████          | 41001/47154 [53:07<09:10, 11.17it/s]

Iteration 41000, loss = 6.2991


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:30<04:51, 17.67it/s]

Iteration 42000, loss = 6.0637


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:51<04:53, 14.13it/s]

Iteration 43000, loss = 6.6870


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [57:11<03:53, 13.50it/s]

Iteration 44000, loss = 6.4670


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [58:29<03:18, 10.81it/s]

Iteration 45000, loss = 4.8836


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:52<01:31, 12.57it/s]

Iteration 46000, loss = 5.7377


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:01:10<00:09, 16.26it/s]

Iteration 47000, loss = 5.8824


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:21<00:00, 12.81it/s]


Checking accuracy score on validation set.

Accuracy: 728 / 83918 correct (0.87)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 26


  0%|                                                                              | 1/47154 [00:00<1:29:34,  8.77it/s]

Iteration 0, loss = 5.2559


  2%|█▋                                                                           | 1001/47154 [01:16<53:39, 14.34it/s]

Iteration 1000, loss = 5.5007


  4%|███▎                                                                         | 2003/47154 [02:34<48:37, 15.48it/s]

Iteration 2000, loss = 5.6474


  6%|████▉                                                                        | 3002/47154 [03:51<51:59, 14.15it/s]

Iteration 3000, loss = 6.1522


  8%|██████▌                                                                      | 4004/47154 [05:08<49:39, 14.48it/s]

Iteration 4000, loss = 5.6815


 11%|████████▏                                                                    | 5003/47154 [06:23<50:02, 14.04it/s]

Iteration 5000, loss = 5.8580


 13%|█████████▊                                                                   | 6002/47154 [07:40<53:26, 12.83it/s]

Iteration 6000, loss = 5.3478


 15%|███████████▍                                                                 | 7002/47154 [08:59<40:44, 16.42it/s]

Iteration 7000, loss = 6.0403


 17%|█████████████                                                                | 8001/47154 [10:16<48:46, 13.38it/s]

Iteration 8000, loss = 5.1899


 19%|██████████████▋                                                              | 9001/47154 [11:36<35:54, 17.71it/s]

Iteration 9000, loss = 5.9759


 21%|███████████████▋                                                          | 10003/47154 [12:55<1:13:56,  8.37it/s]

Iteration 10000, loss = 6.6290


 23%|█████████████████▋                                                          | 11003/47154 [14:14<41:47, 14.42it/s]

Iteration 11000, loss = 5.9585


 25%|███████████████████▎                                                        | 12002/47154 [15:29<45:06, 12.99it/s]

Iteration 12000, loss = 5.8467


 28%|████████████████████▉                                                       | 13004/47154 [16:47<41:27, 13.73it/s]

Iteration 13000, loss = 5.0506


 30%|██████████████████████▌                                                     | 14003/47154 [18:05<43:50, 12.60it/s]

Iteration 14000, loss = 6.2028


 32%|████████████████████████▏                                                   | 15001/47154 [19:19<41:03, 13.05it/s]

Iteration 15000, loss = 6.3780


 34%|█████████████████████████▊                                                  | 16002/47154 [20:38<42:10, 12.31it/s]

Iteration 16000, loss = 6.4179


 36%|███████████████████████████▍                                                | 17003/47154 [21:53<31:46, 15.81it/s]

Iteration 17000, loss = 5.1246


 38%|█████████████████████████████                                               | 18003/47154 [23:12<29:23, 16.53it/s]

Iteration 18000, loss = 5.6410


 40%|██████████████████████████████▋                                             | 19003/47154 [24:30<29:10, 16.08it/s]

Iteration 19000, loss = 6.2056


 42%|████████████████████████████████▏                                           | 20004/47154 [25:47<29:41, 15.24it/s]

Iteration 20000, loss = 5.9969


 45%|█████████████████████████████████▊                                          | 21002/47154 [27:05<33:45, 12.91it/s]

Iteration 21000, loss = 5.2022


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:21<37:26, 11.19it/s]

Iteration 22000, loss = 5.0934


 49%|█████████████████████████████████████                                       | 23004/47154 [29:39<31:52, 12.63it/s]

Iteration 23000, loss = 5.8340


 51%|██████████████████████████████████████▋                                     | 24001/47154 [30:53<30:24, 12.69it/s]

Iteration 24000, loss = 5.7162


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:11<20:48, 17.75it/s]

Iteration 25000, loss = 6.8843


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:28<20:10, 17.48it/s]

Iteration 26000, loss = 5.5819


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:45<27:55, 12.03it/s]

Iteration 27000, loss = 5.0359


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:02<20:07, 15.86it/s]

Iteration 28000, loss = 5.2812


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:21<25:46, 11.74it/s]

Iteration 29000, loss = 6.0125


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:41<28:51,  9.90it/s]

Iteration 30000, loss = 5.8920


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:57<21:01, 12.80it/s]

Iteration 31000, loss = 5.4908


 68%|███████████████████████████████████████████████████▌                        | 32005/47154 [41:18<15:05, 16.72it/s]

Iteration 32000, loss = 5.5731


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:39<18:35, 12.69it/s]

Iteration 33000, loss = 5.9296


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:57<16:33, 13.24it/s]

Iteration 34000, loss = 6.8552


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:17<13:20, 15.17it/s]

Iteration 35000, loss = 6.2227


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:33<11:33, 16.07it/s]

Iteration 36000, loss = 5.8932


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:49<09:44, 17.38it/s]

Iteration 37000, loss = 6.1906


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [49:08<10:51, 14.06it/s]

Iteration 38000, loss = 6.4654


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:25<08:23, 16.18it/s]

Iteration 39000, loss = 5.3679


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:39<09:57, 11.96it/s]

Iteration 40000, loss = 5.6857


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:58<07:04, 14.51it/s]

Iteration 41000, loss = 5.4892


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:19<06:25, 13.35it/s]

Iteration 42000, loss = 5.2841


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:34<04:27, 15.51it/s]

Iteration 43000, loss = 5.0020


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:54<03:14, 16.18it/s]

Iteration 44000, loss = 5.0384


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [58:11<03:21, 10.66it/s]

Iteration 45000, loss = 6.4208


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:30<01:20, 14.26it/s]

Iteration 46000, loss = 5.8309


100%|█████████████████████████████████████████████████████████████████████████▊| 47001/47154 [1:00:48<00:08, 17.12it/s]

Iteration 47000, loss = 6.3751


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:00<00:00, 12.88it/s]


Checking accuracy score on validation set.

Accuracy: 1192 / 83918 correct (1.42)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 27


  0%|                                                                              | 1/47154 [00:00<1:25:39,  9.17it/s]

Iteration 0, loss = 5.1300


  2%|█▋                                                                           | 1005/47154 [01:16<45:46, 16.80it/s]

Iteration 1000, loss = 5.6111


  4%|███▎                                                                         | 2003/47154 [02:30<42:51, 17.56it/s]

Iteration 2000, loss = 5.7650


  6%|████▉                                                                        | 3005/47154 [03:46<45:30, 16.17it/s]

Iteration 3000, loss = 5.3155


  8%|██████▌                                                                      | 4003/47154 [05:03<49:53, 14.42it/s]

Iteration 4000, loss = 6.1732


 11%|████████▏                                                                    | 5006/47154 [06:18<38:11, 18.39it/s]

Iteration 5000, loss = 6.3134


 13%|█████████▊                                                                   | 6003/47154 [07:31<34:19, 19.99it/s]

Iteration 6000, loss = 6.0591


 15%|███████████▍                                                                 | 7002/47154 [08:48<41:43, 16.04it/s]

Iteration 7000, loss = 5.5730


 17%|█████████████                                                                | 8005/47154 [10:04<47:27, 13.75it/s]

Iteration 8000, loss = 6.3037


 19%|██████████████▋                                                              | 9003/47154 [11:20<38:43, 16.42it/s]

Iteration 9000, loss = 5.3821


 21%|████████████████                                                            | 10003/47154 [12:41<41:40, 14.86it/s]

Iteration 10000, loss = 5.0892


 23%|█████████████████▋                                                          | 11001/47154 [13:57<56:50, 10.60it/s]

Iteration 11000, loss = 6.1360


 25%|███████████████████▎                                                        | 12003/47154 [15:17<48:30, 12.08it/s]

Iteration 12000, loss = 5.3109


 28%|████████████████████▉                                                       | 13003/47154 [16:33<45:11, 12.60it/s]

Iteration 13000, loss = 5.3916


 30%|██████████████████████▌                                                     | 14003/47154 [17:47<36:35, 15.10it/s]

Iteration 14000, loss = 6.5866


 32%|████████████████████████▏                                                   | 15002/47154 [19:02<40:04, 13.37it/s]

Iteration 15000, loss = 5.5727


 34%|█████████████████████████▊                                                  | 16004/47154 [20:22<33:24, 15.54it/s]

Iteration 16000, loss = 5.8385


 36%|███████████████████████████▍                                                | 17003/47154 [21:39<29:51, 16.83it/s]

Iteration 17000, loss = 5.9452


 38%|█████████████████████████████                                               | 18004/47154 [22:54<46:36, 10.42it/s]

Iteration 18000, loss = 5.3667


 40%|██████████████████████████████▋                                             | 19002/47154 [24:11<25:55, 18.09it/s]

Iteration 19000, loss = 6.4505


 42%|████████████████████████████████▏                                           | 20002/47154 [25:26<51:57,  8.71it/s]

Iteration 20000, loss = 6.4454


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:43<25:12, 17.30it/s]

Iteration 21000, loss = 6.4031


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:01<45:40,  9.18it/s]

Iteration 22000, loss = 6.7720


 49%|█████████████████████████████████████                                       | 23003/47154 [29:16<29:21, 13.71it/s]

Iteration 23000, loss = 5.8514


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:33<26:58, 14.30it/s]

Iteration 24000, loss = 6.6987


 53%|████████████████████████████████████████▎                                   | 25002/47154 [31:49<27:13, 13.56it/s]

Iteration 25000, loss = 6.2348


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:04<21:04, 16.73it/s]

Iteration 26000, loss = 6.9416


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:19<20:55, 16.05it/s]

Iteration 27000, loss = 4.6913


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:35<24:50, 12.85it/s]

Iteration 28000, loss = 5.0681


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [36:51<19:48, 15.28it/s]

Iteration 29000, loss = 4.9406


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:09<23:41, 12.06it/s]

Iteration 30000, loss = 5.4899


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:23<24:54, 10.80it/s]

Iteration 31000, loss = 5.9318


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:41<14:35, 17.31it/s]

Iteration 32000, loss = 5.8562


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:01<14:02, 16.79it/s]

Iteration 33000, loss = 5.5569


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:18<13:16, 16.52it/s]

Iteration 34000, loss = 6.5940


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:34<21:27,  9.44it/s]

Iteration 35000, loss = 5.0284


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [45:53<14:10, 13.10it/s]

Iteration 36000, loss = 6.2301


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:06<13:04, 12.94it/s]

Iteration 37000, loss = 5.5627


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:22<12:30, 12.19it/s]

Iteration 38000, loss = 4.9564


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:37<13:47,  9.85it/s]

Iteration 39000, loss = 5.9316


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [50:57<08:11, 14.56it/s]

Iteration 40000, loss = 6.1897


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:14<07:11, 14.26it/s]

Iteration 41000, loss = 6.1853


 89%|███████████████████████████████████████████████████████████████████▋        | 42001/47154 [53:31<07:21, 11.67it/s]

Iteration 42000, loss = 4.7846


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [54:48<06:34, 10.51it/s]

Iteration 43000, loss = 5.3063


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:03<04:14, 12.39it/s]

Iteration 44000, loss = 6.2429


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:23<03:06, 11.51it/s]

Iteration 45000, loss = 5.9715


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:40<01:35, 12.09it/s]

Iteration 46000, loss = 6.2815


100%|███████████████████████████████████████████████████████████████████████████▊| 47002/47154 [59:57<00:08, 17.79it/s]

Iteration 47000, loss = 6.0111


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:09<00:00, 13.06it/s]


Checking accuracy score on validation set.

Accuracy: 811 / 83918 correct (0.97)
Log Loss score:	5.79
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 28


  0%|                                                                              | 1/47154 [00:00<1:51:36,  7.04it/s]

Iteration 0, loss = 5.4287


  2%|█▌                                                                         | 1005/47154 [01:19<1:21:59,  9.38it/s]

Iteration 1000, loss = 5.9295


  4%|███▎                                                                         | 2004/47154 [02:37<47:29, 15.84it/s]

Iteration 2000, loss = 6.9076


  6%|████▉                                                                        | 3004/47154 [03:51<40:09, 18.33it/s]

Iteration 3000, loss = 5.6637


  8%|██████▌                                                                      | 4003/47154 [05:11<55:26, 12.97it/s]

Iteration 4000, loss = 4.5609


 11%|████████▏                                                                    | 5004/47154 [06:26<57:24, 12.24it/s]

Iteration 5000, loss = 6.0897


 13%|█████████▊                                                                   | 6001/47154 [07:40<49:20, 13.90it/s]

Iteration 6000, loss = 5.2556


 15%|███████████▍                                                                 | 7003/47154 [08:59<40:29, 16.53it/s]

Iteration 7000, loss = 5.6387


 17%|█████████████                                                                | 8002/47154 [10:17<44:55, 14.52it/s]

Iteration 8000, loss = 6.0148


 19%|██████████████▋                                                              | 9003/47154 [11:36<57:16, 11.10it/s]

Iteration 9000, loss = 6.2873


 21%|████████████████                                                            | 10002/47154 [12:52<46:12, 13.40it/s]

Iteration 10000, loss = 5.7033


 23%|█████████████████▋                                                          | 11004/47154 [14:16<36:07, 16.68it/s]

Iteration 11000, loss = 5.7016


 25%|███████████████████▎                                                        | 12001/47154 [15:30<59:39,  9.82it/s]

Iteration 12000, loss = 5.6506


 28%|████████████████████▉                                                       | 13002/47154 [16:49<49:21, 11.53it/s]

Iteration 13000, loss = 5.8309


 30%|██████████████████████▌                                                     | 14004/47154 [18:09<42:45, 12.92it/s]

Iteration 14000, loss = 6.8443


 32%|████████████████████████▏                                                   | 15002/47154 [19:27<37:05, 14.45it/s]

Iteration 15000, loss = 6.7213


 34%|█████████████████████████▊                                                  | 16003/47154 [20:43<32:47, 15.84it/s]

Iteration 16000, loss = 6.3131


 36%|███████████████████████████▍                                                | 17003/47154 [22:01<33:15, 15.11it/s]

Iteration 17000, loss = 6.8892


 38%|█████████████████████████████                                               | 18004/47154 [23:22<34:50, 13.94it/s]

Iteration 18000, loss = 5.8653


 40%|██████████████████████████████▋                                             | 19002/47154 [24:38<28:59, 16.19it/s]

Iteration 19000, loss = 6.1322


 42%|████████████████████████████████▏                                           | 20002/47154 [25:53<31:52, 14.20it/s]

Iteration 20000, loss = 5.9912


 45%|█████████████████████████████████▊                                          | 21004/47154 [27:12<26:28, 16.46it/s]

Iteration 21000, loss = 6.6737


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:30<41:50, 10.02it/s]

Iteration 22000, loss = 5.0871


 49%|█████████████████████████████████████                                       | 23005/47154 [29:50<23:31, 17.10it/s]

Iteration 23000, loss = 6.1709


 51%|██████████████████████████████████████▋                                     | 24004/47154 [31:09<22:45, 16.95it/s]

Iteration 24000, loss = 5.8426


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:26<28:44, 12.84it/s]

Iteration 25000, loss = 5.4758


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:42<29:14, 12.05it/s]

Iteration 26000, loss = 5.6317


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:59<27:54, 12.03it/s]

Iteration 27000, loss = 6.4584


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:17<24:03, 13.26it/s]

Iteration 28000, loss = 6.1966


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:35<25:56, 11.66it/s]

Iteration 29000, loss = 6.5261


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:50<20:30, 13.94it/s]

Iteration 30000, loss = 5.1325


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [40:12<29:40,  9.07it/s]

Iteration 31000, loss = 5.9989


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:36<20:20, 12.41it/s]

Iteration 32000, loss = 4.8874


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:56<15:49, 14.90it/s]

Iteration 33000, loss = 6.0364


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [44:15<15:43, 13.94it/s]

Iteration 34000, loss = 5.5993


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:33<11:30, 17.59it/s]

Iteration 35000, loss = 5.7862


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:48<13:02, 14.26it/s]

Iteration 36000, loss = 5.4929


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [48:08<11:30, 14.70it/s]

Iteration 37000, loss = 5.3687


 81%|█████████████████████████████████████████████████████████████▎              | 38004/47154 [49:27<10:22, 14.70it/s]

Iteration 38000, loss = 6.2091


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:50<11:44, 11.57it/s]

Iteration 39000, loss = 6.1743


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [52:07<09:44, 12.23it/s]

Iteration 40000, loss = 6.0892


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [53:28<08:05, 12.66it/s]

Iteration 41000, loss = 6.3621


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [54:45<06:58, 12.30it/s]

Iteration 42000, loss = 4.8323


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [56:01<04:17, 16.13it/s]

Iteration 43000, loss = 5.3351


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [57:20<03:38, 14.41it/s]

Iteration 44000, loss = 5.0839


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [58:39<02:53, 12.42it/s]

Iteration 45000, loss = 5.4643


 98%|████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [1:00:01<01:30, 12.78it/s]

Iteration 46000, loss = 6.0351


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:01:20<00:12, 12.19it/s]

Iteration 47000, loss = 6.5038


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:33<00:00, 12.77it/s]


Checking accuracy score on validation set.

Accuracy: 545 / 83918 correct (0.65)
Log Loss score:	5.80
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 29


  0%|                                                                              | 1/47154 [00:00<1:47:39,  7.30it/s]

Iteration 0, loss = 5.3876


  2%|█▋                                                                           | 1003/47154 [01:17<51:42, 14.87it/s]

Iteration 1000, loss = 7.2980


  4%|███▎                                                                         | 2001/47154 [02:36<56:52, 13.23it/s]

Iteration 2000, loss = 4.8283


  6%|████▉                                                                        | 3002/47154 [03:50<44:33, 16.52it/s]

Iteration 3000, loss = 5.2940


  8%|██████▌                                                                      | 4002/47154 [05:08<46:32, 15.45it/s]

Iteration 4000, loss = 6.2823


 11%|████████▏                                                                    | 5004/47154 [06:26<39:51, 17.62it/s]

Iteration 5000, loss = 6.2097


 13%|█████████▊                                                                   | 6003/47154 [07:40<50:11, 13.67it/s]

Iteration 6000, loss = 5.9848


 15%|███████████▍                                                                 | 7004/47154 [08:55<42:03, 15.91it/s]

Iteration 7000, loss = 6.4911


 17%|█████████████                                                                | 8003/47154 [10:11<40:42, 16.03it/s]

Iteration 8000, loss = 4.8412


 19%|██████████████▋                                                              | 9003/47154 [11:26<45:47, 13.89it/s]

Iteration 9000, loss = 6.1708


 21%|████████████████                                                            | 10003/47154 [12:42<48:12, 12.84it/s]

Iteration 10000, loss = 6.0018


 23%|█████████████████▋                                                          | 11003/47154 [13:59<35:36, 16.92it/s]

Iteration 11000, loss = 5.7426


 25%|███████████████████▎                                                        | 12003/47154 [15:17<34:45, 16.86it/s]

Iteration 12000, loss = 6.6672


 28%|████████████████████▉                                                       | 13002/47154 [16:33<50:05, 11.36it/s]

Iteration 13000, loss = 5.5911


 30%|██████████████████████▌                                                     | 14005/47154 [17:49<38:21, 14.40it/s]

Iteration 14000, loss = 6.0128


 32%|████████████████████████▏                                                   | 15002/47154 [19:07<38:59, 13.74it/s]

Iteration 15000, loss = 6.3847


 34%|█████████████████████████▊                                                  | 16002/47154 [20:22<39:44, 13.06it/s]

Iteration 16000, loss = 4.7618


 36%|███████████████████████████▍                                                | 17004/47154 [21:43<35:04, 14.33it/s]

Iteration 17000, loss = 6.7245


 38%|█████████████████████████████                                               | 18004/47154 [22:58<29:20, 16.56it/s]

Iteration 18000, loss = 6.6600


 40%|██████████████████████████████▋                                             | 19005/47154 [24:17<33:15, 14.11it/s]

Iteration 19000, loss = 5.7782


 42%|████████████████████████████████▏                                           | 20002/47154 [25:35<24:45, 18.27it/s]

Iteration 20000, loss = 6.4810


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:52<25:44, 16.94it/s]

Iteration 21000, loss = 6.2017


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:12<27:33, 15.21it/s]

Iteration 22000, loss = 6.8255


 49%|█████████████████████████████████████                                       | 23004/47154 [29:31<20:16, 19.86it/s]

Iteration 23000, loss = 5.4370


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:51<21:56, 17.58it/s]

Iteration 24000, loss = 5.1810


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:06<43:39,  8.46it/s]

Iteration 25000, loss = 5.0460


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:24<22:44, 15.50it/s]

Iteration 26000, loss = 6.4987


 57%|███████████████████████████████████████████▌                                | 27005/47154 [34:44<23:27, 14.31it/s]

Iteration 27000, loss = 4.8124


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:58<24:01, 13.29it/s]

Iteration 28000, loss = 6.3533


 62%|██████████████████████████████████████████████▋                             | 29001/47154 [37:14<21:43, 13.92it/s]

Iteration 29000, loss = 6.1080


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:30<24:38, 11.60it/s]

Iteration 30000, loss = 6.6499


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:46<19:04, 14.12it/s]

Iteration 31000, loss = 5.9676


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:06<18:22, 13.74it/s]

Iteration 32000, loss = 4.6373


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:22<13:43, 17.17it/s]

Iteration 33000, loss = 5.9489


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:40<20:33, 10.66it/s]

Iteration 34000, loss = 6.5643


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:58<14:21, 14.11it/s]

Iteration 35000, loss = 6.8494


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:16<10:46, 17.24it/s]

Iteration 36000, loss = 5.1765


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:32<11:57, 14.15it/s]

Iteration 37000, loss = 6.2926


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [48:51<11:14, 13.56it/s]

Iteration 38000, loss = 4.9586


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:10<11:38, 11.67it/s]

Iteration 39000, loss = 6.3991


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:25<10:35, 11.26it/s]

Iteration 40000, loss = 6.0649


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:42<07:10, 14.27it/s]

Iteration 41000, loss = 5.2880


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:58<06:02, 14.21it/s]

Iteration 42000, loss = 5.7143


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:13<05:23, 12.83it/s]

Iteration 43000, loss = 6.0309


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:30<03:39, 14.33it/s]

Iteration 44000, loss = 5.8027


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [57:47<02:41, 13.31it/s]

Iteration 45000, loss = 4.9522


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46001/47154 [59:07<01:10, 16.45it/s]

Iteration 46000, loss = 5.2085


100%|█████████████████████████████████████████████████████████████████████████▊| 47001/47154 [1:00:24<00:11, 13.13it/s]

Iteration 47000, loss = 6.1272


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:35<00:00, 12.97it/s]


Checking accuracy score on validation set.

Accuracy: 1192 / 83918 correct (1.42)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 30


  0%|                                                                              | 1/47154 [00:00<1:36:39,  8.13it/s]

Iteration 0, loss = 6.3341


  2%|█▋                                                                           | 1004/47154 [01:17<47:18, 16.26it/s]

Iteration 1000, loss = 5.8557


  4%|███▏                                                                       | 2002/47154 [02:34<1:20:56,  9.30it/s]

Iteration 2000, loss = 6.0748


  6%|████▊                                                                      | 3003/47154 [03:48<1:01:28, 11.97it/s]

Iteration 3000, loss = 6.0355


  8%|██████▌                                                                      | 4004/47154 [05:03<55:10, 13.03it/s]

Iteration 4000, loss = 5.7158


 11%|████████▏                                                                    | 5003/47154 [06:19<45:51, 15.32it/s]

Iteration 5000, loss = 5.4251


 13%|█████████▊                                                                   | 6004/47154 [07:35<40:56, 16.75it/s]

Iteration 6000, loss = 5.6734


 15%|███████████▍                                                                 | 7005/47154 [08:50<37:54, 17.65it/s]

Iteration 7000, loss = 6.4144


 17%|█████████████                                                                | 8003/47154 [10:06<42:15, 15.44it/s]

Iteration 8000, loss = 5.1156


 19%|██████████████▋                                                              | 9003/47154 [11:25<44:18, 14.35it/s]

Iteration 9000, loss = 5.1336


 21%|████████████████                                                            | 10003/47154 [12:41<39:39, 15.61it/s]

Iteration 10000, loss = 6.5054


 23%|█████████████████▋                                                          | 11004/47154 [13:57<45:09, 13.34it/s]

Iteration 11000, loss = 5.7888


 25%|███████████████████▎                                                        | 12003/47154 [15:12<33:07, 17.68it/s]

Iteration 12000, loss = 6.1784


 28%|████████████████████▉                                                       | 13002/47154 [16:28<34:14, 16.62it/s]

Iteration 13000, loss = 6.3358


 30%|██████████████████████▌                                                     | 14002/47154 [17:45<34:24, 16.06it/s]

Iteration 14000, loss = 6.1230


 32%|████████████████████████▏                                                   | 15006/47154 [18:59<24:51, 21.56it/s]

Iteration 15000, loss = 5.4102


 34%|█████████████████████████▊                                                  | 16002/47154 [20:20<26:58, 19.25it/s]

Iteration 16000, loss = 5.8707


 36%|███████████████████████████▍                                                | 17002/47154 [21:37<37:57, 13.24it/s]

Iteration 17000, loss = 6.0635


 38%|█████████████████████████████                                               | 18002/47154 [22:52<42:24, 11.46it/s]

Iteration 18000, loss = 6.0637


 40%|██████████████████████████████▋                                             | 19003/47154 [24:09<38:00, 12.35it/s]

Iteration 19000, loss = 6.0073


 42%|████████████████████████████████▏                                           | 20004/47154 [25:25<42:55, 10.54it/s]

Iteration 20000, loss = 6.1990


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:40<27:49, 15.66it/s]

Iteration 21000, loss = 5.5991


 47%|███████████████████████████████████▍                                        | 22002/47154 [27:57<31:45, 13.20it/s]

Iteration 22000, loss = 5.6596


 49%|█████████████████████████████████████                                       | 23002/47154 [29:13<30:46, 13.08it/s]

Iteration 23000, loss = 4.7157


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:31<21:22, 18.05it/s]

Iteration 24000, loss = 5.6007


 53%|████████████████████████████████████████▎                                   | 25001/47154 [31:50<30:44, 12.01it/s]

Iteration 25000, loss = 4.9809


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:06<30:28, 11.56it/s]

Iteration 26000, loss = 6.1816


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:20<24:54, 13.48it/s]

Iteration 27000, loss = 5.7284


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:40<17:07, 18.63it/s]

Iteration 28000, loss = 5.9660


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [36:51<20:57, 14.43it/s]

Iteration 29000, loss = 5.7919


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:08<20:32, 13.91it/s]

Iteration 30000, loss = 6.1050


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:28<16:18, 16.50it/s]

Iteration 31000, loss = 5.9588


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:47<19:55, 12.67it/s]

Iteration 32000, loss = 5.7695


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:06<12:29, 18.89it/s]

Iteration 33000, loss = 6.3335


 72%|██████████████████████████████████████████████████████▊                     | 33999/47154 [43:24<12:27, 17.60it/s]

Iteration 34000, loss = 5.4034


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:41<15:11, 13.34it/s]

Iteration 35000, loss = 5.5309


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [45:55<12:31, 14.83it/s]

Iteration 36000, loss = 5.1594


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:10<13:14, 12.78it/s]

Iteration 37000, loss = 6.3361


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:31<11:41, 13.05it/s]

Iteration 38000, loss = 5.1194


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:47<09:26, 14.39it/s]

Iteration 39000, loss = 6.2659


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:03<09:56, 11.98it/s]

Iteration 40000, loss = 5.6918


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:20<06:47, 15.10it/s]

Iteration 41000, loss = 4.8010


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:37<05:35, 15.37it/s]

Iteration 42000, loss = 4.8667


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [54:53<04:42, 14.67it/s]

Iteration 43000, loss = 5.6000


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:12<03:59, 13.14it/s]

Iteration 44000, loss = 5.1083


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:31<02:06, 17.03it/s]

Iteration 45000, loss = 6.1137


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [58:49<01:34, 12.21it/s]

Iteration 46000, loss = 5.5806


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:09<00:09, 16.15it/s]

Iteration 47000, loss = 6.6660


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:19<00:00, 13.03it/s]


Checking accuracy score on validation set.

Accuracy: 728 / 83918 correct (0.87)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 31


  0%|                                                                              | 1/47154 [00:00<1:33:31,  8.40it/s]

Iteration 0, loss = 5.0400


  2%|█▋                                                                           | 1003/47154 [01:17<50:23, 15.26it/s]

Iteration 1000, loss = 6.4397


  4%|███▎                                                                         | 2002/47154 [02:36<55:17, 13.61it/s]

Iteration 2000, loss = 6.6307


  6%|████▊                                                                      | 3002/47154 [03:56<1:06:20, 11.09it/s]

Iteration 3000, loss = 5.9447


  8%|██████▌                                                                      | 4004/47154 [05:14<43:32, 16.52it/s]

Iteration 4000, loss = 5.3842


 11%|███████▉                                                                   | 5004/47154 [06:30<1:04:51, 10.83it/s]

Iteration 5000, loss = 5.3677


 13%|█████████▊                                                                   | 6005/47154 [07:49<41:54, 16.36it/s]

Iteration 6000, loss = 5.5345


 15%|███████████▍                                                                 | 7002/47154 [09:07<46:01, 14.54it/s]

Iteration 7000, loss = 6.1756


 17%|█████████████                                                                | 8004/47154 [10:21<41:10, 15.85it/s]

Iteration 8000, loss = 5.9953


 19%|██████████████▋                                                              | 9004/47154 [11:38<40:05, 15.86it/s]

Iteration 9000, loss = 4.9975


 21%|████████████████                                                            | 10003/47154 [12:56<40:31, 15.28it/s]

Iteration 10000, loss = 6.5548


 23%|█████████████████▋                                                          | 11002/47154 [14:16<58:12, 10.35it/s]

Iteration 11000, loss = 5.8792


 25%|███████████████████▎                                                        | 12003/47154 [15:31<35:47, 16.37it/s]

Iteration 12000, loss = 5.9752


 28%|████████████████████▉                                                       | 13003/47154 [16:49<35:33, 16.01it/s]

Iteration 13000, loss = 5.0716


 30%|██████████████████████▌                                                     | 14004/47154 [18:10<36:34, 15.11it/s]

Iteration 14000, loss = 5.9213


 32%|████████████████████████▏                                                   | 15002/47154 [19:30<38:56, 13.76it/s]

Iteration 15000, loss = 6.5827


 34%|█████████████████████████▊                                                  | 16001/47154 [20:47<45:06, 11.51it/s]

Iteration 16000, loss = 5.6745


 36%|███████████████████████████▍                                                | 17002/47154 [22:06<34:40, 14.49it/s]

Iteration 17000, loss = 6.4655


 38%|█████████████████████████████                                               | 18005/47154 [23:27<26:33, 18.29it/s]

Iteration 18000, loss = 5.4623


 40%|██████████████████████████████▋                                             | 19004/47154 [24:46<30:17, 15.49it/s]

Iteration 19000, loss = 6.3169


 42%|████████████████████████████████▏                                           | 20004/47154 [26:04<35:31, 12.74it/s]

Iteration 20000, loss = 5.3324


 45%|█████████████████████████████████▊                                          | 21001/47154 [27:20<51:33,  8.45it/s]

Iteration 21000, loss = 4.8947


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:40<32:05, 13.06it/s]

Iteration 22000, loss = 6.3177


 49%|█████████████████████████████████████                                       | 23004/47154 [29:58<25:48, 15.60it/s]

Iteration 23000, loss = 5.8798


 51%|██████████████████████████████████████▋                                     | 24004/47154 [31:13<27:12, 14.18it/s]

Iteration 24000, loss = 5.6981


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:32<28:44, 12.85it/s]

Iteration 25000, loss = 6.2255


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:50<26:26, 13.33it/s]

Iteration 26000, loss = 6.2222


 57%|███████████████████████████████████████████▌                                | 27003/47154 [35:08<28:50, 11.65it/s]

Iteration 27000, loss = 4.5822


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:28<19:49, 16.10it/s]

Iteration 28000, loss = 5.2389


 62%|██████████████████████████████████████████████▋                             | 29001/47154 [37:46<19:33, 15.47it/s]

Iteration 29000, loss = 4.9007


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [39:04<20:49, 13.72it/s]

Iteration 30000, loss = 6.3769


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [40:24<21:54, 12.29it/s]

Iteration 31000, loss = 5.6647


 68%|███████████████████████████████████████████████████▌                        | 32000/47154 [41:41<15:21, 16.44it/s]

Iteration 32000, loss = 5.6817


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [43:00<30:08,  7.83it/s]

Iteration 33000, loss = 5.3485


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [44:19<12:37, 17.36it/s]

Iteration 34000, loss = 5.5477


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [45:39<14:56, 13.56it/s]

Iteration 35000, loss = 6.3364


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:57<13:11, 14.08it/s]

Iteration 36000, loss = 6.2263


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [48:15<10:55, 15.48it/s]

Iteration 37000, loss = 5.5653


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [49:35<15:22,  9.92it/s]

Iteration 38000, loss = 5.2967


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:51<09:20, 14.53it/s]

Iteration 39000, loss = 5.7820


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [52:13<07:58, 14.96it/s]

Iteration 40000, loss = 5.8605


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [53:31<07:53, 12.99it/s]

Iteration 41000, loss = 5.9226


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [54:52<05:01, 17.07it/s]

Iteration 42000, loss = 6.0969


 91%|█████████████████████████████████████████████████████████████████████▎      | 43001/47154 [56:10<04:19, 16.03it/s]

Iteration 43000, loss = 6.4558


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [57:27<03:20, 15.74it/s]

Iteration 44000, loss = 5.0700


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [58:43<03:17, 10.90it/s]

Iteration 45000, loss = 6.0306


 98%|████████████████████████████████████████████████████████████████████████▏ | 46001/47154 [1:00:04<01:42, 11.25it/s]

Iteration 46000, loss = 6.1087


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:01:23<00:09, 15.28it/s]

Iteration 47000, loss = 5.3214


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:35<00:00, 12.76it/s]


Checking accuracy score on validation set.

Accuracy: 569 / 83918 correct (0.68)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 32


  0%|                                                                              | 1/47154 [00:00<1:55:31,  6.80it/s]

Iteration 0, loss = 5.7321


  2%|█▋                                                                           | 1003/47154 [01:17<52:34, 14.63it/s]

Iteration 1000, loss = 5.8726


  4%|███▎                                                                         | 2003/47154 [02:33<56:00, 13.44it/s]

Iteration 2000, loss = 5.6542


  6%|████▉                                                                        | 3002/47154 [03:50<51:06, 14.40it/s]

Iteration 3000, loss = 4.8424


  8%|██████▎                                                                    | 4002/47154 [05:10<1:01:26, 11.71it/s]

Iteration 4000, loss = 5.2618


 11%|████████▏                                                                    | 5003/47154 [06:25<48:04, 14.61it/s]

Iteration 5000, loss = 5.4269


 13%|█████████▊                                                                   | 6003/47154 [07:41<36:51, 18.61it/s]

Iteration 6000, loss = 7.3377


 15%|███████████▏                                                               | 7002/47154 [08:57<1:02:04, 10.78it/s]

Iteration 7000, loss = 5.2311


 17%|█████████████                                                                | 8003/47154 [10:15<43:21, 15.05it/s]

Iteration 8000, loss = 5.9613


 19%|██████████████▋                                                              | 9003/47154 [11:29<49:08, 12.94it/s]

Iteration 9000, loss = 6.3750


 21%|████████████████                                                            | 10004/47154 [12:45<37:06, 16.68it/s]

Iteration 10000, loss = 5.9971


 23%|█████████████████▋                                                          | 11004/47154 [14:05<39:51, 15.12it/s]

Iteration 11000, loss = 5.7363


 25%|███████████████████▎                                                        | 12001/47154 [15:21<31:33, 18.56it/s]

Iteration 12000, loss = 6.2977


 28%|████████████████████▉                                                       | 13001/47154 [16:37<46:49, 12.15it/s]

Iteration 13000, loss = 5.4504


 30%|██████████████████████▌                                                     | 14004/47154 [17:53<40:48, 13.54it/s]

Iteration 14000, loss = 5.9677


 32%|████████████████████████▏                                                   | 15001/47154 [19:12<31:38, 16.94it/s]

Iteration 15000, loss = 4.8858


 34%|█████████████████████████▊                                                  | 16002/47154 [20:29<32:20, 16.05it/s]

Iteration 16000, loss = 5.4789


 36%|███████████████████████████▍                                                | 17000/47154 [21:48<42:18, 11.88it/s]

Iteration 17000, loss = 5.1962


 38%|█████████████████████████████                                               | 18004/47154 [23:06<28:06, 17.29it/s]

Iteration 18000, loss = 5.0716


 40%|██████████████████████████████▋                                             | 19002/47154 [24:26<36:09, 12.98it/s]

Iteration 19000, loss = 6.3432


 42%|████████████████████████████████▏                                           | 20002/47154 [25:41<33:17, 13.60it/s]

Iteration 20000, loss = 6.6380


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:58<28:42, 15.18it/s]

Iteration 21000, loss = 6.0813


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:17<29:43, 14.10it/s]

Iteration 22000, loss = 4.9446


 49%|█████████████████████████████████████                                       | 23000/47154 [29:36<32:20, 12.45it/s]

Iteration 23000, loss = 5.8475


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:54<27:10, 14.20it/s]

Iteration 24000, loss = 5.6147


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:10<26:54, 13.72it/s]

Iteration 25000, loss = 4.4471


 55%|█████████████████████████████████████████▉                                  | 26001/47154 [33:30<33:31, 10.52it/s]

Iteration 26000, loss = 6.3463


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:46<23:43, 14.15it/s]

Iteration 27000, loss = 5.5447


 59%|█████████████████████████████████████████████▏                              | 28001/47154 [36:02<27:35, 11.57it/s]

Iteration 28000, loss = 5.4852


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:23<26:49, 11.28it/s]

Iteration 29000, loss = 6.2050


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:40<22:39, 12.62it/s]

Iteration 30000, loss = 5.6853


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:59<17:12, 15.64it/s]

Iteration 31000, loss = 6.7246


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:17<20:58, 12.04it/s]

Iteration 32000, loss = 6.1455


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:33<14:00, 16.83it/s]

Iteration 33000, loss = 5.4293


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:51<15:44, 13.92it/s]

Iteration 34000, loss = 6.4689


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [45:07<12:53, 15.70it/s]

Iteration 35000, loss = 5.7633


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:22<13:44, 13.52it/s]

Iteration 36000, loss = 5.1507


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:33<13:19, 12.70it/s]

Iteration 37000, loss = 5.9794


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:48<11:36, 13.14it/s]

Iteration 38000, loss = 6.0245


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:04<09:04, 14.96it/s]

Iteration 39000, loss = 5.8234


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [51:20<07:19, 16.28it/s]

Iteration 40000, loss = 4.9935


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:34<06:41, 15.31it/s]

Iteration 41000, loss = 5.4950


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:50<06:43, 12.78it/s]

Iteration 42000, loss = 6.1299


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [55:08<05:26, 12.71it/s]

Iteration 43000, loss = 5.9243


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:28<03:42, 14.17it/s]

Iteration 44000, loss = 5.2453


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [57:48<02:37, 13.61it/s]

Iteration 45000, loss = 5.6581


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:05<01:19, 14.40it/s]

Iteration 46000, loss = 6.2045


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:22<00:10, 14.05it/s]

Iteration 47000, loss = 6.3641


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:34<00:00, 12.97it/s]


Checking accuracy score on validation set.

Accuracy: 1139 / 83918 correct (1.36)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 33


  0%|                                                                              | 1/47154 [00:00<1:24:52,  9.26it/s]

Iteration 0, loss = 6.4047


  2%|█▋                                                                           | 1003/47154 [01:16<53:28, 14.38it/s]

Iteration 1000, loss = 4.9556


  4%|███▎                                                                         | 2001/47154 [02:34<43:10, 17.43it/s]

Iteration 2000, loss = 6.1473


  6%|████▉                                                                        | 3000/47154 [03:55<57:48, 12.73it/s]

Iteration 3000, loss = 5.2595


  8%|██████▌                                                                      | 4003/47154 [05:10<38:57, 18.46it/s]

Iteration 4000, loss = 4.8414


 11%|████████▏                                                                    | 5003/47154 [06:23<40:19, 17.42it/s]

Iteration 5000, loss = 6.4124


 13%|█████████▊                                                                   | 6003/47154 [07:39<49:02, 13.99it/s]

Iteration 6000, loss = 5.2235


 15%|███████████▍                                                                 | 7003/47154 [08:54<44:42, 14.96it/s]

Iteration 7000, loss = 5.9018


 17%|█████████████                                                                | 8003/47154 [10:10<41:14, 15.82it/s]

Iteration 8000, loss = 5.7479


 19%|██████████████▋                                                              | 9004/47154 [11:30<46:09, 13.77it/s]

Iteration 9000, loss = 5.8461


 21%|████████████████▏                                                           | 10005/47154 [12:47<34:46, 17.81it/s]

Iteration 10000, loss = 6.1415


 23%|█████████████████▋                                                          | 11003/47154 [14:06<40:46, 14.78it/s]

Iteration 11000, loss = 5.2729


 25%|███████████████████▎                                                        | 12002/47154 [15:26<35:01, 16.73it/s]

Iteration 12000, loss = 5.9460


 28%|████████████████████▉                                                       | 13003/47154 [16:41<37:43, 15.09it/s]

Iteration 13000, loss = 4.7876


 30%|██████████████████████▌                                                     | 14003/47154 [17:58<33:16, 16.60it/s]

Iteration 14000, loss = 5.3619


 32%|████████████████████████▏                                                   | 15002/47154 [19:14<45:55, 11.67it/s]

Iteration 15000, loss = 6.2290


 34%|█████████████████████████▊                                                  | 16003/47154 [20:30<39:52, 13.02it/s]

Iteration 16000, loss = 6.0567


 36%|███████████████████████████▍                                                | 17003/47154 [21:48<34:59, 14.36it/s]

Iteration 17000, loss = 6.0771


 38%|█████████████████████████████                                               | 18003/47154 [23:08<38:02, 12.77it/s]

Iteration 18000, loss = 6.6853


 40%|██████████████████████████████▋                                             | 19004/47154 [24:23<27:48, 16.87it/s]

Iteration 19000, loss = 6.7274


 42%|████████████████████████████████▏                                           | 20004/47154 [25:39<24:27, 18.50it/s]

Iteration 20000, loss = 6.1773


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:59<26:14, 16.61it/s]

Iteration 21000, loss = 6.6498


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:17<23:03, 18.18it/s]

Iteration 22000, loss = 5.8815


 49%|█████████████████████████████████████                                       | 23002/47154 [29:36<30:57, 13.00it/s]

Iteration 23000, loss = 5.1486


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:52<28:02, 13.76it/s]

Iteration 24000, loss = 6.4272


 53%|████████████████████████████████████████▎                                   | 25004/47154 [32:10<27:58, 13.20it/s]

Iteration 25000, loss = 5.8425


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:27<31:51, 11.07it/s]

Iteration 26000, loss = 5.9266


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:42<20:29, 16.38it/s]

Iteration 27000, loss = 5.9722


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:58<19:37, 16.27it/s]

Iteration 28000, loss = 5.9488


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [37:13<20:22, 14.85it/s]

Iteration 29000, loss = 4.9178


 64%|████████████████████████████████████████████████▎                           | 30004/47154 [38:36<22:37, 12.63it/s]

Iteration 30000, loss = 6.0176


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:53<21:22, 12.60it/s]

Iteration 31000, loss = 6.7707


 68%|███████████████████████████████████████████████████▌                        | 32005/47154 [41:11<17:23, 14.51it/s]

Iteration 32000, loss = 5.2563


 70%|█████████████████████████████████████████████████████▏                      | 33000/47154 [42:24<16:11, 14.56it/s]

Iteration 33000, loss = 5.0061


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:42<16:21, 13.40it/s]

Iteration 34000, loss = 5.3462


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [45:00<25:42,  7.88it/s]

Iteration 35000, loss = 5.0134


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:14<13:00, 14.28it/s]

Iteration 36000, loss = 4.6692


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:34<16:35, 10.19it/s]

Iteration 37000, loss = 6.0016


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:54<11:02, 13.81it/s]

Iteration 38000, loss = 5.5651


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:11<10:17, 13.20it/s]

Iteration 39000, loss = 4.8298


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:29<09:03, 13.16it/s]

Iteration 40000, loss = 5.7612


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:45<06:14, 16.44it/s]

Iteration 41000, loss = 5.9278


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:00<04:37, 18.57it/s]

Iteration 42000, loss = 6.3511


 91%|█████████████████████████████████████████████████████████████████████▎      | 43000/47154 [55:17<04:51, 14.24it/s]

Iteration 43000, loss = 5.3491


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:28<03:12, 16.35it/s]

Iteration 44000, loss = 4.8090


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:44<02:50, 12.63it/s]

Iteration 45000, loss = 5.4825


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:04<01:21, 14.09it/s]

Iteration 46000, loss = 6.6431


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:20<00:11, 13.36it/s]

Iteration 47000, loss = 6.4996


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:32<00:00, 12.98it/s]


Checking accuracy score on validation set.

Accuracy: 569 / 83918 correct (0.68)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 34


  0%|                                                                              | 1/47154 [00:00<1:31:56,  8.55it/s]

Iteration 0, loss = 4.8496


  2%|█▋                                                                           | 1004/47154 [01:19<52:22, 14.69it/s]

Iteration 1000, loss = 5.9330


  4%|███▎                                                                         | 2004/47154 [02:35<47:23, 15.88it/s]

Iteration 2000, loss = 6.0804


  6%|████▉                                                                        | 3004/47154 [03:51<41:09, 17.88it/s]

Iteration 3000, loss = 5.3467


  8%|██████▌                                                                      | 4003/47154 [05:04<41:28, 17.34it/s]

Iteration 4000, loss = 5.1676


 11%|████████▏                                                                    | 5003/47154 [06:20<50:11, 14.00it/s]

Iteration 5000, loss = 5.7111


 13%|█████████▊                                                                   | 6004/47154 [07:35<46:27, 14.76it/s]

Iteration 6000, loss = 5.5059


 15%|███████████▍                                                                 | 7002/47154 [08:49<41:09, 16.26it/s]

Iteration 7000, loss = 4.7964


 17%|█████████████                                                                | 8001/47154 [10:08<55:54, 11.67it/s]

Iteration 8000, loss = 5.2074


 19%|██████████████▋                                                              | 9004/47154 [11:29<53:00, 11.99it/s]

Iteration 9000, loss = 5.9472


 21%|████████████████                                                            | 10002/47154 [12:43<46:45, 13.24it/s]

Iteration 10000, loss = 5.8722


 23%|█████████████████▋                                                          | 11003/47154 [13:59<44:19, 13.59it/s]

Iteration 11000, loss = 6.4024


 25%|███████████████████▎                                                        | 12003/47154 [15:14<47:36, 12.30it/s]

Iteration 12000, loss = 5.8345


 28%|████████████████████▉                                                       | 13002/47154 [16:34<49:15, 11.56it/s]

Iteration 13000, loss = 5.0597


 30%|██████████████████████▌                                                     | 14002/47154 [17:52<43:49, 12.61it/s]

Iteration 14000, loss = 6.5315


 32%|████████████████████████▏                                                   | 15002/47154 [19:09<46:05, 11.63it/s]

Iteration 15000, loss = 5.9569


 34%|█████████████████████████▊                                                  | 16003/47154 [20:24<35:24, 14.66it/s]

Iteration 16000, loss = 6.1292


 36%|███████████████████████████▍                                                | 17001/47154 [21:38<29:24, 17.09it/s]

Iteration 17000, loss = 5.4737


 38%|█████████████████████████████                                               | 18003/47154 [22:58<37:01, 13.12it/s]

Iteration 18000, loss = 6.0260


 40%|██████████████████████████████▋                                             | 19002/47154 [24:19<25:17, 18.55it/s]

Iteration 19000, loss = 5.4161


 42%|████████████████████████████████▏                                           | 20001/47154 [25:37<29:23, 15.40it/s]

Iteration 20000, loss = 5.7702


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:56<31:41, 13.75it/s]

Iteration 21000, loss = 6.2070


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:16<33:54, 12.37it/s]

Iteration 22000, loss = 4.8525


 49%|█████████████████████████████████████                                       | 23003/47154 [29:34<34:54, 11.53it/s]

Iteration 23000, loss = 6.1958


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:51<27:57, 13.80it/s]

Iteration 24000, loss = 5.7420


 53%|████████████████████████████████████████▎                                   | 25000/47154 [32:08<23:37, 15.63it/s]

Iteration 25000, loss = 5.7439


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:23<31:07, 11.33it/s]

Iteration 26000, loss = 6.1807


 57%|███████████████████████████████████████████▌                                | 27000/47154 [34:37<38:05,  8.82it/s]

Iteration 27000, loss = 5.6760


 59%|█████████████████████████████████████████████▏                              | 28005/47154 [35:54<19:11, 16.62it/s]

Iteration 28000, loss = 5.9639


 62%|██████████████████████████████████████████████▋                             | 29005/47154 [37:12<17:53, 16.91it/s]

Iteration 29000, loss = 5.2035


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:28<21:39, 13.20it/s]

Iteration 30000, loss = 5.7876


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:48<18:28, 14.58it/s]

Iteration 31000, loss = 4.7297


 68%|███████████████████████████████████████████████████▌                        | 32005/47154 [41:04<14:37, 17.27it/s]

Iteration 32000, loss = 5.9208


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:19<12:32, 18.80it/s]

Iteration 33000, loss = 6.0189


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:41<17:10, 12.76it/s]

Iteration 34000, loss = 5.9984


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:58<13:25, 15.08it/s]

Iteration 35000, loss = 6.2363


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:13<11:30, 16.16it/s]

Iteration 36000, loss = 5.6067


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:32<09:42, 17.41it/s]

Iteration 37000, loss = 6.6355


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:49<09:16, 16.44it/s]

Iteration 38000, loss = 6.2546


 83%|██████████████████████████████████████████████████████████████▊             | 39000/47154 [50:09<08:56, 15.20it/s]

Iteration 39000, loss = 5.4881


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:28<07:14, 16.44it/s]

Iteration 40000, loss = 5.6068


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:44<08:04, 12.69it/s]

Iteration 41000, loss = 5.5909


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [54:00<05:12, 16.48it/s]

Iteration 42000, loss = 6.0889


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:16<04:44, 14.57it/s]

Iteration 43000, loss = 6.3702


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:34<03:36, 14.53it/s]

Iteration 44000, loss = 6.2830


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:51<02:40, 13.40it/s]

Iteration 45000, loss = 6.3280


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46001/47154 [59:08<01:41, 11.35it/s]

Iteration 46000, loss = 6.0443


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:23<00:10, 13.88it/s]

Iteration 47000, loss = 6.2129


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:35<00:00, 12.97it/s]


Checking accuracy score on validation set.

Accuracy: 784 / 83918 correct (0.93)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 35


  0%|                                                                              | 1/47154 [00:00<1:35:52,  8.20it/s]

Iteration 0, loss = 5.8588


  2%|█▌                                                                         | 1002/47154 [01:19<1:10:49, 10.86it/s]

Iteration 1000, loss = 4.9023


  4%|███▏                                                                       | 2000/47154 [02:36<1:06:50, 11.26it/s]

Iteration 2000, loss = 6.0575


  6%|████▉                                                                        | 3002/47154 [03:52<58:41, 12.54it/s]

Iteration 3000, loss = 5.8656


  8%|██████▌                                                                      | 4004/47154 [05:11<44:43, 16.08it/s]

Iteration 4000, loss = 5.8324


 11%|████████▏                                                                    | 5002/47154 [06:27<57:26, 12.23it/s]

Iteration 5000, loss = 5.3222


 13%|█████████▊                                                                   | 6002/47154 [07:46<53:34, 12.80it/s]

Iteration 6000, loss = 5.3391


 15%|███████████▍                                                                 | 7004/47154 [09:01<42:24, 15.78it/s]

Iteration 7000, loss = 6.0803


 17%|█████████████                                                                | 8003/47154 [10:19<41:45, 15.62it/s]

Iteration 8000, loss = 5.0110


 19%|██████████████▋                                                              | 9003/47154 [11:36<35:43, 17.80it/s]

Iteration 9000, loss = 5.1967


 21%|████████████████                                                            | 10002/47154 [12:50<33:19, 18.58it/s]

Iteration 10000, loss = 5.7471


 23%|█████████████████▋                                                          | 11003/47154 [14:08<42:06, 14.31it/s]

Iteration 11000, loss = 5.8795


 25%|███████████████████▎                                                        | 12003/47154 [15:23<45:35, 12.85it/s]

Iteration 12000, loss = 5.2378


 28%|████████████████████▉                                                       | 13003/47154 [16:34<37:12, 15.30it/s]

Iteration 13000, loss = 5.5073


 30%|██████████████████████▌                                                     | 14003/47154 [17:50<33:23, 16.55it/s]

Iteration 14000, loss = 5.1021


 32%|████████████████████████▏                                                   | 15002/47154 [19:08<41:23, 12.94it/s]

Iteration 15000, loss = 5.4451


 34%|█████████████████████████▊                                                  | 16002/47154 [20:25<55:33,  9.35it/s]

Iteration 16000, loss = 6.5639


 36%|███████████████████████████▍                                                | 17002/47154 [21:45<44:09, 11.38it/s]

Iteration 17000, loss = 5.1474


 38%|█████████████████████████████                                               | 18003/47154 [23:04<32:43, 14.85it/s]

Iteration 18000, loss = 5.9781


 40%|██████████████████████████████▋                                             | 19003/47154 [24:21<25:33, 18.36it/s]

Iteration 19000, loss = 5.9396


 42%|████████████████████████████████▏                                           | 20002/47154 [25:38<50:13,  9.01it/s]

Iteration 20000, loss = 6.3986


 45%|█████████████████████████████████▊                                          | 21002/47154 [26:51<24:17, 17.95it/s]

Iteration 21000, loss = 6.2072


 47%|███████████████████████████████████▍                                        | 21999/47154 [28:11<38:58, 10.76it/s]

Iteration 22000, loss = 6.2592


 49%|█████████████████████████████████████                                       | 23003/47154 [29:28<29:36, 13.59it/s]

Iteration 23000, loss = 6.4809


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:50<25:44, 14.99it/s]

Iteration 24000, loss = 5.8342


 53%|████████████████████████████████████████▎                                   | 25004/47154 [32:05<23:52, 15.46it/s]

Iteration 25000, loss = 6.3058


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:20<23:29, 15.00it/s]

Iteration 26000, loss = 6.0839


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:37<23:21, 14.38it/s]

Iteration 27000, loss = 5.4900


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:55<17:17, 18.46it/s]

Iteration 28000, loss = 5.5401


 62%|██████████████████████████████████████████████▋                             | 29001/47154 [37:14<17:40, 17.12it/s]

Iteration 29000, loss = 6.5159


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:29<22:21, 12.78it/s]

Iteration 30000, loss = 5.7909


 66%|█████████████████████████████████████████████████▉                          | 31000/47154 [39:44<16:18, 16.52it/s]

Iteration 31000, loss = 5.7818


 68%|███████████████████████████████████████████████████▌                        | 31999/47154 [41:04<23:24, 10.79it/s]

Iteration 32000, loss = 5.2901


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:22<18:11, 12.96it/s]

Iteration 33000, loss = 6.9170


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:39<19:45, 11.10it/s]

Iteration 34000, loss = 6.4933


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:55<11:54, 17.01it/s]

Iteration 35000, loss = 5.8921


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [46:11<14:06, 13.17it/s]

Iteration 36000, loss = 5.2734


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:28<17:00,  9.95it/s]

Iteration 37000, loss = 5.9955


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:47<11:16, 13.54it/s]

Iteration 38000, loss = 5.9381


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:04<10:31, 12.90it/s]

Iteration 39000, loss = 5.8535


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:24<08:36, 13.84it/s]

Iteration 40000, loss = 5.1343


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:44<08:34, 11.97it/s]

Iteration 41000, loss = 5.7443


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [54:04<04:43, 18.16it/s]

Iteration 42000, loss = 6.3101


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:20<04:23, 15.73it/s]

Iteration 43000, loss = 6.4235


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:37<03:49, 13.74it/s]

Iteration 44000, loss = 6.6887


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:52<02:24, 14.92it/s]

Iteration 45000, loss = 6.0967


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46001/47154 [59:08<01:47, 10.77it/s]

Iteration 46000, loss = 5.2489


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:24<00:13, 11.16it/s]

Iteration 47000, loss = 6.1542


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:35<00:00, 12.97it/s]


Checking accuracy score on validation set.

Accuracy: 1192 / 83918 correct (1.42)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 36


  0%|                                                                              | 1/47154 [00:00<1:26:25,  9.09it/s]

Iteration 0, loss = 6.0668


  2%|█▋                                                                           | 1002/47154 [01:17<46:36, 16.51it/s]

Iteration 1000, loss = 6.5561


  4%|███▎                                                                         | 2002/47154 [02:34<56:48, 13.25it/s]

Iteration 2000, loss = 5.4600


  6%|████▉                                                                        | 3003/47154 [03:52<59:20, 12.40it/s]

Iteration 3000, loss = 5.3008


  8%|██████▌                                                                      | 4002/47154 [05:10<44:21, 16.21it/s]

Iteration 4000, loss = 5.9616


 11%|███████▉                                                                   | 5002/47154 [06:27<1:06:41, 10.53it/s]

Iteration 5000, loss = 5.0650


 13%|█████████▊                                                                   | 6002/47154 [07:42<47:07, 14.55it/s]

Iteration 6000, loss = 5.8535


 15%|███████████▍                                                                 | 7003/47154 [08:59<36:21, 18.40it/s]

Iteration 7000, loss = 4.7893


 17%|█████████████                                                                | 8002/47154 [10:19<50:04, 13.03it/s]

Iteration 8000, loss = 6.4324


 19%|██████████████▋                                                              | 9000/47154 [11:33<47:37, 13.35it/s]

Iteration 9000, loss = 5.4938


 21%|████████████████                                                            | 10001/47154 [12:51<55:28, 11.16it/s]

Iteration 10000, loss = 5.4219


 23%|█████████████████▋                                                          | 11005/47154 [14:08<41:40, 14.46it/s]

Iteration 11000, loss = 5.1687


 25%|███████████████████▎                                                        | 12002/47154 [15:24<48:10, 12.16it/s]

Iteration 12000, loss = 6.5174


 28%|████████████████████▉                                                       | 13003/47154 [16:42<46:18, 12.29it/s]

Iteration 13000, loss = 6.2631


 30%|██████████████████████▌                                                     | 14005/47154 [18:00<33:08, 16.67it/s]

Iteration 14000, loss = 6.1942


 32%|████████████████████████▏                                                   | 15004/47154 [19:16<37:10, 14.41it/s]

Iteration 15000, loss = 5.9154


 34%|█████████████████████████▊                                                  | 16003/47154 [20:35<52:56,  9.81it/s]

Iteration 16000, loss = 6.0110


 36%|███████████████████████████▍                                                | 17003/47154 [21:52<27:26, 18.31it/s]

Iteration 17000, loss = 6.2049


 38%|█████████████████████████████                                               | 18003/47154 [23:09<30:31, 15.92it/s]

Iteration 18000, loss = 5.7516


 40%|██████████████████████████████▋                                             | 19002/47154 [24:28<25:50, 18.16it/s]

Iteration 19000, loss = 5.3422


 42%|████████████████████████████████▏                                           | 20004/47154 [25:48<44:12, 10.24it/s]

Iteration 20000, loss = 5.3179


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:08<40:28, 10.77it/s]

Iteration 21000, loss = 4.9481


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:24<24:38, 17.02it/s]

Iteration 22000, loss = 6.6331


 49%|█████████████████████████████████████                                       | 23001/47154 [29:42<35:12, 11.44it/s]

Iteration 23000, loss = 6.5572


 51%|██████████████████████████████████████▋                                     | 24001/47154 [30:58<39:40,  9.72it/s]

Iteration 24000, loss = 6.3510


 53%|████████████████████████████████████████▎                                   | 25005/47154 [32:15<21:00, 17.57it/s]

Iteration 25000, loss = 4.8934


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:31<29:54, 11.79it/s]

Iteration 26000, loss = 6.5022


 57%|███████████████████████████████████████████▌                                | 27001/47154 [34:52<18:55, 17.75it/s]

Iteration 27000, loss = 6.2992


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [36:13<31:25, 10.16it/s]

Iteration 28000, loss = 6.9310


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:32<23:29, 12.88it/s]

Iteration 29000, loss = 6.2428


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:50<18:43, 15.27it/s]

Iteration 30000, loss = 6.3731


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [40:05<25:03, 10.74it/s]

Iteration 31000, loss = 5.4124


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:22<15:52, 15.91it/s]

Iteration 32000, loss = 5.4728


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:37<14:29, 16.27it/s]

Iteration 33000, loss = 5.6208


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:54<13:22, 16.38it/s]

Iteration 34000, loss = 6.1974


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:12<15:07, 13.39it/s]

Iteration 35000, loss = 6.3337


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:26<13:48, 13.45it/s]

Iteration 36000, loss = 6.0803


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:43<12:49, 13.20it/s]

Iteration 37000, loss = 6.0191


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:59<15:31,  9.82it/s]

Iteration 38000, loss = 5.4600


 83%|██████████████████████████████████████████████████████████████▊             | 39000/47154 [50:17<18:06,  7.51it/s]

Iteration 39000, loss = 6.0310


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [51:33<09:07, 13.05it/s]

Iteration 40000, loss = 5.2183


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:48<09:09, 11.20it/s]

Iteration 41000, loss = 5.4642


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [54:06<06:47, 12.65it/s]

Iteration 42000, loss = 5.8893


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:23<05:37, 12.29it/s]

Iteration 43000, loss = 4.8865


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:41<03:40, 14.29it/s]

Iteration 44000, loss = 6.1032


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:56<02:46, 12.95it/s]

Iteration 45000, loss = 5.4085


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [59:12<01:29, 12.79it/s]

Iteration 46000, loss = 5.0230


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:28<00:08, 17.47it/s]

Iteration 47000, loss = 6.2953


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:40<00:00, 12.95it/s]


Checking accuracy score on validation set.

Accuracy: 364 / 83918 correct (0.43)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.00
Training model 2, epoch 37


  0%|                                                                              | 2/47154 [00:00<1:04:26, 12.20it/s]

Iteration 0, loss = 5.2023


  2%|█▋                                                                           | 1002/47154 [01:20<56:40, 13.57it/s]

Iteration 1000, loss = 6.7082


  4%|███▎                                                                         | 2003/47154 [02:37<43:11, 17.42it/s]

Iteration 2000, loss = 5.1489


  6%|████▊                                                                      | 3003/47154 [03:53<1:01:18, 12.00it/s]

Iteration 3000, loss = 5.6653


  8%|██████▌                                                                      | 4004/47154 [05:05<51:54, 13.85it/s]

Iteration 4000, loss = 5.2269


 11%|████████▏                                                                    | 5004/47154 [06:22<51:29, 13.64it/s]

Iteration 5000, loss = 5.4278


 13%|█████████▊                                                                   | 6004/47154 [07:39<42:06, 16.29it/s]

Iteration 6000, loss = 6.8581


 15%|███████████▏                                                               | 7003/47154 [08:57<1:04:02, 10.45it/s]

Iteration 7000, loss = 6.0606


 17%|█████████████                                                                | 8004/47154 [10:16<42:44, 15.27it/s]

Iteration 8000, loss = 5.0796


 19%|██████████████▋                                                              | 9002/47154 [11:34<44:38, 14.24it/s]

Iteration 9000, loss = 6.5769


 21%|████████████████                                                            | 10000/47154 [12:54<40:14, 15.39it/s]

Iteration 10000, loss = 4.3333


 23%|█████████████████▋                                                          | 11002/47154 [14:11<37:30, 16.07it/s]

Iteration 11000, loss = 5.8104


 25%|███████████████████▎                                                        | 12003/47154 [15:28<41:01, 14.28it/s]

Iteration 12000, loss = 5.8539


 28%|████████████████████▉                                                       | 12999/47154 [16:41<44:26, 12.81it/s]

Iteration 13000, loss = 5.2885


 30%|██████████████████████▌                                                     | 14001/47154 [18:01<34:25, 16.05it/s]

Iteration 14000, loss = 4.9337


 32%|████████████████████████▏                                                   | 15003/47154 [19:13<28:45, 18.64it/s]

Iteration 15000, loss = 5.7588


 34%|█████████████████████████▊                                                  | 16004/47154 [20:33<35:19, 14.70it/s]

Iteration 16000, loss = 5.8291


 36%|███████████████████████████▍                                                | 17000/47154 [21:53<38:58, 12.90it/s]

Iteration 17000, loss = 6.1887


 38%|█████████████████████████████                                               | 18002/47154 [23:09<31:58, 15.19it/s]

Iteration 18000, loss = 5.6329


 40%|██████████████████████████████▋                                             | 19004/47154 [24:25<24:52, 18.85it/s]

Iteration 19000, loss = 6.3802


 42%|████████████████████████████████▏                                           | 20001/47154 [25:41<32:28, 13.94it/s]

Iteration 20000, loss = 5.3076


 45%|█████████████████████████████████▊                                          | 21004/47154 [27:00<27:51, 15.64it/s]

Iteration 21000, loss = 6.2076


 47%|███████████████████████████████████▍                                        | 22001/47154 [28:15<28:42, 14.61it/s]

Iteration 22000, loss = 5.9316


 49%|█████████████████████████████████████                                       | 23002/47154 [29:33<36:22, 11.07it/s]

Iteration 23000, loss = 5.8263


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:51<25:03, 15.40it/s]

Iteration 24000, loss = 5.7828


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:10<42:57,  8.60it/s]

Iteration 25000, loss = 6.6209


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:26<23:17, 15.13it/s]

Iteration 26000, loss = 5.2641


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:44<26:45, 12.55it/s]

Iteration 27000, loss = 6.0693


 59%|█████████████████████████████████████████████▏                              | 28005/47154 [36:00<17:03, 18.70it/s]

Iteration 28000, loss = 5.7655


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:17<18:26, 16.41it/s]

Iteration 29000, loss = 5.5314


 64%|████████████████████████████████████████████████▎                           | 30001/47154 [38:35<15:45, 18.15it/s]

Iteration 30000, loss = 6.2923


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:51<17:29, 15.39it/s]

Iteration 31000, loss = 4.9658


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:10<15:46, 16.01it/s]

Iteration 32000, loss = 6.2426


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:27<32:22,  7.29it/s]

Iteration 33000, loss = 5.4524


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:44<17:42, 12.38it/s]

Iteration 34000, loss = 5.5867


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [45:02<16:53, 11.99it/s]

Iteration 35000, loss = 5.3289


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [46:20<13:12, 14.08it/s]

Iteration 36000, loss = 6.8222


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:38<12:59, 13.03it/s]

Iteration 37000, loss = 5.2346


 81%|█████████████████████████████████████████████████████████████▎              | 38005/47154 [48:56<09:33, 15.95it/s]

Iteration 38000, loss = 6.6548


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:09<09:19, 14.57it/s]

Iteration 39000, loss = 5.8621


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:26<07:46, 15.33it/s]

Iteration 40000, loss = 5.6692


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:41<08:09, 12.58it/s]

Iteration 41000, loss = 6.0169


 89%|███████████████████████████████████████████████████████████████████▋        | 42001/47154 [54:04<05:54, 14.52it/s]

Iteration 42000, loss = 6.9170


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:25<04:20, 15.93it/s]

Iteration 43000, loss = 5.1950


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:42<03:31, 14.92it/s]

Iteration 44000, loss = 5.7889


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:56<03:18, 10.84it/s]

Iteration 45000, loss = 6.3783


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:10<01:48, 10.59it/s]

Iteration 46000, loss = 5.6577


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:29<00:12, 11.84it/s]

Iteration 47000, loss = 6.7366


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:41<00:00, 12.95it/s]


Checking accuracy score on validation set.

Accuracy: 832 / 83918 correct (0.99)
Log Loss score:	5.78
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 38


  0%|                                                                              | 3/47154 [00:00<1:29:42,  8.76it/s]

Iteration 0, loss = 5.3031


  2%|█▋                                                                           | 1003/47154 [01:18<47:36, 16.15it/s]

Iteration 1000, loss = 6.2544


  4%|███▎                                                                         | 2004/47154 [02:33<44:28, 16.92it/s]

Iteration 2000, loss = 6.4978


  6%|████▉                                                                        | 3003/47154 [03:49<57:26, 12.81it/s]

Iteration 3000, loss = 5.2908


  8%|██████▌                                                                      | 4000/47154 [05:02<46:46, 15.38it/s]

Iteration 4000, loss = 6.2530


 11%|████████▏                                                                    | 5003/47154 [06:17<55:22, 12.68it/s]

Iteration 5000, loss = 5.4898


 13%|█████████▌                                                                 | 6003/47154 [07:35<1:04:28, 10.64it/s]

Iteration 6000, loss = 6.2982


 15%|███████████▍                                                                 | 7004/47154 [08:53<50:30, 13.25it/s]

Iteration 7000, loss = 6.6734


 17%|█████████████                                                                | 8003/47154 [10:12<40:18, 16.19it/s]

Iteration 8000, loss = 5.3079


 19%|██████████████▋                                                              | 9003/47154 [11:29<40:27, 15.72it/s]

Iteration 9000, loss = 6.6250


 21%|████████████████                                                            | 10003/47154 [12:47<47:00, 13.17it/s]

Iteration 10000, loss = 6.3577


 23%|█████████████████▋                                                          | 11004/47154 [14:03<46:42, 12.90it/s]

Iteration 11000, loss = 5.8794


 25%|███████████████████▎                                                        | 12003/47154 [15:21<46:45, 12.53it/s]

Iteration 12000, loss = 6.0339


 28%|████████████████████▉                                                       | 13004/47154 [16:41<32:09, 17.70it/s]

Iteration 13000, loss = 6.0053


 30%|██████████████████████▌                                                     | 14003/47154 [17:57<33:48, 16.34it/s]

Iteration 14000, loss = 6.4258


 32%|████████████████████████▏                                                   | 15002/47154 [19:13<46:51, 11.44it/s]

Iteration 15000, loss = 6.1337


 34%|█████████████████████████▊                                                  | 16002/47154 [20:29<34:46, 14.93it/s]

Iteration 16000, loss = 5.9417


 36%|███████████████████████████▍                                                | 17002/47154 [21:49<36:53, 13.62it/s]

Iteration 17000, loss = 6.9527


 38%|█████████████████████████████                                               | 18003/47154 [23:09<37:16, 13.04it/s]

Iteration 18000, loss = 5.3695


 40%|██████████████████████████████▋                                             | 19003/47154 [24:25<29:53, 15.70it/s]

Iteration 19000, loss = 5.8710


 42%|████████████████████████████████▏                                           | 20002/47154 [25:41<27:02, 16.74it/s]

Iteration 20000, loss = 6.6186


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:59<23:33, 18.50it/s]

Iteration 21000, loss = 6.0302


 47%|███████████████████████████████████▍                                        | 22004/47154 [28:19<29:30, 14.21it/s]

Iteration 22000, loss = 6.2513


 49%|█████████████████████████████████████                                       | 23002/47154 [29:34<31:22, 12.83it/s]

Iteration 23000, loss = 6.1777


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:51<28:06, 13.73it/s]

Iteration 24000, loss = 5.7466


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:09<18:39, 19.79it/s]

Iteration 25000, loss = 6.2694


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:26<22:27, 15.69it/s]

Iteration 26000, loss = 6.2435


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:40<20:13, 16.60it/s]

Iteration 27000, loss = 6.1628


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [36:00<23:53, 13.36it/s]

Iteration 28000, loss = 5.4491


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:17<19:35, 15.44it/s]

Iteration 29000, loss = 5.3244


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:31<18:58, 15.07it/s]

Iteration 30000, loss = 4.9427


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:49<19:53, 13.54it/s]

Iteration 31000, loss = 5.3859


 68%|███████████████████████████████████████████████████▌                        | 32001/47154 [41:05<17:59, 14.03it/s]

Iteration 32000, loss = 6.4259


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [42:22<28:28,  8.28it/s]

Iteration 33000, loss = 5.7725


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:40<15:57, 13.73it/s]

Iteration 34000, loss = 6.6344


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:59<14:55, 13.57it/s]

Iteration 35000, loss = 5.8166


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:18<16:10, 11.49it/s]

Iteration 36000, loss = 4.6596


 78%|███████████████████████████████████████████████████████████▋                | 37001/47154 [47:33<15:16, 11.07it/s]

Iteration 37000, loss = 5.6514


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:52<12:02, 12.67it/s]

Iteration 38000, loss = 6.1056


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:09<08:13, 16.52it/s]

Iteration 39000, loss = 6.3947


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [51:27<10:00, 11.90it/s]

Iteration 40000, loss = 6.1288


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:44<06:29, 15.80it/s]

Iteration 41000, loss = 6.4787


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [54:03<07:07, 12.05it/s]

Iteration 42000, loss = 5.0794


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:16<04:25, 15.64it/s]

Iteration 43000, loss = 7.1507


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:35<04:52, 10.79it/s]

Iteration 44000, loss = 4.6815


 95%|████████████████████████████████████████████████████████████████████████▌   | 45005/47154 [57:53<02:01, 17.62it/s]

Iteration 45000, loss = 6.2819


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [59:09<01:12, 15.91it/s]

Iteration 46000, loss = 6.3459


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:27<00:07, 18.87it/s]

Iteration 47000, loss = 5.5413


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:37<00:00, 12.96it/s]


Checking accuracy score on validation set.

Accuracy: 728 / 83918 correct (0.87)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 39


  0%|                                                                              | 1/47154 [00:00<2:29:19,  5.26it/s]

Iteration 0, loss = 6.7355


  2%|█▋                                                                           | 1002/47154 [01:18<52:06, 14.76it/s]

Iteration 1000, loss = 5.3963


  4%|███▎                                                                         | 2005/47154 [02:34<54:08, 13.90it/s]

Iteration 2000, loss = 6.1668


  6%|████▉                                                                        | 3004/47154 [03:52<51:15, 14.35it/s]

Iteration 3000, loss = 6.4833


  8%|██████▌                                                                      | 4004/47154 [05:09<59:08, 12.16it/s]

Iteration 4000, loss = 5.9231


 11%|███████▉                                                                   | 5003/47154 [06:28<1:07:59, 10.33it/s]

Iteration 5000, loss = 6.2856


 13%|█████████▊                                                                   | 6003/47154 [07:45<39:14, 17.48it/s]

Iteration 6000, loss = 5.3042


 15%|███████████▍                                                                 | 7003/47154 [09:00<52:06, 12.84it/s]

Iteration 7000, loss = 7.0183


 17%|█████████████                                                                | 8003/47154 [10:15<40:30, 16.11it/s]

Iteration 8000, loss = 4.8317


 19%|██████████████▋                                                              | 9004/47154 [11:30<47:13, 13.46it/s]

Iteration 9000, loss = 5.6269


 21%|███████████████▋                                                          | 10000/47154 [12:49<1:02:50,  9.85it/s]

Iteration 10000, loss = 4.9002


 23%|█████████████████▋                                                          | 11005/47154 [14:10<36:39, 16.44it/s]

Iteration 11000, loss = 6.1314


 25%|███████████████████▎                                                        | 12004/47154 [15:27<37:51, 15.47it/s]

Iteration 12000, loss = 5.9033


 28%|████████████████████▉                                                       | 13003/47154 [16:43<43:58, 12.95it/s]

Iteration 13000, loss = 6.3932


 30%|██████████████████████▌                                                     | 14003/47154 [18:02<33:38, 16.42it/s]

Iteration 14000, loss = 5.1783


 32%|████████████████████████▏                                                   | 15001/47154 [19:18<40:25, 13.26it/s]

Iteration 15000, loss = 5.7233


 34%|█████████████████████████▊                                                  | 16004/47154 [20:36<37:03, 14.01it/s]

Iteration 16000, loss = 5.7411


 36%|███████████████████████████▍                                                | 17002/47154 [21:55<38:51, 12.93it/s]

Iteration 17000, loss = 6.2407


 38%|█████████████████████████████                                               | 18003/47154 [23:12<41:06, 11.82it/s]

Iteration 18000, loss = 6.7780


 40%|██████████████████████████████▋                                             | 19004/47154 [24:29<30:50, 15.21it/s]

Iteration 19000, loss = 5.0805


 42%|████████████████████████████████▏                                           | 20002/47154 [25:46<41:52, 10.81it/s]

Iteration 20000, loss = 5.5892


 45%|█████████████████████████████████▊                                          | 21002/47154 [27:04<27:36, 15.79it/s]

Iteration 21000, loss = 6.7903


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:20<27:01, 15.51it/s]

Iteration 22000, loss = 4.6507


 49%|█████████████████████████████████████                                       | 23003/47154 [29:36<27:54, 14.42it/s]

Iteration 23000, loss = 5.1836


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:55<26:20, 14.65it/s]

Iteration 24000, loss = 5.2767


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:14<23:31, 15.70it/s]

Iteration 25000, loss = 6.5643


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:31<23:37, 14.92it/s]

Iteration 26000, loss = 6.3575


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:46<21:00, 15.98it/s]

Iteration 27000, loss = 5.9364


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [36:00<22:29, 14.19it/s]

Iteration 28000, loss = 4.9226


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [37:17<22:26, 13.49it/s]

Iteration 29000, loss = 5.4204


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:33<20:24, 14.01it/s]

Iteration 30000, loss = 5.3122


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:51<27:17,  9.86it/s]

Iteration 31000, loss = 5.7938


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:11<25:16,  9.99it/s]

Iteration 32000, loss = 5.9006


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:32<15:13, 15.49it/s]

Iteration 33000, loss = 7.0060


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:48<15:45, 13.90it/s]

Iteration 34000, loss = 5.1769


 74%|████████████████████████████████████████████████████████▍                   | 35005/47154 [45:04<11:20, 17.86it/s]

Iteration 35000, loss = 6.5753


 76%|██████████████████████████████████████████████████████████                  | 36004/47154 [46:19<13:50, 13.42it/s]

Iteration 36000, loss = 6.2701


 78%|███████████████████████████████████████████████████████████▋                | 37001/47154 [47:37<13:44, 12.32it/s]

Iteration 37000, loss = 5.8703


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [48:56<09:40, 15.77it/s]

Iteration 38000, loss = 5.7757


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:14<16:39,  8.16it/s]

Iteration 39000, loss = 6.3881


 85%|████████████████████████████████████████████████████████████████▍           | 40001/47154 [51:33<08:20, 14.30it/s]

Iteration 40000, loss = 6.2497


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:48<06:16, 16.34it/s]

Iteration 41000, loss = 6.2063


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [54:01<05:06, 16.82it/s]

Iteration 42000, loss = 6.8645


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:20<05:24, 12.78it/s]

Iteration 43000, loss = 5.7235


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:35<04:06, 12.81it/s]

Iteration 44000, loss = 6.2014


 95%|████████████████████████████████████████████████████████████████████████▌   | 45005/47154 [57:51<02:19, 15.40it/s]

Iteration 45000, loss = 6.0639


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:10<01:16, 15.11it/s]

Iteration 46000, loss = 5.4255


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:28<00:11, 12.69it/s]

Iteration 47000, loss = 5.7496


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:39<00:00, 12.96it/s]


Checking accuracy score on validation set.

Accuracy: 786 / 83918 correct (0.94)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 40


  0%|                                                                              | 3/47154 [00:00<2:05:43,  6.25it/s]

Iteration 0, loss = 6.1894


  2%|█▋                                                                           | 1002/47154 [01:21<55:09, 13.95it/s]

Iteration 1000, loss = 6.3329


  4%|███▎                                                                         | 2003/47154 [02:39<46:48, 16.07it/s]

Iteration 2000, loss = 5.7336


  6%|████▊                                                                      | 3001/47154 [03:54<1:17:47,  9.46it/s]

Iteration 3000, loss = 5.5960


  8%|██████▌                                                                      | 4002/47154 [05:09<54:45, 13.13it/s]

Iteration 4000, loss = 6.3440


 11%|████████▏                                                                    | 5001/47154 [06:24<52:13, 13.45it/s]

Iteration 5000, loss = 5.5895


 13%|█████████▌                                                                 | 6002/47154 [07:43<1:03:34, 10.79it/s]

Iteration 6000, loss = 5.0705


 15%|███████████▍                                                                 | 7003/47154 [08:57<37:38, 17.78it/s]

Iteration 7000, loss = 6.9154


 17%|█████████████                                                                | 8003/47154 [10:11<46:10, 14.13it/s]

Iteration 8000, loss = 5.8768


 19%|██████████████▋                                                              | 9002/47154 [11:29<33:52, 18.78it/s]

Iteration 9000, loss = 5.6713


 21%|████████████████                                                            | 10002/47154 [12:50<50:59, 12.14it/s]

Iteration 10000, loss = 5.9375


 23%|█████████████████▋                                                          | 11003/47154 [14:07<40:38, 14.83it/s]

Iteration 11000, loss = 5.8169


 25%|███████████████████▎                                                        | 12003/47154 [15:23<40:13, 14.56it/s]

Iteration 12000, loss = 5.8129


 28%|████████████████████▉                                                       | 13002/47154 [16:40<44:29, 12.80it/s]

Iteration 13000, loss = 5.5225


 30%|██████████████████████▌                                                     | 14003/47154 [17:56<47:32, 11.62it/s]

Iteration 14000, loss = 5.9177


 32%|████████████████████████▏                                                   | 15001/47154 [19:10<41:03, 13.05it/s]

Iteration 15000, loss = 6.3844


 34%|█████████████████████████▊                                                  | 16004/47154 [20:26<32:15, 16.09it/s]

Iteration 16000, loss = 5.1981


 36%|███████████████████████████▍                                                | 17001/47154 [21:43<32:42, 15.36it/s]

Iteration 17000, loss = 5.9232


 38%|█████████████████████████████                                               | 18004/47154 [23:00<27:15, 17.82it/s]

Iteration 18000, loss = 5.1069


 40%|██████████████████████████████▋                                             | 19002/47154 [24:17<29:31, 15.89it/s]

Iteration 19000, loss = 6.0580


 42%|████████████████████████████████▏                                           | 20002/47154 [25:34<36:50, 12.28it/s]

Iteration 20000, loss = 5.5545


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:51<26:49, 16.25it/s]

Iteration 21000, loss = 4.6788


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:09<36:46, 11.40it/s]

Iteration 22000, loss = 6.2147


 49%|█████████████████████████████████████                                       | 23004/47154 [29:24<34:09, 11.79it/s]

Iteration 23000, loss = 6.6598


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:42<27:24, 14.08it/s]

Iteration 24000, loss = 5.8352


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:02<27:40, 13.34it/s]

Iteration 25000, loss = 5.1904


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:19<19:46, 17.82it/s]

Iteration 26000, loss = 6.1102


 57%|███████████████████████████████████████████▌                                | 27002/47154 [34:37<20:13, 16.61it/s]

Iteration 27000, loss = 6.1330


 59%|█████████████████████████████████████████████▏                              | 28001/47154 [35:55<23:31, 13.57it/s]

Iteration 28000, loss = 6.7714


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:12<21:38, 13.98it/s]

Iteration 29000, loss = 4.9640


 64%|████████████████████████████████████████████████▎                           | 30005/47154 [38:27<15:34, 18.35it/s]

Iteration 30000, loss = 6.5622


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:43<21:15, 12.66it/s]

Iteration 31000, loss = 6.6137


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [40:56<17:54, 14.09it/s]

Iteration 32000, loss = 5.2258


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [42:10<24:58,  9.45it/s]

Iteration 33000, loss = 5.9029


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:30<12:45, 17.18it/s]

Iteration 34000, loss = 5.3520


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:51<15:39, 12.93it/s]

Iteration 35000, loss = 4.6995


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:08<12:54, 14.39it/s]

Iteration 36000, loss = 5.7890


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:27<10:57, 15.43it/s]

Iteration 37000, loss = 5.3441


 81%|█████████████████████████████████████████████████████████████▎              | 38005/47154 [48:44<11:51, 12.86it/s]

Iteration 38000, loss = 5.0745


 83%|██████████████████████████████████████████████████████████████▊             | 39001/47154 [49:59<14:15,  9.53it/s]

Iteration 39000, loss = 5.0965


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:17<07:32, 15.82it/s]

Iteration 40000, loss = 6.2026


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:36<11:47,  8.70it/s]

Iteration 41000, loss = 5.7037


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:54<05:45, 14.91it/s]

Iteration 42000, loss = 7.5147


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:14<05:22, 12.86it/s]

Iteration 43000, loss = 4.8205


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:35<03:31, 14.92it/s]

Iteration 44000, loss = 5.2015


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:51<02:41, 13.33it/s]

Iteration 45000, loss = 4.5802


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [59:10<01:29, 12.90it/s]

Iteration 46000, loss = 5.8312


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:26<00:15,  9.95it/s]

Iteration 47000, loss = 5.9041


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:37<00:00, 12.96it/s]


Checking accuracy score on validation set.

Accuracy: 505 / 83918 correct (0.60)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 41


  0%|                                                                              | 1/47154 [00:00<1:42:09,  7.69it/s]

Iteration 0, loss = 5.2707


  2%|█▋                                                                           | 1003/47154 [01:20<57:30, 13.37it/s]

Iteration 1000, loss = 4.9060


  4%|███▏                                                                       | 2003/47154 [02:38<1:06:07, 11.38it/s]

Iteration 2000, loss = 5.9264


  6%|████▉                                                                        | 3002/47154 [03:56<50:02, 14.70it/s]

Iteration 3000, loss = 6.6680


  8%|██████▌                                                                      | 4001/47154 [05:12<36:35, 19.66it/s]

Iteration 4000, loss = 5.9691


 11%|████████▏                                                                    | 5005/47154 [06:29<39:58, 17.58it/s]

Iteration 5000, loss = 4.7974


 13%|█████████▊                                                                   | 6003/47154 [07:41<49:22, 13.89it/s]

Iteration 6000, loss = 6.5785


 15%|███████████▍                                                                 | 7005/47154 [08:56<36:25, 18.37it/s]

Iteration 7000, loss = 4.8178


 17%|████████████▋                                                              | 8001/47154 [10:11<1:10:21,  9.27it/s]

Iteration 8000, loss = 6.1464


 19%|██████████████▋                                                              | 9002/47154 [11:27<45:58, 13.83it/s]

Iteration 9000, loss = 4.6865


 21%|████████████████                                                            | 10003/47154 [12:44<55:11, 11.22it/s]

Iteration 10000, loss = 6.1645


 23%|█████████████████▋                                                          | 11004/47154 [13:58<36:21, 16.57it/s]

Iteration 11000, loss = 5.9300


 25%|███████████████████▎                                                        | 12003/47154 [15:14<38:30, 15.21it/s]

Iteration 12000, loss = 4.9149


 28%|████████████████████▉                                                       | 13001/47154 [16:31<55:23, 10.28it/s]

Iteration 13000, loss = 4.9703


 30%|██████████████████████▌                                                     | 14004/47154 [17:51<41:33, 13.29it/s]

Iteration 14000, loss = 5.8887


 32%|████████████████████████▏                                                   | 15004/47154 [19:07<35:17, 15.18it/s]

Iteration 15000, loss = 5.8607


 34%|█████████████████████████▊                                                  | 16002/47154 [20:22<35:16, 14.72it/s]

Iteration 16000, loss = 6.1343


 36%|███████████████████████████▍                                                | 17004/47154 [21:39<38:30, 13.05it/s]

Iteration 17000, loss = 5.1202


 38%|█████████████████████████████                                               | 18004/47154 [22:57<30:06, 16.14it/s]

Iteration 18000, loss = 7.5478


 40%|██████████████████████████████▋                                             | 19003/47154 [24:14<35:06, 13.36it/s]

Iteration 19000, loss = 5.8075


 42%|████████████████████████████████▏                                           | 20002/47154 [25:28<43:26, 10.42it/s]

Iteration 20000, loss = 5.9457


 45%|█████████████████████████████████▊                                          | 21005/47154 [26:45<25:24, 17.16it/s]

Iteration 21000, loss = 5.0591


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:02<27:38, 15.17it/s]

Iteration 22000, loss = 4.9575


 49%|█████████████████████████████████████                                       | 23003/47154 [29:22<31:59, 12.58it/s]

Iteration 23000, loss = 6.3387


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:41<28:05, 13.73it/s]

Iteration 24000, loss = 5.4178


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:00<25:26, 14.51it/s]

Iteration 25000, loss = 6.4584


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:17<19:58, 17.65it/s]

Iteration 26000, loss = 4.8870


 57%|███████████████████████████████████████████▌                                | 27004/47154 [34:38<21:08, 15.89it/s]

Iteration 27000, loss = 5.9218


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:52<24:47, 12.87it/s]

Iteration 28000, loss = 6.7456


 62%|██████████████████████████████████████████████▋                             | 29001/47154 [37:09<20:09, 15.01it/s]

Iteration 29000, loss = 6.2743


 64%|████████████████████████████████████████████████▎                           | 30000/47154 [38:28<18:02, 15.85it/s]

Iteration 30000, loss = 6.6072


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:47<31:28,  8.55it/s]

Iteration 31000, loss = 5.8997


 68%|███████████████████████████████████████████████████▌                        | 32001/47154 [41:03<21:03, 11.99it/s]

Iteration 32000, loss = 5.5087


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:16<20:20, 11.59it/s]

Iteration 33000, loss = 6.1973


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:32<13:12, 16.60it/s]

Iteration 34000, loss = 5.2789


 74%|████████████████████████████████████████████████████████▍                   | 35001/47154 [44:52<20:55,  9.68it/s]

Iteration 35000, loss = 5.2281


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:10<13:43, 13.54it/s]

Iteration 36000, loss = 5.0599


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:29<09:41, 17.44it/s]

Iteration 37000, loss = 5.9993


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [48:42<13:33, 11.25it/s]

Iteration 38000, loss = 4.7856


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [49:59<10:19, 13.16it/s]

Iteration 39000, loss = 6.2751


 85%|████████████████████████████████████████████████████████████████▍           | 40004/47154 [51:16<06:56, 17.18it/s]

Iteration 40000, loss = 5.6517


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [52:34<06:47, 15.10it/s]

Iteration 41000, loss = 5.8933


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [53:50<07:05, 12.10it/s]

Iteration 42000, loss = 6.6680


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [55:08<04:57, 13.94it/s]

Iteration 43000, loss = 4.9354


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [56:23<03:44, 14.06it/s]

Iteration 44000, loss = 5.8661


 95%|████████████████████████████████████████████████████████████████████████▌   | 45004/47154 [57:40<02:34, 13.88it/s]

Iteration 45000, loss = 6.1592


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46005/47154 [58:59<01:08, 16.88it/s]

Iteration 46000, loss = 4.7653


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:15<00:12, 11.87it/s]

Iteration 47000, loss = 4.8827


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:27<00:00, 13.00it/s]


Checking accuracy score on validation set.

Accuracy: 651 / 83918 correct (0.78)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 42


  0%|                                                                              | 1/47154 [00:00<1:50:48,  7.09it/s]

Iteration 0, loss = 5.8508


  2%|█▋                                                                           | 1001/47154 [01:19<47:45, 16.10it/s]

Iteration 1000, loss = 6.2357


  4%|███▎                                                                         | 2004/47154 [02:36<43:47, 17.19it/s]

Iteration 2000, loss = 5.8635


  6%|████▉                                                                        | 3004/47154 [03:56<40:03, 18.37it/s]

Iteration 3000, loss = 6.9271


  8%|██████▌                                                                      | 4005/47154 [05:13<39:52, 18.03it/s]

Iteration 4000, loss = 6.1064


 11%|████████▏                                                                    | 5004/47154 [06:34<48:06, 14.60it/s]

Iteration 5000, loss = 4.7428


 13%|█████████▊                                                                   | 6004/47154 [07:49<48:50, 14.04it/s]

Iteration 6000, loss = 6.2568


 15%|███████████▍                                                                 | 7001/47154 [09:08<39:45, 16.83it/s]

Iteration 7000, loss = 6.2217


 17%|█████████████                                                                | 8003/47154 [10:26<44:23, 14.70it/s]

Iteration 8000, loss = 6.6645


 19%|██████████████▋                                                              | 9002/47154 [11:47<40:04, 15.87it/s]

Iteration 9000, loss = 6.0227


 21%|████████████████                                                            | 10000/47154 [13:10<38:36, 16.04it/s]

Iteration 10000, loss = 5.4798


 23%|█████████████████▋                                                          | 11004/47154 [14:29<34:48, 17.31it/s]

Iteration 11000, loss = 5.1423


 25%|███████████████████▎                                                        | 12005/47154 [15:48<34:30, 16.97it/s]

Iteration 12000, loss = 6.0542


 28%|████████████████████▉                                                       | 13003/47154 [17:07<38:14, 14.88it/s]

Iteration 13000, loss = 5.6295


 30%|██████████████████████▌                                                     | 14002/47154 [18:23<43:06, 12.82it/s]

Iteration 14000, loss = 5.1766


 32%|████████████████████████▏                                                   | 15001/47154 [19:47<44:30, 12.04it/s]

Iteration 15000, loss = 4.8276


 34%|█████████████████████████▊                                                  | 16003/47154 [21:06<37:31, 13.83it/s]

Iteration 16000, loss = 5.4189


 36%|███████████████████████████▍                                                | 17004/47154 [22:22<30:54, 16.26it/s]

Iteration 17000, loss = 5.8463


 38%|█████████████████████████████                                               | 18002/47154 [23:41<31:43, 15.32it/s]

Iteration 18000, loss = 5.7915


 40%|██████████████████████████████▋                                             | 19003/47154 [24:57<36:37, 12.81it/s]

Iteration 19000, loss = 6.5972


 42%|████████████████████████████████▏                                           | 20003/47154 [26:13<31:14, 14.48it/s]

Iteration 20000, loss = 6.4206


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:32<30:46, 14.17it/s]

Iteration 21000, loss = 5.6042


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:50<31:06, 13.48it/s]

Iteration 22000, loss = 5.6767


 49%|█████████████████████████████████████                                       | 23005/47154 [30:14<30:54, 13.02it/s]

Iteration 23000, loss = 5.5880


 51%|██████████████████████████████████████▋                                     | 24003/47154 [31:34<40:45,  9.47it/s]

Iteration 24000, loss = 7.3938


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:52<29:31, 12.50it/s]

Iteration 25000, loss = 6.0716


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [34:06<27:11, 12.97it/s]

Iteration 26000, loss = 4.8434


 57%|███████████████████████████████████████████▌                                | 27003/47154 [35:24<22:48, 14.72it/s]

Iteration 27000, loss = 6.2622


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [36:42<26:52, 11.87it/s]

Iteration 28000, loss = 5.1400


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [38:00<21:01, 14.39it/s]

Iteration 29000, loss = 4.9570


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [39:17<19:14, 14.85it/s]

Iteration 30000, loss = 6.2530


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [40:36<20:01, 13.45it/s]

Iteration 31000, loss = 5.7853


 68%|███████████████████████████████████████████████████▌                        | 32001/47154 [41:54<15:41, 16.09it/s]

Iteration 32000, loss = 5.9465


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [43:13<15:53, 14.84it/s]

Iteration 33000, loss = 5.9557


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [44:34<24:39,  8.89it/s]

Iteration 34000, loss = 6.8382


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [45:54<11:56, 16.95it/s]

Iteration 35000, loss = 5.9921


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [47:11<11:31, 16.12it/s]

Iteration 36000, loss = 5.6285


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [48:29<15:42, 10.77it/s]

Iteration 37000, loss = 5.9303


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [49:47<14:32, 10.49it/s]

Iteration 38000, loss = 6.5080


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [51:07<11:25, 11.90it/s]

Iteration 39000, loss = 5.7988


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [52:26<07:54, 15.08it/s]

Iteration 40000, loss = 5.9091


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [53:45<06:35, 15.54it/s]

Iteration 41000, loss = 6.0040


 89%|███████████████████████████████████████████████████████████████████▋        | 42002/47154 [55:04<07:15, 11.84it/s]

Iteration 42000, loss = 4.8897


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [56:27<04:01, 17.21it/s]

Iteration 43000, loss = 5.3368


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [57:43<03:08, 16.75it/s]

Iteration 44000, loss = 5.8846


 95%|████████████████████████████████████████████████████████████████████████▌   | 45001/47154 [59:03<02:33, 14.01it/s]

Iteration 45000, loss = 5.6580


 98%|████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [1:00:23<01:26, 13.26it/s]

Iteration 46000, loss = 5.8345


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:01:42<00:12, 11.78it/s]

Iteration 47000, loss = 6.2181


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:55<00:00, 12.69it/s]


Checking accuracy score on validation set.

Accuracy: 528 / 83918 correct (0.63)
Log Loss score:	5.77
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 43


  0%|                                                                              | 1/47154 [00:00<1:40:35,  7.81it/s]

Iteration 0, loss = 5.7842


  2%|█▋                                                                           | 1003/47154 [01:18<42:22, 18.15it/s]

Iteration 1000, loss = 4.6065


  4%|███▎                                                                         | 2005/47154 [02:35<50:19, 14.95it/s]

Iteration 2000, loss = 6.3306


  6%|████▉                                                                        | 3002/47154 [03:51<47:31, 15.48it/s]

Iteration 3000, loss = 6.1387


  8%|██████▌                                                                      | 4002/47154 [05:08<51:07, 14.07it/s]

Iteration 4000, loss = 5.8105


 11%|████████▏                                                                    | 5000/47154 [06:25<50:26, 13.93it/s]

Iteration 5000, loss = 5.6773


 13%|█████████▊                                                                   | 6002/47154 [07:42<44:08, 15.54it/s]

Iteration 6000, loss = 6.3094


 15%|███████████▍                                                                 | 7004/47154 [08:58<48:31, 13.79it/s]

Iteration 7000, loss = 5.2074


 17%|████████████▋                                                              | 8002/47154 [10:15<1:09:04,  9.45it/s]

Iteration 8000, loss = 5.3317


 19%|██████████████▋                                                              | 9002/47154 [11:33<35:08, 18.10it/s]

Iteration 9000, loss = 5.6561


 21%|████████████████                                                            | 10004/47154 [12:46<53:32, 11.56it/s]

Iteration 10000, loss = 5.8123


 23%|█████████████████▋                                                          | 11001/47154 [14:04<42:08, 14.30it/s]

Iteration 11000, loss = 4.9632


 25%|███████████████████▎                                                        | 12000/47154 [15:19<44:00, 13.31it/s]

Iteration 12000, loss = 6.3054


 28%|████████████████████▉                                                       | 13003/47154 [16:34<42:06, 13.52it/s]

Iteration 13000, loss = 4.8666


 30%|██████████████████████▌                                                     | 14001/47154 [17:52<31:02, 17.80it/s]

Iteration 14000, loss = 4.8213


 32%|████████████████████████▏                                                   | 15003/47154 [19:08<34:16, 15.63it/s]

Iteration 15000, loss = 4.8001


 34%|█████████████████████████▊                                                  | 16003/47154 [20:24<41:16, 12.58it/s]

Iteration 16000, loss = 5.8603


 36%|███████████████████████████▍                                                | 17001/47154 [21:40<42:58, 11.69it/s]

Iteration 17000, loss = 5.8156


 38%|█████████████████████████████                                               | 18003/47154 [22:55<35:12, 13.80it/s]

Iteration 18000, loss = 5.1590


 40%|██████████████████████████████▋                                             | 19003/47154 [24:11<29:47, 15.75it/s]

Iteration 19000, loss = 6.7829


 42%|████████████████████████████████▏                                           | 20003/47154 [25:26<31:37, 14.31it/s]

Iteration 20000, loss = 6.4515


 45%|█████████████████████████████████▊                                          | 21004/47154 [26:44<28:11, 15.46it/s]

Iteration 21000, loss = 6.7441


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:01<25:40, 16.32it/s]

Iteration 22000, loss = 6.8458


 49%|█████████████████████████████████████                                       | 23002/47154 [29:18<33:27, 12.03it/s]

Iteration 23000, loss = 5.7482


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:35<32:35, 11.84it/s]

Iteration 24000, loss = 5.5556


 53%|████████████████████████████████████████▎                                   | 25001/47154 [31:53<28:07, 13.12it/s]

Iteration 25000, loss = 5.3140


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:09<19:36, 17.99it/s]

Iteration 26000, loss = 5.7621


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:29<21:41, 15.48it/s]

Iteration 27000, loss = 5.6050


 59%|█████████████████████████████████████████████▏                              | 28004/47154 [35:49<18:46, 17.00it/s]

Iteration 28000, loss = 5.1220


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [37:04<16:07, 18.76it/s]

Iteration 29000, loss = 6.3687


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:22<19:50, 14.41it/s]

Iteration 30000, loss = 5.8049


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [39:40<16:13, 16.58it/s]

Iteration 31000, loss = 5.3755


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [40:56<19:36, 12.88it/s]

Iteration 32000, loss = 5.7342


 70%|█████████████████████████████████████████████████████▏                      | 33003/47154 [42:16<17:45, 13.28it/s]

Iteration 33000, loss = 5.1950


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:30<13:01, 16.83it/s]

Iteration 34000, loss = 5.3191


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [44:51<13:28, 15.03it/s]

Iteration 35000, loss = 5.7664


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:08<18:08, 10.25it/s]

Iteration 36000, loss = 5.0587


 78%|███████████████████████████████████████████████████████████▋                | 37005/47154 [47:28<12:25, 13.61it/s]

Iteration 37000, loss = 6.4337


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:44<10:16, 14.86it/s]

Iteration 38000, loss = 6.1300


 83%|██████████████████████████████████████████████████████████████▊             | 39002/47154 [50:03<10:55, 12.44it/s]

Iteration 39000, loss = 4.8950


 85%|████████████████████████████████████████████████████████████████▍           | 40001/47154 [51:20<09:21, 12.73it/s]

Iteration 40000, loss = 6.9202


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:35<08:21, 12.26it/s]

Iteration 41000, loss = 5.7850


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:52<07:13, 11.88it/s]

Iteration 42000, loss = 6.7486


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [55:12<04:43, 14.66it/s]

Iteration 43000, loss = 5.3358


 93%|██████████████████████████████████████████████████████████████████████▉     | 44004/47154 [56:29<03:38, 14.45it/s]

Iteration 44000, loss = 5.9233


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [57:44<03:32, 10.14it/s]

Iteration 45000, loss = 5.5573


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [59:00<01:26, 13.26it/s]

Iteration 46000, loss = 4.7783


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:00:19<00:09, 16.14it/s]

Iteration 47000, loss = 5.1850


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:30<00:00, 12.99it/s]


Checking accuracy score on validation set.

Accuracy: 832 / 83918 correct (0.99)
Log Loss score:	5.76
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 44


  0%|                                                                              | 1/47154 [00:00<1:42:56,  7.63it/s]

Iteration 0, loss = 4.9320


  2%|█▋                                                                           | 1002/47154 [01:16<51:49, 14.84it/s]

Iteration 1000, loss = 4.7011


  4%|███▎                                                                         | 2003/47154 [02:31<41:39, 18.06it/s]

Iteration 2000, loss = 5.7291


  6%|████▉                                                                        | 3000/47154 [03:47<43:54, 16.76it/s]

Iteration 3000, loss = 4.8902


  8%|██████▌                                                                      | 4001/47154 [05:04<55:49, 12.89it/s]

Iteration 4000, loss = 5.8683


 11%|████████▏                                                                    | 5004/47154 [06:20<50:33, 13.89it/s]

Iteration 5000, loss = 4.9056


 13%|█████████▊                                                                   | 6004/47154 [07:36<41:50, 16.39it/s]

Iteration 6000, loss = 4.9676


 15%|███████████▍                                                                 | 7003/47154 [08:55<37:26, 17.87it/s]

Iteration 7000, loss = 5.9267


 17%|█████████████                                                                | 8003/47154 [10:13<57:34, 11.33it/s]

Iteration 8000, loss = 5.2817


 19%|██████████████▋                                                              | 9003/47154 [11:28<44:19, 14.35it/s]

Iteration 9000, loss = 6.2345


 21%|████████████████                                                            | 10003/47154 [12:42<49:48, 12.43it/s]

Iteration 10000, loss = 6.2686


 23%|█████████████████▋                                                          | 11003/47154 [14:01<54:55, 10.97it/s]

Iteration 11000, loss = 6.2574


 25%|███████████████████▎                                                        | 12003/47154 [15:21<35:01, 16.73it/s]

Iteration 12000, loss = 5.5108


 28%|████████████████████▉                                                       | 13003/47154 [16:37<32:41, 17.41it/s]

Iteration 13000, loss = 4.8110


 30%|██████████████████████▌                                                     | 14001/47154 [17:54<57:15,  9.65it/s]

Iteration 14000, loss = 5.4680


 32%|████████████████████████▏                                                   | 15002/47154 [19:11<35:30, 15.09it/s]

Iteration 15000, loss = 5.0929


 34%|█████████████████████████▊                                                  | 16003/47154 [20:25<33:35, 15.46it/s]

Iteration 16000, loss = 6.1960


 36%|███████████████████████████▍                                                | 17002/47154 [21:44<50:23,  9.97it/s]

Iteration 17000, loss = 6.5633


 38%|█████████████████████████████                                               | 18002/47154 [23:00<37:14, 13.05it/s]

Iteration 18000, loss = 4.8842


 40%|██████████████████████████████▋                                             | 19002/47154 [24:16<32:42, 14.35it/s]

Iteration 19000, loss = 5.6773


 42%|████████████████████████████████▏                                           | 20001/47154 [25:36<53:50,  8.40it/s]

Iteration 20000, loss = 6.4416


 45%|█████████████████████████████████▊                                          | 21000/47154 [26:55<40:50, 10.67it/s]

Iteration 21000, loss = 5.1493


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:10<24:23, 17.19it/s]

Iteration 22000, loss = 5.3372


 49%|█████████████████████████████████████                                       | 23003/47154 [29:30<29:21, 13.71it/s]

Iteration 23000, loss = 6.5478


 51%|██████████████████████████████████████▋                                     | 24004/47154 [30:49<24:08, 15.98it/s]

Iteration 24000, loss = 6.2182


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:05<25:13, 14.64it/s]

Iteration 25000, loss = 6.1822


 55%|█████████████████████████████████████████▉                                  | 25999/47154 [33:23<19:22, 18.19it/s]

Iteration 26000, loss = 4.9445


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:40<25:49, 13.01it/s]

Iteration 27000, loss = 6.0110


 59%|█████████████████████████████████████████████▏                              | 28001/47154 [35:58<24:35, 12.98it/s]

Iteration 28000, loss = 5.5640


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:12<16:57, 17.84it/s]

Iteration 29000, loss = 6.3769


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:28<20:11, 14.16it/s]

Iteration 30000, loss = 5.4866


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:47<12:49, 20.99it/s]

Iteration 31000, loss = 6.2357


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:04<19:53, 12.70it/s]

Iteration 32000, loss = 5.7624


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:20<17:15, 13.66it/s]

Iteration 33000, loss = 6.4717


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:39<16:27, 13.32it/s]

Iteration 34000, loss = 5.6380


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [44:55<13:50, 14.63it/s]

Iteration 35000, loss = 5.0899


 76%|██████████████████████████████████████████████████████████                  | 36001/47154 [46:15<22:43,  8.18it/s]

Iteration 36000, loss = 5.4745


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:33<10:47, 15.68it/s]

Iteration 37000, loss = 5.0794


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:48<14:19, 10.65it/s]

Iteration 38000, loss = 6.5133


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [50:08<07:39, 17.75it/s]

Iteration 39000, loss = 7.2597


 85%|████████████████████████████████████████████████████████████████▍           | 40002/47154 [51:22<10:36, 11.24it/s]

Iteration 40000, loss = 6.3446


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:40<06:06, 16.80it/s]

Iteration 41000, loss = 5.7048


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:56<05:19, 16.14it/s]

Iteration 42000, loss = 4.9883


 91%|█████████████████████████████████████████████████████████████████████▎      | 43001/47154 [55:10<07:20,  9.43it/s]

Iteration 43000, loss = 6.0497


 93%|██████████████████████████████████████████████████████████████████████▉     | 44001/47154 [56:26<02:46, 18.95it/s]

Iteration 44000, loss = 4.8720


 95%|████████████████████████████████████████████████████████████████████████▌   | 45001/47154 [57:43<02:44, 13.07it/s]

Iteration 45000, loss = 5.9540


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:56<01:17, 14.84it/s]

Iteration 46000, loss = 6.0825


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:15<00:10, 14.01it/s]

Iteration 47000, loss = 6.4487


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:26<00:00, 13.00it/s]


Checking accuracy score on validation set.

Accuracy: 681 / 83918 correct (0.81)
Log Loss score:	5.76
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 45


  0%|                                                                              | 1/47154 [00:00<2:00:14,  6.54it/s]

Iteration 0, loss = 6.4182


  2%|█▋                                                                           | 1002/47154 [01:14<51:20, 14.98it/s]

Iteration 1000, loss = 4.9821


  4%|███▎                                                                         | 2005/47154 [02:27<50:51, 14.80it/s]

Iteration 2000, loss = 5.6330


  6%|████▊                                                                      | 3002/47154 [03:44<1:16:00,  9.68it/s]

Iteration 3000, loss = 5.2251


  8%|██████▌                                                                      | 4002/47154 [04:59<53:34, 13.42it/s]

Iteration 4000, loss = 5.4120


 11%|███████▉                                                                   | 5002/47154 [06:17<1:17:26,  9.07it/s]

Iteration 5000, loss = 5.5828


 13%|█████████▊                                                                   | 6002/47154 [07:36<47:54, 14.32it/s]

Iteration 6000, loss = 4.9434


 15%|███████████▍                                                                 | 7002/47154 [08:51<47:49, 14.00it/s]

Iteration 7000, loss = 6.2457


 17%|█████████████                                                                | 8001/47154 [10:08<44:37, 14.62it/s]

Iteration 8000, loss = 6.4118


 19%|██████████████▋                                                              | 9004/47154 [11:23<43:36, 14.58it/s]

Iteration 9000, loss = 5.2684


 21%|████████████████                                                            | 10001/47154 [12:38<41:03, 15.08it/s]

Iteration 10000, loss = 5.6573


 23%|█████████████████▋                                                          | 11003/47154 [13:58<41:35, 14.49it/s]

Iteration 11000, loss = 6.3731


 25%|███████████████████▎                                                        | 12003/47154 [15:14<44:03, 13.30it/s]

Iteration 12000, loss = 6.3794


 28%|████████████████████▉                                                       | 13005/47154 [16:34<31:24, 18.12it/s]

Iteration 13000, loss = 6.1163


 30%|██████████████████████▌                                                     | 14004/47154 [17:52<32:11, 17.16it/s]

Iteration 14000, loss = 6.4632


 32%|████████████████████████▏                                                   | 15002/47154 [19:08<37:47, 14.18it/s]

Iteration 15000, loss = 5.0139


 34%|█████████████████████████▊                                                  | 16004/47154 [20:27<29:15, 17.74it/s]

Iteration 16000, loss = 6.0363


 36%|███████████████████████████▍                                                | 17003/47154 [21:45<31:38, 15.88it/s]

Iteration 17000, loss = 4.8710


 38%|█████████████████████████████                                               | 18004/47154 [23:03<35:32, 13.67it/s]

Iteration 18000, loss = 5.8679


 40%|██████████████████████████████▋                                             | 19002/47154 [24:19<33:35, 13.97it/s]

Iteration 19000, loss = 5.8354


 42%|████████████████████████████████▏                                           | 20000/47154 [25:39<27:05, 16.70it/s]

Iteration 20000, loss = 6.0261


 45%|█████████████████████████████████▊                                          | 21003/47154 [26:56<30:27, 14.31it/s]

Iteration 21000, loss = 6.7232


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:12<27:44, 15.11it/s]

Iteration 22000, loss = 6.4114


 49%|█████████████████████████████████████                                       | 23003/47154 [29:30<29:56, 13.44it/s]

Iteration 23000, loss = 6.9989


 51%|██████████████████████████████████████▋                                     | 24003/47154 [30:46<26:47, 14.40it/s]

Iteration 24000, loss = 6.1100


 53%|████████████████████████████████████████▎                                   | 25001/47154 [32:03<22:22, 16.51it/s]

Iteration 25000, loss = 6.0042


 55%|█████████████████████████████████████████▉                                  | 26003/47154 [33:21<30:02, 11.74it/s]

Iteration 26000, loss = 6.3714


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:38<27:53, 12.04it/s]

Iteration 27000, loss = 5.6789


 59%|█████████████████████████████████████████████▏                              | 28003/47154 [35:54<27:06, 11.78it/s]

Iteration 28000, loss = 5.0323


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:13<23:56, 12.63it/s]

Iteration 29000, loss = 5.8225


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:30<26:11, 10.92it/s]

Iteration 30000, loss = 5.7750


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:47<20:30, 13.12it/s]

Iteration 31000, loss = 5.8226


 68%|███████████████████████████████████████████████████▌                        | 32004/47154 [41:02<20:17, 12.44it/s]

Iteration 32000, loss = 6.0682


 70%|█████████████████████████████████████████████████████▏                      | 33001/47154 [42:16<13:50, 17.04it/s]

Iteration 33000, loss = 5.3134


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [43:33<23:19,  9.40it/s]

Iteration 34000, loss = 5.5913


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:48<13:35, 14.91it/s]

Iteration 35000, loss = 4.9054


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:04<18:05, 10.28it/s]

Iteration 36000, loss = 4.8856


 78%|███████████████████████████████████████████████████████████▋                | 37003/47154 [47:24<12:50, 13.18it/s]

Iteration 37000, loss = 5.4486


 81%|█████████████████████████████████████████████████████████████▏              | 38002/47154 [48:39<12:37, 12.08it/s]

Iteration 38000, loss = 6.0559


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [49:57<11:04, 12.27it/s]

Iteration 39000, loss = 5.9980


 85%|████████████████████████████████████████████████████████████████▍           | 40001/47154 [51:14<10:07, 11.77it/s]

Iteration 40000, loss = 7.2678


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [52:31<07:25, 13.81it/s]

Iteration 41000, loss = 6.3821


 89%|███████████████████████████████████████████████████████████████████▋        | 42004/47154 [53:48<05:14, 16.35it/s]

Iteration 42000, loss = 5.3454


 91%|█████████████████████████████████████████████████████████████████████▎      | 43004/47154 [55:05<03:40, 18.80it/s]

Iteration 43000, loss = 6.1291


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:23<03:54, 13.43it/s]

Iteration 44000, loss = 6.2286


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:41<03:44,  9.58it/s]

Iteration 45000, loss = 6.3855


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46004/47154 [58:59<01:12, 15.96it/s]

Iteration 46000, loss = 6.0905


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:00:16<00:10, 14.37it/s]

Iteration 47000, loss = 5.0171


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:28<00:00, 12.99it/s]


Checking accuracy score on validation set.

Accuracy: 1139 / 83918 correct (1.36)
Log Loss score:	5.76
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 46


  0%|                                                                              | 1/47154 [00:00<1:33:30,  8.40it/s]

Iteration 0, loss = 7.3825


  2%|█▋                                                                           | 1002/47154 [01:21<40:27, 19.01it/s]

Iteration 1000, loss = 5.8404


  4%|███▏                                                                       | 2003/47154 [02:39<1:15:10, 10.01it/s]

Iteration 2000, loss = 6.3137


  6%|████▉                                                                        | 3002/47154 [03:55<50:58, 14.43it/s]

Iteration 3000, loss = 5.5348


  8%|██████▌                                                                      | 4003/47154 [05:11<40:49, 17.61it/s]

Iteration 4000, loss = 7.0451


 11%|████████▏                                                                    | 5004/47154 [06:27<44:41, 15.72it/s]

Iteration 5000, loss = 7.7848


 13%|█████████▊                                                                   | 6005/47154 [07:43<40:05, 17.10it/s]

Iteration 6000, loss = 5.5659


 15%|███████████▍                                                                 | 7002/47154 [09:01<51:51, 12.90it/s]

Iteration 7000, loss = 4.7771


 17%|█████████████                                                                | 8005/47154 [10:18<39:08, 16.67it/s]

Iteration 8000, loss = 5.4212


 19%|██████████████▋                                                              | 9003/47154 [11:38<38:43, 16.42it/s]

Iteration 9000, loss = 5.8517


 21%|████████████████                                                            | 10003/47154 [12:53<36:31, 16.95it/s]

Iteration 10000, loss = 5.5162


 23%|█████████████████▋                                                          | 11004/47154 [14:10<37:02, 16.26it/s]

Iteration 11000, loss = 6.0569


 25%|███████████████████▎                                                        | 12003/47154 [15:28<33:01, 17.74it/s]

Iteration 12000, loss = 6.0425


 28%|████████████████████▉                                                       | 13004/47154 [16:44<36:18, 15.68it/s]

Iteration 13000, loss = 6.5281


 30%|██████████████████████▌                                                     | 14001/47154 [18:01<49:12, 11.23it/s]

Iteration 14000, loss = 4.8553


 32%|████████████████████████▏                                                   | 15002/47154 [19:17<36:35, 14.64it/s]

Iteration 15000, loss = 5.2109


 34%|█████████████████████████▊                                                  | 16003/47154 [20:34<37:10, 13.97it/s]

Iteration 16000, loss = 6.1625


 36%|███████████████████████████▍                                                | 17004/47154 [21:50<30:54, 16.26it/s]

Iteration 17000, loss = 4.8899


 38%|█████████████████████████████                                               | 18001/47154 [23:09<36:28, 13.32it/s]

Iteration 18000, loss = 5.3789


 40%|██████████████████████████████▌                                             | 19001/47154 [24:24<26:24, 17.76it/s]

Iteration 19000, loss = 6.2186


 42%|████████████████████████████████▏                                           | 20004/47154 [25:41<27:44, 16.31it/s]

Iteration 20000, loss = 5.8768


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:00<31:52, 13.67it/s]

Iteration 21000, loss = 6.1963


 47%|███████████████████████████████████▍                                        | 22003/47154 [28:20<29:52, 14.03it/s]

Iteration 22000, loss = 5.4977


 49%|█████████████████████████████████████                                       | 23003/47154 [29:36<24:49, 16.21it/s]

Iteration 23000, loss = 4.8956


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:50<38:20, 10.06it/s]

Iteration 24000, loss = 4.8191


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:07<38:04,  9.70it/s]

Iteration 25000, loss = 4.8677


 55%|█████████████████████████████████████████▉                                  | 26004/47154 [33:24<23:44, 14.85it/s]

Iteration 26000, loss = 5.7642


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:40<18:55, 17.75it/s]

Iteration 27000, loss = 5.2291


 59%|█████████████████████████████████████████████▏                              | 28001/47154 [35:57<23:34, 13.54it/s]

Iteration 28000, loss = 5.9605


 62%|██████████████████████████████████████████████▋                             | 29002/47154 [37:15<18:36, 16.25it/s]

Iteration 29000, loss = 4.8763


 64%|████████████████████████████████████████████████▎                           | 30002/47154 [38:32<21:22, 13.38it/s]

Iteration 30000, loss = 6.3323


 66%|█████████████████████████████████████████████████▉                          | 31002/47154 [39:51<18:28, 14.58it/s]

Iteration 31000, loss = 4.8759


 68%|███████████████████████████████████████████████████▌                        | 32002/47154 [41:07<19:01, 13.27it/s]

Iteration 32000, loss = 6.6413


 70%|█████████████████████████████████████████████████████▏                      | 33002/47154 [42:22<13:08, 17.95it/s]

Iteration 33000, loss = 4.8450


 72%|██████████████████████████████████████████████████████▊                     | 34004/47154 [43:39<13:32, 16.19it/s]

Iteration 34000, loss = 5.5051


 74%|████████████████████████████████████████████████████████▍                   | 35002/47154 [44:53<13:04, 15.48it/s]

Iteration 35000, loss = 6.2634


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [46:12<15:03, 12.35it/s]

Iteration 36000, loss = 5.4368


 78%|███████████████████████████████████████████████████████████▋                | 37004/47154 [47:29<12:52, 13.14it/s]

Iteration 37000, loss = 4.7149


 81%|█████████████████████████████████████████████████████████████▎              | 38003/47154 [48:43<09:41, 15.73it/s]

Iteration 38000, loss = 5.6004


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [49:58<11:11, 12.13it/s]

Iteration 39000, loss = 5.9138


 85%|████████████████████████████████████████████████████████████████▍           | 40000/47154 [51:13<07:14, 16.47it/s]

Iteration 40000, loss = 5.6544


 87%|██████████████████████████████████████████████████████████████████          | 41003/47154 [52:30<07:34, 13.53it/s]

Iteration 41000, loss = 4.8654


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [53:47<05:35, 15.36it/s]

Iteration 42000, loss = 6.7818


 91%|█████████████████████████████████████████████████████████████████████▎      | 43005/47154 [55:08<04:45, 14.53it/s]

Iteration 43000, loss = 5.8500


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [56:24<03:40, 14.31it/s]

Iteration 44000, loss = 6.7323


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [57:40<02:42, 13.23it/s]

Iteration 45000, loss = 5.8629


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46003/47154 [58:57<02:23,  8.00it/s]

Iteration 46000, loss = 5.7679


100%|█████████████████████████████████████████████████████████████████████████▊| 47004/47154 [1:00:18<00:09, 16.50it/s]

Iteration 47000, loss = 5.8438


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:00:31<00:00, 12.98it/s]


Checking accuracy score on validation set.

Accuracy: 784 / 83918 correct (0.93)
Log Loss score:	5.76
Fbeta-score (beta=1): 	0.01
Training model 2, epoch 47


  0%|                                                                              | 1/47154 [00:00<1:23:18,  9.43it/s]

Iteration 0, loss = 4.7518


  2%|█▌                                                                         | 1003/47154 [01:17<1:12:46, 10.57it/s]

Iteration 1000, loss = 6.1816


  4%|███▎                                                                         | 2004/47154 [02:34<47:09, 15.96it/s]

Iteration 2000, loss = 6.4581


  6%|████▊                                                                      | 3001/47154 [03:50<1:13:04, 10.07it/s]

Iteration 3000, loss = 5.5305


  8%|██████▌                                                                      | 4004/47154 [05:06<51:31, 13.96it/s]

Iteration 4000, loss = 4.7600


 11%|████████▏                                                                    | 5002/47154 [06:21<52:57, 13.27it/s]

Iteration 5000, loss = 5.0818


 13%|█████████▌                                                                 | 6004/47154 [07:37<1:00:17, 11.37it/s]

Iteration 6000, loss = 6.6334


 15%|███████████▏                                                               | 7003/47154 [08:56<1:03:02, 10.61it/s]

Iteration 7000, loss = 5.1164


 17%|█████████████                                                                | 7999/47154 [10:11<49:26, 13.20it/s]

Iteration 8000, loss = 6.1086


 19%|██████████████▋                                                              | 9002/47154 [11:31<39:14, 16.21it/s]

Iteration 9000, loss = 5.3683


 21%|████████████████▏                                                           | 10005/47154 [12:52<42:30, 14.56it/s]

Iteration 10000, loss = 6.5802


 23%|█████████████████▋                                                          | 11005/47154 [14:09<47:32, 12.67it/s]

Iteration 11000, loss = 4.8041


 25%|███████████████████▎                                                        | 12004/47154 [15:28<37:01, 15.82it/s]

Iteration 12000, loss = 6.1156


 28%|████████████████████▉                                                       | 13004/47154 [16:47<35:47, 15.91it/s]

Iteration 13000, loss = 4.9508


 30%|██████████████████████▌                                                     | 14004/47154 [18:04<41:09, 13.42it/s]

Iteration 14000, loss = 6.4990


 32%|████████████████████████▏                                                   | 15003/47154 [19:21<32:13, 16.63it/s]

Iteration 15000, loss = 5.0812


 34%|█████████████████████████▊                                                  | 16003/47154 [20:35<46:45, 11.10it/s]

Iteration 16000, loss = 4.9060


 36%|███████████████████████████▍                                                | 17003/47154 [21:53<57:25,  8.75it/s]

Iteration 17000, loss = 4.9559


 38%|█████████████████████████████                                               | 18003/47154 [23:09<29:07, 16.68it/s]

Iteration 18000, loss = 6.8767


 40%|██████████████████████████████▋                                             | 19003/47154 [24:27<32:30, 14.43it/s]

Iteration 19000, loss = 5.7765


 42%|████████████████████████████████▏                                           | 20001/47154 [25:47<58:32,  7.73it/s]

Iteration 20000, loss = 6.1216


 45%|█████████████████████████████████▊                                          | 21003/47154 [27:06<26:56, 16.18it/s]

Iteration 21000, loss = 5.8366


 47%|███████████████████████████████████▍                                        | 22001/47154 [28:22<21:46, 19.26it/s]

Iteration 22000, loss = 6.8698


 49%|█████████████████████████████████████                                       | 23003/47154 [29:36<26:04, 15.44it/s]

Iteration 23000, loss = 5.2511


 51%|██████████████████████████████████████▋                                     | 24002/47154 [30:53<44:42,  8.63it/s]

Iteration 24000, loss = 5.4827


 53%|████████████████████████████████████████▎                                   | 25002/47154 [32:08<25:09, 14.68it/s]

Iteration 25000, loss = 6.4261


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [33:23<24:48, 14.21it/s]

Iteration 26000, loss = 6.3602


 57%|███████████████████████████████████████████▌                                | 27003/47154 [34:37<26:23, 12.73it/s]

Iteration 27000, loss = 5.5592


 59%|█████████████████████████████████████████████▏                              | 28002/47154 [35:51<24:24, 13.08it/s]

Iteration 28000, loss = 5.6457


 62%|██████████████████████████████████████████████▋                             | 29004/47154 [37:11<20:40, 14.63it/s]

Iteration 29000, loss = 5.6432


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [38:31<19:40, 14.53it/s]

Iteration 30000, loss = 6.9775


 66%|█████████████████████████████████████████████████▉                          | 31003/47154 [39:53<22:21, 12.04it/s]

Iteration 31000, loss = 5.4697


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:14<22:08, 11.41it/s]

Iteration 32000, loss = 6.0655


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [42:32<17:49, 13.23it/s]

Iteration 33000, loss = 6.4090


 72%|██████████████████████████████████████████████████████▊                     | 34003/47154 [43:50<17:57, 12.20it/s]

Iteration 34000, loss = 6.1161


 74%|████████████████████████████████████████████████████████▍                   | 35004/47154 [45:11<10:37, 19.06it/s]

Iteration 35000, loss = 5.3850


 76%|██████████████████████████████████████████████████████████                  | 36003/47154 [46:31<12:41, 14.64it/s]

Iteration 36000, loss = 5.4492


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [47:50<16:03, 10.53it/s]

Iteration 37000, loss = 6.4147


 81%|█████████████████████████████████████████████████████████████▎              | 38005/47154 [49:10<09:44, 15.66it/s]

Iteration 38000, loss = 5.6803


 83%|██████████████████████████████████████████████████████████████▊             | 39004/47154 [50:30<08:14, 16.48it/s]

Iteration 39000, loss = 4.8585


 85%|████████████████████████████████████████████████████████████████▍           | 40005/47154 [51:53<08:47, 13.56it/s]

Iteration 40000, loss = 6.4282


 87%|██████████████████████████████████████████████████████████████████          | 41002/47154 [53:13<09:41, 10.58it/s]

Iteration 41000, loss = 5.6496


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [54:34<06:51, 12.50it/s]

Iteration 42000, loss = 5.7204


 91%|█████████████████████████████████████████████████████████████████████▎      | 43002/47154 [55:51<04:53, 14.12it/s]

Iteration 43000, loss = 6.7341


 93%|██████████████████████████████████████████████████████████████████████▉     | 44002/47154 [57:11<03:59, 13.18it/s]

Iteration 44000, loss = 5.1689


 95%|████████████████████████████████████████████████████████████████████████▌   | 45002/47154 [58:33<02:56, 12.18it/s]

Iteration 45000, loss = 6.2219


 98%|██████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [59:53<01:12, 15.94it/s]

Iteration 46000, loss = 6.3033


100%|█████████████████████████████████████████████████████████████████████████▊| 47003/47154 [1:01:13<00:12, 12.33it/s]

Iteration 47000, loss = 4.7876


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:26<00:00, 12.79it/s]


Checking accuracy score on validation set.

Accuracy: 364 / 83918 correct (0.43)
Log Loss score:	5.76
Fbeta-score (beta=1): 	0.00
Training model 2, epoch 48


  0%|                                                                              | 1/47154 [00:00<2:12:01,  5.95it/s]

Iteration 0, loss = 5.4735


  2%|█▌                                                                         | 1003/47154 [01:12<1:09:47, 11.02it/s]

Iteration 1000, loss = 6.3275


  4%|███▎                                                                         | 2003/47154 [02:28<58:31, 12.86it/s]

Iteration 2000, loss = 4.8764


  6%|████▉                                                                        | 3004/47154 [03:45<45:17, 16.25it/s]

Iteration 3000, loss = 5.4400


  8%|██████▎                                                                    | 4003/47154 [05:05<1:11:43, 10.03it/s]

Iteration 4000, loss = 6.1258


 11%|████████▏                                                                    | 5001/47154 [06:23<45:31, 15.43it/s]

Iteration 5000, loss = 6.0795


 13%|█████████▌                                                                 | 6003/47154 [07:43<1:16:39,  8.95it/s]

Iteration 6000, loss = 6.0425


 15%|███████████▍                                                                 | 7002/47154 [08:59<58:53, 11.36it/s]

Iteration 7000, loss = 6.0323


 17%|█████████████                                                                | 8002/47154 [10:22<53:17, 12.25it/s]

Iteration 8000, loss = 5.9486


 19%|██████████████▋                                                              | 9002/47154 [11:42<54:50, 11.60it/s]

Iteration 9000, loss = 4.8626


 21%|████████████████                                                            | 10001/47154 [12:58<41:59, 14.74it/s]

Iteration 10000, loss = 4.8840


 23%|█████████████████▋                                                          | 11006/47154 [14:18<37:35, 16.03it/s]

Iteration 11000, loss = 5.7093


 25%|███████████████████▎                                                        | 12005/47154 [15:34<43:07, 13.58it/s]

Iteration 12000, loss = 6.0697


 28%|████████████████████▉                                                       | 13003/47154 [16:53<50:56, 11.18it/s]

Iteration 13000, loss = 6.5951


 30%|██████████████████████▌                                                     | 14004/47154 [18:13<39:38, 13.94it/s]

Iteration 14000, loss = 6.5233


 32%|████████████████████████▏                                                   | 15004/47154 [19:31<36:29, 14.69it/s]

Iteration 15000, loss = 5.8308


 34%|█████████████████████████▊                                                  | 16004/47154 [20:47<41:46, 12.43it/s]

Iteration 16000, loss = 5.1990


 36%|███████████████████████████▍                                                | 17000/47154 [22:05<45:47, 10.98it/s]

Iteration 17000, loss = 5.2062


 38%|█████████████████████████████                                               | 18000/47154 [23:26<41:47, 11.63it/s]

Iteration 18000, loss = 4.8080


 40%|██████████████████████████████▋                                             | 19003/47154 [24:48<25:14, 18.59it/s]

Iteration 19000, loss = 5.5235


 42%|████████████████████████████████▏                                           | 20002/47154 [26:05<29:38, 15.26it/s]

Iteration 20000, loss = 6.0042


 45%|█████████████████████████████████▊                                          | 21002/47154 [27:28<38:22, 11.36it/s]

Iteration 21000, loss = 6.3160


 47%|███████████████████████████████████▍                                        | 22002/47154 [28:46<32:51, 12.76it/s]

Iteration 22000, loss = 5.5589


 49%|█████████████████████████████████████                                       | 23004/47154 [30:05<23:28, 17.15it/s]

Iteration 23000, loss = 5.4195


 51%|██████████████████████████████████████▋                                     | 24004/47154 [31:22<30:16, 12.75it/s]

Iteration 24000, loss = 6.3898


 53%|████████████████████████████████████████▎                                   | 25003/47154 [32:43<26:51, 13.75it/s]

Iteration 25000, loss = 6.3534


 55%|█████████████████████████████████████████▉                                  | 26002/47154 [34:02<27:00, 13.06it/s]

Iteration 26000, loss = 5.9764


 57%|███████████████████████████████████████████▌                                | 27004/47154 [35:22<18:08, 18.52it/s]

Iteration 27000, loss = 5.6348


 59%|█████████████████████████████████████████████▏                              | 28005/47154 [36:39<24:35, 12.98it/s]

Iteration 28000, loss = 5.8456


 62%|██████████████████████████████████████████████▋                             | 29003/47154 [37:54<22:58, 13.17it/s]

Iteration 29000, loss = 7.1280


 64%|████████████████████████████████████████████████▎                           | 30003/47154 [39:14<21:07, 13.53it/s]

Iteration 30000, loss = 5.7132


 66%|█████████████████████████████████████████████████▉                          | 31004/47154 [40:30<15:40, 17.17it/s]

Iteration 31000, loss = 5.7267


 68%|███████████████████████████████████████████████████▌                        | 32003/47154 [41:49<16:51, 14.99it/s]

Iteration 32000, loss = 6.8402


 70%|█████████████████████████████████████████████████████▏                      | 33004/47154 [43:09<17:09, 13.75it/s]

Iteration 33000, loss = 5.7454


 72%|██████████████████████████████████████████████████████▊                     | 34002/47154 [44:27<15:35, 14.06it/s]

Iteration 34000, loss = 6.7496


 74%|████████████████████████████████████████████████████████▍                   | 35003/47154 [45:45<17:08, 11.81it/s]

Iteration 35000, loss = 5.3329


 76%|██████████████████████████████████████████████████████████                  | 36002/47154 [47:05<11:41, 15.90it/s]

Iteration 36000, loss = 6.7553


 78%|███████████████████████████████████████████████████████████▋                | 37002/47154 [48:22<18:02,  9.37it/s]

Iteration 37000, loss = 5.2090


 81%|█████████████████████████████████████████████████████████████▏              | 38001/47154 [49:44<09:58, 15.31it/s]

Iteration 38000, loss = 4.9527


 83%|██████████████████████████████████████████████████████████████▊             | 39003/47154 [51:03<09:53, 13.73it/s]

Iteration 39000, loss = 6.8186


 85%|████████████████████████████████████████████████████████████████▍           | 40003/47154 [52:25<06:39, 17.91it/s]

Iteration 40000, loss = 5.3817


 87%|██████████████████████████████████████████████████████████████████          | 41004/47154 [53:42<06:09, 16.66it/s]

Iteration 41000, loss = 6.1094


 89%|███████████████████████████████████████████████████████████████████▋        | 42003/47154 [55:01<05:45, 14.90it/s]

Iteration 42000, loss = 5.9042


 91%|█████████████████████████████████████████████████████████████████████▎      | 43003/47154 [56:21<04:38, 14.90it/s]

Iteration 43000, loss = 5.3740


 93%|██████████████████████████████████████████████████████████████████████▉     | 44003/47154 [57:42<03:40, 14.31it/s]

Iteration 44000, loss = 6.7475


 95%|████████████████████████████████████████████████████████████████████████▌   | 45003/47154 [59:03<02:27, 14.62it/s]

Iteration 45000, loss = 5.4045


 98%|████████████████████████████████████████████████████████████████████████▏ | 46002/47154 [1:00:23<01:11, 16.04it/s]

Iteration 46000, loss = 6.0426


100%|█████████████████████████████████████████████████████████████████████████▊| 47002/47154 [1:01:45<00:11, 13.51it/s]

Iteration 47000, loss = 5.4831


100%|██████████████████████████████████████████████████████████████████████████| 47154/47154 [1:01:57<00:00, 12.68it/s]


Checking accuracy score on validation set.


KeyboardInterrupt: 

In [None]:
import matplotlib.pyplot as plt

train_losses = torch.tensor(train_losses, device = 'cpu')
plt.plot(np.arange(len(train_losses)), train_losses)
plt.title('Train Loss Curve of Bird Species Classifier')

In [None]:
val_losses = torch.tensor(val_losses, device = 'cpu')
plt.plot(np.arange(len(val_losses)), val_losses)
plt.title('Validation Accuracy Curve of Bird Species Classifier')

In [None]:
log_scores = torch.tensor(log_scores, device = 'cpu')
plt.plot(np.arange(len(log_scores)), log_scores)
plt.title('Log-score Curve of Bird Species Classifier')

In [None]:
fbeta_scores = torch.tensor(fbeta_scores, device = 'cpu')
plt.plot(np.arange(len(fbeta_scores)), fbeta_scores)
plt.title('F-beta score Curve of Bird Species Classifier')

In [None]:
print('\nAccuracy: %.2f' % (100 * test_scores[0]))
print('Log Loss score:\t%.2f' % (test_scores[1]))
print('Fbeta-score (beta=1.0): \t%.2f' % (test_scores[2]))