In [1]:
import numpy as np
import math
import os
import time
import logging
from hyperopt.plotting import *
from hyperopt import fmin, tpe, hp, STATUS_OK, STATUS_FAIL, Trials, base, rand
from data.data_loader import Dataset
from misc.preferences import PREFERENCES
from misc.run_configuration import from_hyperopt, OutputLayerType, LearningSchedulerType, OptimizerType, default_params
from misc import utils
from misc.hyperopt_space import *

from optimizer import get_optimizer
from criterion import NllLoss, LossCombiner
from models.transformer.encoder import TransformerEncoder
from models.jointAspectTagger import JointAspectTagger
from trainer.train import Trainer
import pprint
import argparse
import pickle
import traceback


In [2]:
POSSIBLE_DATASET_VALUES = ['germeval', 'organic', 'coNLL-2003', 'amazon']


def load_model(dataset, rc, experiment_name):
    transformer = TransformerEncoder(dataset.source_embedding,
                                        hyperparameters=rc)

    # NER or ABSA-task?
    if rc.task == 'ner':
        from models.transformer_tagger import TransformerTagger
        from models.output_layers import SoftmaxOutputLayer
        loss = NllLoss(dataset.target_size, dataset.class_weights[0])
        softmax = SoftmaxOutputLayer(rc.model_size, dataset.target_size)
        model = TransformerTagger(transformer, softmax)

    else:
        from models.jointAspectTagger import JointAspectTagger
        loss = LossCombiner(4, dataset.class_weights, NllLoss)
        model = JointAspectTagger(transformer, rc, 4, 20, dataset.target_names)


    optimizer = get_optimizer(model, rc)
    trainer = Trainer(
                        model,
                        loss,
                        optimizer,
                        rc,
                        dataset,
                        experiment_name,
                        enable_tensorboard=False,
                        verbose=False)
    return trainer

def load_dataset(rc, logger, task):
    dataset = Dataset(
            task,
            logger,
            rc,
            source_index=PREFERENCES.source_index,
            target_vocab_index=PREFERENCES.target_vocab_index,
            data_path=PREFERENCES.data_root,
            train_file=PREFERENCES.data_train,
            valid_file=PREFERENCES.data_validation,
            test_file=PREFERENCES.data_test,
            file_format=PREFERENCES.file_format,
            init_token=None,
            eos_token=None
        )
    dataset.load_data(dsl, verbose=False)
    return dataset

def objective(parameters):
    run_time = time.time()

    utils.reset_loggers()
    experiment_name = utils.create_loggers(experiment_name=main_experiment_name)
    logger = logging.getLogger(__name__)
    dataset_logger = logging.getLogger('data_loader')

    # generate hp's from parameters
    try:
        rc = from_hyperopt(parameters, use_cuda, model_size=300, early_stopping=5, num_epochs=35, log_every_xth_iteration=-1, language=PREFERENCES.language)
    except Exception as err:
        print('Could not convert params: ' + str(err))
        logger.exception("Could not load parameters from hyperopt configuration: " + parameters)
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time
        }
    logger.info('New Params:')
    logger.info(rc)
    print('\n\n#########################################################################')
    print(rc)

    logger.debug('Load dataset')
    try:
        dataset = load_dataset(rc, dataset_logger, rc.task)
    except Exception as err:
        print('Could not load dataset: ' + str(err))
        logger.exception("Could not load dataset")
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time
        }
    logger.debug('dataset loaded')
    logger.debug('Load model')

    try:
        trainer = load_model(dataset, rc, experiment_name)
    except Exception as err:
        print('Could not load model: ' + str(err))
        logger.exception("Could not load model")
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time
        }

    logger.debug('model loaded')

    logger.debug('Begin training')
    model = None
    try:
        result = trainer.train(use_cuda=rc.use_cuda, perform_evaluation=False)
        model = result['model']
    except Exception as err:
        print('Exception while training: ' + str(err))
        logger.exception("Could not complete iteration")
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time,
            'best_loss': trainer.get_best_loss(),
            'best_f1': trainer.get_best_f1()
        }

    if math.isnan(trainer.get_best_loss()):
        print('Loss is nan')
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time,
            'best_loss': trainer.get_best_loss(),
            'best_f1': trainer.get_best_f1()
        }

    # perform evaluation and log results
    result = None
    try:
        result = trainer.perform_final_evaluation(use_test_set=True, verbose=False)
    except Exception as err:
        logger.exception("Could not complete iteration evaluation.")
        print('Could not complete iteration evaluation: ' + str(err))
        return {
            'status': STATUS_FAIL,
            'eval_time': time.time() - run_time,
            'best_loss': trainer.get_best_loss(),
            'best_f1': trainer.get_best_f1()
        }
    print(f'VAL f1\t{trainer.get_best_f1()} - ({result[1][1]})')
    print(f'VAL loss\t{trainer.get_best_loss()}')

    print(f"       .---.\n \
         /     \\\n\
          \\.@-@./\n\
          /`\\_/`\\\n\
         //  _  \\\\\tLoss: {trainer.get_best_loss()}\n\
        | \\     )|_\tf1: {trainer.get_best_f1()}\n\
       /`\\_`>  <_/ \\\n\
       \\__/'---'\\__/\n")

    return {
            'loss': result[1][0],
            'status': STATUS_OK,
            'eval_time': time.time() - run_time,
            'best_loss': trainer.get_best_loss(),
            'best_f1': trainer.get_best_f1(),
            'sample_iterations': trainer.get_num_samples_seen(),
            'iterations': trainer.get_num_iterations(),
            'rc': rc,
            'results': {
                'train': {
                    'loss': result[0][0],
                    'f1': result[0][1]
                },
                'validation': {
                    'loss': result[1][0],
                    'f1': result[1][1]
                },
                'test': {
                    'loss': result[2][0],
                    'f1': result[2][1]
                }
            }
        }

In [3]:
dataset_choice = 'coNLL-2003'
runs = 150
main_experiment_name = 'CoNLL-2003HyperoptTPE'
use_cuda = True
description = 'CoNLL-2003 NER TPE Hyperopt run'

if dataset_choice not in POSSIBLE_DATASET_VALUES:
    raise Error()

In [7]:
if dataset_choice == POSSIBLE_DATASET_VALUES[0]:
    PREFERENCES.defaults(
        data_root='./data/data/germeval2017',
        data_train='train_v1.4.tsv',    
        data_validation='dev_v1.4.tsv',
        data_test='test_TIMESTAMP1.tsv',
        source_index=0,
        target_vocab_index=2,
        file_format='csv',
        language='de'
    )
    from data.germeval2017 import germeval2017_dataset as dsl

    search_space = {
        'batch_size': hp.quniform('batch_size', 10, 100, 1),
        'num_encoder_blocks': hp.quniform('num_encoder_blocks', 1, 8, 1),
        'pointwise_layer_size': hp.quniform('pointwise_layer_size', 32, 256, 1),
        'clip_comments_to': hp.quniform('clip_comments_to', 10, 250, 1),
        'dropout_rate': hp.uniform('dropout_rate', 0.0, 0.8),
        'output_dropout_rate': hp.uniform('last_layer_dropout', 0.0, 0.8),
        'num_heads': hp.choice('num_heads', [1, 2, 3, 4, 5]),
        'transformer_use_bias': hp_bool('transformer_use_bias'),
        'output_layer': hp.choice('output_layer', [
            {
                'type': OutputLayerType.Convolutions,
                'output_conv_num_filters': hp.quniform('output_conv_num_filters', 1, 400, 1),
                'output_conv_kernel_size': hp.quniform('output_conv_kernel_size', 1, 10, 1),
                'output_conv_stride': hp.quniform('output_conv_stride', 1, 10, 1),
                'output_conv_padding': hp.quniform('output_conv_padding', 0, 5, 1),
            },
            {
                'type': OutputLayerType.LinearSum
            }
        ]),
        'learning_rate_scheduler': hp.choice('learning_rate_scheduler', [
            {
                'type': LearningSchedulerType.Noam,
                'noam_learning_rate_warmup': hp.quniform('noam_learning_rate_warmup', 1000, 9000, 1),
                'noam_learning_rate_factor': hp.uniform('noam_learning_rate_factor', 0.01, 4)
            }
        ]),
        'optimizer': hp.choice('optimizer', [
            {
                'type': OptimizerType.Adam,
                'adam_beta1': hp.uniform('adam_beta1', 0.7, 0.999),
                'adam_beta2': hp.uniform('adam_beta2', 0.7, 0.999),
                'adam_eps': hp.loguniform('adam_eps', np.log(1e-10), np.log(1)),
                'learning_rate': hp.lognormal('adam_learning_rate', np.log(0.01), np.log(10)),
                'adam_weight_decay': 1*10**hp.quniform('adam_weight_decay', -8, -3, 1)
            },
            #{
            #    'type': OptimizerType.SGD,
            #    'sgd_momentum': hp.uniform('sgd_momentum', 0.4, 1),
            #    'sgd_weight_decay': hp.loguniform('sgd_weight_decay', np.log(1e-4), np.log(1)),
            #    'sgd_nesterov': hp_bool('sgd_nesterov'),
            #    'learning_rate': hp.lognormal('sgd_learning_rate', np.log(0.01), np.log(10))
        ]),
        'replace_url_tokens': hp_bool('replace_url_tokens'),
        'harmonize_bahn': hp_bool('harmonize_bahn'),
        'embedding_type': hp.choice('embedding_type', ['fasttext', 'glove']),
        'embedding_name': hp.choice('embedding_name', ['6B']),
        'embedding_dim': hp.choice('embedding_dim', [300]),
        'use_stop_words': hp_bool('use_stop_words'),
        'use_spell_checker': hp_bool('use_spell_checker'),
        'embedding_type': hp.choice('embedding_type', ['fasttext', 'glove']),
        'task': 'germeval'
    }

elif dataset_choice == POSSIBLE_DATASET_VALUES[1]:
     from data.organic2019 import organic_dataset as dsl
     from data.organic2019 import ORGANIC_TASK_ALL, ORGANIC_TASK_ENTITIES, ORGANIC_TASK_ATTRIBUTES, ORGANIC_TASK_ENTITIES_COMBINE, ORGANIC_TASK_COARSE
     PREFERENCES.defaults(
        data_root='./data/data/organic2019',
        data_train='train.csv',    
        data_validation='validation.csv',
        data_test='test.csv',
        source_index=0,
        target_vocab_index=1,
        file_format='csv',
        language='en'
     )

     search_space = {
        'batch_size': hp.quniform('batch_size', 10, 64, 1),
        'num_encoder_blocks': hp.quniform('num_encoder_blocks', 1, 4, 1),
        'pointwise_layer_size': hp.quniform('pointwise_layer_size', 32, 350, 1),
        'clip_comments_to': hp.quniform('clip_comments_to', 45, 180, 1),
        'dropout_rate': hp.uniform('dropout_rate', 0.0, 0.8),
        'output_dropout_rate': hp.uniform('last_layer_dropout', 0.0, 0.8),
        'num_heads': hp.choice('num_heads', [1, 2, 3, 4, 5]),
        'transformer_use_bias': hp_bool('transformer_use_bias'),
        'output_layer': hp.choice('output_layer', [
            {
                'type': OutputLayerType.Convolutions,
                'output_conv_num_filters': hp.quniform('output_conv_num_filters', 10, 400, 1),
                'output_conv_kernel_size': hp.quniform('output_conv_kernel_size', 1, 10, 1),
                'output_conv_stride': hp.quniform('output_conv_stride', 1, 10, 1),
                'output_conv_padding': hp.quniform('output_conv_padding', 0, 5, 1),
            },
            {
                'type': OutputLayerType.LinearSum
            }
        ]),
        'learning_rate_scheduler': hp.choice('learning_rate_scheduler', [
            {
                'type': LearningSchedulerType.Noam,
                'noam_learning_rate_warmup': hp.quniform('noam_learning_rate_warmup', 1000, 9000, 1),
                'noam_learning_rate_factor': hp.uniform('noam_learning_rate_factor', 0.01, 4)
            }
        ]),
        'optimizer': hp.choice('optimizer', [
            {
                'type': OptimizerType.Adam,
                'adam_beta1': hp.uniform('adam_beta1', 0.7, 0.999),
                'adam_beta2': hp.uniform('adam_beta2', 0.7, 0.999),
                'adam_eps': hp.loguniform('adam_eps', np.log(1e-10), np.log(1)),
                'learning_rate': hp.lognormal('adam_learning_rate', np.log(0.01), np.log(10)),
                'adam_weight_decay': 1*10**hp.quniform('adam_weight_decay', -8, -3, 1)
            },
            #{
            #    'type': OptimizerType.SGD,
            #    'sgd_momentum': hp.uniform('sgd_momentum', 0.4, 1),
            #    'sgd_weight_decay': hp.loguniform('sgd_weight_decay', np.log(1e-4), np.log(1)),
            #    'sgd_nesterov': hp_bool('sgd_nesterov'),
            #    'learning_rate': hp.lognormal('sgd_learning_rate', np.log(0.01), np.log(10))
        ]),
        'task': hp.choice('task', [
            ORGANIC_TASK_ENTITIES,
            ORGANIC_TASK_ENTITIES_COMBINE
        ]),
        'use_stop_words': hp_bool('use_stop_words'),
        'use_spell_checker': hp_bool('use_spell_checker'),
        'embedding_type': hp.choice('embedding_type', ['fasttext', 'glove'])
    }
elif dataset_choice == POSSIBLE_DATASET_VALUES[2]:
    PREFERENCES.defaults(
        data_root='./data/data/conll2003',
        data_train='eng.train.txt',
        data_validation='eng.testa.txt',
        data_test='eng.testb.txt',
        source_index=0,
        target_vocab_index=1,
        file_format='txt',
        language='en'
    )
    from data.conll import conll2003_dataset as dsl

    search_space = {
        'batch_size': hp.quniform('batch_size', 10, 64, 1),
        'num_encoder_blocks': hp.quniform('num_encoder_blocks', 1, 4, 1),
        'pointwise_layer_size': hp.quniform('pointwise_layer_size', 32, 350, 1),
        'dropout_rate': hp.uniform('dropout_rate', 0.0, 0.8),
        'output_dropout_rate': hp.uniform('last_layer_dropout', 0.0, 0.8),
        'num_heads': hp.choice('num_heads', [1, 2, 3]),
        'transformer_use_bias': True,
        'learning_rate_scheduler': {
                'type': LearningSchedulerType.Noam,
                'noam_learning_rate_warmup': hp.quniform('noam_learning_rate_warmup', 1000, 9000, 1),
                'noam_learning_rate_factor': hp.uniform('noam_learning_rate_factor', 0.01, 4)
            },
        'optimizer':
            {
                'type': OptimizerType.Adam,
                'adam_beta1': 0.9,
                'adam_beta2': 0.98,
                'adam_eps': 10e-9,
                'learning_rate': hp.lognormal('adam_learning_rate', np.log(0.01), np.log(10)),
                'adam_weight_decay': 1*10**hp.quniform('adam_weight_decay', -8, -3, 1)
            },
        'output_layer': {'type': None},
        'task': 'ner',
        'clip_comments_to': 200,
        'embedding_type': hp.choice('embedding_type', ['fasttext', 'glove'])
    }
    
else:
    PREFERENCES.defaults(
        data_root='./data/data/amazon/splits',
        data_train='train.pkl',    
        data_validation='val.pkl',
        data_test='test.pkl',
        source_index=0,
        target_vocab_index=1,
        file_format='pkl',
        language='en'
    )
    from data.amazon import amazon_dataset as dsl

In [8]:
experiment_name = utils.create_loggers(experiment_name=main_experiment_name)
logger = logging.getLogger(__name__)
dataset_logger = logging.getLogger('data_loader')
logger.info('Run hyper parameter random grid search for experiment with name ' + main_experiment_name)
logger.info('num_optim_iterations: ' + str(runs))

Log path is  C:\Users\felix\OneDrive\Studium\Studium\6. Semester\MA\Project\ABSA-Transformer\logs\CoNLL-2003HyperoptTPE\20190428\3


In [9]:
try:
    logger.info('Current commit: ' + utils.get_current_git_commit())
    print('Current commit: ' + utils.get_current_git_commit())
except Exception as err:
    logger.exception('Could not print current commit')

trials = Trials()
try:

    best = fmin(objective,
        space=search_space,
        algo=rand.suggest,
        max_evals=runs,
        trials=trials)

    print(best)
except Exception as err:
    logger.exception('Could not complete optimization')
    print('Could not complete optimization. The log file provides more details.')
    traceback.print_tb(err.__traceback__)



path = os.path.join(os.getcwd(), 'logs', f'hp_run_{main_experiment_name}.pkl')
with open(path, 'wb') as f:
    pickle.dump(trials, f)

Current commit: b'8b18e1e'
Log path is                                                                                                            
C:\Users\felix\OneDrive\Studium\Studium\6. Semester\MA\Project\ABSA-Transformer\logs\CoNLL-2003HyperoptTPE\20190428\4  
                                                                                                                       

#########################################################################
+----------------------------------------------------------------------------------+                                   
|                                 Hyperparameters                                  |
+------------------------------+---------------------------------------------------+
|          Parameter           |                       Value                       |
+------------------------------+---------------------------------------------------+
|            kwargs            | {'batch_size': 49.0, 'learning_rate_sche[...]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.122		0.800		0.60m - 0.6m / 0.0m                                                                    
2	28k	0.03		0.02		0.146		0.831		0.61m - 1.3m / 21.1m                                                                   
3	42k	0.02		0.02		0.126		0.803		0.60m - 1.9m / 21.5m                                                                   
4	56k	0.01		0.02		0.118		0.797		0.61m - 2.5m / 21.1m                                                                   
5	70k	0.01		0.02		0.136		0.824		0.60m - 3.1m / 21.3m                                                                   
6	84k	0.01		0.02		0.179		0.864		0.59m - 3.7m / 21.1m                                                                   
7	98k	0.01		0.02		0.180		0.864		0.61m - 4.3m / 20.9m                                                                   
8	113k	0.01		0.02		0.176		0.858		0.59m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.10		0.263		0.739		0.73m - 0.7m / 0.0m                                                                    
2	28k	0.06		0.13		0.193		0.741		0.73m - 1.5m / 25.5m                                                                   
3	42k	0.05		0.11		0.252		0.770		0.73m - 2.2m / 25.6m                                                                   
4	56k	0.05		0.10		0.341		0.810		0.73m - 3.0m / 25.5m                                                                   
5	70k	0.05		0.11		0.274		0.761		0.70m - 3.7m / 25.8m                                                                   
6	84k	0.05		0.11		0.344		0.818		0.70m - 4.4m / 24.7m                                                                   
7	98k	0.05		0.11		0.319		0.802		0.74m - 5.2m / 24.9m                                                                   
8	112k	0.05		0.13		0.333		0.807		0.73m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.03		0.380		0.880		0.82m - 0.8m / 0.0m                                                                    
2	28k	0.02		0.02		0.476		0.917		0.84m - 1.7m / 28.8m                                                                   
3	42k	0.01		0.02		0.380		0.881		0.81m - 2.5m / 29.4m                                                                   
4	56k	0.01		0.02		0.496		0.924		0.82m - 3.3m / 28.3m                                                                   
5	70k	0.01		0.02		0.414		0.896		0.85m - 4.2m / 28.6m                                                                   
6	84k	0.01		0.02		0.398		0.889		0.84m - 5.1m / 29.9m                                                                   
7	98k	0.01		0.02		0.461		0.913		0.83m - 5.9m / 29.4m                                                                   
8	112k	0.01		0.02		0.469		0.914		0.82m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.114		0.802		0.49m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.067		0.716		0.50m - 1.0m / 17.3m                                                                   
3	42k	0.02		0.01		0.135		0.835		0.49m - 1.5m / 17.5m                                                                   
4	56k	0.01		0.01		0.192		0.881		0.50m - 2.0m / 17.3m                                                                   
5	70k	0.01		0.01		0.213		0.893		0.49m - 2.6m / 17.5m                                                                   
6	85k	0.01		0.01		0.189		0.880		0.49m - 3.1m / 17.3m                                                                   
7	99k	0.00		0.01		0.154		0.858		0.49m - 3.6m / 17.2m                                                                   
8	113k	0.00		0.01		0.181		0.877		0.49m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.105		0.782		0.26m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.03		0.106		0.784		0.26m - 0.5m / 9.0m                                                                    
3	42k	0.03		0.03		0.115		0.796		0.25m - 0.8m / 9.2m                                                                    
4	56k	0.02		0.02		0.136		0.827		0.26m - 1.1m / 8.9m                                                                    
5	70k	0.02		0.02		0.150		0.844		0.26m - 1.4m / 9.1m                                                                    
6	84k	0.01		0.02		0.152		0.846		0.26m - 1.6m / 9.0m                                                                    
7	99k	0.01		0.02		0.154		0.848		0.25m - 1.9m / 9.1m                                                                    
8	113k	0.01		0.01		0.154		0.849		0.26m -

+------------------------------+---------------------------------------------------+
  3%|█▌                                           | 5/150 [40:56<19:42:53, 489.47s/it, best loss: 0.010560442404578362]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.06		0.249		0.773		1.53m - 1.5m / 0.0m                                                                    
2	28k	0.07		0.09		0.304		0.817		1.56m - 3.1m / 53.6m                                                                   
3	42k	0.08		0.09		0.304		0.817		1.51m - 4.6m / 54.5m                                                                   
4	56k	0.08		0.09		0.304		0.817		1.60m - 6.3m / 53.1m                                                                   
5	70k	0.08		0.09		0.304		0.817		1.62m - 7.9m / 55.9m                                                                   
6	84k	0.08		0.09		0.304		0.817		1.53m - 9.4m / 56.5m                                                                   
7	98k	0.08		0.09		0.304		0.817		1.52m - 11.0m / 53.9m                                                                  
VAL f1	0.3037556731804399 - (0.303755673

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.04		0.168		0.727		1.23m - 1.2m / 0.0m                                                                    
2	28k	0.03		0.03		0.341		0.874		1.25m - 2.5m / 43.2m                                                                   
3	42k	0.02		0.02		0.373		0.888		1.25m - 3.8m / 43.7m                                                                   
4	56k	0.02		0.02		0.375		0.894		1.25m - 5.0m / 43.9m                                                                   
5	70k	0.02		0.03		0.364		0.883		1.23m - 6.3m / 43.9m                                                                   
6	84k	0.02		0.03		0.285		0.845		1.23m - 7.5m / 43.1m                                                                   
7	98k	0.03		0.05		0.230		0.794		1.23m - 8.8m / 43.2m                                                                   
8	112k	0.05		0.07		0.223		0.815		1.23m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.06		0.226		0.803		1.34m - 1.3m / 0.0m                                                                    
2	28k	0.06		0.05		0.242		0.791		1.34m - 2.7m / 46.9m                                                                   
3	42k	0.03		0.04		0.362		0.869		1.34m - 4.1m / 47.0m                                                                   
4	56k	0.03		0.04		0.396		0.886		1.34m - 5.4m / 47.0m                                                                   
5	70k	0.02		0.05		0.433		0.901		1.33m - 6.8m / 47.0m                                                                   
6	84k	0.02		0.04		0.447		0.906		1.34m - 8.1m / 46.7m                                                                   
7	98k	0.02		0.04		0.429		0.900		1.36m - 9.5m / 47.1m                                                                   
8	112k	0.02		0.05		0.410		0.895		1.32m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.07		0.204		0.712		1.73m - 1.7m / 0.0m                                                                    
2	28k	0.05		0.05		0.338		0.824		1.77m - 3.5m / 60.5m                                                                   
3	42k	0.04		0.04		0.492		0.896		1.73m - 5.3m / 61.8m                                                                   
4	56k	0.03		0.04		0.414		0.873		1.77m - 7.0m / 60.8m                                                                   
5	70k	0.03		0.05		0.415		0.879		1.76m - 8.8m / 61.8m                                                                   
6	84k	0.03		0.06		0.342		0.838		1.80m - 10.6m / 61.6m                                                                  
7	98k	0.05		0.07		0.258		0.764		1.77m - 12.4m / 63.0m                                                                  
8	112k	0.06		0.06		0.185		0.670		1.77m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.127		0.809		0.25m - 0.2m / 0.0m                                                                    
2	28k	0.01		0.01		0.156		0.846		0.25m - 0.5m / 8.7m                                                                    
3	42k	0.01		0.01		0.192		0.876		0.25m - 0.8m / 9.0m                                                                    
4	56k	0.00		0.01		0.204		0.885		0.25m - 1.1m / 8.7m                                                                    
5	70k	0.00		0.01		0.174		0.865		0.25m - 1.3m / 8.8m                                                                    
6	84k	0.00		0.01		0.201		0.883		0.24m - 1.6m / 8.7m                                                                    
7	99k	0.00		0.01		0.187		0.877		0.25m - 1.8m / 8.7m                                                                    
8	113k	0.00		0.01		0.165		0.856		0.25m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.155		0.798		0.33m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.05		0.161		0.800		0.34m - 0.7m / 11.6m                                                                   
3	42k	0.02		0.04		0.192		0.835		0.34m - 1.0m / 11.8m                                                                   
4	56k	0.02		0.03		0.184		0.826		0.34m - 1.4m / 11.8m                                                                   
5	70k	0.02		0.03		0.185		0.831		0.33m - 1.7m / 12.0m                                                                   
6	84k	0.02		0.03		0.159		0.800		0.33m - 2.1m / 11.8m                                                                   
7	98k	0.02		0.04		0.119		0.741		0.33m - 2.4m / 11.8m                                                                   
8	113k	0.02		0.03		0.182		0.831		0.34m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.093		0.787		0.33m - 0.3m / 0.0m                                                                    
2	28k	0.02		0.03		0.094		0.788		0.33m - 0.7m / 11.4m                                                                   
3	42k	0.02		0.02		0.112		0.810		0.32m - 1.0m / 11.6m                                                                   
4	56k	0.01		0.02		0.082		0.768		0.33m - 1.4m / 11.3m                                                                   
5	70k	0.01		0.01		0.123		0.824		0.33m - 1.7m / 11.7m                                                                   
6	84k	0.01		0.02		0.123		0.826		0.32m - 2.0m / 11.7m                                                                   
7	99k	0.01		0.01		0.142		0.849		0.33m - 2.4m / 11.4m                                                                   
8	113k	0.01		0.01		0.140		0.849		0.32m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.08		0.250		0.813		0.75m - 0.7m / 0.0m                                                                    
2	28k	0.06		0.05		0.258		0.827		0.77m - 1.5m / 26.2m                                                                   
3	42k	0.04		0.05		0.250		0.811		0.75m - 2.3m / 26.8m                                                                   
4	56k	0.04		0.05		0.256		0.814		0.78m - 3.1m / 26.3m                                                                   
5	70k	0.04		0.05		0.254		0.811		0.75m - 3.9m / 27.3m                                                                   
6	84k	0.04		0.05		0.288		0.846		0.75m - 4.6m / 26.3m                                                                   
7	98k	0.04		0.05		0.299		0.845		0.76m - 5.4m / 26.3m                                                                   
8	112k	0.04		0.05		0.277		0.834		0.74m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.06		0.270		0.824		1.29m - 1.3m / 0.0m                                                                    
2	28k	0.05		0.04		0.327		0.852		1.30m - 2.6m / 45.3m                                                                   
3	42k	0.03		0.04		0.382		0.880		1.28m - 3.9m / 45.5m                                                                   
4	56k	0.02		0.03		0.370		0.875		1.30m - 5.2m / 45.0m                                                                   
5	70k	0.02		0.03		0.425		0.900		1.30m - 6.5m / 45.5m                                                                   
6	84k	0.03		0.05		0.376		0.879		1.32m - 7.9m / 45.7m                                                                   
7	98k	0.03		0.04		0.337		0.860		1.31m - 9.2m / 46.3m                                                                   
8	112k	0.04		0.05		0.263		0.812		1.29m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.02		0.284		0.866		0.68m - 0.7m / 0.0m                                                                    
2	28k	0.02		0.02		0.335		0.892		0.67m - 1.4m / 23.9m                                                                   
3	42k	0.01		0.02		0.339		0.896		0.64m - 2.0m / 23.5m                                                                   
4	56k	0.01		0.01		0.431		0.923		0.66m - 2.7m / 22.4m                                                                   
5	70k	0.01		0.02		0.376		0.909		0.65m - 3.4m / 23.1m                                                                   
6	84k	0.01		0.02		0.295		0.876		0.66m - 4.0m / 22.9m                                                                   
7	98k	0.01		0.02		0.373		0.907		0.66m - 4.7m / 23.1m                                                                   
8	113k	0.01		0.02		0.298		0.877		0.65m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.01		0.113		0.821		0.23m - 0.2m / 0.0m                                                                    
2	28k	0.01		0.01		0.111		0.823		0.23m - 0.5m / 8.0m                                                                    
3	42k	0.00		0.01		0.135		0.853		0.23m - 0.7m / 8.1m                                                                    
4	56k	0.00		0.01		0.137		0.854		0.23m - 1.0m / 8.1m                                                                    
5	70k	0.00		0.01		0.119		0.838		0.23m - 1.2m / 8.1m                                                                    
6	84k	0.00		0.01		0.138		0.863		0.23m - 1.5m / 8.2m                                                                    
7	98k	0.00		0.01		0.134		0.850		0.23m - 1.7m / 8.1m                                                                    
8	112k	0.00		0.01		0.129		0.854		0.23m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.113		0.793		0.26m - 0.3m / 0.0m                                                                    
2	28k	0.02		0.03		0.127		0.814		0.26m - 0.5m / 9.0m                                                                    
3	42k	0.02		0.03		0.118		0.799		0.25m - 0.8m / 9.0m                                                                    
4	56k	0.01		0.02		0.142		0.829		0.26m - 1.1m / 8.9m                                                                    
5	70k	0.01		0.02		0.150		0.839		0.25m - 1.3m / 9.0m                                                                    
6	85k	0.01		0.02		0.167		0.859		0.25m - 1.6m / 8.9m                                                                    
7	99k	0.01		0.02		0.168		0.859		0.25m - 1.9m / 8.9m                                                                    
8	113k	0.01		0.02		0.171		0.862		0.25m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.135		0.799		0.80m - 0.8m / 0.0m                                                                    
2	28k	0.03		0.04		0.135		0.799		0.80m - 1.6m / 27.9m                                                                   
3	42k	0.03		0.04		0.135		0.799		0.79m - 2.4m / 27.9m                                                                   
4	56k	0.03		0.04		0.135		0.799		0.77m - 3.2m / 27.8m                                                                   
5	70k	0.03		0.04		0.135		0.799		0.79m - 4.0m / 27.2m                                                                   
6	84k	0.03		0.04		0.135		0.799		0.77m - 4.8m / 27.8m                                                                   
VAL f1	0.13502363699347208 - (0.13502363699347208)                                                                     
VAL loss	0.03806721839502071            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.138		0.810		0.45m - 0.4m / 0.0m                                                                    
2	28k	0.04		0.04		0.138		0.810		0.47m - 0.9m / 15.6m                                                                   
3	42k	0.03		0.04		0.138		0.810		0.44m - 1.4m / 16.5m                                                                   
4	56k	0.03		0.03		0.165		0.835		0.44m - 1.8m / 15.6m                                                                   
5	70k	0.02		0.03		0.162		0.841		0.44m - 2.3m / 15.6m                                                                   
6	85k	0.02		0.03		0.143		0.813		0.43m - 2.7m / 15.5m                                                                   
7	99k	0.02		0.03		0.161		0.832		0.45m - 3.2m / 15.4m                                                                   
8	113k	0.01		0.03		0.167		0.836		0.45m -

+------------------------------+---------------------------------------------------+
 13%|█████▎                                    | 19/150 [2:49:35<17:26:01, 479.09s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.111		0.776		0.66m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.01		0.163		0.839		0.68m - 1.4m / 23.3m                                                                   
3	42k	0.01		0.01		0.176		0.856		0.68m - 2.1m / 24.0m                                                                   
4	56k	0.01		0.01		0.185		0.870		0.73m - 2.8m / 23.7m                                                                   
5	70k	0.00		0.01		0.170		0.861		0.68m - 3.5m / 25.3m                                                                   
6	84k	0.00		0.01		0.203		0.877		0.68m - 4.2m / 24.0m                                                                   
7	99k	0.00		0.01		0.205		0.882		0.67m - 5.0m / 24.0m                                                                   
8	113k	0.00		0.01		0.200		0.876		0.65m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.138		0.810		0.72m - 0.7m / 0.0m                                                                    
2	28k	0.03		0.02		0.124		0.789		0.69m - 1.4m / 25.4m                                                                   
3	42k	0.01		0.02		0.176		0.846		0.73m - 2.2m / 24.4m                                                                   
4	56k	0.01		0.02		0.179		0.855		0.65m - 2.9m / 25.6m                                                                   
5	70k	0.01		0.02		0.137		0.827		0.68m - 3.6m / 23.1m                                                                   
6	85k	0.01		0.02		0.114		0.793		0.69m - 4.3m / 23.9m                                                                   
7	99k	0.00		0.01		0.173		0.865		0.68m - 5.0m / 24.2m                                                                   
8	113k	0.00		0.01		0.187		0.867		0.68m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.084		0.768		0.28m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.03		0.086		0.774		0.30m - 0.6m / 10.0m                                                                   
3	42k	0.02		0.02		0.098		0.797		0.29m - 0.9m / 10.5m                                                                   
4	56k	0.01		0.02		0.115		0.825		0.28m - 1.2m / 10.2m                                                                   
5	70k	0.01		0.02		0.126		0.838		0.31m - 1.5m / 9.9m                                                                    
6	84k	0.01		0.02		0.126		0.837		0.30m - 1.9m / 10.8m                                                                   
7	99k	0.01		0.02		0.128		0.845		0.29m - 2.2m / 10.5m                                                                   
8	113k	0.01		0.02		0.132		0.845		0.30m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.05		0.241		0.810		0.53m - 0.5m / 0.0m                                                                    
2	28k	0.05		0.04		0.289		0.848		0.59m - 1.1m / 18.7m                                                                   
3	42k	0.03		0.05		0.253		0.834		0.59m - 1.8m / 20.7m                                                                   
4	56k	0.02		0.05		0.235		0.819		0.61m - 2.4m / 20.7m                                                                   
5	70k	0.02		0.04		0.275		0.850		0.53m - 2.9m / 21.3m                                                                   
6	84k	0.01		0.04		0.278		0.856		0.57m - 3.5m / 18.7m                                                                   
7	98k	0.01		0.04		0.274		0.857		0.59m - 4.1m / 20.2m                                                                   
VAL f1	0.28880837835049594 - (0.28880837

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.06		0.196		0.815		0.74m - 0.7m / 0.0m                                                                    
2	28k	0.04		0.03		0.184		0.793		0.75m - 1.5m / 25.9m                                                                   
3	42k	0.03		0.03		0.213		0.823		0.75m - 2.3m / 26.4m                                                                   
4	56k	0.03		0.03		0.200		0.812		0.75m - 3.1m / 26.4m                                                                   
5	70k	0.03		0.03		0.221		0.831		0.73m - 3.8m / 26.4m                                                                   
6	84k	0.03		0.04		0.212		0.822		0.73m - 4.6m / 25.9m                                                                   
7	98k	0.03		0.04		0.218		0.826		0.77m - 5.3m / 25.9m                                                                   
8	113k	0.02		0.04		0.226		0.841		0.74m -

+------------------------------+---------------------------------------------------+
 16%|██████▋                                   | 24/150 [3:49:10<25:54:41, 740.33s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.09		0.10		0.316		0.819		1.81m - 1.8m / 0.0m                                                                    
2	28k	0.09		0.09		0.316		0.819		1.70m - 3.5m / 63.5m                                                                   
3	42k	0.08		0.08		0.219		0.769		1.64m - 5.2m / 59.6m                                                                   
4	56k	0.07		0.09		0.238		0.755		1.71m - 6.9m / 57.7m                                                                   
5	70k	0.07		0.08		0.263		0.777		1.74m - 8.7m / 60.0m                                                                   
6	84k	0.07		0.07		0.276		0.788		1.72m - 10.4m / 61.0m                                                                  
VAL f1	0.3160025966520403 - (0.3160025966520403)                                                                       
VAL loss	0.07185446733024482            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.093		0.787		0.34m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.03		0.093		0.787		0.35m - 0.7m / 12.1m                                                                   
3	42k	0.03		0.03		0.093		0.787		0.35m - 1.1m / 12.4m                                                                   
4	56k	0.02		0.03		0.093		0.787		0.36m - 1.5m / 12.4m                                                                   
5	70k	0.02		0.02		0.103		0.796		0.35m - 1.8m / 12.5m                                                                   
6	84k	0.02		0.02		0.083		0.760		0.35m - 2.2m / 12.4m                                                                   
7	99k	0.02		0.02		0.105		0.803		0.35m - 2.5m / 12.3m                                                                   
8	113k	0.01		0.02		0.114		0.816		0.35m -

+------------------------------+---------------------------------------------------+
 17%|███████▎                                  | 26/150 [4:12:19<24:42:10, 717.18s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.09		0.08		0.245		0.819		0.80m - 0.8m / 0.0m                                                                    
2	28k	0.07		0.07		0.245		0.819		0.81m - 1.6m / 27.9m                                                                   
3	42k	0.06		0.06		0.226		0.802		0.79m - 2.4m / 28.4m                                                                   
4	56k	0.05		0.05		0.215		0.786		0.81m - 3.2m / 27.7m                                                                   
5	70k	0.04		0.06		0.229		0.793		0.79m - 4.0m / 28.2m                                                                   
6	84k	0.03		0.05		0.278		0.836		0.80m - 4.9m / 27.9m                                                                   
7	98k	0.03		0.05		0.249		0.809		0.80m - 5.7m / 28.2m                                                                   
8	112k	0.03		0.05		0.269		0.825		0.78m -

+------------------------------+---------------------------------------------------+
 18%|███████▌                                  | 27/150 [4:33:36<30:14:11, 884.97s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.04		0.528		0.895		1.24m - 1.2m / 0.0m                                                                    
2	28k	0.04		0.04		0.559		0.907		1.24m - 2.5m / 43.3m                                                                   
3	42k	0.02		0.04		0.492		0.893		1.20m - 3.7m / 43.3m                                                                   
4	56k	0.02		0.03		0.635		0.932		1.20m - 4.9m / 42.0m                                                                   
5	70k	0.02		0.03		0.618		0.926		1.22m - 6.2m / 42.1m                                                                   
6	84k	0.01		0.04		0.595		0.919		1.24m - 7.4m / 42.9m                                                                   
7	98k	0.01		0.03		0.629		0.928		1.28m - 8.7m / 43.4m                                                                   
8	112k	0.01		0.04		0.637		0.930		1.28m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.116		0.802		0.37m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.01		0.159		0.855		0.38m - 0.8m / 12.9m                                                                   
3	42k	0.01		0.01		0.149		0.849		0.39m - 1.2m / 13.5m                                                                   
4	56k	0.01		0.01		0.171		0.870		0.38m - 1.6m / 13.8m                                                                   
5	70k	0.00		0.01		0.162		0.861		0.37m - 2.0m / 13.2m                                                                   
6	84k	0.00		0.01		0.111		0.817		0.37m - 2.3m / 13.0m                                                                   
7	98k	0.00		0.01		0.124		0.831		0.36m - 2.7m / 13.0m                                                                   
8	112k	0.00		0.01		0.142		0.859		0.36m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.133		0.794		0.70m - 0.7m / 0.0m                                                                    
2	28k	0.02		0.02		0.180		0.833		0.71m - 1.4m / 24.7m                                                                   
3	42k	0.01		0.02		0.166		0.829		0.71m - 2.2m / 24.7m                                                                   
4	56k	0.01		0.02		0.199		0.850		0.71m - 2.9m / 24.7m                                                                   
5	70k	0.01		0.01		0.210		0.860		0.76m - 3.6m / 24.8m                                                                   
6	84k	0.01		0.01		0.253		0.886		0.75m - 4.4m / 26.5m                                                                   
7	98k	0.01		0.01		0.215		0.863		0.74m - 5.2m / 26.1m                                                                   
8	112k	0.01		0.01		0.256		0.889		0.68m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.158		0.809		0.69m - 0.7m / 0.0m                                                                    
2	28k	0.02		0.03		0.231		0.868		0.71m - 1.4m / 24.1m                                                                   
3	42k	0.01		0.02		0.244		0.874		0.69m - 2.1m / 24.7m                                                                   
4	56k	0.01		0.01		0.243		0.874		0.70m - 2.8m / 24.1m                                                                   
5	70k	0.01		0.01		0.281		0.896		0.71m - 3.6m / 24.6m                                                                   
6	84k	0.01		0.01		0.239		0.872		0.67m - 4.3m / 24.9m                                                                   
7	98k	0.00		0.01		0.244		0.879		0.69m - 5.0m / 23.8m                                                                   
8	113k	0.00		0.02		0.263		0.886		0.69m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.05		0.157		0.731		1.39m - 1.4m / 0.0m                                                                    
2	28k	0.04		0.04		0.271		0.827		1.36m - 2.8m / 48.6m                                                                   
3	42k	0.02		0.03		0.335		0.874		1.37m - 4.2m / 47.7m                                                                   
4	56k	0.02		0.04		0.272		0.851		1.37m - 5.5m / 47.9m                                                                   
5	70k	0.02		0.05		0.263		0.845		1.36m - 6.9m / 48.0m                                                                   
6	84k	0.02		0.03		0.363		0.885		1.37m - 8.3m / 47.8m                                                                   
7	98k	0.03		0.04		0.339		0.867		1.34m - 9.7m / 48.1m                                                                   
8	112k	0.04		0.05		0.191		0.754		1.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.113		0.793		0.50m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.02		0.126		0.820		0.51m - 1.0m / 17.4m                                                                   
3	42k	0.02		0.02		0.159		0.851		0.49m - 1.6m / 17.8m                                                                   
4	56k	0.01		0.02		0.156		0.846		0.51m - 2.1m / 17.3m                                                                   
5	70k	0.01		0.02		0.187		0.873		0.49m - 2.6m / 17.9m                                                                   
6	85k	0.01		0.01		0.177		0.863		0.50m - 3.1m / 17.4m                                                                   
7	99k	0.01		0.01		0.153		0.856		0.51m - 3.6m / 17.7m                                                                   
8	113k	0.00		0.01		0.173		0.861		0.51m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.142		0.800		0.46m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.155		0.819		0.44m - 0.9m / 16.0m                                                                   
3	42k	0.01		0.03		0.177		0.840		0.45m - 1.4m / 15.6m                                                                   
4	56k	0.01		0.02		0.248		0.891		0.45m - 1.9m / 15.8m                                                                   
5	70k	0.01		0.02		0.250		0.894		0.44m - 2.3m / 15.8m                                                                   
6	84k	0.01		0.02		0.229		0.882		0.48m - 2.8m / 15.5m                                                                   
7	98k	0.01		0.02		0.228		0.883		0.47m - 3.3m / 16.6m                                                                   
8	112k	0.01		0.02		0.223		0.878		0.48m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.112		0.791		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.01		0.01		0.208		0.883		0.40m - 0.8m / 14.4m                                                                   
3	42k	0.01		0.01		0.209		0.885		0.42m - 1.3m / 14.2m                                                                   
4	56k	0.00		0.01		0.215		0.887		0.42m - 1.7m / 14.6m                                                                   
5	70k	0.00		0.01		0.192		0.873		0.41m - 2.1m / 14.7m                                                                   
6	84k	0.00		0.01		0.208		0.885		0.41m - 2.6m / 14.4m                                                                   
7	98k	0.00		0.01		0.200		0.886		0.40m - 3.0m / 14.4m                                                                   
8	113k	0.00		0.01		0.212		0.885		0.41m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.03		0.432		0.884		1.00m - 1.0m / 0.0m                                                                    
2	28k	0.02		0.03		0.487		0.910		1.01m - 2.0m / 35.0m                                                                   
3	42k	0.02		0.03		0.382		0.874		0.98m - 3.0m / 35.5m                                                                   
4	56k	0.03		0.05		0.334		0.840		0.98m - 4.0m / 34.4m                                                                   
5	70k	0.04		0.04		0.370		0.851		1.05m - 5.1m / 34.3m                                                                   
6	84k	0.04		0.05		0.414		0.873		1.05m - 6.1m / 36.5m                                                                   
7	98k	0.05		0.05		0.297		0.814		0.98m - 7.1m / 36.5m                                                                   
VAL f1	0.48684004426638294 - (0.48684004

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.03		0.248		0.844		0.48m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.03		0.202		0.817		0.48m - 1.0m / 16.7m                                                                   
3	42k	0.01		0.03		0.227		0.836		0.46m - 1.4m / 16.8m                                                                   
4	56k	0.01		0.03		0.207		0.825		0.46m - 1.9m / 16.2m                                                                   
5	70k	0.01		0.03		0.225		0.843		0.46m - 2.4m / 16.2m                                                                   
6	84k	0.01		0.03		0.224		0.846		0.46m - 2.9m / 16.3m                                                                   
VAL f1	0.2482827496528645 - (0.2482827496528645)                                                                       
VAL loss	0.025557055211984193           

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.08		0.320		0.823		1.33m - 1.3m / 0.0m                                                                    
2	28k	0.06		0.05		0.385		0.846		1.36m - 2.7m / 46.7m                                                                   
3	42k	0.04		0.05		0.364		0.836		1.34m - 4.1m / 47.8m                                                                   
4	56k	0.04		0.06		0.351		0.837		1.33m - 5.4m / 47.0m                                                                   
5	70k	0.05		0.06		0.358		0.841		1.29m - 6.7m / 46.7m                                                                   
6	84k	0.05		0.09		0.399		0.860		1.28m - 8.0m / 45.5m                                                                   
7	98k	0.06		0.13		0.328		0.826		1.41m - 9.4m / 45.3m                                                                   
8	112k	0.06		0.10		0.324		0.831		1.39m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.05		0.167		0.812		0.68m - 0.7m / 0.0m                                                                    
2	28k	0.05		0.05		0.167		0.812		0.70m - 1.4m / 24.0m                                                                   
3	42k	0.04		0.04		0.150		0.799		0.71m - 2.1m / 24.4m                                                                   
4	56k	0.04		0.04		0.159		0.809		0.73m - 2.9m / 24.9m                                                                   
5	70k	0.03		0.05		0.202		0.841		0.71m - 3.6m / 25.6m                                                                   
6	84k	0.02		0.03		0.187		0.827		0.70m - 4.3m / 25.0m                                                                   
7	99k	0.02		0.03		0.151		0.794		0.69m - 5.0m / 24.5m                                                                   
8	113k	0.02		0.03		0.182		0.824		0.70m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.084		0.768		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.03		0.02		0.092		0.781		0.41m - 0.8m / 14.3m                                                                   
3	42k	0.02		0.02		0.077		0.752		0.40m - 1.3m / 14.3m                                                                   
4	56k	0.02		0.01		0.076		0.756		0.39m - 1.7m / 14.0m                                                                   
5	70k	0.01		0.01		0.081		0.767		0.38m - 2.1m / 13.6m                                                                   
6	84k	0.01		0.01		0.082		0.772		0.38m - 2.4m / 13.4m                                                                   
7	99k	0.01		0.01		0.077		0.757		0.38m - 2.8m / 13.4m                                                                   
VAL f1	0.09197306879988813 - (0.09197306

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.090		0.780		0.35m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.03		0.090		0.780		0.35m - 0.7m / 12.1m                                                                   
3	42k	0.03		0.03		0.090		0.780		0.35m - 1.1m / 12.4m                                                                   
4	56k	0.02		0.02		0.097		0.791		0.35m - 1.4m / 12.4m                                                                   
5	70k	0.02		0.02		0.095		0.794		0.35m - 1.8m / 12.3m                                                                   
6	85k	0.02		0.02		0.097		0.802		0.36m - 2.2m / 12.3m                                                                   
7	99k	0.01		0.03		0.098		0.796		0.36m - 2.6m / 12.6m                                                                   
8	113k	0.01		0.02		0.107		0.810		0.36m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.155		0.804		0.52m - 0.5m / 0.0m                                                                    
2	28k	0.04		0.05		0.155		0.804		0.52m - 1.1m / 18.4m                                                                   
3	42k	0.04		0.03		0.143		0.786		0.51m - 1.6m / 18.2m                                                                   
4	56k	0.03		0.03		0.144		0.783		0.52m - 2.2m / 18.0m                                                                   
5	70k	0.02		0.04		0.148		0.788		0.53m - 2.7m / 18.3m                                                                   
6	84k	0.02		0.04		0.161		0.803		0.55m - 3.3m / 18.7m                                                                   
7	98k	0.02		0.04		0.194		0.829		0.55m - 3.8m / 19.2m                                                                   
8	112k	0.02		0.04		0.172		0.814		0.54m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.158		0.823		0.49m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.115		0.772		0.50m - 1.0m / 17.1m                                                                   
3	42k	0.01		0.02		0.141		0.820		0.50m - 1.5m / 17.5m                                                                   
4	56k	0.01		0.02		0.125		0.794		0.50m - 2.0m / 17.6m                                                                   
5	70k	0.01		0.02		0.147		0.829		0.49m - 2.5m / 17.5m                                                                   
6	84k	0.01		0.02		0.153		0.831		0.49m - 3.0m / 17.3m                                                                   
VAL f1	0.15846677537753165 - (0.15846677537753165)                                                                     
VAL loss	0.01951020572152807            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.101		0.753		0.47m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.213		0.872		0.47m - 0.9m / 16.3m                                                                   
3	42k	0.01		0.02		0.185		0.860		0.46m - 1.4m / 16.3m                                                                   
4	56k	0.01		0.02		0.241		0.887		0.47m - 1.9m / 16.3m                                                                   
5	70k	0.01		0.02		0.184		0.860		0.46m - 2.4m / 16.4m                                                                   
6	84k	0.01		0.01		0.180		0.856		0.47m - 2.9m / 16.3m                                                                   
7	98k	0.01		0.02		0.174		0.849		0.48m - 3.4m / 16.4m                                                                   
8	112k	0.01		0.02		0.206		0.874		0.49m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.06		0.182		0.809		0.98m - 1.0m / 0.0m                                                                    
2	28k	0.05		0.05		0.182		0.809		1.06m - 2.1m / 34.4m                                                                   
3	42k	0.05		0.05		0.182		0.809		1.06m - 3.1m / 37.2m                                                                   
4	56k	0.04		0.05		0.109		0.747		1.05m - 4.2m / 37.1m                                                                   
5	70k	0.04		0.04		0.095		0.734		1.01m - 5.2m / 36.8m                                                                   
6	84k	0.03		0.03		0.133		0.764		1.01m - 6.3m / 35.4m                                                                   
VAL f1	0.1824699017138206 - (0.1824699017138206)                                                                       
VAL loss	0.03477815148311064            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.125		0.791		0.47m - 0.5m / 0.0m                                                                    
2	28k	0.01		0.01		0.189		0.862		0.46m - 0.9m / 16.4m                                                                   
3	42k	0.01		0.01		0.223		0.884		0.44m - 1.4m / 16.0m                                                                   
4	56k	0.00		0.01		0.234		0.893		0.44m - 1.9m / 15.5m                                                                   
5	70k	0.00		0.01		0.254		0.904		0.43m - 2.3m / 15.6m                                                                   
6	85k	0.00		0.01		0.244		0.896		0.43m - 2.8m / 15.3m                                                                   
7	99k	0.00		0.01		0.221		0.884		0.45m - 3.2m / 15.4m                                                                   
8	113k	0.00		0.01		0.250		0.899		0.44m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.177		0.839		0.63m - 0.6m / 0.0m                                                                    
2	28k	0.02		0.02		0.176		0.846		0.64m - 1.3m / 22.2m                                                                   
3	42k	0.01		0.01		0.246		0.889		0.64m - 1.9m / 22.5m                                                                   
4	56k	0.01		0.01		0.261		0.894		0.65m - 2.6m / 22.6m                                                                   
5	70k	0.00		0.02		0.153		0.830		0.65m - 3.3m / 22.8m                                                                   
6	84k	0.00		0.02		0.230		0.876		0.64m - 3.9m / 22.8m                                                                   
7	98k	0.00		0.02		0.208		0.867		0.66m - 4.6m / 22.5m                                                                   
8	113k	0.00		0.02		0.238		0.882		0.65m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.161		0.814		0.34m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.02		0.237		0.875		0.33m - 0.7m / 11.8m                                                                   
3	42k	0.02		0.02		0.258		0.885		0.34m - 1.0m / 11.6m                                                                   
4	56k	0.01		0.02		0.258		0.887		0.35m - 1.4m / 12.1m                                                                   
5	70k	0.01		0.02		0.252		0.890		0.34m - 1.8m / 12.3m                                                                   
6	84k	0.01		0.02		0.281		0.899		0.34m - 2.1m / 12.0m                                                                   
7	99k	0.01		0.01		0.293		0.904		0.36m - 2.5m / 12.0m                                                                   
8	113k	0.01		0.02		0.217		0.885		0.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.04		0.123		0.813		0.37m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.02		0.143		0.837		0.38m - 0.8m / 13.1m                                                                   
3	42k	0.01		0.02		0.150		0.848		0.38m - 1.2m / 13.2m                                                                   
4	56k	0.01		0.02		0.149		0.847		0.37m - 1.5m / 13.2m                                                                   
5	70k	0.01		0.02		0.099		0.803		0.38m - 1.9m / 12.9m                                                                   
6	85k	0.02		0.03		0.076		0.758		0.37m - 2.3m / 13.3m                                                                   
7	99k	0.02		0.03		0.030		0.709		0.38m - 2.7m / 13.1m                                                                   
8	113k	0.02		0.03		0.099		0.784		0.38m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.117		0.789		0.59m - 0.6m / 0.0m                                                                    
2	28k	0.03		0.02		0.125		0.803		0.59m - 1.2m / 20.7m                                                                   
3	42k	0.02		0.01		0.167		0.850		0.58m - 1.8m / 20.6m                                                                   
4	56k	0.01		0.01		0.171		0.853		0.61m - 2.4m / 20.2m                                                                   
5	70k	0.01		0.01		0.136		0.825		0.59m - 3.1m / 21.3m                                                                   
6	84k	0.01		0.01		0.143		0.843		0.57m - 3.6m / 20.9m                                                                   
7	98k	0.00		0.01		0.137		0.831		0.56m - 4.2m / 20.1m                                                                   
8	113k	0.00		0.02		0.113		0.796		0.60m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.04		0.201		0.817		0.90m - 0.9m / 0.0m                                                                    
2	28k	0.03		0.03		0.197		0.815		0.89m - 1.8m / 31.6m                                                                   
3	42k	0.02		0.02		0.291		0.881		0.90m - 2.7m / 31.3m                                                                   
4	56k	0.01		0.02		0.267		0.868		0.89m - 3.6m / 31.5m                                                                   
5	70k	0.01		0.02		0.228		0.848		0.86m - 4.5m / 31.2m                                                                   
6	84k	0.01		0.02		0.314		0.891		0.87m - 5.4m / 30.4m                                                                   
7	98k	0.01		0.02		0.267		0.871		0.89m - 6.3m / 30.6m                                                                   
8	113k	0.00		0.02		0.310		0.891		0.89m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.08		0.295		0.818		0.87m - 0.9m / 0.0m                                                                    
2	28k	0.08		0.07		0.297		0.820		0.88m - 1.8m / 30.5m                                                                   
3	42k	0.07		0.06		0.328		0.837		0.85m - 2.6m / 30.7m                                                                   
4	56k	0.06		0.05		0.352		0.855		0.85m - 3.5m / 30.0m                                                                   
5	70k	0.05		0.04		0.385		0.871		0.89m - 4.4m / 29.8m                                                                   
6	84k	0.04		0.04		0.407		0.882		0.89m - 5.3m / 31.1m                                                                   
7	98k	0.03		0.03		0.431		0.891		0.89m - 6.2m / 31.1m                                                                   
8	112k	0.03		0.03		0.419		0.887		0.87m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.387		0.900		1.08m - 1.1m / 0.0m                                                                    
2	28k	0.02		0.03		0.332		0.878		1.09m - 2.2m / 37.9m                                                                   
3	42k	0.02		0.02		0.360		0.888		1.07m - 3.3m / 38.1m                                                                   
4	56k	0.02		0.02		0.358		0.891		1.06m - 4.3m / 37.5m                                                                   
5	70k	0.02		0.02		0.316		0.870		1.03m - 5.4m / 37.2m                                                                   
6	84k	0.02		0.02		0.411		0.910		1.03m - 6.4m / 36.4m                                                                   
7	98k	0.02		0.03		0.266		0.842		1.01m - 7.5m / 36.4m                                                                   
8	113k	0.02		0.02		0.396		0.905		0.99m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.154		0.792		0.55m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.02		0.221		0.860		0.53m - 1.1m / 19.2m                                                                   
3	42k	0.01		0.02		0.200		0.849		0.53m - 1.7m / 18.7m                                                                   
4	56k	0.01		0.02		0.183		0.835		0.54m - 2.2m / 18.7m                                                                   
5	70k	0.01		0.02		0.251		0.881		0.53m - 2.7m / 18.8m                                                                   
6	84k	0.01		0.02		0.210		0.855		0.55m - 3.3m / 18.6m                                                                   
7	98k	0.01		0.02		0.221		0.871		0.54m - 3.9m / 19.4m                                                                   
8	113k	0.01		0.02		0.230		0.870		0.54m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.278		0.880		0.40m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.02		0.272		0.875		0.40m - 0.8m / 13.9m                                                                   
3	42k	0.01		0.01		0.336		0.906		0.39m - 1.2m / 14.2m                                                                   
4	56k	0.01		0.01		0.363		0.915		0.37m - 1.6m / 13.8m                                                                   
5	70k	0.00		0.01		0.285		0.884		0.37m - 2.0m / 13.0m                                                                   
6	84k	0.00		0.01		0.337		0.907		0.37m - 2.4m / 13.2m                                                                   
7	98k	0.00		0.01		0.277		0.880		0.36m - 2.8m / 13.1m                                                                   
8	112k	0.00		0.01		0.318		0.902		0.37m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.106		0.784		0.55m - 0.6m / 0.0m                                                                    
2	28k	0.03		0.03		0.106		0.784		0.55m - 1.1m / 19.4m                                                                   
3	42k	0.03		0.02		0.087		0.779		0.55m - 1.7m / 19.4m                                                                   
4	56k	0.02		0.02		0.139		0.831		0.55m - 2.2m / 19.2m                                                                   
5	70k	0.01		0.02		0.133		0.824		0.54m - 2.8m / 19.4m                                                                   
6	84k	0.01		0.02		0.117		0.805		0.55m - 3.4m / 19.1m                                                                   
7	99k	0.01		0.02		0.137		0.832		0.55m - 3.9m / 19.4m                                                                   
8	113k	0.01		0.02		0.135		0.832		0.56m -

+------------------------------+---------------------------------------------------+
 37%|███████████████▋                          | 56/150 [8:47:58<17:40:17, 676.78s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.090		0.780		0.37m - 0.4m / 0.0m                                                                    
2	28k	0.03		0.03		0.090		0.780		0.37m - 0.8m / 13.1m                                                                   
3	42k	0.03		0.03		0.090		0.780		0.37m - 1.1m / 13.0m                                                                   
4	56k	0.03		0.03		0.090		0.780		0.37m - 1.5m / 13.1m                                                                   
5	70k	0.03		0.03		0.090		0.780		0.39m - 1.9m / 13.1m                                                                   
6	85k	0.02		0.02		0.092		0.784		0.37m - 2.3m / 13.5m                                                                   
7	99k	0.02		0.02		0.104		0.800		0.40m - 2.7m / 13.1m                                                                   
8	113k	0.02		0.02		0.108		0.808		0.41m -

+------------------------------+---------------------------------------------------+
 38%|███████████████▉                          | 57/150 [9:00:53<18:14:45, 706.29s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.08		0.245		0.819		1.02m - 1.0m / 0.0m                                                                    
2	28k	0.06		0.07		0.216		0.770		1.03m - 2.1m / 35.7m                                                                   
3	42k	0.06		0.05		0.279		0.838		1.04m - 3.1m / 36.0m                                                                   
4	56k	0.05		0.05		0.242		0.812		1.07m - 4.2m / 36.3m                                                                   
5	70k	0.04		0.07		0.239		0.804		1.09m - 5.3m / 37.3m                                                                   
6	84k	0.04		0.06		0.274		0.839		1.07m - 6.4m / 38.0m                                                                   
7	98k	0.04		0.06		0.241		0.807		1.01m - 7.4m / 37.3m                                                                   
8	112k	0.04		0.08		0.288		0.845		1.02m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.154		0.810		0.50m - 0.5m / 0.0m                                                                    
2	28k	0.04		0.04		0.154		0.810		0.51m - 1.0m / 17.5m                                                                   
3	42k	0.04		0.04		0.155		0.810		0.49m - 1.5m / 17.8m                                                                   
4	56k	0.03		0.04		0.175		0.828		0.49m - 2.0m / 17.2m                                                                   
5	70k	0.03		0.04		0.159		0.822		0.49m - 2.5m / 17.3m                                                                   
6	84k	0.02		0.03		0.167		0.821		0.49m - 3.0m / 17.2m                                                                   
7	99k	0.02		0.04		0.159		0.805		0.49m - 3.5m / 17.1m                                                                   
8	113k	0.02		0.03		0.171		0.823		0.48m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.173		0.859		0.28m - 0.3m / 0.0m                                                                    
2	28k	0.01		0.01		0.214		0.885		0.28m - 0.6m / 9.8m                                                                    
3	42k	0.01		0.01		0.152		0.844		0.28m - 0.9m / 10.0m                                                                   
4	56k	0.01		0.01		0.184		0.863		0.27m - 1.2m / 9.8m                                                                    
5	70k	0.01		0.01		0.152		0.847		0.27m - 1.4m / 9.7m                                                                    
6	84k	0.01		0.01		0.148		0.839		0.28m - 1.7m / 9.6m                                                                    
7	98k	0.01		0.01		0.147		0.838		0.27m - 2.0m / 9.7m                                                                    
VAL f1	0.21400290650260473 - (0.21400290

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.06		0.419		0.887		0.58m - 0.6m / 0.0m                                                                    
2	28k	0.03		0.04		0.372		0.865		0.58m - 1.2m / 20.2m                                                                   
3	42k	0.03		0.04		0.395		0.877		0.60m - 1.8m / 20.2m                                                                   
4	56k	0.03		0.04		0.416		0.881		0.59m - 2.4m / 21.0m                                                                   
5	70k	0.03		0.04		0.341		0.846		0.59m - 3.0m / 20.8m                                                                   
6	84k	0.03		0.04		0.442		0.895		0.59m - 3.6m / 20.6m                                                                   
7	98k	0.03		0.07		0.375		0.870		0.55m - 4.2m / 20.6m                                                                   
8	112k	0.03		0.04		0.373		0.861		0.56m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.166		0.847		0.70m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.01		0.238		0.897		0.73m - 1.5m / 24.6m                                                                   
3	42k	0.01		0.01		0.237		0.898		0.70m - 2.3m / 25.7m                                                                   
4	56k	0.00		0.01		0.204		0.879		0.70m - 3.0m / 24.6m                                                                   
5	70k	0.00		0.01		0.257		0.907		0.67m - 3.7m / 24.8m                                                                   
6	84k	0.00		0.01		0.255		0.905		0.67m - 4.3m / 23.7m                                                                   
7	98k	0.00		0.01		0.246		0.905		0.68m - 5.0m / 23.8m                                                                   
8	112k	0.00		0.01		0.261		0.908		0.67m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.104		0.781		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.02		0.104		0.786		0.41m - 0.8m / 14.2m                                                                   
3	42k	0.01		0.01		0.135		0.839		0.41m - 1.3m / 14.5m                                                                   
4	56k	0.01		0.01		0.146		0.845		0.41m - 1.7m / 14.5m                                                                   
5	70k	0.01		0.01		0.136		0.836		0.44m - 2.2m / 14.4m                                                                   
6	84k	0.01		0.02		0.134		0.830		0.44m - 2.6m / 15.4m                                                                   
7	98k	0.01		0.02		0.116		0.811		0.43m - 3.0m / 15.3m                                                                   
8	112k	0.01		0.02		0.140		0.835		0.44m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.147		0.785		0.77m - 0.8m / 0.0m                                                                    
2	28k	0.02		0.02		0.277		0.883		0.78m - 1.6m / 27.0m                                                                   
3	42k	0.01		0.01		0.321		0.903		0.78m - 2.4m / 27.2m                                                                   
4	56k	0.01		0.01		0.303		0.896		0.76m - 3.1m / 27.2m                                                                   
5	70k	0.00		0.02		0.281		0.887		0.75m - 3.9m / 26.8m                                                                   
6	84k	0.00		0.02		0.303		0.898		0.75m - 4.7m / 26.3m                                                                   
7	98k	0.00		0.02		0.315		0.904		0.76m - 5.4m / 26.6m                                                                   
8	112k	0.00		0.01		0.349		0.915		0.75m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.07		0.007		0.022		0.53m - 0.5m / 0.0m                                                                    
2	28k	0.07		0.05		0.154		0.806		0.52m - 1.1m / 18.4m                                                                   
3	42k	0.05		0.04		0.156		0.810		0.50m - 1.6m / 18.4m                                                                   
4	56k	0.05		0.04		0.156		0.810		0.52m - 2.1m / 17.7m                                                                   
5	70k	0.04		0.04		0.156		0.810		0.53m - 2.7m / 18.3m                                                                   
6	84k	0.04		0.04		0.156		0.810		0.51m - 3.2m / 18.7m                                                                   
7	99k	0.04		0.04		0.156		0.810		0.52m - 3.7m / 18.1m                                                                   
8	113k	0.04		0.04		0.156		0.810		0.51m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.09		0.270		0.813		1.17m - 1.2m / 0.0m                                                                    
2	28k	0.08		0.09		0.270		0.813		1.18m - 2.4m / 41.0m                                                                   
3	42k	0.08		0.09		0.270		0.813		1.16m - 3.5m / 41.4m                                                                   
4	56k	0.07		0.09		0.270		0.813		1.17m - 4.7m / 40.7m                                                                   
5	70k	0.07		0.09		0.270		0.813		1.25m - 6.0m / 41.0m                                                                   
6	84k	0.07		0.09		0.270		0.813		1.26m - 7.3m / 43.5m                                                                   
VAL f1	0.2697702466638855 - (0.2697702466638855)                                                                       
VAL loss	0.08638743788113355            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.09		0.08		0.300		0.824		1.19m - 1.2m / 0.0m                                                                    
2	28k	0.05		0.06		0.366		0.859		1.20m - 2.4m / 41.8m                                                                   
3	42k	0.04		0.04		0.435		0.893		1.15m - 3.6m / 42.1m                                                                   
4	56k	0.03		0.03		0.427		0.885		1.19m - 4.8m / 40.6m                                                                   
5	70k	0.03		0.03		0.465		0.904		1.19m - 6.0m / 41.7m                                                                   
6	84k	0.03		0.03		0.478		0.908		1.14m - 7.2m / 41.8m                                                                   
7	98k	0.03		0.04		0.408		0.885		1.16m - 8.3m / 40.3m                                                                   
8	112k	0.03		0.04		0.352		0.849		1.17m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.155		0.804		0.65m - 0.7m / 0.0m                                                                    
2	28k	0.04		0.04		0.155		0.804		0.71m - 1.4m / 22.9m                                                                   
3	42k	0.04		0.04		0.121		0.779		0.66m - 2.1m / 25.0m                                                                   
4	56k	0.03		0.04		0.181		0.828		0.68m - 2.9m / 23.4m                                                                   
5	70k	0.02		0.03		0.166		0.816		0.67m - 3.6m / 23.9m                                                                   
6	84k	0.02		0.03		0.180		0.832		0.65m - 4.3m / 23.8m                                                                   
7	98k	0.02		0.03		0.190		0.839		0.65m - 4.9m / 23.2m                                                                   
8	112k	0.01		0.03		0.218		0.861		0.62m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.373		0.903		0.50m - 0.5m / 0.0m                                                                    
2	28k	0.01		0.01		0.343		0.897		0.49m - 1.0m / 17.4m                                                                   
3	42k	0.01		0.02		0.297		0.872		0.49m - 1.5m / 17.1m                                                                   
4	56k	0.01		0.02		0.345		0.894		0.49m - 2.0m / 17.2m                                                                   
5	70k	0.01		0.02		0.290		0.874		0.51m - 2.5m / 17.3m                                                                   
6	84k	0.01		0.02		0.309		0.880		0.48m - 3.0m / 17.7m                                                                   
VAL f1	0.37304322319266375 - (0.37304322319266375)                                                                     
VAL loss	0.014826405084620301           

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.02		0.01		0.295		0.889		0.62m - 0.6m / 0.0m                                                                    
2	28k	0.01		0.02		0.168		0.800		0.62m - 1.3m / 21.8m                                                                   
3	42k	0.02		0.03		0.222		0.842		0.62m - 1.9m / 21.8m                                                                   
4	56k	0.03		0.03		0.148		0.760		0.63m - 2.5m / 21.7m                                                                   
5	70k	0.03		0.03		0.150		0.781		0.62m - 3.2m / 22.1m                                                                   
6	84k	0.03		0.03		0.129		0.761		0.62m - 3.8m / 21.7m                                                                   
VAL f1	0.29506973355209665 - (0.29506973355209665)                                                                     
VAL loss	0.01480805737219648            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.122		0.800		0.45m - 0.4m / 0.0m                                                                    
2	28k	0.04		0.04		0.122		0.800		0.43m - 0.9m / 15.6m                                                                   
3	42k	0.03		0.03		0.122		0.800		0.43m - 1.3m / 15.2m                                                                   
4	56k	0.03		0.04		0.122		0.800		0.43m - 1.8m / 15.1m                                                                   
5	70k	0.03		0.03		0.108		0.783		0.43m - 2.2m / 15.2m                                                                   
6	84k	0.02		0.03		0.118		0.799		0.43m - 2.7m / 15.1m                                                                   
7	98k	0.02		0.03		0.144		0.829		0.42m - 3.1m / 15.1m                                                                   
8	113k	0.02		0.03		0.145		0.831		0.43m -

+------------------------------+---------------------------------------------------+
 47%|███████████████████▍                     | 71/150 [11:10:03<11:53:45, 542.09s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.279		0.869		0.66m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.02		0.370		0.912		0.68m - 1.4m / 23.2m                                                                   
3	42k	0.01		0.01		0.362		0.909		0.69m - 2.1m / 23.7m                                                                   
4	56k	0.01		0.01		0.328		0.896		0.66m - 2.7m / 24.2m                                                                   
5	70k	0.01		0.01		0.334		0.897		0.65m - 3.4m / 23.3m                                                                   
6	84k	0.01		0.01		0.330		0.896		0.66m - 4.1m / 23.1m                                                                   
7	98k	0.01		0.02		0.324		0.893		0.66m - 4.8m / 23.1m                                                                   
VAL f1	0.36973400419404545 - (0.36973400

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.123		0.794		0.84m - 0.8m / 0.0m                                                                    
2	28k	0.02		0.03		0.181		0.841		0.83m - 1.7m / 29.5m                                                                   
3	42k	0.01		0.02		0.254		0.890		0.81m - 2.5m / 29.0m                                                                   
4	56k	0.01		0.01		0.270		0.899		0.81m - 3.3m / 28.4m                                                                   
5	70k	0.01		0.02		0.214		0.867		0.83m - 4.2m / 28.3m                                                                   
6	84k	0.01		0.02		0.175		0.842		0.85m - 5.1m / 29.2m                                                                   
7	98k	0.02		0.02		0.099		0.744		0.81m - 5.9m / 29.8m                                                                   
8	113k	0.02		0.03		0.105		0.752		0.77m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.01		0.097		0.788		0.33m - 0.3m / 0.0m                                                                    
2	28k	0.01		0.01		0.111		0.819		0.33m - 0.7m / 11.5m                                                                   
3	42k	0.01		0.01		0.147		0.862		0.33m - 1.0m / 11.6m                                                                   
4	56k	0.01		0.01		0.159		0.873		0.33m - 1.4m / 11.6m                                                                   
5	70k	0.01		0.01		0.130		0.835		0.34m - 1.7m / 11.6m                                                                   
6	84k	0.01		0.01		0.153		0.865		0.34m - 2.1m / 11.9m                                                                   
7	98k	0.00		0.01		0.137		0.850		0.33m - 2.4m / 11.9m                                                                   
8	112k	0.01		0.01		0.156		0.868		0.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.100		0.793		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.01		0.127		0.831		0.40m - 0.8m / 14.2m                                                                   
3	42k	0.01		0.01		0.122		0.831		0.40m - 1.2m / 14.0m                                                                   
4	56k	0.01		0.01		0.148		0.858		0.39m - 1.6m / 13.9m                                                                   
5	70k	0.00		0.01		0.154		0.868		0.39m - 2.1m / 13.6m                                                                   
6	84k	0.00		0.01		0.165		0.874		0.40m - 2.5m / 13.9m                                                                   
7	99k	0.00		0.01		0.123		0.840		0.40m - 2.9m / 14.1m                                                                   
8	113k	0.00		0.02		0.141		0.854		0.39m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.208		0.822		1.21m - 1.2m / 0.0m                                                                    
2	28k	0.02		0.02		0.315		0.888		1.19m - 2.4m / 42.4m                                                                   
3	42k	0.01		0.02		0.321		0.889		1.18m - 3.6m / 41.6m                                                                   
4	56k	0.01		0.02		0.325		0.894		1.24m - 4.9m / 41.3m                                                                   
5	70k	0.01		0.01		0.326		0.893		1.19m - 6.1m / 43.2m                                                                   
6	84k	0.01		0.03		0.304		0.881		1.12m - 7.2m / 41.7m                                                                   
7	98k	0.01		0.02		0.313		0.890		1.16m - 8.4m / 39.8m                                                                   
8	112k	0.01		0.02		0.269		0.861		1.17m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.093		0.787		0.36m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.03		0.097		0.793		0.36m - 0.7m / 12.4m                                                                   
3	42k	0.02		0.02		0.098		0.797		0.35m - 1.1m / 12.6m                                                                   
4	56k	0.01		0.02		0.081		0.759		0.35m - 1.5m / 12.4m                                                                   
5	70k	0.01		0.02		0.116		0.814		0.35m - 1.8m / 12.2m                                                                   
6	84k	0.01		0.01		0.117		0.826		0.35m - 2.2m / 12.2m                                                                   
7	99k	0.01		0.01		0.102		0.807		0.35m - 2.6m / 12.4m                                                                   
8	113k	0.01		0.01		0.120		0.823		0.34m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.06		0.407		0.838		1.82m - 1.8m / 0.0m                                                                    
2	28k	0.05		0.04		0.570		0.910		1.76m - 3.6m / 63.8m                                                                   
3	42k	0.04		0.05		0.477		0.870		1.73m - 5.3m / 61.7m                                                                   
4	56k	0.05		0.07		0.390		0.824		1.69m - 7.1m / 60.8m                                                                   
5	70k	0.07		0.09		0.362		0.814		1.69m - 8.8m / 59.6m                                                                   
6	84k	0.09		0.12		0.267		0.754		1.69m - 10.5m / 59.6m                                                                  
7	98k	0.11		0.13		0.382		0.820		1.70m - 12.2m / 59.6m                                                                  
VAL f1	0.5696803048130338 - (0.569680304

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.05		0.465		0.866		0.85m - 0.9m / 0.0m                                                                    
2	28k	0.04		0.05		0.537		0.899		0.86m - 1.7m / 29.8m                                                                   
3	42k	0.03		0.05		0.447		0.868		0.87m - 2.6m / 30.1m                                                                   
4	56k	0.03		0.05		0.530		0.901		0.81m - 3.5m / 30.4m                                                                   
5	70k	0.03		0.04		0.614		0.924		0.81m - 4.3m / 28.6m                                                                   
6	84k	0.03		0.04		0.548		0.908		0.80m - 5.1m / 28.5m                                                                   
7	98k	0.03		0.04		0.594		0.921		0.82m - 5.9m / 28.2m                                                                   
8	112k	0.03		0.04		0.559		0.914		0.82m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.141		0.818		0.47m - 0.5m / 0.0m                                                                    
2	28k	0.01		0.01		0.198		0.873		0.48m - 1.0m / 16.5m                                                                   
3	42k	0.01		0.01		0.188		0.867		0.47m - 1.5m / 16.9m                                                                   
4	56k	0.00		0.01		0.214		0.883		0.46m - 1.9m / 16.5m                                                                   
5	70k	0.00		0.01		0.218		0.887		0.46m - 2.4m / 16.1m                                                                   
6	84k	0.00		0.01		0.211		0.881		0.46m - 2.9m / 16.2m                                                                   
7	99k	0.00		0.01		0.200		0.875		0.45m - 3.4m / 16.2m                                                                   
8	113k	0.01		0.01		0.204		0.878		0.46m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.07		0.197		0.809		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.07		0.06		0.196		0.815		0.41m - 0.8m / 14.4m                                                                   
3	42k	0.06		0.06		0.196		0.815		0.41m - 1.3m / 14.5m                                                                   
4	56k	0.05		0.05		0.196		0.815		0.40m - 1.7m / 14.4m                                                                   
5	70k	0.05		0.05		0.196		0.815		0.41m - 2.1m / 14.2m                                                                   
6	84k	0.05		0.04		0.198		0.817		0.43m - 2.5m / 14.3m                                                                   
7	98k	0.04		0.04		0.228		0.839		0.39m - 3.0m / 14.9m                                                                   
8	113k	0.04		0.03		0.240		0.848		0.43m -

+------------------------------+---------------------------------------------------+
 54%|██████████████████████▏                  | 81/150 [12:30:29<10:23:37, 542.29s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.06		0.384		0.865		0.60m - 0.6m / 0.0m                                                                    
2	28k	0.05		0.07		0.354		0.851		0.61m - 1.3m / 21.1m                                                                   
3	42k	0.04		0.05		0.383		0.867		0.60m - 1.9m / 21.5m                                                                   
4	56k	0.03		0.05		0.406		0.877		0.62m - 2.5m / 21.2m                                                                   
5	70k	0.03		0.04		0.468		0.903		0.60m - 3.1m / 21.7m                                                                   
6	84k	0.03		0.04		0.473		0.905		0.59m - 3.7m / 21.2m                                                                   
7	98k	0.03		0.04		0.350		0.865		0.62m - 4.4m / 20.8m                                                                   
8	112k	0.03		0.05		0.337		0.854		0.61m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.242		0.852		0.85m - 0.8m / 0.0m                                                                    
2	28k	0.02		0.02		0.299		0.884		0.86m - 1.7m / 29.7m                                                                   
3	42k	0.02		0.03		0.280		0.873		0.85m - 2.6m / 30.0m                                                                   
4	56k	0.03		0.04		0.142		0.765		0.87m - 3.5m / 29.8m                                                                   
5	70k	0.04		0.05		0.179		0.805		0.89m - 4.4m / 30.4m                                                                   
6	84k	0.05		0.05		0.196		0.815		0.85m - 5.2m / 31.0m                                                                   
7	98k	0.05		0.05		0.196		0.815		0.84m - 6.1m / 30.0m                                                                   
VAL f1	0.29903744523098597 - (0.29903744

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.09		0.08		0.254		0.814		1.43m - 1.4m / 0.0m                                                                    
2	28k	0.07		0.08		0.254		0.814		1.39m - 2.8m / 50.1m                                                                   
3	42k	0.07		0.08		0.222		0.788		1.39m - 4.2m / 48.6m                                                                   
4	56k	0.06		0.08		0.077		0.673		1.44m - 5.7m / 48.6m                                                                   
5	70k	0.06		0.08		0.119		0.738		1.42m - 7.1m / 50.4m                                                                   
6	84k	0.06		0.08		0.074		0.698		1.38m - 8.5m / 49.9m                                                                   
VAL f1	0.2537352115376537 - (0.2537352115376537)                                                                       
VAL loss	0.0768694028693227             

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.04		0.089		0.783		0.22m - 0.2m / 0.0m                                                                    
2	28k	0.03		0.03		0.089		0.783		0.23m - 0.5m / 7.8m                                                                    
3	42k	0.02		0.02		0.095		0.791		0.22m - 0.7m / 7.9m                                                                    
4	56k	0.02		0.02		0.103		0.807		0.22m - 0.9m / 7.9m                                                                    
5	70k	0.02		0.02		0.098		0.801		0.23m - 1.2m / 7.9m                                                                    
6	84k	0.01		0.03		0.094		0.786		0.22m - 1.4m / 8.0m                                                                    
7	98k	0.01		0.02		0.115		0.825		0.22m - 1.7m / 7.8m                                                                    
8	112k	0.01		0.02		0.126		0.837		0.22m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.07		0.270		0.813		1.16m - 1.2m / 0.0m                                                                    
2	28k	0.08		0.06		0.238		0.796		1.15m - 2.3m / 40.6m                                                                   
3	42k	0.06		0.05		0.291		0.831		1.14m - 3.5m / 40.2m                                                                   
4	56k	0.04		0.05		0.351		0.869		1.10m - 4.6m / 40.0m                                                                   
5	70k	0.03		0.06		0.342		0.860		1.17m - 5.8m / 38.8m                                                                   
6	84k	0.03		0.04		0.325		0.849		1.18m - 7.0m / 40.8m                                                                   
7	98k	0.02		0.04		0.387		0.882		1.18m - 8.2m / 41.3m                                                                   
8	112k	0.02		0.04		0.330		0.852		1.10m -

+------------------------------+---------------------------------------------------+
 57%|███████████████████████▌                 | 86/150 [13:25:55<14:06:04, 793.19s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.367		0.868		0.64m - 0.6m / 0.0m                                                                    
2	28k	0.02		0.03		0.500		0.910		0.64m - 1.3m / 22.5m                                                                   
3	42k	0.02		0.03		0.507		0.911		0.63m - 2.0m / 22.5m                                                                   
4	56k	0.02		0.04		0.438		0.886		0.63m - 2.6m / 22.2m                                                                   
5	70k	0.03		0.04		0.475		0.902		0.64m - 3.3m / 22.1m                                                                   
6	84k	0.03		0.04		0.433		0.885		0.65m - 3.9m / 22.4m                                                                   
7	98k	0.03		0.04		0.443		0.891		0.62m - 4.5m / 22.7m                                                                   
8	112k	0.03		0.04		0.430		0.884		0.64m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.084		0.768		0.38m - 0.4m / 0.0m                                                                    
2	28k	0.03		0.02		0.089		0.775		0.38m - 0.8m / 13.2m                                                                   
3	42k	0.02		0.02		0.084		0.760		0.38m - 1.2m / 13.2m                                                                   
4	56k	0.02		0.02		0.083		0.763		0.37m - 1.5m / 13.2m                                                                   
5	70k	0.01		0.02		0.090		0.779		0.38m - 1.9m / 13.0m                                                                   
6	84k	0.01		0.02		0.094		0.785		0.38m - 2.3m / 13.3m                                                                   
7	99k	0.01		0.02		0.090		0.780		0.37m - 2.7m / 13.3m                                                                   
8	113k	0.01		0.02		0.090		0.789		0.38m -

+------------------------------+---------------------------------------------------+
 59%|████████████████████████                 | 88/150 [13:41:19<10:55:13, 634.08s/it, best loss: 0.007256374223039066]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.10		0.07		0.244		0.759		1.79m - 1.8m / 0.0m                                                                    
2	28k	0.05		0.05		0.414		0.861		1.82m - 3.6m / 62.6m                                                                   
3	42k	0.04		0.05		0.508		0.901		1.76m - 5.4m / 63.6m                                                                   
4	56k	0.03		0.04		0.422		0.872		1.77m - 7.2m / 61.7m                                                                   
5	70k	0.03		0.05		0.428		0.867		1.89m - 9.1m / 62.1m                                                                   
6	84k	0.04		0.05		0.442		0.874		1.86m - 11.0m / 65.8m                                                                  
7	98k	0.04		0.06		0.442		0.877		1.76m - 12.7m / 64.8m                                                                  
8	112k	0.05		0.06		0.398		0.859		1.77m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.05		0.300		0.847		0.73m - 0.7m / 0.0m                                                                    
2	28k	0.03		0.03		0.387		0.893		0.75m - 1.5m / 25.7m                                                                   
3	42k	0.02		0.02		0.460		0.919		0.74m - 2.3m / 26.1m                                                                   
4	56k	0.01		0.02		0.420		0.906		0.74m - 3.0m / 25.9m                                                                   
5	70k	0.01		0.02		0.407		0.905		0.75m - 3.8m / 26.0m                                                                   
6	84k	0.01		0.02		0.371		0.891		0.74m - 4.5m / 26.4m                                                                   
7	98k	0.01		0.02		0.450		0.918		0.75m - 5.3m / 26.1m                                                                   
8	112k	0.01		0.02		0.453		0.920		0.75m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.04		0.447		0.874		1.13m - 1.1m / 0.0m                                                                    
2	28k	0.04		0.05		0.481		0.891		1.18m - 2.3m / 39.7m                                                                   
3	42k	0.05		0.08		0.407		0.853		1.11m - 3.5m / 41.4m                                                                   
4	56k	0.07		0.07		0.217		0.749		1.08m - 4.6m / 39.0m                                                                   
5	70k	0.07		0.08		0.358		0.833		1.09m - 5.7m / 38.0m                                                                   
6	84k	0.07		0.07		0.381		0.843		1.08m - 6.8m / 38.4m                                                                   
7	98k	0.06		0.07		0.363		0.830		1.09m - 7.9m / 38.2m                                                                   
VAL f1	0.4811716721928253 - (0.481171672

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.01		0.153		0.848		0.38m - 0.4m / 0.0m                                                                    
2	28k	0.01		0.01		0.201		0.889		0.38m - 0.8m / 13.3m                                                                   
3	42k	0.00		0.01		0.222		0.901		0.36m - 1.2m / 13.3m                                                                   
4	56k	0.00		0.01		0.194		0.887		0.38m - 1.6m / 12.7m                                                                   
5	70k	0.00		0.01		0.204		0.894		0.39m - 2.0m / 13.3m                                                                   
6	85k	0.00		0.01		0.217		0.900		0.37m - 2.3m / 13.7m                                                                   
7	99k	0.00		0.01		0.217		0.901		0.37m - 2.7m / 13.2m                                                                   
8	113k	0.00		0.01		0.208		0.896		0.37m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.164		0.832		0.73m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.01		0.195		0.863		0.74m - 1.5m / 25.6m                                                                   
3	42k	0.00		0.01		0.186		0.858		0.72m - 2.2m / 26.1m                                                                   
4	56k	0.00		0.01		0.243		0.894		0.73m - 3.0m / 25.4m                                                                   
5	70k	0.00		0.01		0.249		0.898		0.73m - 3.7m / 25.7m                                                                   
6	85k	0.00		0.01		0.291		0.913		0.73m - 4.5m / 25.6m                                                                   
7	99k	0.00		0.01		0.249		0.895		0.78m - 5.3m / 25.8m                                                                   
8	113k	0.00		0.01		0.296		0.918		0.78m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.252		0.879		0.35m - 0.4m / 0.0m                                                                    
2	28k	0.01		0.02		0.275		0.893		0.35m - 0.7m / 12.4m                                                                   
3	42k	0.01		0.02		0.174		0.835		0.35m - 1.1m / 12.3m                                                                   
4	56k	0.01		0.03		0.154		0.806		0.36m - 1.5m / 12.3m                                                                   
5	70k	0.01		0.03		0.168		0.826		0.36m - 1.8m / 12.5m                                                                   
6	84k	0.01		0.03		0.180		0.832		0.35m - 2.2m / 12.6m                                                                   
7	98k	0.01		0.02		0.172		0.832		0.35m - 2.6m / 12.3m                                                                   
VAL f1	0.27513112287593555 - (0.27513112

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.305		0.887		1.02m - 1.0m / 0.0m                                                                    
2	28k	0.01		0.01		0.279		0.875		0.98m - 2.0m / 35.9m                                                                   
3	42k	0.01		0.02		0.374		0.915		0.92m - 3.0m / 34.5m                                                                   
4	56k	0.01		0.01		0.339		0.903		0.92m - 3.9m / 32.4m                                                                   
5	70k	0.01		0.02		0.253		0.861		0.94m - 4.9m / 32.5m                                                                   
6	84k	0.01		0.02		0.335		0.898		0.91m - 5.8m / 33.0m                                                                   
7	98k	0.01		0.01		0.314		0.892		0.92m - 6.7m / 32.2m                                                                   
8	113k	0.01		0.02		0.317		0.894		0.93m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.099		0.773		0.53m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.03		0.099		0.773		0.54m - 1.1m / 18.4m                                                                   
3	42k	0.03		0.02		0.073		0.736		0.52m - 1.6m / 18.8m                                                                   
4	56k	0.02		0.03		0.091		0.759		0.52m - 2.1m / 18.2m                                                                   
5	70k	0.01		0.03		0.097		0.769		0.52m - 2.7m / 18.4m                                                                   
6	84k	0.01		0.02		0.118		0.806		0.52m - 3.2m / 18.2m                                                                   
7	98k	0.01		0.02		0.109		0.794		0.51m - 3.8m / 18.3m                                                                   
8	112k	0.01		0.02		0.121		0.813		0.50m -

+------------------------------+---------------------------------------------------+
 64%|██████████████████████████▉               | 96/150 [14:51:04<8:16:57, 552.17s/it, best loss: 0.007194733719890525]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.319		0.885		0.72m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.02		0.396		0.912		0.69m - 1.4m / 25.4m                                                                   
3	42k	0.01		0.02		0.364		0.901		0.68m - 2.1m / 24.2m                                                                   
4	56k	0.01		0.02		0.414		0.917		0.66m - 2.8m / 23.9m                                                                   
5	70k	0.01		0.01		0.414		0.918		0.68m - 3.5m / 23.4m                                                                   
6	84k	0.01		0.01		0.436		0.925		0.67m - 4.2m / 23.9m                                                                   
7	98k	0.01		0.01		0.429		0.922		0.66m - 4.9m / 23.8m                                                                   
8	113k	0.00		0.01		0.396		0.913		0.67m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.13		0.14		0.336		0.766		1.75m - 1.8m / 0.0m                                                                    
2	28k	0.10		0.13		0.348		0.803		1.68m - 3.5m / 61.4m                                                                   
3	42k	0.09		0.16		0.336		0.818		1.60m - 5.1m / 58.9m                                                                   
4	56k	0.09		0.11		0.267		0.723		1.61m - 6.7m / 56.4m                                                                   
5	70k	0.09		0.14		0.361		0.808		1.61m - 8.3m / 56.6m                                                                   
6	84k	0.09		0.18		0.387		0.820		1.67m - 10.0m / 56.6m                                                                  
7	98k	0.09		0.13		0.413		0.836		1.60m - 11.7m / 58.5m                                                                  
8	112k	0.08		0.18		0.400		0.830		1.60m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.176		0.818		0.68m - 0.7m / 0.0m                                                                    
2	28k	0.02		0.02		0.248		0.874		0.68m - 1.4m / 23.8m                                                                   
3	42k	0.01		0.02		0.300		0.900		0.66m - 2.1m / 24.0m                                                                   
4	56k	0.01		0.01		0.339		0.915		0.67m - 2.8m / 23.4m                                                                   
5	70k	0.01		0.01		0.311		0.904		0.66m - 3.5m / 23.7m                                                                   
6	84k	0.00		0.01		0.325		0.912		0.66m - 4.2m / 23.4m                                                                   
7	99k	0.00		0.01		0.335		0.915		0.66m - 4.8m / 23.3m                                                                   
8	113k	0.00		0.01		0.338		0.915		0.67m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.17		0.16		0.389		0.773		1.91m - 1.9m / 0.0m                                                                    
2	28k	0.12		0.11		0.411		0.822		2.02m - 4.0m / 66.9m                                                                   
3	42k	0.10		0.15		0.354		0.775		1.84m - 5.8m / 70.7m                                                                   
4	56k	0.11		0.15		0.321		0.758		1.85m - 7.7m / 64.6m                                                                   
5	70k	0.11		0.20		0.047		0.416		1.83m - 9.5m / 64.9m                                                                   
6	84k	0.11		0.16		0.416		0.797		1.84m - 11.4m / 64.6m                                                                  
7	98k	0.11		0.19		0.394		0.814		1.84m - 13.2m / 64.6m                                                                  
8	112k	0.11		0.16		0.235		0.761		1.88m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.07		0.189		0.807		0.41m - 0.4m / 0.0m                                                                    
2	28k	0.05		0.06		0.192		0.807		0.41m - 0.8m / 14.3m                                                                   
3	42k	0.04		0.05		0.217		0.827		0.41m - 1.3m / 14.2m                                                                   
4	56k	0.03		0.04		0.233		0.842		0.41m - 1.7m / 14.3m                                                                   
5	70k	0.02		0.04		0.246		0.853		0.41m - 2.1m / 14.4m                                                                   
6	84k	0.02		0.04		0.255		0.857		0.41m - 2.5m / 14.3m                                                                   
7	98k	0.02		0.03		0.303		0.888		0.40m - 2.9m / 14.3m                                                                   
8	113k	0.02		0.03		0.297		0.880		0.40m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.148		0.810		0.66m - 0.7m / 0.0m                                                                    
2	28k	0.04		0.04		0.148		0.810		0.67m - 1.4m / 23.2m                                                                   
3	42k	0.04		0.03		0.143		0.801		0.68m - 2.0m / 23.5m                                                                   
4	56k	0.03		0.03		0.125		0.788		0.67m - 2.7m / 23.7m                                                                   
5	70k	0.03		0.02		0.167		0.829		0.67m - 3.4m / 23.4m                                                                   
6	84k	0.02		0.03		0.179		0.839		0.73m - 4.1m / 23.4m                                                                   
7	98k	0.02		0.03		0.196		0.852		0.70m - 4.9m / 25.2m                                                                   
8	113k	0.01		0.02		0.218		0.867		0.71m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.400		0.902		0.72m - 0.7m / 0.0m                                                                    
2	28k	0.01		0.02		0.450		0.920		0.73m - 1.5m / 25.3m                                                                   
3	42k	0.01		0.02		0.377		0.902		0.75m - 2.2m / 25.6m                                                                   
4	56k	0.01		0.02		0.353		0.890		0.73m - 3.0m / 26.1m                                                                   
5	70k	0.01		0.02		0.407		0.908		0.72m - 3.7m / 25.6m                                                                   
6	84k	0.01		0.02		0.404		0.907		0.73m - 4.5m / 25.4m                                                                   
7	98k	0.01		0.02		0.356		0.889		0.75m - 5.2m / 25.7m                                                                   
VAL f1	0.4495804258366203 - (0.449580425

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.01		0.235		0.866		0.35m - 0.3m / 0.0m                                                                    
2	28k	0.01		0.01		0.295		0.899		0.35m - 0.7m / 12.2m                                                                   
3	42k	0.01		0.01		0.312		0.905		0.34m - 1.1m / 12.3m                                                                   
4	56k	0.01		0.01		0.288		0.895		0.36m - 1.5m / 12.0m                                                                   
5	70k	0.01		0.01		0.271		0.889		0.33m - 1.8m / 12.5m                                                                   
6	84k	0.01		0.02		0.225		0.868		0.34m - 2.2m / 11.7m                                                                   
7	99k	0.01		0.02		0.175		0.845		0.34m - 2.5m / 11.9m                                                                   
8	113k	0.01		0.02		0.237		0.866		0.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.251		0.854		1.05m - 1.1m / 0.0m                                                                    
2	28k	0.02		0.02		0.233		0.857		1.06m - 2.1m / 36.9m                                                                   
3	42k	0.02		0.03		0.151		0.778		1.06m - 3.2m / 37.2m                                                                   
4	56k	0.04		0.05		0.105		0.756		1.06m - 4.3m / 37.1m                                                                   
5	70k	0.05		0.05		0.174		0.803		1.03m - 5.3m / 37.0m                                                                   
6	84k	0.05		0.06		0.194		0.807		1.05m - 6.4m / 36.4m                                                                   
VAL f1	0.25107596531206017 - (0.25107596531206017)                                                                     
VAL loss	0.02487191578807703            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.122		0.800		0.42m - 0.4m / 0.0m                                                                    
2	28k	0.02		0.03		0.118		0.790		0.43m - 0.9m / 14.8m                                                                   
3	42k	0.02		0.03		0.128		0.797		0.43m - 1.3m / 15.0m                                                                   
4	56k	0.02		0.02		0.120		0.796		0.42m - 1.8m / 15.1m                                                                   
5	70k	0.02		0.03		0.039		0.660		0.42m - 2.2m / 15.0m                                                                   
6	84k	0.02		0.03		0.022		0.576		0.42m - 2.6m / 14.8m                                                                   
7	98k	0.02		0.02		0.055		0.726		0.45m - 3.1m / 14.7m                                                                   
8	113k	0.02		0.02		0.114		0.801		0.45m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.03		0.422		0.880		1.44m - 1.4m / 0.0m                                                                    
2	28k	0.03		0.03		0.482		0.905		1.38m - 2.8m / 50.4m                                                                   
3	42k	0.02		0.03		0.379		0.861		1.28m - 4.1m / 48.4m                                                                   
4	56k	0.02		0.03		0.480		0.904		1.27m - 5.4m / 45.3m                                                                   
5	70k	0.02		0.03		0.510		0.914		1.28m - 6.7m / 44.8m                                                                   
6	84k	0.02		0.03		0.497		0.908		1.33m - 8.1m / 45.1m                                                                   
7	98k	0.02		0.03		0.490		0.909		1.35m - 9.4m / 46.8m                                                                   
8	112k	0.02		0.05		0.437		0.885		1.37m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.17		0.16		0.405		0.824		1.41m - 1.4m / 0.0m                                                                    
2	28k	0.13		0.11		0.371		0.817		1.34m - 2.8m / 49.4m                                                                   
3	42k	0.10		0.09		0.393		0.821		1.32m - 4.1m / 46.9m                                                                   
4	56k	0.07		0.09		0.422		0.828		1.31m - 5.4m / 46.2m                                                                   
5	70k	0.06		0.08		0.462		0.849		1.26m - 6.7m / 46.1m                                                                   
6	84k	0.05		0.07		0.542		0.888		1.29m - 8.0m / 44.6m                                                                   
7	98k	0.04		0.06		0.570		0.900		1.24m - 9.3m / 45.4m                                                                   
8	112k	0.04		0.06		0.575		0.903		1.27m -

+------------------------------+---------------------------------------------------+
 72%|████████████████████████████           | 108/150 [17:27:33<12:21:22, 1059.11s/it, best loss: 0.007194733719890525]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.114		0.802		0.62m - 0.6m / 0.0m                                                                    
2	28k	0.02		0.01		0.134		0.827		0.62m - 1.3m / 21.6m                                                                   
3	42k	0.01		0.02		0.179		0.875		0.62m - 1.9m / 21.7m                                                                   
4	56k	0.01		0.01		0.202		0.889		0.62m - 2.5m / 21.8m                                                                   
5	70k	0.00		0.01		0.217		0.898		0.62m - 3.2m / 21.8m                                                                   
6	85k	0.00		0.01		0.213		0.899		0.62m - 3.8m / 21.9m                                                                   
7	99k	0.00		0.01		0.215		0.898		0.62m - 4.4m / 21.8m                                                                   
8	113k	0.00		0.01		0.188		0.883		0.62m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.099		0.773		0.39m - 0.4m / 0.0m                                                                    
2	28k	0.03		0.03		0.106		0.788		0.40m - 0.8m / 13.8m                                                                   
3	42k	0.02		0.02		0.069		0.762		0.40m - 1.2m / 13.9m                                                                   
4	56k	0.02		0.02		0.089		0.761		0.39m - 1.6m / 13.9m                                                                   
5	70k	0.01		0.03		0.095		0.775		0.39m - 2.1m / 13.9m                                                                   
6	84k	0.01		0.02		0.108		0.800		0.40m - 2.5m / 13.8m                                                                   
7	98k	0.01		0.02		0.111		0.806		0.40m - 2.9m / 14.0m                                                                   
8	112k	0.01		0.02		0.108		0.800		0.39m -

+------------------------------+---------------------------------------------------+
 73%|██████████████████████████████           | 110/150 [17:50:37<9:34:51, 862.30s/it, best loss: 0.006738710305531937]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.089		0.783		0.47m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.03		0.089		0.783		0.47m - 1.0m / 16.6m                                                                   
3	42k	0.02		0.02		0.077		0.763		0.45m - 1.4m / 16.3m                                                                   
4	56k	0.02		0.02		0.093		0.801		0.44m - 1.9m / 15.8m                                                                   
5	70k	0.01		0.02		0.089		0.784		0.44m - 2.3m / 15.4m                                                                   
6	84k	0.01		0.02		0.106		0.808		0.44m - 2.8m / 15.6m                                                                   
7	98k	0.01		0.02		0.096		0.793		0.44m - 3.2m / 15.7m                                                                   
8	112k	0.01		0.01		0.128		0.841		0.44m -

+------------------------------+---------------------------------------------------+
 74%|██████████████████████████████▎          | 111/150 [18:01:33<8:40:19, 800.50s/it, best loss: 0.006738710305531937]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.130		0.800		0.59m - 0.6m / 0.0m                                                                    
2	28k	0.01		0.01		0.175		0.847		0.59m - 1.2m / 20.7m                                                                   
3	42k	0.01		0.01		0.211		0.875		0.60m - 1.8m / 20.8m                                                                   
4	56k	0.00		0.01		0.208		0.872		0.60m - 2.4m / 21.0m                                                                   
5	70k	0.00		0.01		0.250		0.900		0.62m - 3.1m / 21.0m                                                                   
6	84k	0.00		0.01		0.242		0.894		0.63m - 3.7m / 21.7m                                                                   
7	99k	0.00		0.01		0.238		0.891		0.62m - 4.4m / 22.2m                                                                   
8	113k	0.00		0.01		0.236		0.892		0.58m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.02		0.01		0.300		0.909		0.32m - 0.3m / 0.0m                                                                    
2	28k	0.01		0.01		0.217		0.878		0.32m - 0.7m / 11.3m                                                                   
3	42k	0.01		0.01		0.202		0.877		0.32m - 1.0m / 11.4m                                                                   
4	56k	0.01		0.01		0.197		0.870		0.32m - 1.3m / 11.4m                                                                   
5	70k	0.01		0.02		0.199		0.865		0.33m - 1.7m / 11.4m                                                                   
6	84k	0.01		0.02		0.221		0.868		0.33m - 2.0m / 11.5m                                                                   
VAL f1	0.2995573513871599 - (0.2995573513871599)                                                                       
VAL loss	0.010547797358594835           

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.123		0.789		0.28m - 0.3m / 0.0m                                                                    
2	28k	0.04		0.04		0.123		0.789		0.29m - 0.6m / 10.0m                                                                   
3	42k	0.03		0.03		0.134		0.809		0.28m - 0.9m / 10.3m                                                                   
4	56k	0.02		0.04		0.117		0.778		0.29m - 1.2m / 10.0m                                                                   
5	70k	0.02		0.04		0.133		0.803		0.29m - 1.5m / 10.1m                                                                   
6	84k	0.01		0.04		0.152		0.826		0.29m - 1.8m / 10.3m                                                                   
7	99k	0.01		0.04		0.155		0.831		0.29m - 2.1m / 10.2m                                                                   
8	113k	0.01		0.03		0.163		0.837		0.29m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.275		0.867		0.45m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.292		0.874		0.46m - 0.9m / 15.9m                                                                   
3	42k	0.01		0.01		0.332		0.897		0.46m - 1.4m / 16.1m                                                                   
4	56k	0.01		0.01		0.303		0.883		0.45m - 1.9m / 16.2m                                                                   
5	70k	0.01		0.01		0.331		0.895		0.45m - 2.3m / 15.7m                                                                   
6	84k	0.01		0.02		0.326		0.893		0.44m - 2.8m / 15.7m                                                                   
7	98k	0.01		0.02		0.344		0.901		0.45m - 3.2m / 15.5m                                                                   
8	113k	0.01		0.02		0.342		0.900		0.43m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.14		0.09		0.420		0.841		2.32m - 2.3m / 0.0m                                                                    
2	28k	0.07		0.07		0.509		0.872		2.28m - 4.6m / 81.1m                                                                   
3	42k	0.05		0.07		0.444		0.843		2.31m - 6.9m / 79.8m                                                                   
4	56k	0.04		0.06		0.567		0.896		2.21m - 9.2m / 80.8m                                                                   
5	70k	0.04		0.05		0.591		0.904		2.25m - 11.4m / 77.7m                                                                  
6	84k	0.04		0.07		0.470		0.866		2.13m - 13.6m / 78.8m                                                                  
7	98k	0.04		0.05		0.561		0.899		2.14m - 15.7m / 75.4m                                                                  
8	112k	0.04		0.06		0.501		0.869		2.21m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.09		0.06		0.358		0.842		1.04m - 1.0m / 0.0m                                                                    
2	28k	0.04		0.05		0.349		0.833		1.01m - 2.1m / 36.4m                                                                   
3	42k	0.02		0.03		0.492		0.902		1.07m - 3.1m / 35.3m                                                                   
4	56k	0.02		0.02		0.469		0.899		1.08m - 4.3m / 37.3m                                                                   
5	70k	0.01		0.03		0.465		0.896		1.01m - 5.3m / 37.7m                                                                   
6	84k	0.01		0.03		0.469		0.897		0.99m - 6.3m / 35.5m                                                                   
7	98k	0.01		0.02		0.533		0.919		1.01m - 7.3m / 34.9m                                                                   
8	112k	0.01		0.03		0.501		0.910		1.00m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.05		0.542		0.889		1.95m - 2.0m / 0.0m                                                                    
2	28k	0.04		0.04		0.610		0.915		1.93m - 3.9m / 68.4m                                                                   
3	42k	0.03		0.03		0.607		0.914		1.80m - 5.8m / 67.8m                                                                   
4	56k	0.02		0.04		0.579		0.905		1.80m - 7.6m / 63.6m                                                                   
5	70k	0.02		0.04		0.565		0.900		1.80m - 9.4m / 63.6m                                                                   
6	84k	0.02		0.04		0.589		0.909		1.80m - 11.2m / 63.5m                                                                  
7	98k	0.02		0.05		0.630		0.922		1.81m - 13.1m / 63.5m                                                                  
8	112k	0.02		0.04		0.549		0.903		1.83m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.16		0.14		0.405		0.824		1.38m - 1.4m / 0.0m                                                                    
2	28k	0.13		0.10		0.394		0.822		1.33m - 2.7m / 48.3m                                                                   
3	42k	0.11		0.08		0.436		0.842		1.34m - 4.1m / 46.6m                                                                   
4	56k	0.08		0.08		0.420		0.829		1.33m - 5.4m / 47.1m                                                                   
5	70k	0.06		0.07		0.482		0.861		1.36m - 6.8m / 46.6m                                                                   
6	84k	0.05		0.06		0.501		0.872		1.39m - 8.2m / 47.5m                                                                   
7	98k	0.04		0.06		0.521		0.882		1.34m - 9.6m / 48.5m                                                                   
8	112k	0.04		0.06		0.490		0.867		1.35m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.131		0.800		0.29m - 0.3m / 0.0m                                                                    
2	28k	0.02		0.02		0.148		0.826		0.30m - 0.6m / 10.3m                                                                   
3	42k	0.01		0.01		0.177		0.856		0.30m - 0.9m / 10.7m                                                                   
4	56k	0.01		0.01		0.180		0.859		0.31m - 1.3m / 10.4m                                                                   
5	70k	0.01		0.01		0.193		0.867		0.31m - 1.6m / 10.8m                                                                   
6	84k	0.01		0.01		0.184		0.864		0.32m - 1.9m / 10.9m                                                                   
7	99k	0.01		0.01		0.202		0.875		0.30m - 2.3m / 11.1m                                                                   
8	113k	0.01		0.01		0.199		0.872		0.30m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.04		0.347		0.840		1.36m - 1.4m / 0.0m                                                                    
2	28k	0.03		0.04		0.343		0.844		1.36m - 2.7m / 47.5m                                                                   
3	42k	0.02		0.04		0.372		0.863		1.34m - 4.1m / 47.7m                                                                   
4	56k	0.02		0.04		0.325		0.834		1.31m - 5.4m / 47.1m                                                                   
5	70k	0.03		0.06		0.316		0.830		1.31m - 6.7m / 46.1m                                                                   
6	84k	0.04		0.07		0.227		0.751		1.30m - 8.1m / 46.1m                                                                   
7	98k	0.06		0.08		0.142		0.618		1.30m - 9.4m / 45.8m                                                                   
8	112k	0.07		0.07		0.181		0.672		1.31m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.099		0.773		0.45m - 0.4m / 0.0m                                                                    
2	28k	0.03		0.02		0.114		0.799		0.45m - 0.9m / 15.6m                                                                   
3	42k	0.02		0.02		0.117		0.809		0.45m - 1.4m / 15.9m                                                                   
4	56k	0.01		0.02		0.116		0.801		0.46m - 1.9m / 15.7m                                                                   
5	70k	0.01		0.02		0.120		0.807		0.43m - 2.3m / 16.2m                                                                   
6	84k	0.01		0.02		0.117		0.808		0.42m - 2.8m / 15.2m                                                                   
7	98k	0.01		0.02		0.132		0.828		0.43m - 3.2m / 14.8m                                                                   
8	112k	0.00		0.02		0.130		0.829		0.42m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.07		0.178		0.809		0.55m - 0.6m / 0.0m                                                                    
2	28k	0.05		0.06		0.178		0.809		0.56m - 1.1m / 19.3m                                                                   
3	42k	0.04		0.05		0.178		0.809		0.57m - 1.7m / 19.6m                                                                   
4	56k	0.04		0.06		0.192		0.817		0.56m - 2.3m / 19.9m                                                                   
5	70k	0.04		0.04		0.172		0.801		0.55m - 2.9m / 19.7m                                                                   
6	84k	0.03		0.04		0.169		0.794		0.55m - 3.4m / 19.4m                                                                   
7	98k	0.03		0.05		0.169		0.792		0.55m - 4.0m / 19.3m                                                                   
8	112k	0.03		0.05		0.154		0.776		0.55m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.13		0.14		0.332		0.804		1.66m - 1.7m / 0.0m                                                                    
2	28k	0.10		0.12		0.361		0.818		1.62m - 3.3m / 58.0m                                                                   
3	42k	0.09		0.10		0.391		0.837		1.49m - 4.8m / 56.8m                                                                   
4	56k	0.08		0.14		0.396		0.839		1.50m - 6.3m / 52.5m                                                                   
5	70k	0.08		0.13		0.381		0.827		1.46m - 7.8m / 53.0m                                                                   
6	84k	0.08		0.14		0.382		0.825		1.46m - 9.3m / 51.7m                                                                   
7	98k	0.08		0.12		0.320		0.793		1.45m - 10.7m / 51.5m                                                                  
8	112k	0.08		0.17		0.375		0.828		1.45m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.02		0.180		0.861		0.76m - 0.8m / 0.0m                                                                    
2	28k	0.01		0.01		0.200		0.869		0.80m - 1.7m / 26.8m                                                                   
3	42k	0.01		0.01		0.205		0.880		0.79m - 2.5m / 28.2m                                                                   
4	56k	0.01		0.01		0.166		0.849		0.79m - 3.3m / 27.8m                                                                   
5	70k	0.01		0.01		0.137		0.818		0.74m - 4.0m / 27.7m                                                                   
6	84k	0.01		0.02		0.079		0.729		0.73m - 4.8m / 26.2m                                                                   
7	98k	0.02		0.03		0.062		0.623		0.73m - 5.5m / 26.0m                                                                   
8	113k	0.02		0.03		0.095		0.750		0.75m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.145		0.778		1.00m - 1.0m / 0.0m                                                                    
2	28k	0.02		0.03		0.131		0.752		0.97m - 2.0m / 35.1m                                                                   
3	42k	0.01		0.02		0.159		0.803		0.96m - 3.0m / 34.1m                                                                   
4	56k	0.01		0.03		0.131		0.758		0.94m - 4.0m / 33.8m                                                                   
5	70k	0.01		0.02		0.253		0.872		0.96m - 4.9m / 33.2m                                                                   
6	84k	0.01		0.02		0.183		0.821		0.95m - 5.9m / 33.6m                                                                   
7	98k	0.01		0.03		0.158		0.789		0.95m - 6.9m / 33.5m                                                                   
8	112k	0.02		0.03		0.167		0.810		0.95m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.04		0.122		0.800		0.27m - 0.3m / 0.0m                                                                    
2	28k	0.03		0.03		0.122		0.800		0.28m - 0.6m / 9.6m                                                                    
3	42k	0.03		0.02		0.161		0.843		0.28m - 0.9m / 9.8m                                                                    
4	56k	0.02		0.02		0.164		0.851		0.27m - 1.2m / 9.9m                                                                    
5	70k	0.02		0.02		0.178		0.864		0.28m - 1.5m / 9.6m                                                                    
6	84k	0.01		0.02		0.176		0.863		0.27m - 1.7m / 9.9m                                                                    
7	98k	0.01		0.02		0.202		0.882		0.28m - 2.0m / 9.7m                                                                    
8	113k	0.01		0.02		0.203		0.880		0.27m -

+------------------------------+---------------------------------------------------+
 85%|██████████████████████████████████▋      | 127/150 [21:14:45<3:46:22, 590.53s/it, best loss: 0.006738710305531937]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.128		0.786		0.64m - 0.6m / 0.0m                                                                    
2	28k	0.02		0.01		0.215		0.869		0.64m - 1.3m / 22.6m                                                                   
3	42k	0.01		0.01		0.237		0.884		0.63m - 2.0m / 22.5m                                                                   
4	56k	0.01		0.01		0.243		0.883		0.64m - 2.6m / 22.2m                                                                   
5	70k	0.00		0.01		0.275		0.900		0.63m - 3.3m / 22.6m                                                                   
6	84k	0.00		0.01		0.268		0.898		0.63m - 3.9m / 22.2m                                                                   
7	98k	0.00		0.01		0.271		0.899		0.63m - 4.6m / 22.3m                                                                   
8	112k	0.00		0.01		0.279		0.905		0.68m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.090		0.780		0.24m - 0.2m / 0.0m                                                                    
2	28k	0.03		0.03		0.090		0.780		0.24m - 0.5m / 8.3m                                                                    
3	42k	0.03		0.02		0.092		0.785		0.24m - 0.7m / 8.4m                                                                    
4	56k	0.02		0.02		0.111		0.816		0.23m - 1.0m / 8.4m                                                                    
5	70k	0.02		0.01		0.119		0.831		0.23m - 1.3m / 8.3m                                                                    
6	85k	0.02		0.01		0.126		0.842		0.23m - 1.5m / 8.2m                                                                    
7	99k	0.01		0.01		0.125		0.840		0.24m - 1.8m / 8.3m                                                                    
8	113k	0.01		0.01		0.136		0.853		0.23m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.180		0.828		0.66m - 0.7m / 0.0m                                                                    
2	28k	0.02		0.02		0.139		0.792		0.67m - 1.3m / 23.1m                                                                   
3	42k	0.01		0.01		0.200		0.858		0.67m - 2.0m / 23.5m                                                                   
4	56k	0.01		0.02		0.175		0.837		0.70m - 2.7m / 23.4m                                                                   
5	70k	0.00		0.02		0.180		0.839		0.71m - 3.5m / 24.6m                                                                   
6	84k	0.00		0.02		0.187		0.849		0.69m - 4.2m / 24.9m                                                                   
7	98k	0.00		0.01		0.241		0.880		0.66m - 4.9m / 24.1m                                                                   
8	112k	0.00		0.02		0.185		0.851		0.65m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.03		0.220		0.827		0.67m - 0.7m / 0.0m                                                                    
2	28k	0.03		0.03		0.233		0.843		0.67m - 1.4m / 23.5m                                                                   
3	42k	0.02		0.03		0.207		0.828		0.66m - 2.0m / 23.6m                                                                   
4	56k	0.01		0.04		0.242		0.852		0.66m - 2.7m / 23.1m                                                                   
5	70k	0.01		0.04		0.210		0.827		0.66m - 3.4m / 23.2m                                                                   
6	84k	0.01		0.03		0.251		0.859		0.65m - 4.1m / 23.3m                                                                   
7	98k	0.01		0.03		0.241		0.852		0.65m - 4.7m / 23.0m                                                                   
8	112k	0.01		0.02		0.310		0.888		0.63m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.05		0.155		0.798		0.79m - 0.8m / 0.0m                                                                    
2	28k	0.04		0.05		0.155		0.798		0.78m - 1.6m / 27.9m                                                                   
3	42k	0.04		0.05		0.129		0.730		0.76m - 2.4m / 27.3m                                                                   
4	56k	0.04		0.05		0.105		0.743		0.77m - 3.2m / 26.9m                                                                   
5	70k	0.04		0.04		0.111		0.749		0.77m - 4.0m / 27.0m                                                                   
6	84k	0.04		0.04		0.101		0.749		0.76m - 4.8m / 27.1m                                                                   
VAL f1	0.15492418383919282 - (0.15492418383919282)                                                                     
VAL loss	0.04175147136784919            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.02		0.195		0.849		0.33m - 0.3m / 0.0m                                                                    
2	28k	0.01		0.01		0.263		0.897		0.33m - 0.7m / 11.4m                                                                   
3	42k	0.01		0.01		0.264		0.896		0.32m - 1.0m / 11.6m                                                                   
4	56k	0.00		0.01		0.238		0.885		0.32m - 1.4m / 11.2m                                                                   
5	70k	0.00		0.01		0.292		0.908		0.33m - 1.7m / 11.4m                                                                   
6	84k	0.00		0.01		0.260		0.897		0.31m - 2.0m / 11.5m                                                                   
7	98k	0.00		0.01		0.262		0.899		0.31m - 2.3m / 11.1m                                                                   
8	113k	0.00		0.01		0.258		0.896		0.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.089		0.783		0.50m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.03		0.089		0.783		0.49m - 1.0m / 17.4m                                                                   
3	42k	0.02		0.02		0.091		0.793		0.47m - 1.5m / 17.1m                                                                   
4	56k	0.01		0.02		0.105		0.810		0.47m - 2.0m / 16.5m                                                                   
5	70k	0.01		0.01		0.114		0.823		0.46m - 2.5m / 16.5m                                                                   
6	84k	0.01		0.01		0.124		0.836		0.46m - 3.0m / 16.3m                                                                   
7	98k	0.01		0.01		0.126		0.840		0.46m - 3.4m / 16.3m                                                                   
8	112k	0.01		0.01		0.125		0.837		0.45m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.04		0.461		0.875		0.76m - 0.8m / 0.0m                                                                    
2	28k	0.03		0.04		0.514		0.896		0.78m - 1.6m / 26.6m                                                                   
3	42k	0.03		0.03		0.486		0.888		0.73m - 2.3m / 27.2m                                                                   
4	56k	0.03		0.03		0.558		0.912		0.73m - 3.0m / 25.6m                                                                   
5	70k	0.03		0.03		0.538		0.907		0.77m - 3.8m / 25.6m                                                                   
6	84k	0.02		0.03		0.590		0.922		0.77m - 4.6m / 26.9m                                                                   
7	98k	0.02		0.03		0.559		0.916		0.72m - 5.3m / 26.9m                                                                   
8	112k	0.02		0.03		0.586		0.922		0.72m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.07		0.212		0.805		1.04m - 1.0m / 0.0m                                                                    
2	28k	0.05		0.05		0.240		0.835		1.00m - 2.1m / 36.3m                                                                   
3	42k	0.03		0.03		0.264		0.847		0.99m - 3.1m / 35.1m                                                                   
4	56k	0.02		0.03		0.282		0.862		0.97m - 4.1m / 34.7m                                                                   
5	70k	0.02		0.03		0.309		0.877		0.97m - 5.0m / 34.2m                                                                   
6	84k	0.01		0.03		0.331		0.889		0.95m - 6.0m / 34.3m                                                                   
7	98k	0.01		0.03		0.337		0.891		0.97m - 7.0m / 33.6m                                                                   
8	112k	0.01		0.02		0.321		0.885		1.00m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.04		0.122		0.800		0.70m - 0.7m / 0.0m                                                                    
2	28k	0.03		0.03		0.122		0.800		0.68m - 1.4m / 24.4m                                                                   
3	42k	0.03		0.03		0.096		0.768		0.68m - 2.1m / 23.7m                                                                   
4	56k	0.03		0.02		0.095		0.763		0.68m - 2.8m / 23.9m                                                                   
5	70k	0.02		0.02		0.102		0.766		0.67m - 3.5m / 24.0m                                                                   
6	84k	0.02		0.02		0.148		0.830		0.67m - 4.1m / 23.5m                                                                   
7	98k	0.01		0.02		0.180		0.861		0.67m - 4.8m / 23.6m                                                                   
8	113k	0.01		0.02		0.179		0.862		0.66m -

+------------------------------+---------------------------------------------------+
 91%|█████████████████████████████████████▍   | 137/150 [23:00:19<2:52:52, 797.87s/it, best loss: 0.006738710305531937]

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.100		0.792		0.49m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.03		0.105		0.803		0.49m - 1.0m / 17.2m                                                                   
3	42k	0.02		0.02		0.093		0.792		0.48m - 1.5m / 17.3m                                                                   
4	56k	0.02		0.02		0.099		0.785		0.48m - 2.0m / 16.9m                                                                   
5	70k	0.01		0.02		0.118		0.816		0.49m - 2.5m / 16.8m                                                                   
6	84k	0.01		0.02		0.138		0.840		0.49m - 3.0m / 17.3m                                                                   
7	99k	0.01		0.02		0.155		0.856		0.48m - 3.5m / 17.1m                                                                   
8	113k	0.01		0.02		0.151		0.855		0.48m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.06		0.156		0.810		0.92m - 0.9m / 0.0m                                                                    
2	28k	0.04		0.04		0.156		0.810		0.88m - 1.8m / 32.4m                                                                   
3	42k	0.04		0.04		0.156		0.810		0.84m - 2.7m / 30.9m                                                                   
4	56k	0.04		0.04		0.145		0.799		0.82m - 3.5m / 29.6m                                                                   
5	70k	0.04		0.04		0.102		0.746		0.81m - 4.3m / 29.0m                                                                   
6	84k	0.03		0.03		0.107		0.766		0.81m - 5.2m / 28.7m                                                                   
7	99k	0.03		0.03		0.104		0.754		0.83m - 6.0m / 28.7m                                                                   
8	113k	0.02		0.03		0.109		0.763		0.81m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.06		0.05		0.194		0.807		0.66m - 0.7m / 0.0m                                                                    
2	28k	0.04		0.03		0.268		0.867		0.66m - 1.3m / 23.0m                                                                   
3	42k	0.02		0.03		0.280		0.869		0.66m - 2.0m / 23.0m                                                                   
4	56k	0.01		0.03		0.324		0.894		0.66m - 2.7m / 23.0m                                                                   
5	70k	0.01		0.02		0.333		0.899		0.65m - 3.3m / 23.1m                                                                   
6	84k	0.01		0.03		0.312		0.890		0.64m - 4.0m / 22.8m                                                                   
7	98k	0.01		0.03		0.291		0.879		0.65m - 4.7m / 22.6m                                                                   
8	112k	0.01		0.02		0.332		0.901		0.64m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.08		0.06		0.333		0.847		1.31m - 1.3m / 0.0m                                                                    
2	28k	0.04		0.04		0.380		0.865		1.23m - 2.6m / 45.9m                                                                   
3	42k	0.03		0.04		0.460		0.901		1.23m - 3.9m / 43.1m                                                                   
4	56k	0.02		0.03		0.469		0.905		1.22m - 5.1m / 43.4m                                                                   
5	70k	0.02		0.03		0.433		0.891		1.19m - 6.3m / 42.8m                                                                   
6	84k	0.02		0.03		0.473		0.906		1.20m - 7.5m / 42.0m                                                                   
7	98k	0.02		0.03		0.468		0.904		1.19m - 8.7m / 42.3m                                                                   
8	112k	0.02		0.02		0.459		0.903		1.20m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.125		0.806		0.75m - 0.7m / 0.0m                                                                    
2	28k	0.03		0.02		0.147		0.832		0.74m - 1.5m / 26.2m                                                                   
3	42k	0.02		0.01		0.161		0.844		0.72m - 2.2m / 25.8m                                                                   
4	56k	0.01		0.01		0.208		0.881		0.72m - 3.0m / 25.3m                                                                   
5	70k	0.01		0.01		0.178		0.858		0.71m - 3.7m / 25.5m                                                                   
6	84k	0.01		0.01		0.199		0.875		0.70m - 4.4m / 25.0m                                                                   
7	98k	0.00		0.01		0.184		0.868		0.72m - 5.2m / 24.9m                                                                   
8	112k	0.00		0.01		0.201		0.877		0.72m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.11		0.13		0.316		0.819		1.45m - 1.4m / 0.0m                                                                    
2	28k	0.08		0.07		0.281		0.801		1.48m - 3.0m / 50.6m                                                                   
3	42k	0.05		0.07		0.325		0.825		1.40m - 4.4m / 51.9m                                                                   
4	56k	0.04		0.06		0.372		0.854		1.36m - 5.7m / 49.2m                                                                   
5	70k	0.04		0.09		0.342		0.831		1.37m - 7.1m / 47.9m                                                                   
6	84k	0.04		0.06		0.361		0.850		1.39m - 8.5m / 48.2m                                                                   
7	98k	0.04		0.06		0.426		0.882		1.42m - 10.0m / 48.9m                                                                  
8	112k	0.04		0.06		0.382		0.860		1.33m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.07		0.07		0.202		0.804		0.89m - 0.9m / 0.0m                                                                    
2	28k	0.06		0.04		0.159		0.770		0.90m - 1.8m / 31.3m                                                                   
3	42k	0.04		0.04		0.185		0.801		0.90m - 2.7m / 31.4m                                                                   
4	56k	0.03		0.04		0.211		0.817		0.89m - 3.6m / 31.5m                                                                   
5	70k	0.02		0.03		0.250		0.849		0.89m - 4.5m / 31.2m                                                                   
6	84k	0.02		0.03		0.278		0.866		0.89m - 5.4m / 31.3m                                                                   
7	98k	0.02		0.03		0.294		0.876		0.88m - 6.3m / 31.1m                                                                   
8	113k	0.01		0.02		0.317		0.889		0.87m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.05		0.03		0.373		0.897		1.24m - 1.2m / 0.0m                                                                    
2	28k	0.02		0.03		0.370		0.895		1.26m - 2.5m / 43.4m                                                                   
3	42k	0.02		0.03		0.291		0.854		1.30m - 3.8m / 44.1m                                                                   
4	56k	0.03		0.04		0.228		0.816		1.25m - 5.1m / 45.3m                                                                   
5	70k	0.04		0.06		0.197		0.785		1.26m - 6.4m / 43.9m                                                                   
6	84k	0.06		0.06		0.144		0.792		1.26m - 7.6m / 44.2m                                                                   
VAL f1	0.37340667590677823 - (0.37340667590677823)                                                                     
VAL loss	0.029554871765225577           

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.03		0.113		0.802		0.55m - 0.5m / 0.0m                                                                    
2	28k	0.03		0.02		0.065		0.735		0.54m - 1.1m / 19.2m                                                                   
3	42k	0.02		0.02		0.131		0.823		0.57m - 1.7m / 19.0m                                                                   
4	56k	0.01		0.02		0.099		0.794		0.57m - 2.3m / 20.0m                                                                   
5	70k	0.01		0.01		0.153		0.852		0.58m - 2.9m / 19.9m                                                                   
6	85k	0.01		0.01		0.182		0.877		0.52m - 3.4m / 20.2m                                                                   
7	99k	0.01		0.01		0.189		0.882		0.53m - 4.0m / 18.5m                                                                   
8	113k	0.01		0.01		0.154		0.859		0.52m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.02		0.02		0.122		0.832		0.46m - 0.5m / 0.0m                                                                    
2	28k	0.01		0.01		0.178		0.885		0.47m - 0.9m / 16.0m                                                                   
3	42k	0.00		0.01		0.145		0.857		0.45m - 1.4m / 16.3m                                                                   
4	56k	0.00		0.01		0.193		0.893		0.45m - 1.9m / 15.7m                                                                   
5	70k	0.00		0.01		0.200		0.897		0.46m - 2.3m / 15.9m                                                                   
6	85k	0.00		0.01		0.192		0.892		0.45m - 2.8m / 16.1m                                                                   
7	99k	0.00		0.01		0.202		0.899		0.45m - 3.3m / 15.8m                                                                   
8	113k	0.00		0.01		0.190		0.891		0.45m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.13		0.09		0.543		0.879		1.49m - 1.5m / 0.0m                                                                    
2	28k	0.06		0.09		0.465		0.851		1.43m - 2.9m / 52.0m                                                                   
3	42k	0.05		0.07		0.538		0.880		1.41m - 4.4m / 50.2m                                                                   
4	56k	0.06		0.06		0.522		0.875		1.42m - 5.8m / 49.7m                                                                   
5	70k	0.07		0.07		0.515		0.872		1.42m - 7.2m / 49.8m                                                                   
6	84k	0.08		0.07		0.486		0.858		1.44m - 8.7m / 49.8m                                                                   
VAL f1	0.5429158089937979 - (0.5429158089937979)                                                                       
VAL loss	0.06318303090792436            

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.04		0.03		0.141		0.811		0.47m - 0.5m / 0.0m                                                                    
2	28k	0.02		0.02		0.221		0.875		0.47m - 1.0m / 16.5m                                                                   
3	42k	0.01		0.01		0.237		0.885		0.47m - 1.5m / 16.6m                                                                   
4	56k	0.01		0.01		0.263		0.900		0.48m - 1.9m / 16.5m                                                                   
5	70k	0.00		0.01		0.229		0.881		0.47m - 2.4m / 16.8m                                                                   
6	84k	0.00		0.01		0.256		0.895		0.50m - 2.9m / 16.4m                                                                   
7	98k	0.00		0.01		0.268		0.900		0.48m - 3.4m / 17.4m                                                                   
8	112k	0.00		0.01		0.264		0.899		0.49m -

A Jupyter Widget

# EP	# IT	tr loss		val loss	f1		acc		duration / total time                                                             
1	14k	0.03		0.01		0.166		0.842		0.76m - 0.8m / 0.0m                                                                    
2	28k	0.01		0.01		0.201		0.869		0.76m - 1.5m / 26.6m                                                                   
3	42k	0.01		0.01		0.227		0.888		0.75m - 2.3m / 26.5m                                                                   
4	56k	0.00		0.01		0.243		0.895		0.76m - 3.1m / 26.5m                                                                   
5	70k	0.01		0.01		0.202		0.874		0.75m - 3.9m / 26.7m                                                                   
6	84k	0.01		0.01		0.196		0.873		0.76m - 4.6m / 26.3m                                                                   
7	99k	0.01		0.02		0.063		0.734		0.74m - 5.4m / 26.6m                                                                   
8	113k	0.02		0.02		0.104		0.762		0.75m -