In [588]:
import argparse
import sys
import os
import json
import pprint
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import re
import torch
from collections import Counter
from transformers import AutoModel, AutoTokenizer
from tqdm import tqdm
from sklearn.metrics import f1_score

In [589]:
BASE_DIR = "/Users/katemarg/PycharmProjects/temporal_robustness_evaluation"
DATA_DIR = os.path.join(BASE_DIR, 'data')
CKPT_DIR = os.path.join(BASE_DIR, 'pretrained_models')
RES_DIR = os.path.join(BASE_DIR, 'results')
LOG_DIR = os.path.join(BASE_DIR, 'logs')
CACHE_DIR = os.path.join(BASE_DIR, 'cached')

TEMPLAMA_ORIG_DIR = os.path.join("data", "templama", "test.json")
TEMPLAMA_REPRODUCED_DIR = os.path.join("templama_docker", "reproduce1", "templama", "test.jsonl")
TEMPLAMA_NEW_DIR = os.path.join(DATA_DIR, "dynamic-templama",
                                "dataset_from_2019-1-1_to_2022-12-31_per_quarter", 
                                "test.jsonl")
lm = "cardiffnlp/twitter-roberta-base-mar2022"
# dataset_filepath=CACHE_DIR+'/{}_dynamic-templama_multiple_masks.pt'.format(lm)
dataset_filepath=CACHE_DIR+'/cardiffnlp-twitter-roberta-base-mar2022_dynamic-templama_multiple_masks.pt'

## Load dataset

In [591]:
data_dict_multi_token = torch.load(dataset_filepath)

In [592]:
data_dict_multi_token['2019-Q1']

{'text': [['Lionel Messi plays for <mask> <mask>.'],
  ['Cristiano Ronaldo plays for <mask> <mask> <mask> <mask> <mask>.'],
  ['LeBron James plays for <mask> <mask> <mask>.'],
  ['Puck Moonen plays for <mask> <mask> <mask> <mask> <mask>.'],
  ['Zlatan Ibrahimović plays for <mask> <mask> <mask> <mask> <mask>.'],
  ['Neymar plays for <mask> <mask> <mask> <mask>.'],
  ["Samuel Eto'o plays for <mask> <mask>."],
  ['Megan Rapinoe plays for <mask> <mask>.'],
  ['Pau Gasol plays for <mask> <mask> <mask>.'],
  ['Robert Lewandowski plays for <mask> <mask> <mask>.'],
  ['Andrea Pirlo plays for <mask> <mask> <mask> <mask>.'],
  ['Kevin Durant plays for <mask> <mask>.'],
  ['Lukas Podolski plays for <mask> <mask> <mask>.'],
  ['Lewis Hamilton plays for <mask>.'],
  ['Naomi Osaka plays for <mask> <mask> <mask> <mask>.'],
  ['José Mourinho plays for <mask> <mask> <mask> <mask> <mask>.'],
  ['Luis Suárez plays for <mask> <mask>.'],
  ['Franck Ribéry plays for <mask> <mask> <mask>.'],
  ['Xavi Hernánd

In [593]:
# Load pre-trained model tokenizer (vocabulary)
tokenizer = AutoTokenizer.from_pretrained(lm, use_fast=False, add_prefix_space=True)

CLS = tokenizer.cls_token
PAD = tokenizer.pad_token
SEP = tokenizer.sep_token
MASK = tokenizer.mask_token

mask_id = tokenizer.mask_token_id
sep_id = tokenizer.sep_token_id
cls_id = tokenizer.cls_token_id
pad_id = tokenizer.pad_token_id

special_ids = [mask_id, sep_id, cls_id, pad_id]
def tokenizer_return_id(text, filter_special_tokens=False):
    """
    Text to token ids for a string.
    """
    output = tokenizer(text)
    if filter_special_tokens:
        token_ids = [i for i in output['input_ids'] if i not in tokenizer.all_special_ids]
    else:
        token_ids = [i for i in output['input_ids'] ]
    return token_ids

def tokenize_batch(batch):
    """
    Text to token ids for a list of strings.
    """
#     return [tokenizer.convert_tokens_to_ids(sent) for sent in batch]
    return [tokenizer_return_id(sent) for sent in batch]

def untokenize_id(ids):
    """
    Token ids to strings.
    """
#     return [tokenizer.convert_tokens_to_ids(sent) for sent in batch]
    return [tokenizer.decode(_id) for _id in ids]


def untokenize_batch(batch, filter_special_tokens=False):
    """
    Token ids to strings for a list of ids.
    """
#     return [tokenizer.convert_ids_to_tokens(sent) for sent in batch]
#     print(label_id)
    if filter_special_tokens:
        _batch = []
        for sent in batch:
            _batch.append([x for x in sent if x not in special_ids])
        batch = _batch
#         return [tokenizer.decode(label_id) for label_id in batch if label_id not in special_ids]
#     else:
    return [untokenize_id(sent) for sent in batch]

def detokenize(sent):
    """ Roughly detokenizes (mainly undoes wordpiece) """
    # not sure what this does.... their code
    new_sent = []
    for i, tok in enumerate(sent):
        if tok.startswith("##"):
            new_sent[len(new_sent) - 1] = new_sent[len(new_sent) - 1] + tok[2:]
        else:
            new_sent.append(tok)
    return new_sent

In [594]:
def split_dataset(data):
    """
    Split temporal dataset Dt to D_unchanged, D_new and D_updated compared to D_(t-1) for all t.
    Specifically:
    - D_unchanged: data where text_t = text_(t-1) & label_t = label_(t-1)
    - D_updated: data where text_t = text_(t-1) & label_t != label_(t-1)
    - D_new: data where text_t not in D_(t-1)
    - D_deleted: data that exist in D_(t-1) but not in D_t

    Args:
        data: a dictionary with keys the time (year/quarter/month) and values dictionaries
        data = {
                '2019-Q1':
                    {
                    'text': [list of text],
                    'labels': [list of labels],
                    'labels_ids': [list of label token ids -- for a given model/tokenizer],
                    'relations' [list of Wikidata relations]
                    },
                '2019-Q2': {...}
                }

    Returns:
        D_unchanged, D_new, D_updated, D_deleted
    """
    unchanged_t, new_t, updated_t, deleted_t = {}, {}, {}, {}
    quarters = list(data.keys())
    t_0 = quarters[0]  # t=t0
    t_1 = quarters[0]  # t-1

    for t in quarters[1:]:
        if t in ['2022-Q3', '2022-Q4']:
            continue # skip last two quarters of 2022
        data_t = data[t]      # D_t
        data_t_1 = data[t_1]  # D_(t-1)

        unchanged_t[t] = {key: [] for key in data_t.keys()}
        new_t[t] = {key: [] for key in data_t.keys()}
        updated_t[t] = {key: [] for key in data_t.keys()}
        deleted_t[t] = {key: [] for key in data_t.keys()}

        for i in range(0, len(data_t['text'])): # for all facts in t
            text_t = data_t['text'][i]
            labels_ids_t = data_t['labels_ids'][i][0]
            if text_t in data_t_1['text']:  # if fact in t in facts of t-1
                t_1_index = data_t_1['text'].index(text_t)
                labels_inds_t_1 = data_t_1['labels_ids'][t_1_index][0]
                if labels_ids_t == labels_inds_t_1:
                    # text_t = text_t-1 & label_t = label_t-1
                    # add to D_unchanged
                    for key in data_t.keys():
                        unchanged_t[t][key].append(data_t[key][i])
                else:
                    # text_t = text_(t-1) & label_t != label_(t-1)
                    # add to D_updated
                    for key in data_t.keys():
                        updated_t[t][key].append(data_t[key][i])
            else:
                # text_t not in D_(t-1) texts
                # add to D_new
                for key in data_t.keys():
                    new_t[t][key].append(data_t[key][i])
        for j in range(0, len(data_t_1['text'])):
            text_t_1 = data_t_1['text'][j]
            if text_t_1 not in data_t['text']:
                # text_(t+1) not in D_t
                # add to D_deleted
                for key in data_t_1.keys():
                    deleted_t[t][key].append(data_t_1[key][j])
        t_1 = t

        assert len(data_t['text']) == len(unchanged_t[t]['text']) + len(updated_t[t]['text']) + len(new_t[t]['text'])
        print(
            't={}: From total {} samples in D_t, {} are unchanged, {} are updated, {} are deleted and {} are new, compared to D_(t-1).'.format(
                t,
                len(data_t['text']),
                len(unchanged_t[t]['text']),
                len(updated_t[t]['text']),
                len(deleted_t[t]['text']),
                len(new_t[t]['text'])))
    return unchanged_t, new_t, updated_t, deleted_t, data[t_0]

## Split dataset

In [595]:
# Split dataset
unchanged_t, new_t, updated_t, deleted_t, orig = split_dataset(data_dict_multi_token)

t=2019-Q2: From total 7962 samples in D_t, 7728 are unchanged, 36 are updated, 206 are deleted and 198 are new, compared to D_(t-1).
t=2019-Q3: From total 8011 samples in D_t, 7633 are unchanged, 65 are updated, 264 are deleted and 313 are new, compared to D_(t-1).
t=2019-Q4: From total 7989 samples in D_t, 7742 are unchanged, 51 are updated, 218 are deleted and 196 are new, compared to D_(t-1).
t=2020-Q1: From total 7872 samples in D_t, 7359 are unchanged, 107 are updated, 524 are deleted and 406 are new, compared to D_(t-1).
t=2020-Q2: From total 7848 samples in D_t, 7699 are unchanged, 30 are updated, 143 are deleted and 119 are new, compared to D_(t-1).
t=2020-Q3: From total 7900 samples in D_t, 7666 are unchanged, 40 are updated, 142 are deleted and 194 are new, compared to D_(t-1).
t=2020-Q4: From total 7892 samples in D_t, 7682 are unchanged, 26 are updated, 192 are deleted and 184 are new, compared to D_(t-1).
t=2021-Q1: From total 7819 samples in D_t, 7381 are unchanged, 69 ar

In [600]:
updated_t['2022-Q2']

{'text': [['Nemanja Nikolić plays for <mask> <mask> <mask> <mask> <mask>.'],
  ['Chris Heaton-Harris holds the position of <mask> <mask> <mask> <mask> <mask>.'],
  ['Katy Gallagher holds the position of <mask> <mask> <mask> <mask> <mask>.'],
  ['Antti Kurvinen holds the position of <mask> <mask> <mask> <mask> <mask>.'],
  ['Bridget Brink holds the position of <mask> <mask> <mask> <mask> <mask>.'],
  ['Christian Wakeford is a member of the <mask> <mask>.'],
  ['Gabriëlle Popken is a member of the <mask> <mask> <mask>.'],
  ['<mask> <mask> <mask> <mask> <mask> is the chair of Democratic Party.'],
  ['<mask> <mask> <mask> <mask> <mask> is the chair of Democratic Party.'],
  ['<mask> <mask> <mask> is the head of the government of Pittsburgh.'],
  ['<mask> <mask> is the head of the government of Portland.'],
  ['<mask> <mask> <mask> <mask> is the head coach of Galatasaray S.K..'],
  ['<mask> <mask> <mask> <mask> is the head coach of AC Sparta Prague.'],
  ['<mask> <mask> <mask> <mask> <mask

## Calculate distribution of correct number of masks for each relation in the dataset

In [596]:
num_masks_per_relation = {'relation': [], 'num_masks': []}
rels = []
avg_masks = []
for key,data in data_dict_multi_token.items():
    num_masks_per_relation['relation'] += data['relation']
    num_masks_per_relation['num_masks'] += data['num_masks']

In [597]:
df = pd.DataFrame(data=num_masks_per_relation)
df['avg_num_masks'] = df['num_masks'].apply(lambda l: np.mean(l))

In [598]:
# add histogram
for relation in list(set(df['relation'])):
    rel_avg_masks = df[df['relation']==relation]['avg_num_masks']
    mean = rel_avg_masks.mean()
    std = rel_avg_masks.std()
    print('Relation {} has {}+-{} masks.'.format(relation, mean, std))

Relation P108 has 3.2557063380647846+-1.0566433779824 masks.
Relation P488 has 3.7991272946133012+-1.0440151510212339 masks.
Relation P39 has 2.8759821987344414+-1.2484631699010644 masks.
Relation P102 has 3.0394688306897826+-1.0380073991779586 masks.
Relation P69 has 3.3333333333333335+-0.8677908410058633 masks.
Relation P127 has 3.0933882676083972+-1.0390291009634056 masks.
Relation P6 has 3.7954545454545454+-1.0120816013870382 masks.
Relation P286 has 3.7844364937388195+-1.0331849038301197 masks.
Relation P279 has 3.5+-0.8728715609439694 masks.
Relation P54 has 4.093302066539645+-0.9763579711325114 masks.


## We will filter examples at max M=5 number of masks, as in [Jiang et al., 2020](https://aclanthology.org/2020.emnlp-main.479/)

-----

## Multi-token generation

In [481]:
from transformers import AutoTokenizer, AutoModel, pipeline
lm = "cardiffnlp/twitter-roberta-base-mar2022"
fill_mask_model = pipeline(
    'fill-mask', model=lm, framework="pt",
    tokenizer=tokenizer, top_k=100
)
model = fill_mask_model.model
model.eval()
cuda = torch.cuda.is_available()
if cuda:
    model = model.cuda()
year='2019-Q1'
batch_size = 100
N = batch_size # number of shots
temperature = 1.0
burnin = 200

Downloading: 100%|█████████████████████████████████████████████████████████████| 725/725 [00:00<00:00, 196kB/s]
Downloading: 100%|██████████████████████████████████████████████████████████| 476M/476M [05:34<00:00, 1.49MB/s]


In [485]:
def generate_step(out, gen_idx, temperature=None, top_k=0, sample=False, return_list=True, num_masks=0):
    """ Generate a word from out[gen_idx]

    args:
        - out (torch.Tensor): tensor of logits of size batch_size x seq_len x vocab_size
        - gen_idx (int): location for which to generate for
        - top_k (int): if >0, only sample from the top k most probable words
        - sample (Bool): if True, sample from full distribution. Overridden by top_k
    """
    logits = out[:, gen_idx]
    if num_masks==1:  # if single-token then return the argmax
        idx = torch.argmax(logits, dim=-1)
        return idx.tolist() if return_list else idx
    else:
        if temperature is not None:
            logits = logits / temperature
        if top_k > 0:
            kth_vals, kth_idx = logits.topk(top_k, dim=-1)
            dist = torch.distributions.categorical.Categorical(logits=kth_vals)
            idx = kth_idx.gather(dim=1, index=dist.sample().unsqueeze(-1)).squeeze(-1)
        elif sample:
            dist = torch.distributions.categorical.Categorical(logits=logits)
            idx = dist.sample().squeeze(-1)
        else:
            idx = torch.argmax(logits, dim=-1)
        return idx.tolist() if return_list else idx

In [486]:
text_list = data_dict_multi_token[year]['text']
labels_list = data_dict_multi_token[year]['labels']
labels_ids_list = data_dict_multi_token[year]['labels_ids']
relation_list = data_dict_multi_token[year]['relation']
num_answers_list = data_dict_multi_token[year]['num_answers']

In [487]:
data_dict_multi_token

{'2019-Q1': {'text': [['Alex Morgan plays for <mask> <mask> <mask> <mask> <mask> <mask> <mask>.'],
   ['Lionel Messi plays for <mask> <mask>.'],
   ['Cristiano Ronaldo plays for <mask> <mask> <mask> <mask> <mask>.'],
   ['LeBron James plays for <mask> <mask> <mask>.'],
   ['Puck Moonen plays for <mask> <mask> <mask> <mask> <mask>.'],
   ['Zlatan Ibrahimović plays for <mask> <mask> <mask> <mask> <mask>.'],
   ['Neymar plays for <mask> <mask> <mask> <mask>.'],
   ['Ronaldinho plays for <mask> <mask> <mask> <mask> <mask> <mask>.'],
   ["Samuel Eto'o plays for <mask> <mask>."],
   ['Megan Rapinoe plays for <mask> <mask>.'],
   ['Pau Gasol plays for <mask> <mask> <mask>.'],
   ['Alisha Lehmann plays for <mask> <mask> <mask> <mask> <mask> <mask> <mask>.'],
   ['Robert Lewandowski plays for <mask> <mask> <mask>.'],
   ['Gianluigi Buffon plays for <mask> <mask> <mask> <mask> <mask> <mask> <mask> <mask> <mask> <mask>.'],
   ['Andrea Pirlo plays for <mask> <mask> <mask> <mask>.'],
   ['Kevin Dur

### For a single test example:

In [488]:
i = 0  # for i in range(0, len(text_list)) i is in [0,#test examples]

In [489]:
len(text_list)

11238

In [497]:
text_i = text_list[i]
# text_i = ['The name of the current president of the United States is <mask> <mask>.']
labels_i = labels_list[i][0]
labels_ids_i = labels_ids_list[i][0] # there is an 'extra' list that is why we put [0]
relation_i = relation_list[i]
num_answers_i = num_answers_list[i]
print('Example: {}, Labels: {}, Ids: {}'.format(text_i, labels_i, labels_ids_i))

Example: ['Alex Morgan plays for <mask> <mask> <mask> <mask> <mask> <mask> <mask>.'], Labels: [" United States women's national soccer team"], Ids: [315, 532, 390, 18, 632, 4191, 165]


In [498]:
generated_seq_tokens = [[] for _ in range(batch_size)]  # for each trial
logits_list = [[] for _ in range(batch_size)]

In [499]:
# tokenize text
tokenized_sentence = tokenizer_return_id(text_i)[0]

# mask indices to generate
mask_inds = list(np.where(np.array(tokenized_sentence) == mask_id)[0])

# number of masks (tokens)
M = len(mask_inds)

# create batch (same input, N times)
tokenized_sentence_b = [tokenized_sentence for _ in range(batch_size)]

In [500]:
mask_inds

[5, 6, 7, 8, 9, 10, 11]

In [501]:
for m in mask_inds:
    # tensor
    inp = torch.tensor(tokenized_sentence_b).cuda() if cuda else torch.tensor(tokenized_sentence_b)

    # get logits
    out = model(inp)
    logits = out.logits  # batch_size x max_len x vocab

    # get new ids
    idxs_b = generate_step(logits, gen_idx=m, top_k=10, temperature=temperature, # sample=(m < burnin)
                          )

    # replace mask with predicted token id
    tokenized_sentence_b_np = np.array(tokenized_sentence_b)                       
    tokenized_sentence_b_np[:,m] = np.array(idxs_b)
    tokenized_sentence_b = tokenized_sentence_b_np.tolist() 

    # the following code does not work *and I don't know why*
    # for jj in range(len(idxs_b)):
    #     print('before: {}, predicted token id: {}'.format(tokenized_sentence_b[jj][m],idxs_b[jj]))
    #     tokenized_sentence_b[jj][m] = idxs_b[jj]

    assert sorted(idxs_b) == sorted([sent[m] for sent in tokenized_sentence_b])

    # find logits
    logits_m = logits[:,m]  # logits for the mask in position m
    logits_b = logits_m[:,idxs_b].tolist()[0]  # logits for sampled tokens

    assert len(idxs_b) == len(logits_b)

    # add generated tokens and corresponding logits to lists
    for j in range(N):
        generated_seq_tokens[j].append(idxs_b[j])
        logits_list[j].append(logits_b[j])

In [502]:
# calculate sum of logits for each generated sequence of tokens
sum_logits = np.array(logits_list).sum(axis=-1)

# finding ranking (return indices of the parallel lists for logits and generated tokens)
ranked_inds_of_list = sum_logits.argsort()[::-1]

# ranked logits sum in descending order
ranked_logits = sum_logits[ranked_inds_of_list]

# ranked generated tokens in descending order
ranked_generated_tokens = np.array(generated_seq_tokens)[ranked_inds_of_list]

In [503]:
for no, p in enumerate(ranked_generated_tokens):
    print('{}: {}'.format(no,"".join(untokenize_id(p))))

0:  the @OfficialFAFA right now
1:  the @OfficialBRFC as well
2:  the #AFCAFLs
3:  the U.S. national team
4:  the @CelticFC side
5:  the @LFC and are amazing
6:  the U.K. national team
7:  the #Eagles in this game
8:  the @user @user @user
9:  the @Saints at the moment
10:  the #Rams for the season
11:  the @LFC against #Arsenal
12:  the @Rovers at 10 tonight
13:  the #Eagles at the minute
14:  the @Eagles in a minute
15:  the #Eagles in the game
16:  the @user as the youth manager
17:  the #Bears on the night
18:  the @user on Friday at home
19:  the U.S. Soccer Team
20:  the #Rays in this clip
21:  the @user to start the game
22:  the US national team in this match
23:  the @user today at the Stadium
24:  the @user as his first international
25:  the @Lions tonight in Philly
26:  @RangersFC as the forward
27:  the #LeedsCity side today
28:  the @user in the home opener
29:  @user and @user this weekend
30:  the Red Devils. That's it
31:  @user and @user on Thursday
32:  the #Bills, p

## Evaluation

TempLAMA: "F1 score, which captures the precision 
    and recall that words chosen as being part of the answer are actually part of the answer."

In [504]:
# compare with gold labels
import evaluate
assert len(labels_ids_i) == M
f1_micro_list, f1_macro_list = [], []
rouge_list, bleu_list = [], []

rouge = evaluate.load('rouge')
bleu = evaluate.load("bleu")

In [505]:
labels_ids_i

[315, 532, 390, 18, 632, 4191, 165]

In [507]:
ranked_generated_tokens

array([[    5,   787, 34111,  5944,  5944,   235,   122],
       [    5,   787, 34111,  7202,  5268,    25,   157],
       [    5,   849,   250,  5268,   250,  7613,    29],
       [    5,   121,     4,   104,     4,   632,   165],
       [    5,   787,   347,  6607,   636,  5268,   526],
       [    5,   787,   574,  5268,     8,    32,  2770],
       [    5,   121,     4,   530,     4,   632,   165],
       [    5,   849,   717, 26007,    11,    42,   177],
       [    5,   787, 12105,   787, 12105,   787, 12105],
       [    5,   787,   104, 24487,    23,     5,  1151],
       [    5,   849,   500,  7042,    13,     5,   191],
       [    5,   787,   574,  5268,   136,   849, 31661],
       [    5,   787,   500, 13507,    23,   158,  3422],
       [    5,   849,   717, 26007,    23,     5,  2289],
       [    5,   787,   717, 26007,    11,    10,  2289],
       [    5,   849,   717, 26007,    11,     5,   177],
       [    5,   787, 12105,    25,     5,  2719,  1044],
       [    5,

In [509]:
for j in range(0,N):
    gold_ids = labels_ids_i
    pred_ids_j = ranked_generated_tokens[j]
    gold_tok = labels_i  # list of strings
    pred_tok_j = ["".join(untokenize_id(ranked_generated_tokens[j]))] # list of strings
    
    # F1 score
    # F1_micro calculates metrics globally by counting the total true positives, 
    # false negatives and false positives.
    f1_micro_list.append(f1_score(gold_ids,pred_ids_j, average='micro')) 
    # F1_macro calculates metrics for each label, and finds their unweighted mean. 
    # This does not take label imbalance into account.
    f1_macro_list.append(f1_score(gold_ids,pred_ids_j, average='macro'))
    
    # BLEU
    bleu_list.append(bleu.compute(references=gold_tok,
              predictions=pred_tok_j)['bleu'])

    # ROUGE
    rouge_list.append(rouge.compute(references=gold_tok,
                  predictions=pred_tok_j))
    
    # exact match / P@1
max_f1_micro = np.array(f1_micro_list).max()
max_f1_macro = np.array(f1_macro_list).max()
max_bleu = np.array(bleu_list).max()

In [512]:
f1_macro_list

[0.0,
 0.0,
 0.0,
 0.09090909090909091,
 0.0,
 0.0,
 0.09090909090909091,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.08333333333333333,
 0.0,
 0.08333333333333333,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.07692307692307693,
 0.0,
 0.0,
 0.0,
 0.0,
 0.08333333333333333,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0,
 0.0]

In [234]:
["".join(untokenize_id(ranked_generated_tokens[42]))]

[' luxury cars']

In [235]:
bleu.compute(references=labels_i,
              predictions=["".join(untokenize_id(ranked_generated_tokens[42]))])

{'bleu': 0.0,
 'precisions': [0.0, 0.0, 0.0, 0.0],
 'brevity_penalty': 1.0,
 'length_ratio': 1.0,
 'translation_length': 2,
 'reference_length': 2}

In [236]:
rouge_list

[{'rouge1': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0)),
  'rouge2': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0)),
  'rougeL': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0)),
  'rougeLsum': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0))},
 {'rouge1': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0)),
  'rouge2': AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasur

In [230]:
np.array(f1_macro_list).max()

0.3333333333333333

In [231]:
np.array(bleu_list).max()

0.0

# All together:

In [299]:
for_logging_dict = {
    'model': None,
    'quarter': None,
    'split': None,
    'logits': None,
    'mlm_scores': None,
    'f1_macro': None,
    'f1_micro': None,
    'bleu': None,
    'rouge':None
    
}
rouge = evaluate.load('rouge')
bleu = evaluate.load("bleu")

max_f1_micro_list, max_f1_macro_list = [], []
max_bleu_list, max_rouge_list = [], []

all_logits_list = []
all_pred_tokens_list = []

for i in tqdm(range(0, 1000)):
    text_i = text_list[i]
    labels_i = labels_list[i][0]
    labels_ids_i = labels_ids_list[i][0] # there is an 'extra' list that is why we put [0]
    relation_i = relation_list[i]
    num_answers_i = num_answers_list[i]
#     print('i={}: Example: {}, Labels: {}, Ids: {}'.format(i, text_i, labels_i, labels_ids_i))
    
    generated_seq_tokens = [[] for _ in range(batch_size)]  # for each trial
    logits_list = [[] for _ in range(batch_size)]

    # tokenize text
    tokenized_sentence = tokenizer_return_id(text_i)[0]

    # mask indices to generate
    mask_inds = list(np.where(np.array(tokenized_sentence) == mask_id)[0])

    # number of masks (tokens)
    M = len(mask_inds)

    # create batch (same input, N times)
    tokenized_sentence_b = [tokenized_sentence for _ in range(batch_size)]

    for m in mask_inds:
        # tensor
        inp = torch.tensor(tokenized_sentence_b).cuda() if cuda else torch.tensor(tokenized_sentence_b)

        # get logits
        out = model(inp)
        logits = out.logits  # batch_size x max_len x vocab

        # get new ids
        idxs_b = generate_step(logits, gen_idx=m, top_k=50, temperature=temperature, # sample=(m < burnin)
                              )

        # replace mask with predicted token id
        tokenized_sentence_b_np = np.array(tokenized_sentence_b)                       
        tokenized_sentence_b_np[:,m] = np.array(idxs_b)
        tokenized_sentence_b = tokenized_sentence_b_np.tolist() 

        # the following code does not work *and I don't know why*
        # for jj in range(len(idxs_b)):
        #     print('before: {}, predicted token id: {}'.format(tokenized_sentence_b[jj][m],idxs_b[jj]))
        #     tokenized_sentence_b[jj][m] = idxs_b[jj]

        assert sorted(idxs_b) == sorted([sent[m] for sent in tokenized_sentence_b])

        # find logits
        logits_m = logits[:,m]  # logits for the mask in position m
        logits_b = logits_m[:,idxs_b].tolist()[0]  # logits for sampled tokens

        assert len(idxs_b) == len(logits_b)

        # add generated tokens and corresponding logits to lists
        for j in range(N):
            generated_seq_tokens[j].append(idxs_b[j])
            logits_list[j].append(logits_b[j])
    
    # calculate sum of logits for each generated sequence of tokens
    sum_logits = np.array(logits_list).sum(axis=-1)

    # finding ranking (return indices of the parallel lists for logits and generated tokens)
    ranked_inds_of_list = sum_logits.argsort()[::-1]

    # ranked logits sum in descending order
    ranked_logits = sum_logits[ranked_inds_of_list]

    # ranked generated tokens in descending order
    ranked_generated_tokens = np.array(generated_seq_tokens)[ranked_inds_of_list]
    
    all_logits_list.append(ranked_logits)
    all_pred_tokens_list.append(ranked_generated_tokens)
    
    # Evaluation
#     print('Evaluation!')
    f1_micro_i, f1_macro_i = [], []
    rouge_i, bleu_i = [], []

    gold_ids = labels_ids_i
    gold_tok = labels_i  # list of strings
    
    for j in range(N):    
        pred_ids_j = ranked_generated_tokens[j]
        pred_tok_j = ["".join(untokenize_id(ranked_generated_tokens[j]))] # list of strings

        # F1 score
        # F1_micro calculates metrics globally by counting the total true positives, 
        # false negatives and false positives.
        f1_micro_i.append(f1_score(gold_ids,pred_ids_j, average='micro')) 
        # F1_macro calculates metrics for each label, and finds their unweighted mean. 
        # This does not take label imbalance into account.
        f1_macro_i.append(f1_score(gold_ids,pred_ids_j, average='macro'))

        # BLEU
#         bleu_i.append(bleu.compute(references=gold_tok,
#                   predictions=pred_tok_j)['bleu'])

#         # ROUGE
#         rouge_i.append(rouge.compute(references=gold_tok,
#                       predictions=pred_tok_j))

        # exact match / P@1
        
    max_f1_micro_list.append(np.array(f1_micro_i).max())
    max_f1_macro_list.append(np.array(f1_macro_i).max())
#     max_bleu_list.append(np.array(bleu_i).max())
    print('Avg f1_micro {}, Avg f1_macro {}'.format(np.mean(max_f1_micro_list), np.mean(max_f1_macro_list)))


  0%|                                                                                                      | 1/1000 [00:03<56:53,  3.42s/it]

Avg f1_micro 0.14285714285714285, Avg f_macro 0.07692307692307693


  0%|▏                                                                                                     | 2/1000 [00:04<29:59,  1.80s/it]

Avg f1_micro 0.07142857142857142, Avg f_macro 0.038461538461538464


  0%|▎                                                                                                     | 3/1000 [00:06<33:08,  1.99s/it]

Avg f1_micro 0.11428571428571428, Avg f_macro 0.053418803418803416


  0%|▍                                                                                                     | 4/1000 [00:07<27:14,  1.64s/it]

Avg f1_micro 0.16904761904761906, Avg f_macro 0.09006410256410256


  0%|▌                                                                                                     | 5/1000 [00:09<31:51,  1.92s/it]

Avg f1_micro 0.13523809523809524, Avg f_macro 0.07205128205128206


  1%|▌                                                                                                     | 6/1000 [00:12<34:34,  2.09s/it]

Avg f1_micro 0.1793650793650794, Avg f_macro 0.08385225885225885


  1%|▋                                                                                                     | 7/1000 [00:13<31:41,  1.92s/it]

Avg f1_micro 0.1894557823129252, Avg f_macro 0.0922815279958137


  1%|▊                                                                                                     | 8/1000 [00:16<35:32,  2.15s/it]

Avg f1_micro 0.16577380952380955, Avg f_macro 0.08074633699633699


  1%|▉                                                                                                     | 9/1000 [00:17<28:43,  1.74s/it]

Avg f1_micro 0.14735449735449738, Avg f_macro 0.07177452177452176


  1%|█                                                                                                    | 10/1000 [00:18<23:57,  1.45s/it]

Avg f1_micro 0.13261904761904764, Avg f_macro 0.0645970695970696


  1%|█                                                                                                    | 11/1000 [00:19<22:33,  1.37s/it]

Avg f1_micro 0.15086580086580087, Avg f_macro 0.07690642690642689


  1%|█▏                                                                                                   | 12/1000 [00:22<32:31,  1.98s/it]

Avg f1_micro 0.1501984126984127, Avg f_macro 0.07744200244200243


  1%|█▎                                                                                                   | 13/1000 [00:23<28:32,  1.74s/it]

Avg f1_micro 0.13864468864468865, Avg f_macro 0.07148492533107917


  1%|█▍                                                                                                   | 14/1000 [00:29<50:19,  3.06s/it]

Avg f1_micro 0.1358843537414966, Avg f_macro 0.06902436188150474


  2%|█▌                                                                                                   | 15/1000 [00:31<44:24,  2.71s/it]

Avg f1_micro 0.1434920634920635, Avg f_macro 0.0739465472798806


  2%|█▌                                                                                                   | 16/1000 [00:32<34:23,  2.10s/it]

Avg f1_micro 0.13452380952380952, Avg f_macro 0.06932488807488807


  2%|█▋                                                                                                   | 17/1000 [00:33<30:41,  1.87s/it]

Avg f1_micro 0.12661064425770308, Avg f_macro 0.0652469534822476


  2%|█▊                                                                                                   | 18/1000 [00:36<36:41,  2.24s/it]

Avg f1_micro 0.12883597883597883, Avg f_macro 0.06532582643693755


  2%|█▉                                                                                                   | 19/1000 [00:37<27:15,  1.67s/it]

Avg f1_micro 0.17468671679197995, Avg f_macro 0.11451920399288819


  2%|██                                                                                                   | 20/1000 [00:41<39:05,  2.39s/it]

Avg f1_micro 0.16595238095238093, Avg f_macro 0.10879324379324377


  2%|██                                                                                                   | 21/1000 [00:42<34:55,  2.14s/it]

Avg f1_micro 0.16995464852607708, Avg f_macro 0.11041533422485801


  2%|██▏                                                                                                  | 22/1000 [00:44<34:17,  2.10s/it]

Avg f1_micro 0.17132034632034632, Avg f_macro 0.10918433418433417


  2%|██▎                                                                                                  | 23/1000 [00:45<27:51,  1.71s/it]

Avg f1_micro 0.16387163561076604, Avg f_macro 0.1044371892197979


  2%|██▍                                                                                                  | 24/1000 [00:47<26:01,  1.60s/it]

Avg f1_micro 0.1570436507936508, Avg f_macro 0.10008563966897299


  2%|██▌                                                                                                  | 25/1000 [00:50<36:57,  2.27s/it]

Avg f1_micro 0.15576190476190477, Avg f_macro 0.09830443630443629


  3%|██▋                                                                                                  | 26/1000 [00:52<35:16,  2.17s/it]

Avg f1_micro 0.14977106227106227, Avg f_macro 0.09452349644657335


  3%|██▋                                                                                                  | 27/1000 [00:55<38:34,  2.38s/it]

Avg f1_micro 0.14422398589065255, Avg f_macro 0.09102262620781137


  3%|██▊                                                                                                  | 28/1000 [00:58<38:37,  2.38s/it]

Avg f1_micro 0.13907312925170068, Avg f_macro 0.08777181812896097


  3%|██▉                                                                                                  | 29/1000 [01:00<38:41,  2.39s/it]

Avg f1_micro 0.13427750410509032, Avg f_macro 0.08474520371072093


  3%|███                                                                                                  | 30/1000 [01:01<32:51,  2.03s/it]

Avg f1_micro 0.1298015873015873, Avg f_macro 0.08192036358703024


  3%|███▏                                                                                                 | 31/1000 [01:05<40:23,  2.50s/it]

Avg f1_micro 0.13022273425499234, Avg f_macro 0.08175916079141884


  3%|███▏                                                                                                 | 32/1000 [01:08<44:32,  2.76s/it]

Avg f1_micro 0.13061755952380952, Avg f_macro 0.0810981264106264


  3%|███▎                                                                                                 | 33/1000 [01:10<41:54,  2.60s/it]

Avg f1_micro 0.12665945165945167, Avg f_macro 0.0786406074284862


  3%|███▍                                                                                                 | 34/1000 [01:12<39:21,  2.44s/it]

Avg f1_micro 0.13764005602240895, Avg f_macro 0.08613156995509937


  4%|███▌                                                                                                 | 35/1000 [01:13<30:45,  1.91s/it]

Avg f1_micro 0.13370748299319726, Avg f_macro 0.08367066795638224


  4%|███▋                                                                                                 | 36/1000 [01:17<41:24,  2.58s/it]

Avg f1_micro 0.12999338624338624, Avg f_macro 0.08134648273537162


  4%|███▋                                                                                                 | 37/1000 [01:19<39:02,  2.43s/it]

Avg f1_micro 0.12648005148005148, Avg f_macro 0.07914792914792915


  4%|███▊                                                                                                 | 38/1000 [01:22<38:04,  2.37s/it]

Avg f1_micro 0.12841478696741854, Avg f_macro 0.0799890655153813


  4%|███▉                                                                                                 | 39/1000 [01:24<36:24,  2.27s/it]

Avg f1_micro 0.12512210012210012, Avg f_macro 0.07793806383549973


  4%|████                                                                                                 | 40/1000 [01:28<44:38,  2.79s/it]

Avg f1_micro 0.12556547619047617, Avg f_macro 0.0782623395123395


  4%|████▏                                                                                                | 41/1000 [01:30<40:39,  2.54s/it]

Avg f1_micro 0.12250290360046456, Avg f_macro 0.07635350196325806


  4%|████▏                                                                                                | 42/1000 [01:35<54:14,  3.40s/it]

Avg f1_micro 0.12196712018140587, Avg f_macro 0.07593612166441296


  4%|████▎                                                                                                | 43/1000 [01:36<44:26,  2.79s/it]

Avg f1_micro 0.11913067552602434, Avg f_macro 0.07417016534663592


  4%|████▍                                                                                                | 44/1000 [01:38<40:47,  2.56s/it]

Avg f1_micro 0.1209686147186147, Avg f_macro 0.07532538886148511


  4%|████▌                                                                                                | 45/1000 [01:39<33:43,  2.12s/it]

Avg f1_micro 0.11828042328042326, Avg f_macro 0.07365149133122989


  5%|████▋                                                                                                | 46/1000 [01:40<27:25,  1.72s/it]

Avg f1_micro 0.11570910973084884, Avg f_macro 0.07205037195446402


  5%|████▋                                                                                                | 47/1000 [01:42<27:42,  1.74s/it]

Avg f1_micro 0.11856636271529887, Avg f_macro 0.07406348460791513


  5%|████▊                                                                                                | 48/1000 [01:43<23:14,  1.46s/it]

Avg f1_micro 0.11609623015873016, Avg f_macro 0.07252049534525025


  5%|████▉                                                                                                | 49/1000 [01:44<21:26,  1.35s/it]

Avg f1_micro 0.127332361516035, Avg f_macro 0.08124456686881656


  5%|█████                                                                                                | 50/1000 [01:47<28:40,  1.81s/it]

Avg f1_micro 0.12811904761904763, Avg f_macro 0.08143785734962206


  5%|█████▏                                                                                               | 51/1000 [01:49<27:49,  1.76s/it]

Avg f1_micro 0.13050887021475258, Avg f_macro 0.08310901047348569


  5%|█████▎                                                                                               | 52/1000 [01:50<27:10,  1.72s/it]

Avg f1_micro 0.12799908424908427, Avg f_macro 0.0815107602720725


  5%|█████▎                                                                                               | 53/1000 [01:52<29:32,  1.87s/it]

Avg f1_micro 0.12935759209344116, Avg f_macro 0.08176976659218613


  5%|█████▍                                                                                               | 54/1000 [01:53<24:27,  1.55s/it]

Avg f1_micro 0.12696208112874782, Avg f_macro 0.08025551165529379


  6%|█████▌                                                                                               | 55/1000 [01:54<22:12,  1.41s/it]

Avg f1_micro 0.12465367965367967, Avg f_macro 0.07879632053428845


  6%|█████▋                                                                                               | 56/1000 [01:59<38:25,  2.44s/it]

Avg f1_micro 0.12441184807256236, Avg f_macro 0.07823958351794487


  6%|█████▊                                                                                               | 57/1000 [02:02<39:04,  2.49s/it]

Avg f1_micro 0.12924672793093847, Avg f_macro 0.08104406868596756


  6%|█████▊                                                                                               | 58/1000 [02:03<35:04,  2.23s/it]

Avg f1_micro 0.12701833607006022, Avg f_macro 0.07964675715689915


  6%|█████▉                                                                                               | 59/1000 [02:09<52:55,  3.37s/it]

Avg f1_micro 0.12656039817056766, Avg f_macro 0.07929382109342228


  6%|██████                                                                                               | 60/1000 [02:10<42:13,  2.70s/it]

Avg f1_micro 0.12445105820105822, Avg f_macro 0.07797225740853192


  6%|██████▏                                                                                              | 61/1000 [02:13<41:38,  2.66s/it]

Avg f1_micro 0.1256895654436638, Avg f_macro 0.07806014389910243


  6%|██████▎                                                                                              | 62/1000 [02:16<44:50,  2.87s/it]

Avg f1_micro 0.12366231438812085, Avg f_macro 0.07680110932008465


  6%|██████▎                                                                                              | 63/1000 [02:22<55:18,  3.54s/it]

Avg f1_micro 0.12169942050894433, Avg f_macro 0.07558204409278171


  6%|██████▍                                                                                              | 64/1000 [02:23<45:28,  2.91s/it]

Avg f1_micro 0.12500620039682542, Avg f_macro 0.077526074653832


  6%|██████▌                                                                                              | 65/1000 [02:25<42:57,  2.76s/it]

Avg f1_micro 0.12923687423687427, Avg f_macro 0.07999636947600748


  7%|██████▋                                                                                              | 66/1000 [02:28<43:25,  2.79s/it]

Avg f1_micro 0.1272787397787398, Avg f_macro 0.07878430327182555


  7%|██████▊                                                                                              | 67/1000 [02:30<37:08,  2.39s/it]

Avg f1_micro 0.12537905709547503, Avg f_macro 0.07760841814836547


  7%|██████▊                                                                                              | 68/1000 [02:36<53:31,  3.45s/it]

Avg f1_micro 0.12353524743230627, Avg f_macro 0.07646711788147774


  7%|██████▉                                                                                              | 69/1000 [02:37<44:19,  2.86s/it]

Avg f1_micro 0.12174488152749025, Avg f_macro 0.07535889878174618


  7%|███████                                                                                              | 70/1000 [02:40<44:21,  2.86s/it]

Avg f1_micro 0.12286281179138324, Avg f_macro 0.07606805737057838


  7%|███████▏                                                                                             | 71/1000 [02:41<34:47,  2.25s/it]

Avg f1_micro 0.1281746031746032, Avg f_macro 0.0796915119616031


  7%|███████▎                                                                                             | 72/1000 [02:42<30:06,  1.95s/it]

Avg f1_micro 0.1263944003527337, Avg f_macro 0.07858468540658084


  7%|███████▎                                                                                             | 73/1000 [02:43<24:14,  1.57s/it]

Avg f1_micro 0.1315122852794086, Avg f_macro 0.08207439291242676


  7%|███████▍                                                                                             | 74/1000 [02:45<28:55,  1.87s/it]

Avg f1_micro 0.13514049764049765, Avg f_macro 0.0828957814251932


  8%|███████▌                                                                                             | 75/1000 [02:46<23:45,  1.54s/it]

Avg f1_micro 0.13333862433862437, Avg f_macro 0.08179050433952395


  8%|███████▋                                                                                             | 76/1000 [02:50<34:10,  2.22s/it]

Avg f1_micro 0.1334638680033417, Avg f_macro 0.08144530764499805


  8%|███████▊                                                                                             | 77/1000 [02:52<35:51,  2.33s/it]

Avg f1_micro 0.13692537621109052, Avg f_macro 0.08347972232617


  8%|███████▉                                                                                             | 78/1000 [02:54<30:32,  1.99s/it]

Avg f1_micro 0.1351699226699227, Avg f_macro 0.08240946947583448


  8%|███████▉                                                                                             | 79/1000 [02:56<30:56,  2.02s/it]

Avg f1_micro 0.1397880249146072, Avg f_macro 0.08558572091706865


  8%|████████                                                                                             | 80/1000 [02:56<25:00,  1.63s/it]

Avg f1_micro 0.14429067460317463, Avg f_macro 0.08868256607227196


  8%|████████▏                                                                                            | 81/1000 [02:57<20:38,  1.35s/it]

Avg f1_micro 0.142509308250049, Avg f_macro 0.08758771957755254


  8%|████████▎                                                                                            | 82/1000 [03:01<34:15,  2.24s/it]

Avg f1_micro 0.14077138985675572, Avg f_macro 0.08651957665587508


  8%|████████▍                                                                                            | 83/1000 [03:04<36:09,  2.37s/it]

Avg f1_micro 0.13907534901510807, Avg f_macro 0.08547717211785248


  8%|████████▍                                                                                            | 84/1000 [03:10<52:02,  3.41s/it]

Avg f1_micro 0.13861016628873774, Avg f_macro 0.08492644014352697


  8%|████████▌                                                                                            | 85/1000 [03:11<39:48,  2.61s/it]

Avg f1_micro 0.1369794584500467, Avg f_macro 0.08392730555360313


  9%|████████▋                                                                                            | 86/1000 [03:13<37:07,  2.44s/it]

Avg f1_micro 0.13771225544481358, Avg f_macro 0.08424339631589972


  9%|████████▊                                                                                            | 87/1000 [03:16<39:03,  2.57s/it]

Avg f1_micro 0.13612935595694217, Avg f_macro 0.08327508141571698


  9%|████████▉                                                                                            | 88/1000 [03:16<30:58,  2.04s/it]

Avg f1_micro 0.13458243145743146, Avg f_macro 0.08232877367235655


  9%|████████▉                                                                                            | 89/1000 [03:19<32:40,  2.15s/it]

Avg f1_micro 0.13756465132869627, Avg f_macro 0.0842127200355885


  9%|█████████                                                                                            | 90/1000 [03:20<30:18,  2.00s/it]

Avg f1_micro 0.13881393298059966, Avg f_macro 0.08486432473360578


  9%|█████████▏                                                                                           | 91/1000 [03:25<39:54,  2.63s/it]

Avg f1_micro 0.1386621315192744, Avg f_macro 0.08445503597410513


  9%|█████████▎                                                                                           | 92/1000 [03:27<38:02,  2.51s/it]

Avg f1_micro 0.1393288474810214, Avg f_macro 0.08489574210482138


  9%|█████████▍                                                                                           | 93/1000 [03:30<41:51,  2.77s/it]

Avg f1_micro 0.1393667861409797, Avg f_macro 0.08458025622794756


  9%|█████████▍                                                                                           | 94/1000 [03:31<33:11,  2.20s/it]

Avg f1_micro 0.13788416075650117, Avg f_macro 0.08368046626807576


 10%|█████████▌                                                                                           | 95/1000 [03:32<28:07,  1.86s/it]

Avg f1_micro 0.13994152046783626, Avg f_macro 0.08490488241262234


 10%|█████████▋                                                                                           | 96/1000 [03:34<27:03,  1.80s/it]

Avg f1_micro 0.14108796296296297, Avg f_macro 0.08610378988749086


 10%|█████████▊                                                                                           | 97/1000 [03:35<26:17,  1.75s/it]

Avg f1_micro 0.14221076746849942, Avg f_macro 0.08693433500892565


 10%|█████████▉                                                                                           | 98/1000 [03:38<28:26,  1.89s/it]

Avg f1_micro 0.14484126984126985, Avg f_macro 0.08847679320368394


 10%|█████████▉                                                                                           | 99/1000 [03:40<29:16,  1.95s/it]

Avg f1_micro 0.14337822671156006, Avg f_macro 0.08758308822182855


 10%|██████████                                                                                          | 100/1000 [03:41<26:03,  1.74s/it]

Avg f1_micro 0.14194444444444446, Avg f_macro 0.08670725733961027


 10%|██████████                                                                                          | 101/1000 [03:43<25:18,  1.69s/it]

Avg f1_micro 0.14053905390539054, Avg f_macro 0.08584876964317847


 10%|██████████▏                                                                                         | 102/1000 [03:45<27:47,  1.86s/it]

Avg f1_micro 0.14112200435729846, Avg f_macro 0.08609643965756997


 10%|██████████▎                                                                                         | 103/1000 [03:46<25:00,  1.67s/it]

Avg f1_micro 0.13975188781014022, Avg f_macro 0.08526055189390425


 10%|██████████▍                                                                                         | 104/1000 [03:48<25:31,  1.71s/it]

Avg f1_micro 0.1408119658119658, Avg f_macro 0.0858143652685508


 10%|██████████▎                                                                                       | 105/1000 [04:07<1:45:26,  7.07s/it]

Avg f1_micro 0.14042328042328042, Avg f_macro 0.0852428613289732


 11%|██████████▍                                                                                       | 106/1000 [04:10<1:23:19,  5.59s/it]

Avg f1_micro 0.14145702306079666, Avg f_macro 0.08601101043593257


 11%|██████████▍                                                                                       | 107/1000 [04:13<1:13:11,  4.92s/it]

Avg f1_micro 0.1414701082925382, Avg f_macro 0.08592607647786848


 11%|██████████▌                                                                                       | 108/1000 [04:15<1:00:09,  4.05s/it]

Avg f1_micro 0.14201205173427395, Avg f_macro 0.08615927124299111


 11%|██████████▉                                                                                         | 109/1000 [04:17<49:30,  3.33s/it]

Avg f1_micro 0.1468253968253968, Avg f_macro 0.08995597517654165


 11%|███████████                                                                                         | 110/1000 [04:20<48:28,  3.27s/it]

Avg f1_micro 0.14549062049062048, Avg f_macro 0.08913819358402762


 11%|███████████                                                                                         | 111/1000 [04:22<44:34,  3.01s/it]

Avg f1_micro 0.14598169598169597, Avg f_macro 0.08933614779598333


 11%|███████████▏                                                                                        | 112/1000 [04:24<39:07,  2.64s/it]

Avg f1_micro 0.14467828798185942, Avg f_macro 0.0885385036192335


 11%|███████████▎                                                                                        | 113/1000 [04:26<37:59,  2.57s/it]

Avg f1_micro 0.14339794915016155, Avg f_macro 0.08775497703853231


 11%|███████████▍                                                                                        | 114/1000 [04:29<37:10,  2.52s/it]

Avg f1_micro 0.1438944583681426, Avg f_macro 0.08795985540759002


 12%|███████████▌                                                                                        | 115/1000 [04:30<33:14,  2.25s/it]

Avg f1_micro 0.1426432022084196, Avg f_macro 0.08719498709969793


 12%|███████████▌                                                                                        | 116/1000 [04:33<34:56,  2.37s/it]

Avg f1_micro 0.1442870826491516, Avg f_macro 0.0883590149886852


 12%|███████████▋                                                                                        | 117/1000 [04:37<43:24,  2.95s/it]

Avg f1_micro 0.1430538597205264, Avg f_macro 0.08760380973237165


 12%|███████████▊                                                                                        | 118/1000 [04:40<41:42,  2.84s/it]

Avg f1_micro 0.14353645412967447, Avg f_macro 0.08792072659904647


 12%|███████████▉                                                                                        | 119/1000 [04:44<47:06,  3.21s/it]

Avg f1_micro 0.14233026543950913, Avg f_macro 0.08718189696376037


 12%|████████████                                                                                        | 120/1000 [04:45<39:17,  2.68s/it]

Avg f1_micro 0.1411441798941799, Avg f_macro 0.08645538115572902


 12%|████████████                                                                                        | 121/1000 [04:48<40:59,  2.80s/it]

Avg f1_micro 0.13997769906860819, Avg f_macro 0.08574087387345028


 12%|████████████▏                                                                                       | 122/1000 [04:50<33:25,  2.28s/it]

Avg f1_micro 0.1415625813166797, Avg f_macro 0.08667742408760232


 12%|████████████▎                                                                                       | 123/1000 [04:51<29:44,  2.03s/it]

Avg f1_micro 0.14041166602142213, Avg f_macro 0.08597272958282506


 12%|████████████▍                                                                                       | 124/1000 [04:55<38:39,  2.65s/it]

Avg f1_micro 0.13927931387608808, Avg f_macro 0.08527940111844744


 12%|████████████▌                                                                                       | 125/1000 [04:57<33:49,  2.32s/it]

Avg f1_micro 0.13816507936507938, Avg f_macro 0.08459716590949987


 13%|████████████▌                                                                                       | 126/1000 [04:57<26:49,  1.84s/it]

Avg f1_micro 0.13706853111615017, Avg f_macro 0.08392575983085304


 13%|████████████▋                                                                                       | 127/1000 [04:59<25:50,  1.78s/it]

Avg f1_micro 0.13795775528058993, Avg f_macro 0.08438978646885532


 13%|████████████▊                                                                                       | 128/1000 [05:02<32:08,  2.21s/it]

Avg f1_micro 0.13818204365079367, Avg f_macro 0.08444071853479468


 13%|████████████▉                                                                                       | 129/1000 [05:05<34:57,  2.41s/it]

Avg f1_micro 0.13840285468192445, Avg f_macro 0.08464746576406845


 13%|█████████████                                                                                       | 130/1000 [05:08<37:01,  2.55s/it]

Avg f1_micro 0.13862026862026863, Avg f_macro 0.08469563211133785


 13%|█████████████                                                                                       | 131/1000 [05:11<38:25,  2.65s/it]

Avg f1_micro 0.1388343632618442, Avg f_macro 0.0847430630945268


 13%|█████████████▏                                                                                      | 132/1000 [05:12<33:57,  2.35s/it]

Avg f1_micro 0.1377825877825878, Avg f_macro 0.08410107019229553


 13%|█████████████▎                                                                                      | 133/1000 [05:15<34:57,  2.42s/it]

Avg f1_micro 0.13825038787444802, Avg f_macro 0.08409529773470935


 13%|█████████████▍                                                                                      | 134/1000 [05:16<29:08,  2.02s/it]

Avg f1_micro 0.1421937929400616, Avg f_macro 0.08719906416952496


 14%|█████████████▌                                                                                      | 135/1000 [05:17<26:12,  1.82s/it]

Avg f1_micro 0.14114050558495003, Avg f_macro 0.08655314517567662


 14%|█████████████▌                                                                                      | 136/1000 [05:21<33:43,  2.34s/it]

Avg f1_micro 0.1401027077497666, Avg f_macro 0.08591672499056136


 14%|█████████████▋                                                                                      | 137/1000 [05:23<30:38,  2.13s/it]

Avg f1_micro 0.13908006024794348, Avg f_macro 0.08528959561106822


 14%|█████████████▊                                                                                      | 138/1000 [05:26<35:53,  2.50s/it]

Avg f1_micro 0.13910743041177825, Avg f_macro 0.08533031659148867


 14%|█████████████▉                                                                                      | 139/1000 [05:28<35:33,  2.48s/it]

Avg f1_micro 0.1393056982985041, Avg f_macro 0.08519604572872015


 14%|██████████████                                                                                      | 140/1000 [05:31<37:17,  2.60s/it]

Avg f1_micro 0.13950113378684809, Avg f_macro 0.08523685319429422


 14%|██████████████                                                                                      | 141/1000 [05:34<36:29,  2.55s/it]

Avg f1_micro 0.139930203759991, Avg f_macro 0.08542035856959079


 14%|██████████████▏                                                                                     | 142/1000 [05:39<49:12,  3.44s/it]

Avg f1_micro 0.13894477978985023, Avg f_macro 0.08481880674867819


 14%|██████████████▎                                                                                     | 143/1000 [05:41<39:39,  2.78s/it]

Avg f1_micro 0.13797313797313798, Avg f_macro 0.08422566823994616


 14%|██████████████▍                                                                                     | 144/1000 [05:44<42:17,  2.96s/it]

Avg f1_micro 0.13701499118165786, Avg f_macro 0.08364076776605767


 14%|██████████████▍                                                                                     | 145/1000 [05:50<53:53,  3.78s/it]

Avg f1_micro 0.13865626710454299, Avg f_macro 0.08365506788983855


 15%|██████████████▌                                                                                     | 146/1000 [05:52<48:13,  3.39s/it]

Avg f1_micro 0.13907642965862144, Avg f_macro 0.0838431229803952


 15%|██████████████▍                                                                                   | 147/1000 [05:59<1:01:47,  4.35s/it]

Avg f1_micro 0.13813033149767845, Avg f_macro 0.0832727615995762


 15%|██████████████▊                                                                                     | 148/1000 [06:01<52:18,  3.68s/it]

Avg f1_micro 0.13719701844701845, Avg f_macro 0.08271010780498446


 15%|██████████████▉                                                                                     | 149/1000 [06:02<42:52,  3.02s/it]

Avg f1_micro 0.13627623308831363, Avg f_macro 0.08215500641032014


 15%|███████████████                                                                                     | 150/1000 [06:04<37:03,  2.62s/it]

Avg f1_micro 0.13703439153439154, Avg f_macro 0.08271841747869578


 15%|███████████████                                                                                     | 151/1000 [06:09<48:48,  3.45s/it]

Avg f1_micro 0.13686271418059498, Avg f_macro 0.08246494745860139


 15%|██████████████▉                                                                                   | 152/1000 [06:16<1:02:02,  4.39s/it]

Avg f1_micro 0.1366201963241437, Avg f_macro 0.08216607962688058


 15%|███████████████▎                                                                                    | 153/1000 [06:17<48:07,  3.41s/it]

Avg f1_micro 0.13790590310198153, Avg f_macro 0.08293623596918855


 15%|███████████████                                                                                   | 154/1000 [06:23<1:00:27,  4.29s/it]

Avg f1_micro 0.1376597608740466, Avg f_macro 0.0827796599525819


 16%|███████████████▌                                                                                    | 155/1000 [06:27<57:45,  4.10s/it]

Avg f1_micro 0.13861495135688684, Avg f_macro 0.08278323203890933


 16%|███████████████▌                                                                                    | 156/1000 [06:30<51:48,  3.68s/it]

Avg f1_micro 0.13879477004477006, Avg f_macro 0.0826799207224206


 16%|███████████████▋                                                                                    | 157/1000 [06:31<42:00,  2.99s/it]

Avg f1_micro 0.1379107269234658, Avg f_macro 0.08215329702355167


 16%|███████████████▊                                                                                    | 158/1000 [06:34<41:44,  2.97s/it]

Avg f1_micro 0.13809272654209365, Avg f_macro 0.08205528037572328


 16%|███████████████▉                                                                                    | 159/1000 [06:35<32:16,  2.30s/it]

Avg f1_micro 0.13722421882799243, Avg f_macro 0.08153920942996402


 16%|████████████████                                                                                    | 160/1000 [06:37<33:02,  2.36s/it]

Avg f1_micro 0.13761656746031745, Avg f_macro 0.08155042270436008


 16%|████████████████                                                                                    | 161/1000 [06:40<33:28,  2.39s/it]

Avg f1_micro 0.13883219954648526, Avg f_macro 0.08173402946465046


 16%|████████████████▏                                                                                   | 162/1000 [06:41<30:21,  2.17s/it]

Avg f1_micro 0.14106163041348227, Avg f_macro 0.08328711158729664


 16%|████████████████▎                                                                                   | 163/1000 [06:44<31:24,  2.25s/it]

Avg f1_micro 0.1414232155029701, Avg f_macro 0.08354301887817213


 16%|████████████████▍                                                                                   | 164/1000 [06:45<26:58,  1.94s/it]

Avg f1_micro 0.14259339914827718, Avg f_macro 0.08425312242159791


 16%|████████████████▌                                                                                   | 165/1000 [06:46<24:31,  1.76s/it]

Avg f1_micro 0.14576960076960077, Avg f_macro 0.08677280046752762


 17%|████████████████▌                                                                                   | 166/1000 [06:48<22:11,  1.60s/it]

Avg f1_micro 0.14489147064448268, Avg f_macro 0.08625007275386781


 17%|████████████████▋                                                                                   | 167/1000 [06:51<27:42,  2.00s/it]

Avg f1_micro 0.14502186103982512, Avg f_macro 0.08639894124702496


 17%|████████████████▊                                                                                   | 168/1000 [06:52<26:17,  1.90s/it]

Avg f1_micro 0.14564673091458807, Avg f_macro 0.0868767253269038


 17%|████████████████▉                                                                                   | 169/1000 [06:54<24:57,  1.80s/it]

Avg f1_micro 0.1462642058795905, Avg f_macro 0.08720797040104722


 17%|█████████████████                                                                                   | 170/1000 [06:56<26:49,  1.94s/it]

Avg f1_micro 0.14540382819794587, Avg f_macro 0.08669498233986458


 17%|█████████████████                                                                                   | 171/1000 [07:03<45:43,  3.31s/it]

Avg f1_micro 0.14520328599275967, Avg f_macro 0.0866057050830734


 17%|█████████████████▏                                                                                  | 172/1000 [07:05<40:12,  2.91s/it]

Avg f1_micro 0.14581256921373198, Avg f_macro 0.08707117578995476


 17%|█████████████████▎                                                                                  | 173/1000 [07:06<35:34,  2.58s/it]

Avg f1_micro 0.14641480869804568, Avg f_macro 0.08739363802733734


 17%|█████████████████▍                                                                                  | 174/1000 [07:10<39:11,  2.85s/it]

Avg f1_micro 0.1465311986863711, Avg f_macro 0.08746608838350207


 18%|█████████████████▌                                                                                  | 175/1000 [07:13<42:16,  3.07s/it]

Avg f1_micro 0.1456938775510204, Avg f_macro 0.08696628216416777


 18%|█████████████████▌                                                                                  | 176/1000 [07:16<41:36,  3.03s/it]

Avg f1_micro 0.1448660714285714, Avg f_macro 0.08647215556096226


 18%|█████████████████▋                                                                                  | 177/1000 [07:20<44:07,  3.22s/it]

Avg f1_micro 0.14404761904761904, Avg f_macro 0.08598361230920541


 18%|█████████████████▊                                                                                  | 178/1000 [07:22<39:30,  2.88s/it]

Avg f1_micro 0.14323836276083465, Avg f_macro 0.0855005583074683


 18%|█████████████████▉                                                                                  | 179/1000 [07:25<37:41,  2.75s/it]

Avg f1_micro 0.14243814844373504, Avg f_macro 0.08502290155714724


 18%|██████████████████                                                                                  | 180/1000 [07:28<40:20,  2.95s/it]

Avg f1_micro 0.14164682539682538, Avg f_macro 0.08455055210405199


 18%|██████████████████                                                                                  | 181/1000 [07:32<45:22,  3.32s/it]

Avg f1_micro 0.1416535122336227, Avg f_macro 0.08458568215269863


 18%|██████████████████▏                                                                                 | 182/1000 [07:39<58:40,  4.30s/it]

Avg f1_micro 0.14142464678178965, Avg f_macro 0.08446433225076072


 18%|██████████████████▎                                                                                 | 183/1000 [07:41<51:15,  3.76s/it]

Avg f1_micro 0.1428376268540203, Avg f_macro 0.08536889874119372


 18%|██████████████████▍                                                                                 | 184/1000 [07:44<46:49,  3.44s/it]

Avg f1_micro 0.14296713250517598, Avg f_macro 0.0855088020692911


 18%|██████████████████▌                                                                                 | 185/1000 [07:47<44:39,  3.29s/it]

Avg f1_micro 0.1421943371943372, Avg f_macro 0.08504659232837601


 19%|██████████████████▌                                                                                 | 186/1000 [07:48<34:16,  2.53s/it]

Avg f1_micro 0.14142985151049667, Avg f_macro 0.08458935258467506


 19%|██████████████████▋                                                                                 | 187/1000 [07:48<27:19,  2.02s/it]

Avg f1_micro 0.1406735421441304, Avg f_macro 0.08413700310561263


 19%|██████████████████▊                                                                                 | 188/1000 [07:51<28:15,  2.09s/it]

Avg f1_micro 0.13992527862208712, Avg f_macro 0.08368946585505085


 19%|██████████████████▉                                                                                 | 189/1000 [07:52<24:48,  1.84s/it]

Avg f1_micro 0.13918493323255227, Avg f_macro 0.08324666444841038


 19%|███████████████████                                                                                 | 190/1000 [07:55<29:17,  2.17s/it]

Avg f1_micro 0.1393295739348371, Avg f_macro 0.08333483989868189


 19%|███████████████████                                                                                 | 191/1000 [07:59<35:20,  2.62s/it]

Avg f1_micro 0.13934804288207428, Avg f_macro 0.0833744956631343


 19%|███████████████████▏                                                                                | 192/1000 [08:01<33:49,  2.51s/it]

Avg f1_micro 0.1396639384920635, Avg f_macro 0.08380830905377772


 19%|███████████████████▎                                                                                | 193/1000 [08:03<33:26,  2.49s/it]

Avg f1_micro 0.13997656057241548, Avg f_macro 0.08402173750427627


 19%|███████████████████▍                                                                                | 194/1000 [08:06<33:54,  2.52s/it]

Avg f1_micro 0.14131688757977418, Avg f_macro 0.0843250127896003


 20%|███████████████████▌                                                                                | 195/1000 [08:09<34:34,  2.58s/it]

Avg f1_micro 0.1405921855921856, Avg f_macro 0.08389257682657672


 20%|███████████████████▌                                                                                | 196/1000 [08:13<42:55,  3.20s/it]

Avg f1_micro 0.1398748785228377, Avg f_macro 0.08346455347542071


 20%|███████████████████▋                                                                                | 197/1000 [08:15<37:51,  2.83s/it]

Avg f1_micro 0.1391648537587624, Avg f_macro 0.08304087553899725


 20%|███████████████████▊                                                                                | 198/1000 [08:19<43:09,  3.23s/it]

Avg f1_micro 0.13846200096200095, Avg f_macro 0.0826214771776892


 20%|███████████████████▉                                                                                | 199/1000 [08:22<39:54,  2.99s/it]

Avg f1_micro 0.13776621201244318, Avg f_macro 0.08220629387528874


 20%|████████████████████                                                                                | 200/1000 [08:25<39:35,  2.97s/it]

Avg f1_micro 0.13791071428571428, Avg f_macro 0.0822952624059123


 20%|████████████████████                                                                                | 201/1000 [08:25<30:39,  2.30s/it]

Avg f1_micro 0.13722459132906895, Avg f_macro 0.08188583323971374


 20%|████████████████████▏                                                                               | 202/1000 [08:26<24:26,  1.84s/it]

Avg f1_micro 0.13654526166902403, Avg f_macro 0.08148045782763594


 20%|████████████████████▎                                                                               | 203/1000 [08:31<34:40,  2.61s/it]

Avg f1_micro 0.1364883884588318, Avg f_macro 0.08131365285123895


 20%|████████████████████▍                                                                               | 204/1000 [08:33<33:11,  2.50s/it]

Avg f1_micro 0.13679971988795517, Avg f_macro 0.08145971882310107


 20%|████████████████████▌                                                                               | 205/1000 [08:34<26:25,  1.99s/it]

Avg f1_micro 0.13613240418118466, Avg f_macro 0.08106235434103716


 21%|████████████████████▌                                                                               | 206/1000 [08:34<21:11,  1.60s/it]

Avg f1_micro 0.13547156726768375, Avg f_macro 0.08066884776656612


 21%|████████████████████▋                                                                               | 207/1000 [08:37<25:09,  1.90s/it]

Avg f1_micro 0.13481711525189785, Avg f_macro 0.08027914318798367


 21%|████████████████████▊                                                                               | 208/1000 [08:40<31:05,  2.36s/it]

Avg f1_micro 0.13485576923076922, Avg f_macro 0.08026300825401779


 21%|████████████████████▉                                                                               | 209/1000 [08:44<36:14,  2.75s/it]

Avg f1_micro 0.13421052631578947, Avg f_macro 0.07987897472170191


 21%|█████████████████████                                                                               | 210/1000 [08:45<30:47,  2.34s/it]

Avg f1_micro 0.13357142857142856, Avg f_macro 0.07949859865159857


 21%|█████████████████████                                                                               | 211/1000 [08:48<31:51,  2.42s/it]

Avg f1_micro 0.13293838862559243, Avg f_macro 0.07912182804187536


 21%|█████████████████████▏                                                                              | 212/1000 [08:51<31:53,  2.43s/it]

Avg f1_micro 0.132311320754717, Avg f_macro 0.0787486118718665


 21%|█████████████████████▎                                                                              | 213/1000 [08:51<25:29,  1.94s/it]

Avg f1_micro 0.1316901408450704, Avg f_macro 0.07837890007904084


 21%|█████████████████████▍                                                                              | 214/1000 [08:54<30:06,  2.30s/it]

Avg f1_micro 0.13107476635514018, Avg f_macro 0.07801264353661541


 22%|█████████████████████▌                                                                              | 215/1000 [08:56<26:23,  2.02s/it]

Avg f1_micro 0.13046511627906976, Avg f_macro 0.07764979403179395


 22%|█████████████████████▌                                                                              | 216/1000 [08:59<28:56,  2.22s/it]

Avg f1_micro 0.13140432098765434, Avg f_macro 0.07831911082897186


 22%|█████████████████████▋                                                                              | 217/1000 [09:00<24:55,  1.91s/it]

Avg f1_micro 0.13079877112135177, Avg f_macro 0.07795819326754802


 22%|█████████████████████▊                                                                              | 218/1000 [09:03<28:51,  2.21s/it]

Avg f1_micro 0.1301987767584098, Avg f_macro 0.07760058687641248


 22%|█████████████████████▉                                                                              | 219/1000 [09:05<30:21,  2.33s/it]

Avg f1_micro 0.13143074581430747, Avg f_macro 0.07855087773868587


 22%|██████████████████████                                                                              | 220/1000 [09:06<25:32,  1.96s/it]

Avg f1_micro 0.13083333333333336, Avg f_macro 0.07819382829441912


 22%|██████████████████████                                                                              | 221/1000 [09:09<29:09,  2.25s/it]

Avg f1_micro 0.13099547511312218, Avg f_macro 0.07814166919203111


 22%|██████████████████████▏                                                                             | 222/1000 [09:12<31:56,  2.46s/it]

Avg f1_micro 0.13130630630630633, Avg f_macro 0.07829018019166659


 22%|██████████████████████▎                                                                             | 223/1000 [09:16<38:30,  2.97s/it]

Avg f1_micro 0.1312780269058296, Avg f_macro 0.07816906750597324


 22%|██████████████████████▍                                                                             | 224/1000 [09:19<37:02,  2.86s/it]

Avg f1_micro 0.13158482142857145, Avg f_macro 0.07831613020063906


 22%|██████████████████████▌                                                                             | 225/1000 [09:20<30:08,  2.33s/it]

Avg f1_micro 0.13396296296296295, Avg f_macro 0.08019028073308065


 23%|██████████████████████▌                                                                             | 226/1000 [09:23<30:26,  2.36s/it]

Avg f1_micro 0.1351401179941003, Avg f_macro 0.0804675677336296


 23%|██████████████████████▋                                                                             | 227/1000 [09:25<31:39,  2.46s/it]

Avg f1_micro 0.13527900146842878, Avg f_macro 0.0806025613167903


 23%|██████████████████████▊                                                                             | 228/1000 [09:27<29:38,  2.30s/it]

Avg f1_micro 0.13578216374269006, Avg f_macro 0.08073637074571277


 23%|██████████████████████▉                                                                             | 229/1000 [09:29<28:12,  2.20s/it]

Avg f1_micro 0.1351892285298399, Avg f_macro 0.0803838101747708


 23%|███████████████████████                                                                             | 230/1000 [09:32<29:50,  2.33s/it]

Avg f1_micro 0.13547101449275362, Avg f_macro 0.08051740713536358


 23%|███████████████████████                                                                             | 231/1000 [09:38<44:13,  3.45s/it]

Avg f1_micro 0.13488455988455988, Avg f_macro 0.08016884693131439


 23%|███████████████████████▏                                                                            | 232/1000 [09:39<34:04,  2.66s/it]

Avg f1_micro 0.13645833333333335, Avg f_macro 0.08126007316580586


 23%|███████████████████████▎                                                                            | 233/1000 [09:42<36:49,  2.88s/it]

Avg f1_micro 0.13587267525035765, Avg f_macro 0.08091131748698266


 23%|███████████████████████▍                                                                            | 234/1000 [09:43<29:59,  2.35s/it]

Avg f1_micro 0.13814102564102565, Avg f_macro 0.0827022947626793


 24%|███████████████████████▌                                                                            | 235/1000 [09:47<34:49,  2.73s/it]

Avg f1_micro 0.138161094224924, Avg f_macro 0.08267770234634056


 24%|███████████████████████▌                                                                            | 236/1000 [09:49<33:38,  2.64s/it]

Avg f1_micro 0.13842312348668281, Avg f_macro 0.08285703411605945


 24%|███████████████████████▋                                                                            | 237/1000 [09:53<37:21,  2.94s/it]

Avg f1_micro 0.13844183242917418, Avg f_macro 0.08289100903923681


 24%|███████████████████████▊                                                                            | 238/1000 [09:58<44:22,  3.49s/it]

Avg f1_micro 0.13838535414165665, Avg f_macro 0.08274280752066458


 24%|███████████████████████▉                                                                            | 239/1000 [10:01<42:52,  3.38s/it]

Avg f1_micro 0.13780633592349073, Avg f_macro 0.08239660330509696


 24%|████████████████████████                                                                            | 240/1000 [10:04<42:52,  3.39s/it]

Avg f1_micro 0.13782738095238098, Avg f_macro 0.08240050634688127


 24%|████████████████████████                                                                            | 241/1000 [10:06<38:28,  3.04s/it]

Avg f1_micro 0.13808535862477772, Avg f_macro 0.08245377435057925


 24%|████████████████████████▏                                                                           | 242/1000 [10:08<34:15,  2.71s/it]

Avg f1_micro 0.1385478158205431, Avg f_macro 0.08280176150891018


 24%|████████████████████████▎                                                                           | 243/1000 [10:11<33:49,  2.68s/it]

Avg f1_micro 0.13962375073486186, Avg f_macro 0.08360413194623062


 24%|████████████████████████▍                                                                           | 244/1000 [10:15<39:18,  3.12s/it]

Avg f1_micro 0.13905152224824358, Avg f_macro 0.08326149206120509


 24%|████████████████████████▌                                                                           | 245/1000 [10:16<30:32,  2.43s/it]

Avg f1_micro 0.14052478134110788, Avg f_macro 0.08428219345415257


 25%|████████████████████████▌                                                                           | 246/1000 [10:17<26:28,  2.11s/it]

Avg f1_micro 0.1399535423925668, Avg f_macro 0.08393958291165601


 25%|████████████████████████▋                                                                           | 247/1000 [10:19<25:17,  2.02s/it]

Avg f1_micro 0.14039907460960094, Avg f_macro 0.08427451037625118


 25%|████████████████████████▊                                                                           | 248/1000 [10:23<32:17,  2.58s/it]

Avg f1_micro 0.13983294930875576, Avg f_macro 0.08393469380215339


 25%|████████████████████████▉                                                                           | 249/1000 [10:31<51:16,  4.10s/it]

Avg f1_micro 0.13927137119908206, Avg f_macro 0.08359760667844997


 25%|█████████████████████████                                                                           | 250/1000 [10:33<45:04,  3.61s/it]

Avg f1_micro 0.13871428571428573, Avg f_macro 0.08326321625173617


 25%|█████████████████████████                                                                           | 251/1000 [10:37<45:07,  3.61s/it]

Avg f1_micro 0.13873079112122935, Avg f_macro 0.0831528271652972


 25%|█████████████████████████▏                                                                          | 252/1000 [10:40<44:13,  3.55s/it]

Avg f1_micro 0.13874716553287983, Avg f_macro 0.08312810593417728


 25%|█████████████████████████▎                                                                          | 253/1000 [10:41<35:24,  2.84s/it]

Avg f1_micro 0.13819875776397517, Avg f_macro 0.08279953634550465


 25%|█████████████████████████▍                                                                          | 254/1000 [10:47<46:01,  3.70s/it]

Avg f1_micro 0.13804836895388078, Avg f_macro 0.08261936902539257


 26%|█████████████████████████▌                                                                          | 255/1000 [10:48<36:52,  2.97s/it]

Avg f1_micro 0.1388141923436041, Avg f_macro 0.08307968522529299


 26%|█████████████████████████▌                                                                          | 256/1000 [10:49<28:22,  2.29s/it]

Avg f1_micro 0.14022507440476192, Avg f_macro 0.08405723853821502


 26%|█████████████████████████▋                                                                          | 257/1000 [10:51<27:30,  2.22s/it]

Avg f1_micro 0.14045766166388735, Avg f_macro 0.08421654889409745


 26%|█████████████████████████▊                                                                          | 258/1000 [10:55<34:16,  2.77s/it]

Avg f1_micro 0.1404669619785899, Avg f_macro 0.08410545977263024


 26%|█████████████████████████▉                                                                          | 259/1000 [10:58<36:48,  2.98s/it]

Avg f1_micro 0.1399246184960471, Avg f_macro 0.08378072826771661


 26%|██████████████████████████                                                                          | 260/1000 [11:01<36:29,  2.96s/it]

Avg f1_micro 0.14002747252747252, Avg f_macro 0.08371490495386642


 26%|██████████████████████████                                                                          | 261/1000 [11:03<29:57,  2.43s/it]

Avg f1_micro 0.13949096880131365, Avg f_macro 0.08339415819159107


 26%|██████████████████████████▏                                                                         | 262/1000 [11:05<29:58,  2.44s/it]

Avg f1_micro 0.13972191930207198, Avg f_macro 0.08355295911452393


 26%|██████████████████████████▎                                                                         | 263/1000 [11:10<38:53,  3.17s/it]

Avg f1_micro 0.13919065725149377, Avg f_macro 0.08323526725477289


 26%|██████████████████████████▍                                                                         | 264/1000 [11:14<43:56,  3.58s/it]

Avg f1_micro 0.13913690476190477, Avg f_macro 0.08323563871719167


 26%|██████████████████████████▌                                                                         | 265/1000 [11:17<39:37,  3.23s/it]

Avg f1_micro 0.13936657681940703, Avg f_macro 0.08334082917905551


 27%|██████████████████████████▌                                                                         | 266/1000 [11:19<36:36,  2.99s/it]

Avg f1_micro 0.13959452201933406, Avg f_macro 0.08344522873519106


 27%|██████████████████████████▋                                                                         | 267/1000 [11:22<34:29,  2.82s/it]

Avg f1_micro 0.13982075976457997, Avg f_macro 0.0836008645826248


 27%|██████████████████████████▊                                                                         | 268/1000 [11:25<34:41,  2.84s/it]

Avg f1_micro 0.13929904051172706, Avg f_macro 0.08328892105806276


 27%|██████████████████████████▉                                                                         | 269/1000 [11:27<31:58,  2.62s/it]

Avg f1_micro 0.13878120021242696, Avg f_macro 0.08297929681621123


 27%|███████████████████████████                                                                         | 270/1000 [11:30<33:02,  2.72s/it]

Avg f1_micro 0.13888447971781306, Avg f_macro 0.08300866642396264


 27%|███████████████████████████                                                                         | 271/1000 [11:32<31:53,  2.62s/it]

Avg f1_micro 0.13910999824283957, Avg f_macro 0.0831123654818488


 27%|███████████████████████████▏                                                                        | 272/1000 [11:34<31:02,  2.56s/it]

Avg f1_micro 0.13859856442577034, Avg f_macro 0.08280680531463613


 27%|███████████████████████████▎                                                                        | 273/1000 [11:39<38:17,  3.16s/it]

Avg f1_micro 0.13854875283446713, Avg f_macro 0.0826779124293043


 27%|███████████████████████████▍                                                                        | 274/1000 [11:40<31:06,  2.57s/it]

Avg f1_micro 0.1380431004518596, Avg f_macro 0.08237616822335793


 28%|███████████████████████████▌                                                                        | 275/1000 [11:44<36:45,  3.04s/it]

Avg f1_micro 0.137995670995671, Avg f_macro 0.08237964882375784


 28%|███████████████████████████▌                                                                        | 276/1000 [11:47<35:37,  2.95s/it]

Avg f1_micro 0.1382203243616287, Avg f_macro 0.08248374832479898


 28%|███████████████████████████▋                                                                        | 277/1000 [11:49<32:28,  2.70s/it]

Avg f1_micro 0.1386238610967853, Avg f_macro 0.0827876577772967


 28%|███████████████████████████▊                                                                        | 278/1000 [11:52<31:36,  2.63s/it]

Avg f1_micro 0.13956406303528607, Avg f_macro 0.0833463181381526


 28%|███████████████████████████▉                                                                        | 279/1000 [11:54<30:11,  2.51s/it]

Avg f1_micro 0.13906383341867212, Avg f_macro 0.08304758581507678


 28%|████████████████████████████                                                                        | 280/1000 [11:58<36:03,  3.00s/it]

Avg f1_micro 0.13946003401360543, Avg f_macro 0.08320886275218412


 28%|████████████████████████████                                                                        | 281/1000 [12:00<33:17,  2.78s/it]

Avg f1_micro 0.13967547873241826, Avg f_macro 0.0833081590096892


 28%|████████████████████████████▏                                                                       | 282/1000 [12:02<30:14,  2.53s/it]

Avg f1_micro 0.14006670043904088, Avg f_macro 0.08351932561907732


 28%|████████████████████████████▎                                                                       | 283/1000 [12:06<35:01,  2.93s/it]

Avg f1_micro 0.14001346121487465, Avg f_macro 0.08339246951307015


 28%|████████████████████████████▍                                                                       | 284/1000 [12:08<30:25,  2.55s/it]

Avg f1_micro 0.13952045606975186, Avg f_macro 0.08309883405703822


 28%|████████████████████████████▍                                                                       | 285/1000 [12:12<35:04,  2.94s/it]

Avg f1_micro 0.13946950710108605, Avg f_macro 0.08298719622274002


 29%|████████████████████████████▌                                                                       | 286/1000 [12:14<33:13,  2.79s/it]

Avg f1_micro 0.1396811521811522, Avg f_macro 0.08313409413804512


 29%|████████████████████████████▋                                                                       | 287/1000 [12:17<31:53,  2.68s/it]

Avg f1_micro 0.14058818649410987, Avg f_macro 0.08371550844418434


 29%|████████████████████████████▊                                                                       | 288/1000 [12:19<29:45,  2.51s/it]

Avg f1_micro 0.14096808862433863, Avg f_macro 0.08392086134145155


 29%|████████████████████████████▉                                                                       | 289/1000 [12:21<30:02,  2.54s/it]

Avg f1_micro 0.14186439281594992, Avg f_macro 0.08412479311140204


 29%|████████████████████████████▉                                                                       | 290/1000 [12:22<23:54,  2.02s/it]

Avg f1_micro 0.1413752052545156, Avg f_macro 0.08383470761791445


 29%|█████████████████████████████                                                                       | 291/1000 [12:23<20:36,  1.74s/it]

Avg f1_micro 0.14088937980690558, Avg f_macro 0.08354661583915873


 29%|█████████████████████████████▏                                                                      | 292/1000 [12:24<18:12,  1.54s/it]

Avg f1_micro 0.14040688193085454, Avg f_macro 0.08326049729176435


 29%|█████████████████████████████▎                                                                      | 293/1000 [12:27<22:59,  1.95s/it]

Avg f1_micro 0.1399276775556639, Avg f_macro 0.08297633177199723


 29%|█████████████████████████████▍                                                                      | 294/1000 [12:31<28:57,  2.46s/it]

Avg f1_micro 0.13993764172335602, Avg f_macro 0.08295574246979003


 30%|█████████████████████████████▌                                                                      | 295/1000 [12:33<27:28,  2.34s/it]

Avg f1_micro 0.1401412429378531, Avg f_macro 0.08309826537667209


 30%|█████████████████████████████▌                                                                      | 296/1000 [12:35<26:23,  2.25s/it]

Avg f1_micro 0.14034346846846849, Avg f_macro 0.08309905952517432


 30%|█████████████████████████████▋                                                                      | 297/1000 [12:38<28:43,  2.45s/it]

Avg f1_micro 0.1404320987654321, Avg f_macro 0.08304373160309181


 30%|█████████████████████████████▊                                                                      | 298/1000 [12:39<25:40,  2.19s/it]

Avg f1_micro 0.13996085011185683, Avg f_macro 0.08276506136281297


 30%|█████████████████████████████▉                                                                      | 299/1000 [12:43<28:53,  2.47s/it]

Avg f1_micro 0.13949275362318841, Avg f_macro 0.0824882551375193


 30%|██████████████████████████████                                                                      | 300/1000 [12:44<26:30,  2.27s/it]

Avg f1_micro 0.13986111111111113, Avg f_macro 0.08276884984261644


 30%|██████████████████████████████                                                                      | 301/1000 [12:47<26:22,  2.26s/it]

Avg f1_micro 0.14006090808416388, Avg f_macro 0.08290915266705957


 30%|██████████████████████████████▏                                                                     | 302/1000 [12:48<24:42,  2.12s/it]

Avg f1_micro 0.1395971302428256, Avg f_macro 0.08263461904895673


 30%|██████████████████████████████▎                                                                     | 303/1000 [12:53<31:46,  2.73s/it]

Avg f1_micro 0.13954895489548955, Avg f_macro 0.0824994112853188


 30%|██████████████████████████████▍                                                                     | 304/1000 [12:55<30:42,  2.65s/it]

Avg f1_micro 0.13974780701754386, Avg f_macro 0.08263921585345921


 30%|██████████████████████████████▌                                                                     | 305/1000 [13:00<39:23,  3.40s/it]

Avg f1_micro 0.13965391621129328, Avg f_macro 0.08252439562973983


 31%|██████████████████████████████▌                                                                     | 306/1000 [13:02<33:52,  2.93s/it]

Avg f1_micro 0.13919753086419753, Avg f_macro 0.08225470806232238


 31%|██████████████████████████████▋                                                                     | 307/1000 [13:04<31:29,  2.73s/it]

Avg f1_micro 0.13874411871154543, Avg f_macro 0.08198677741716824


 31%|██████████████████████████████▊                                                                     | 308/1000 [13:07<30:28,  2.64s/it]

Avg f1_micro 0.13894300144300145, Avg f_macro 0.08212643073724236


 31%|██████████████████████████████▉                                                                     | 309/1000 [13:09<28:04,  2.44s/it]

Avg f1_micro 0.13914059690758718, Avg f_macro 0.0822651801523322


 31%|███████████████████████████████                                                                     | 310/1000 [13:12<31:17,  2.72s/it]

Avg f1_micro 0.13915258576548897, Avg f_macro 0.08217902007298775


 31%|███████████████████████████████                                                                     | 311/1000 [13:13<25:58,  2.26s/it]

Avg f1_micro 0.13870514979839738, Avg f_macro 0.0819147788508881


 31%|███████████████████████████████▏                                                                    | 312/1000 [13:16<28:11,  2.46s/it]

Avg f1_micro 0.13826058201058203, Avg f_macro 0.0816522314827763


 31%|███████████████████████████████▎                                                                    | 313/1000 [13:18<26:24,  2.31s/it]

Avg f1_micro 0.1386175769562351, Avg f_macro 0.08192384309678233


 31%|███████████████████████████████▍                                                                    | 314/1000 [13:21<27:25,  2.40s/it]

Avg f1_micro 0.13881306237994137, Avg f_macro 0.08211789819156055


 32%|███████████████████████████████▌                                                                    | 315/1000 [13:26<36:53,  3.23s/it]

Avg f1_micro 0.13837238599143362, Avg f_macro 0.08185720645126988


 32%|███████████████████████████████▌                                                                    | 316/1000 [13:29<36:32,  3.21s/it]

Avg f1_micro 0.13793449869399238, Avg f_macro 0.08159816465870258


 32%|███████████████████████████████▋                                                                    | 317/1000 [13:32<37:06,  3.26s/it]

Avg f1_micro 0.1379500275399329, Avg f_macro 0.0816275366658016


 32%|███████████████████████████████▊                                                                    | 318/1000 [13:35<33:52,  2.98s/it]

Avg f1_micro 0.1375162224218828, Avg f_macro 0.081370846298928


 32%|███████████████████████████████▉                                                                    | 319/1000 [13:37<32:36,  2.87s/it]

Avg f1_micro 0.137712096332786, Avg f_macro 0.08156359331008228


 32%|████████████████████████████████                                                                    | 320/1000 [13:39<26:52,  2.37s/it]

Avg f1_micro 0.13728174603174603, Avg f_macro 0.08130870708098828


 32%|████████████████████████████████                                                                    | 321/1000 [13:40<22:33,  1.99s/it]

Avg f1_micro 0.13685407704099292, Avg f_macro 0.081055408928088


 32%|████████████████████████████████▏                                                                   | 322/1000 [13:41<20:01,  1.77s/it]

Avg f1_micro 0.13642906437937494, Avg f_macro 0.08080368405564052


 32%|████████████████████████████████▎                                                                   | 323/1000 [13:43<22:16,  1.97s/it]

Avg f1_micro 0.13662587842154406, Avg f_macro 0.0808975150991559


 32%|████████████████████████████████▍                                                                   | 324/1000 [13:46<24:26,  2.17s/it]

Avg f1_micro 0.136204193611601, Avg f_macro 0.08064783141057826


 32%|████████████████████████████████▌                                                                   | 325/1000 [13:47<21:43,  1.93s/it]

Avg f1_micro 0.13578510378510378, Avg f_macro 0.08039968423700725


 33%|████████████████████████████████▌                                                                   | 326/1000 [13:49<19:49,  1.76s/it]

Avg f1_micro 0.13536858506183658, Avg f_macro 0.08015305943873421


 33%|████████████████████████████████▋                                                                   | 327/1000 [13:52<26:05,  2.33s/it]

Avg f1_micro 0.13539148585020144, Avg f_macro 0.08007783771432084


 33%|████████████████████████████████▊                                                                   | 328/1000 [13:57<32:50,  2.93s/it]

Avg f1_micro 0.13612199961285326, Avg f_macro 0.08011085982771952


 33%|████████████████████████████████▉                                                                   | 329/1000 [13:59<30:31,  2.73s/it]

Avg f1_micro 0.13631615766874125, Avg f_macro 0.08012065458001623


 33%|█████████████████████████████████                                                                   | 330/1000 [14:01<28:13,  2.53s/it]

Avg f1_micro 0.1359030784030784, Avg f_macro 0.07987786471765254


 33%|█████████████████████████████████                                                                   | 331/1000 [14:03<26:39,  2.39s/it]

Avg f1_micro 0.1354924950846401, Avg f_macro 0.07963654186352066


 33%|█████████████████████████████████▏                                                                  | 332/1000 [14:04<22:49,  2.05s/it]

Avg f1_micro 0.13508438515968635, Avg f_macro 0.0793966727615221


 33%|█████████████████████████████████▎                                                                  | 333/1000 [14:06<20:30,  1.85s/it]

Avg f1_micro 0.134678726345393, Avg f_macro 0.07915824431479081


 33%|█████████████████████████████████▍                                                                  | 334/1000 [14:08<23:02,  2.08s/it]

Avg f1_micro 0.13547310141621519, Avg f_macro 0.07934895957988766


 34%|█████████████████████████████████▌                                                                  | 335/1000 [14:09<18:27,  1.66s/it]

Avg f1_micro 0.13506870409855484, Avg f_macro 0.07911209701397755


 34%|█████████████████████████████████▌                                                                  | 336/1000 [14:10<17:46,  1.61s/it]

Avg f1_micro 0.13466671390778534, Avg f_macro 0.07887664434429309


 34%|█████████████████████████████████▋                                                                  | 337/1000 [14:13<20:27,  1.85s/it]

Avg f1_micro 0.1348605812255664, Avg f_macro 0.07897229558098988


 34%|█████████████████████████████████▊                                                                  | 338/1000 [14:15<20:15,  1.84s/it]

Avg f1_micro 0.1352012303935381, Avg f_macro 0.07923174638301851


 34%|█████████████████████████████████▉                                                                  | 339/1000 [14:17<22:14,  2.02s/it]

Avg f1_micro 0.1353923772065365, Avg f_macro 0.07932578580699519


 34%|██████████████████████████████████                                                                  | 340/1000 [14:18<19:40,  1.79s/it]

Avg f1_micro 0.13499416433239964, Avg f_macro 0.07909247467226874


 34%|██████████████████████████████████                                                                  | 341/1000 [14:21<23:26,  2.13s/it]

Avg f1_micro 0.13459828701764184, Avg f_macro 0.07886053193129434


 34%|██████████████████████████████████▏                                                                 | 342/1000 [14:24<25:12,  2.30s/it]

Avg f1_micro 0.1342047247749002, Avg f_macro 0.07862994558061803


 34%|██████████████████████████████████▎                                                                 | 343/1000 [14:29<33:44,  3.08s/it]

Avg f1_micro 0.1338134573557314, Avg f_macro 0.07840070375676784


 34%|██████████████████████████████████▍                                                                 | 344/1000 [14:31<29:58,  2.74s/it]

Avg f1_micro 0.13342446474713918, Avg f_macro 0.0781727947342191


 34%|██████████████████████████████████▌                                                                 | 345/1000 [14:33<28:18,  2.59s/it]

Avg f1_micro 0.1336174373130895, Avg f_macro 0.07826826811502167


 35%|██████████████████████████████████▌                                                                 | 346/1000 [14:36<28:22,  2.60s/it]

Avg f1_micro 0.13323125974860078, Avg f_macro 0.07804205924763723


 35%|██████████████████████████████████▋                                                                 | 347/1000 [14:38<27:49,  2.56s/it]

Avg f1_micro 0.1328473079914002, Avg f_macro 0.0778171541777593


 35%|██████████████████████████████████▊                                                                 | 348/1000 [14:42<31:21,  2.89s/it]

Avg f1_micro 0.13287607188469258, Avg f_macro 0.07783300526728683


 35%|██████████████████████████████████▉                                                                 | 349/1000 [14:43<24:34,  2.27s/it]

Avg f1_micro 0.13249533815436396, Avg f_macro 0.07760998806021724


 35%|███████████████████████████████████                                                                 | 350/1000 [14:45<25:02,  2.31s/it]

Avg f1_micro 0.1321167800453515, Avg f_macro 0.07738824523718804


 35%|███████████████████████████████████                                                                 | 351/1000 [14:49<30:57,  2.86s/it]

Avg f1_micro 0.1324526296748519, Avg f_macro 0.07768576642402848


 35%|███████████████████████████████████▏                                                                | 352/1000 [14:52<30:19,  2.81s/it]

Avg f1_micro 0.13254982864357864, Avg f_macro 0.07765446216335414


 35%|███████████████████████████████████▎                                                                | 353/1000 [14:55<32:09,  2.98s/it]

Avg f1_micro 0.13257902783398537, Avg f_macro 0.07771776397025683


 35%|███████████████████████████████████▍                                                                | 354/1000 [14:57<28:16,  2.63s/it]

Avg f1_micro 0.13291072549547128, Avg f_macro 0.07790177351513504


 36%|███████████████████████████████████▌                                                                | 355/1000 [14:59<25:01,  2.33s/it]

Avg f1_micro 0.13253632908562488, Avg f_macro 0.07768233189959944


 36%|███████████████████████████████████▌                                                                | 356/1000 [15:02<26:51,  2.50s/it]

Avg f1_micro 0.1321640360263956, Avg f_macro 0.07746412310212866


 36%|███████████████████████████████████▋                                                                | 357/1000 [15:05<28:50,  2.69s/it]

Avg f1_micro 0.13179382864256817, Avg f_macro 0.07724713676290701


 36%|███████████████████████████████████▊                                                                | 358/1000 [15:08<31:02,  2.90s/it]

Avg f1_micro 0.13182473175489937, Avg f_macro 0.07724623156782369


 36%|███████████████████████████████████▉                                                                | 359/1000 [15:10<26:44,  2.50s/it]

Avg f1_micro 0.13145753194499712, Avg f_macro 0.07703106100635343


 36%|████████████████████████████████████                                                                | 360/1000 [15:12<24:42,  2.32s/it]

Avg f1_micro 0.1310923721340388, Avg f_macro 0.07681708583689133


 36%|████████████████████████████████████                                                                | 361/1000 [15:13<23:06,  2.17s/it]

Avg f1_micro 0.13142175614474783, Avg f_macro 0.0770000222829308


 36%|████████████████████████████████████▏                                                               | 362/1000 [15:15<20:02,  1.88s/it]

Avg f1_micro 0.1319795229325616, Avg f_macro 0.07733980122690061


 36%|████████████████████████████████████▎                                                               | 363/1000 [15:18<23:38,  2.23s/it]

Avg f1_micro 0.13161594297957935, Avg f_macro 0.07712674392324524


 36%|███████████████████████████████████▎                                                             | 364/1000 [18:26<10:16:08, 58.13s/it]

Avg f1_micro 0.13194117390545962, Avg f_macro 0.0773727327219909


 36%|███████████████████████████████████▊                                                              | 365/1000 [18:30<7:21:43, 41.74s/it]

Avg f1_micro 0.1315796912372255, Avg f_macro 0.07716075263234161


 37%|███████████████████████████████████▊                                                              | 366/1000 [18:36<5:28:24, 31.08s/it]

Avg f1_micro 0.1315237661549137, Avg f_macro 0.0770713638121561


 37%|███████████████████████████████████▉                                                              | 367/1000 [18:39<3:59:31, 22.70s/it]

Avg f1_micro 0.1317103498983608, Avg f_macro 0.07720195955108755


 37%|████████████████████████████████████                                                              | 368/1000 [18:44<3:02:51, 17.36s/it]

Avg f1_micro 0.13165437370600414, Avg f_macro 0.0771315250177478


 37%|████████████████████████████████████▏                                                             | 369/1000 [18:46<2:14:00, 12.74s/it]

Avg f1_micro 0.13129758678539166, Avg f_macro 0.07692249649466447


 37%|████████████████████████████████████▎                                                             | 370/1000 [18:49<1:43:12,  9.83s/it]

Avg f1_micro 0.13094272844272845, Avg f_macro 0.07671459785548969


 37%|████████████████████████████████████▎                                                             | 371/1000 [18:51<1:17:51,  7.43s/it]

Avg f1_micro 0.1312636375304839, Avg f_macro 0.07695705626198882


 37%|████████████████████████████████████▍                                                             | 372/1000 [18:54<1:03:03,  6.02s/it]

Avg f1_micro 0.13144841269841268, Avg f_macro 0.0770488682373897


 37%|█████████████████████████████████████▎                                                              | 373/1000 [18:56<51:15,  4.91s/it]

Avg f1_micro 0.13216839014426146, Avg f_macro 0.07748062794210242


 37%|█████████████████████████████████████▍                                                              | 374/1000 [19:00<48:01,  4.60s/it]

Avg f1_micro 0.13219696969696967, Avg f_macro 0.07749627688699876


 38%|█████████████████████████████████████▌                                                              | 375/1000 [19:04<45:27,  4.36s/it]

Avg f1_micro 0.1322253968253968, Avg f_macro 0.07753204439105767


 38%|█████████████████████████████████████▌                                                              | 376/1000 [19:06<38:14,  3.68s/it]

Avg f1_micro 0.13240564842958458, Avg f_macro 0.07757913495182106


 38%|█████████████████████████████████████▋                                                              | 377/1000 [19:07<29:38,  2.85s/it]

Avg f1_micro 0.13205443981306048, Avg f_macro 0.07737335475300987


 38%|█████████████████████████████████████▊                                                              | 378/1000 [19:09<26:53,  2.59s/it]

Avg f1_micro 0.13236646510456032, Avg f_macro 0.07754659228767688


 38%|█████████████████████████████████████▉                                                              | 379/1000 [19:11<25:47,  2.49s/it]

Avg f1_micro 0.1320172132177409, Avg f_macro 0.07734198386475426


 38%|██████████████████████████████████████                                                              | 380/1000 [19:13<25:02,  2.42s/it]

Avg f1_micro 0.13219611528822053, Avg f_macro 0.07743084998908678


 38%|██████████████████████████████████████                                                              | 381/1000 [19:14<21:13,  2.06s/it]

Avg f1_micro 0.13184914385701788, Avg f_macro 0.0772276194116876


 38%|██████████████████████████████████████▏                                                             | 382/1000 [19:17<22:24,  2.18s/it]

Avg f1_micro 0.13202754923959112, Avg f_macro 0.07735267799961512


 38%|██████████████████████████████████████▎                                                             | 383/1000 [19:19<23:08,  2.25s/it]

Avg f1_micro 0.1316828297898794, Avg f_macro 0.07715071278290594


 38%|██████████████████████████████████████▍                                                             | 384/1000 [19:22<23:42,  2.31s/it]

Avg f1_micro 0.1318607390873016, Avg f_macro 0.07727532030170046


 38%|██████████████████████████████████████▌                                                             | 385/1000 [19:23<22:08,  2.16s/it]

Avg f1_micro 0.13216759431045147, Avg f_macro 0.07750750561693415


 39%|██████████████████████████████████████▌                                                             | 386/1000 [19:26<24:37,  2.41s/it]

Avg f1_micro 0.13182519121638295, Avg f_macro 0.07730670897025815


 39%|██████████████████████████████████████▋                                                             | 387/1000 [19:29<24:45,  2.42s/it]

Avg f1_micro 0.1325181493786145, Avg f_macro 0.07775294486439184


 39%|██████████████████████████████████████▊                                                             | 388/1000 [19:31<22:52,  2.24s/it]

Avg f1_micro 0.1334652675503191, Avg f_macro 0.07841165720580665


 39%|██████████████████████████████████████▉                                                             | 389/1000 [19:32<19:40,  1.93s/it]

Avg f1_micro 0.13312216917615377, Avg f_macro 0.07821008482224416


 39%|███████████████████████████████████████                                                             | 390/1000 [19:33<15:56,  1.57s/it]

Avg f1_micro 0.1327808302808303, Avg f_macro 0.07800954614321276


 39%|███████████████████████████████████████                                                             | 391/1000 [19:37<23:26,  2.31s/it]

Avg f1_micro 0.13280660090123006, Avg f_macro 0.07804253730629684


 39%|███████████████████████████████████████▏                                                            | 392/1000 [19:38<20:45,  2.05s/it]

Avg f1_micro 0.13246780855199225, Avg f_macro 0.07784344920092363


 39%|███████████████████████████████████████▎                                                            | 393/1000 [19:40<19:08,  1.89s/it]

Avg f1_micro 0.1321307403368472, Avg f_macro 0.07764537426657014


 39%|███████████████████████████████████████▍                                                            | 394/1000 [19:44<25:17,  2.50s/it]

Avg f1_micro 0.13179538312787045, Avg f_macro 0.07744830478873621


 40%|███████████████████████████████████████▌                                                            | 395/1000 [19:50<36:27,  3.62s/it]

Avg f1_micro 0.13146172393007838, Avg f_macro 0.07725223313104321


 40%|███████████████████████████████████████▌                                                            | 396/1000 [19:51<29:08,  2.90s/it]

Avg f1_micro 0.1311297498797499, Avg f_macro 0.07705715173424764


 40%|███████████████████████████████████████▋                                                            | 397/1000 [19:53<27:10,  2.70s/it]

Avg f1_micro 0.13130322658030466, Avg f_macro 0.07714292996945385


 40%|███████████████████████████████████████▊                                                            | 398/1000 [19:56<27:06,  2.70s/it]

Avg f1_micro 0.13097331897583153, Avg f_macro 0.07694910351224417


 40%|███████████████████████████████████████▉                                                            | 399/1000 [19:59<27:38,  2.76s/it]

Avg f1_micro 0.13164757130922544, Avg f_macro 0.07711428656824643


 40%|████████████████████████████████████████                                                            | 400/1000 [20:01<25:13,  2.52s/it]

Avg f1_micro 0.13131845238095238, Avg f_macro 0.0769215008518258


 40%|████████████████████████████████████████                                                            | 401/1000 [20:03<24:27,  2.45s/it]

Avg f1_micro 0.1309909749435934, Avg f_macro 0.07672967666017536


 40%|████████████████████████████████████████▏                                                           | 402/1000 [20:04<20:41,  2.08s/it]

Avg f1_micro 0.1306651267472163, Avg f_macro 0.07653880681773712


 40%|████████████████████████████████████████▎                                                           | 403/1000 [20:06<18:03,  1.81s/it]

Avg f1_micro 0.1303408956634763, Avg f_macro 0.0763488842201745


 40%|████████████████████████████████████████▍                                                           | 404/1000 [20:07<18:30,  1.86s/it]

Avg f1_micro 0.13063708156529938, Avg f_macro 0.07651350862274124


 40%|████████████████████████████████████████▌                                                           | 405/1000 [20:10<20:15,  2.04s/it]

Avg f1_micro 0.13080834803057026, Avg f_macro 0.07663322835453694


 41%|████████████████████████████████████████▌                                                           | 406/1000 [20:12<21:25,  2.16s/it]

Avg f1_micro 0.1309787708186723, Avg f_macro 0.07671814924802604


 41%|████████████████████████████████████████▋                                                           | 407/1000 [20:18<32:25,  3.28s/it]

Avg f1_micro 0.1309299559299559, Avg f_macro 0.07664665268382707


 41%|████████████████████████████████████████▊                                                           | 408/1000 [20:20<27:24,  2.78s/it]

Avg f1_micro 0.13122179427326486, Avg f_macro 0.07680893329699698


 41%|████████████████████████████████████████▉                                                           | 409/1000 [20:21<21:33,  2.19s/it]

Avg f1_micro 0.13090095859044515, Avg f_macro 0.07662113639407034


 41%|█████████████████████████████████████████                                                           | 410/1000 [20:26<30:19,  3.08s/it]

Avg f1_micro 0.13085269066976382, Avg f_macro 0.07655039959218002


 41%|█████████████████████████████████████████                                                           | 411/1000 [20:29<29:47,  3.03s/it]

Avg f1_micro 0.13093982929749354, Avg f_macro 0.07652635158019581


 41%|█████████████████████████████████████████▏                                                          | 412/1000 [20:30<24:22,  2.49s/it]

Avg f1_micro 0.13143107566651255, Avg f_macro 0.07682604490160311


 41%|█████████████████████████████████████████▎                                                          | 413/1000 [20:36<33:55,  3.47s/it]

Avg f1_micro 0.13111284061647258, Avg f_macro 0.07664002542242247


 41%|█████████████████████████████████████████▍                                                          | 414/1000 [20:39<32:15,  3.30s/it]

Avg f1_micro 0.13079614293382408, Avg f_macro 0.07645490458806879


 42%|█████████████████████████████████████████▌                                                          | 415/1000 [20:42<31:01,  3.18s/it]

Avg f1_micro 0.13048097150506788, Avg f_macro 0.07627067590231441


 42%|█████████████████████████████████████████▌                                                          | 416/1000 [20:45<31:36,  3.25s/it]

Avg f1_micro 0.13051072191697194, Avg f_macro 0.07623302057708303


 42%|█████████████████████████████████████████▋                                                          | 417/1000 [20:48<32:02,  3.30s/it]

Avg f1_micro 0.13054032964104909, Avg f_macro 0.07623467538846432


 42%|█████████████████████████████████████████▊                                                          | 418/1000 [20:51<30:55,  3.19s/it]

Avg f1_micro 0.13022803220171641, Avg f_macro 0.07605229578227181


 42%|█████████████████████████████████████████▉                                                          | 419/1000 [20:54<29:26,  3.04s/it]

Avg f1_micro 0.13031499791642992, Avg f_macro 0.07613596837255544


 42%|██████████████████████████████████████████                                                          | 420/1000 [20:55<23:46,  2.46s/it]

Avg f1_micro 0.13000472411186698, Avg f_macro 0.07595469225738269


 42%|██████████████████████████████████████████                                                          | 421/1000 [21:02<36:53,  3.82s/it]

Avg f1_micro 0.1301277964579627, Avg f_macro 0.07598263668965877


 42%|██████████████████████████████████████████▏                                                         | 422/1000 [21:04<31:56,  3.32s/it]

Avg f1_micro 0.12981943675071636, Avg f_macro 0.07580258304821408


 42%|██████████████████████████████████████████▎                                                         | 423/1000 [21:07<31:28,  3.27s/it]

Avg f1_micro 0.1295125350089889, Avg f_macro 0.07562338072422303


 42%|██████████████████████████████████████████▍                                                         | 424/1000 [21:11<31:50,  3.32s/it]

Avg f1_micro 0.12954400814070627, Avg f_macro 0.07557605094788183


 42%|██████████████████████████████████████████▌                                                         | 425/1000 [21:13<29:19,  3.06s/it]

Avg f1_micro 0.12970978694508106, Avg f_macro 0.07565966285414825


 43%|██████████████████████████████████████████▌                                                         | 426/1000 [21:16<28:01,  2.93s/it]

Avg f1_micro 0.1303442710132851, Avg f_macro 0.07606891247186151


 43%|██████████████████████████████████████████▋                                                         | 427/1000 [21:18<24:11,  2.53s/it]

Avg f1_micro 0.13062449520294955, Avg f_macro 0.07622532518939146


 43%|██████████████████████████████████████████▊                                                         | 428/1000 [21:19<21:09,  2.22s/it]

Avg f1_micro 0.13031929778425105, Avg f_macro 0.07604722863521064


 43%|██████████████████████████████████████████▉                                                         | 429/1000 [21:22<23:13,  2.44s/it]

Avg f1_micro 0.1300155231973414, Avg f_macro 0.07586996236799569


 43%|███████████████████████████████████████████                                                         | 430/1000 [21:24<23:15,  2.45s/it]

Avg f1_micro 0.13017827779455687, Avg f_macro 0.07595191852786341


 43%|███████████████████████████████████████████                                                         | 431/1000 [21:28<27:13,  2.87s/it]

Avg f1_micro 0.1302076951148877, Avg f_macro 0.07590459517989981


 43%|███████████████████████████████████████████▏                                                        | 432/1000 [21:31<27:21,  2.89s/it]

Avg f1_micro 0.13029209088236868, Avg f_macro 0.07593932780890257


 43%|███████████████████████████████████████████▎                                                        | 433/1000 [21:35<31:10,  3.30s/it]

Avg f1_micro 0.13032110947815337, Avg f_macro 0.07589225212240523


 43%|███████████████████████████████████████████▍                                                        | 434/1000 [21:38<27:47,  2.95s/it]

Avg f1_micro 0.1305968672904157, Avg f_macro 0.076046549105665


 44%|███████████████████████████████████████████▌                                                        | 435/1000 [21:39<24:36,  2.61s/it]

Avg f1_micro 0.13029664460698945, Avg f_macro 0.07587172945254853


 44%|███████████████████████████████████████████▌                                                        | 436/1000 [21:40<19:50,  2.11s/it]

Avg f1_micro 0.1299977990918358, Avg f_macro 0.07569771172444634


 44%|███████████████████████████████████████████▋                                                        | 437/1000 [21:45<26:17,  2.80s/it]

Avg f1_micro 0.12998636248064166, Avg f_macro 0.07568794252468461


 44%|███████████████████████████████████████████▊                                                        | 438/1000 [21:48<28:41,  3.06s/it]

Avg f1_micro 0.1306680635447759, Avg f_macro 0.07597176000750497


 44%|███████████████████████████████████████████▉                                                        | 439/1000 [21:51<27:25,  2.93s/it]

Avg f1_micro 0.13082599506289713, Avg f_macro 0.07605180408746763


 44%|████████████████████████████████████████████                                                        | 440/1000 [21:56<33:40,  3.61s/it]

Avg f1_micro 0.13078118850846124, Avg f_macro 0.0759736560478749


 44%|████████████████████████████████████████████                                                        | 441/1000 [21:59<32:21,  3.47s/it]

Avg f1_micro 0.13048463252544887, Avg f_macro 0.07580138018382077


 44%|████████████████████████████████████████████▏                                                       | 442/1000 [22:02<29:27,  3.17s/it]

Avg f1_micro 0.13064190711249535, Avg f_macro 0.07588126645288704


 44%|████████████████████████████████████████████▎                                                       | 443/1000 [22:04<27:22,  2.95s/it]

Avg f1_micro 0.13034700438763644, Avg f_macro 0.07570997691236134


 44%|████████████████████████████████████████████▍                                                       | 444/1000 [22:09<30:42,  3.31s/it]

Avg f1_micro 0.13033496158496158, Avg f_macro 0.07571270911959267


 44%|████████████████████████████████████████████▌                                                       | 445/1000 [22:11<28:56,  3.13s/it]

Avg f1_micro 0.1304166058660441, Avg f_macro 0.07579225609036012


 45%|████████████████████████████████████████████▌                                                       | 446/1000 [22:14<27:00,  2.92s/it]

Avg f1_micro 0.13012419195154623, Avg f_macro 0.07562231829643555


 45%|████████████████████████████████████████████▋                                                       | 447/1000 [22:15<23:54,  2.59s/it]

Avg f1_micro 0.13039237049304164, Avg f_macro 0.0758259969281363


 45%|████████████████████████████████████████████▊                                                       | 448/1000 [22:18<24:45,  2.69s/it]

Avg f1_micro 0.13010131609461967, Avg f_macro 0.07565674247070742


 45%|████████████████████████████████████████████▉                                                       | 449/1000 [22:25<34:53,  3.80s/it]

Avg f1_micro 0.13003427530153588, Avg f_macro 0.07561925201846034


 45%|█████████████████████████████████████████████                                                       | 450/1000 [22:26<27:53,  3.04s/it]

Avg f1_micro 0.13048605098605098, Avg f_macro 0.07582157960656745


 45%|█████████████████████████████████████████████                                                       | 451/1000 [22:29<28:31,  3.12s/it]

Avg f1_micro 0.1305662740806865, Avg f_macro 0.07585503306843558


 45%|█████████████████████████████████████████████▏                                                      | 452/1000 [22:32<26:07,  2.86s/it]

Avg f1_micro 0.13027741064245488, Avg f_macro 0.07568721219881515


 45%|█████████████████████████████████████████████▎                                                      | 453/1000 [22:35<26:16,  2.88s/it]

Avg f1_micro 0.13035774012595205, Avg f_macro 0.07574088281206279


 45%|█████████████████████████████████████████████▍                                                      | 454/1000 [22:37<25:00,  2.75s/it]

Avg f1_micro 0.13095166580849402, Avg f_macro 0.07612471346666176


 46%|█████████████████████████████████████████████▌                                                      | 455/1000 [22:39<23:14,  2.56s/it]

Avg f1_micro 0.13176276104847534, Avg f_macro 0.07669000713669842


 46%|█████████████████████████████████████████████▌                                                      | 456/1000 [22:41<21:34,  2.38s/it]

Avg f1_micro 0.1320220532391585, Avg f_macro 0.07688732437250974


 46%|█████████████████████████████████████████████▋                                                      | 457/1000 [22:43<19:25,  2.15s/it]

Avg f1_micro 0.1331919539249955, Avg f_macro 0.07781317267804036


 46%|█████████████████████████████████████████████▊                                                      | 458/1000 [22:45<20:11,  2.23s/it]

Avg f1_micro 0.13290114179852172, Avg f_macro 0.0776432749211014


 46%|█████████████████████████████████████████████▉                                                      | 459/1000 [22:47<20:13,  2.24s/it]

Avg f1_micro 0.13304732667477767, Avg f_macro 0.07771618959689663


 46%|██████████████████████████████████████████████                                                      | 460/1000 [22:49<19:48,  2.20s/it]

Avg f1_micro 0.13275809335591945, Avg f_macro 0.07754724135864252


 46%|██████████████████████████████████████████████                                                      | 461/1000 [22:53<22:17,  2.48s/it]

Avg f1_micro 0.1331931806443737, Avg f_macro 0.07792132543378646


 46%|██████████████████████████████████████████████▏                                                     | 462/1000 [22:58<30:03,  3.35s/it]

Avg f1_micro 0.13290488371657203, Avg f_macro 0.07775266455622415


 46%|██████████████████████████████████████████████▎                                                     | 463/1000 [23:02<30:52,  3.45s/it]

Avg f1_micro 0.13292637887670286, Avg f_macro 0.07776471783652028


 46%|██████████████████████████████████████████████▍                                                     | 464/1000 [23:02<23:34,  2.64s/it]

Avg f1_micro 0.13371748581877893, Avg f_macro 0.07831551226647032


 46%|██████████████████████████████████████████████▌                                                     | 465/1000 [23:04<19:53,  2.23s/it]

Avg f1_micro 0.13414676721128335, Avg f_macro 0.078577199336865


 47%|██████████████████████████████████████████████▌                                                     | 466/1000 [23:06<19:09,  2.15s/it]

Avg f1_micro 0.1338588986121175, Avg f_macro 0.07840857873742967


 47%|██████████████████████████████████████████████▋                                                     | 467/1000 [23:09<23:11,  2.61s/it]

Avg f1_micro 0.1335722628549181, Avg f_macro 0.07824068028188913


 47%|██████████████████████████████████████████████▊                                                     | 468/1000 [23:12<24:34,  2.77s/it]

Avg f1_micro 0.13328685203685203, Avg f_macro 0.07807349934111586


 47%|██████████████████████████████████████████████▉                                                     | 469/1000 [23:15<22:42,  2.57s/it]

Avg f1_micro 0.13353570736299947, Avg f_macro 0.07821163077718415


 47%|███████████████████████████████████████████████                                                     | 470/1000 [23:17<22:45,  2.58s/it]

Avg f1_micro 0.13325158883669522, Avg f_macro 0.07804522305212631


 47%|███████████████████████████████████████████████                                                     | 471/1000 [23:20<24:01,  2.72s/it]

Avg f1_micro 0.13296867675848567, Avg f_macro 0.07787952194161225


 47%|███████████████████████████████████████████████▏                                                    | 472/1000 [23:23<23:42,  2.69s/it]

Avg f1_micro 0.13268696346026856, Avg f_macro 0.07771452295444782


 47%|███████████████████████████████████████████████▎                                                    | 473/1000 [23:27<26:11,  2.98s/it]

Avg f1_micro 0.13240644133878807, Avg f_macro 0.07755022163741938


 47%|███████████████████████████████████████████████▍                                                    | 474/1000 [23:30<27:56,  3.19s/it]

Avg f1_micro 0.13212710285495097, Avg f_macro 0.07738661357489318


 48%|███████████████████████████████████████████████▌                                                    | 475/1000 [23:32<23:40,  2.71s/it]

Avg f1_micro 0.13237525632262476, Avg f_macro 0.07752444626811897


 48%|███████████████████████████████████████████████▌                                                    | 476/1000 [23:33<20:52,  2.39s/it]

Avg f1_micro 0.13209715704463604, Avg f_macro 0.07736157978436241


 48%|███████████████████████████████████████████████▋                                                    | 477/1000 [23:34<16:25,  1.89s/it]

Avg f1_micro 0.13182022380135588, Avg f_macro 0.07719939617894446


 48%|███████████████████████████████████████████████▊                                                    | 478/1000 [23:38<22:03,  2.53s/it]

Avg f1_micro 0.13244104222137695, Avg f_macro 0.0774563012078588


 48%|███████████████████████████████████████████████▉                                                    | 479/1000 [23:40<20:30,  2.36s/it]

Avg f1_micro 0.1321645473524388, Avg f_macro 0.07729459702997184


 48%|████████████████████████████████████████████████                                                    | 480/1000 [23:43<22:29,  2.59s/it]

Avg f1_micro 0.13188920454545455, Avg f_macro 0.07713356661949274


 48%|████████████████████████████████████████████████                                                    | 481/1000 [23:45<20:50,  2.41s/it]

Avg f1_micro 0.13213475713475714, Avg f_macro 0.07727020607113025


 48%|████████████████████████████████████████████████▏                                                   | 482/1000 [23:48<20:24,  2.36s/it]

Avg f1_micro 0.13227555639381366, Avg f_macro 0.07734041541768623


 48%|████████████████████████████████████████████████▎                                                   | 483/1000 [23:52<24:37,  2.86s/it]

Avg f1_micro 0.1322974644403216, Avg f_macro 0.07736850791352766


 48%|████████████████████████████████████████████████▍                                                   | 484/1000 [23:58<33:55,  3.94s/it]

Avg f1_micro 0.13202412257164325, Avg f_macro 0.07720865562445012


 48%|████████████████████████████████████████████████▌                                                   | 485/1000 [24:00<30:01,  3.50s/it]

Avg f1_micro 0.13175190788592853, Avg f_macro 0.0770494625200698


 49%|████████████████████████████████████████████████▌                                                   | 486/1000 [24:03<28:35,  3.34s/it]

Avg f1_micro 0.1321666844814993, Avg f_macro 0.07734817190217298


 49%|████████████████████████████████████████████████▋                                                   | 487/1000 [24:07<28:25,  3.32s/it]

Avg f1_micro 0.13189529498564406, Avg f_macro 0.0771893460871788


 49%|████████████████████████████████████████████████▊                                                   | 488/1000 [24:08<23:41,  2.78s/it]

Avg f1_micro 0.13162501774182103, Avg f_macro 0.07703117119765589


 49%|████████████████████████████████████████████████▉                                                   | 489/1000 [24:11<24:06,  2.83s/it]

Avg f1_micro 0.1313558459263981, Avg f_macro 0.07687364324019647


 49%|█████████████████████████████████████████████████                                                   | 490/1000 [24:13<22:37,  2.66s/it]

Avg f1_micro 0.1314959360367524, Avg f_macro 0.0769435156236065


 49%|█████████████████████████████████████████████████                                                   | 491/1000 [24:15<20:51,  2.46s/it]

Avg f1_micro 0.13122812353973254, Avg f_macro 0.07678680785247899


 49%|█████████████████████████████████████████████████▏                                                  | 492/1000 [24:16<16:30,  1.95s/it]

Avg f1_micro 0.13096139971139975, Avg f_macro 0.07663073710481136


 49%|█████████████████████████████████████████████████▎                                                  | 493/1000 [24:22<25:08,  2.97s/it]

Avg f1_micro 0.13092113543432002, Avg f_macro 0.07661052600858793


 49%|█████████████████████████████████████████████████▍                                                  | 494/1000 [24:24<24:34,  2.91s/it]

Avg f1_micro 0.13106097119255017, Avg f_macro 0.07668036524968616


 50%|█████████████████████████████████████████████████▌                                                  | 495/1000 [24:26<22:25,  2.66s/it]

Avg f1_micro 0.13120024195781774, Avg f_macro 0.07669380558924907


 50%|█████████████████████████████████████████████████▌                                                  | 496/1000 [24:30<23:34,  2.81s/it]

Avg f1_micro 0.131223743774147, Avg f_macro 0.07666137061952491


 50%|█████████████████████████████████████████████████▋                                                  | 497/1000 [24:32<22:35,  2.69s/it]

Avg f1_micro 0.13136212658345456, Avg f_macro 0.07673068599274742


 50%|█████████████████████████████████████████████████▊                                                  | 498/1000 [24:34<20:42,  2.47s/it]

Avg f1_micro 0.13160035524493358, Avg f_macro 0.07691128033145006


 50%|█████████████████████████████████████████████████▉                                                  | 499/1000 [24:37<21:01,  2.52s/it]

Avg f1_micro 0.13133662707811006, Avg f_macro 0.07675714950914256


 50%|██████████████████████████████████████████████████                                                  | 500/1000 [24:40<22:42,  2.72s/it]

Avg f1_micro 0.13147395382395383, Avg f_macro 0.07677030187679094


 50%|██████████████████████████████████████████████████                                                  | 501/1000 [24:44<25:55,  3.12s/it]

Avg f1_micro 0.1314966747601478, Avg f_macro 0.07677060681700308


 50%|██████████████████████████████████████████████████▏                                                 | 502/1000 [24:46<23:52,  2.88s/it]

Avg f1_micro 0.131732737161024, Avg f_macro 0.07694968263343668


 50%|██████████████████████████████████████████████████▎                                                 | 503/1000 [24:48<20:22,  2.46s/it]

Avg f1_micro 0.13147084305135995, Avg f_macro 0.07679670115702826


 50%|██████████████████████████████████████████████████▍                                                 | 504/1000 [24:50<20:55,  2.53s/it]

Avg f1_micro 0.13187136386541148, Avg f_macro 0.07684273944838337


 50%|██████████████████████████████████████████████████▌                                                 | 505/1000 [24:54<22:58,  2.79s/it]

Avg f1_micro 0.1318931178832169, Avg f_macro 0.07684289853249165


 51%|██████████████████████████████████████████████████▌                                                 | 506/1000 [24:57<25:29,  3.10s/it]

Avg f1_micro 0.1319147859167622, Avg f_macro 0.07685572547873838


 51%|██████████████████████████████████████████████████▋                                                 | 507/1000 [25:00<23:50,  2.90s/it]

Avg f1_micro 0.1320490762798455, Avg f_macro 0.07698590578914943


 51%|██████████████████████████████████████████████████▊                                                 | 508/1000 [25:03<23:05,  2.82s/it]

Avg f1_micro 0.13178913715331037, Avg f_macro 0.07683435873050938


 51%|██████████████████████████████████████████████████▉                                                 | 509/1000 [25:05<22:47,  2.78s/it]

Avg f1_micro 0.13185765882229536, Avg f_macro 0.07690170009078562


 51%|███████████████████████████████████████████████████                                                 | 510/1000 [25:08<22:22,  2.74s/it]

Avg f1_micro 0.13238342811872225, Avg f_macro 0.07724110852198016


 51%|███████████████████████████████████████████████████                                                 | 511/1000 [25:09<18:17,  2.24s/it]

Avg f1_micro 0.13310283432592632, Avg f_macro 0.07774226747464424


 51%|███████████████████████████████████████████████████▏                                                | 512/1000 [25:10<14:46,  1.82s/it]

Avg f1_micro 0.1328428678526335, Avg f_macro 0.07759042710848282


 51%|███████████████████████████████████████████████████▎                                                | 513/1000 [25:11<14:11,  1.75s/it]

Avg f1_micro 0.1330712443285543, Avg f_macro 0.07776406500235844


 51%|███████████████████████████████████████████████████▍                                                | 514/1000 [25:15<18:48,  2.32s/it]

Avg f1_micro 0.1330902830416449, Avg f_macro 0.07777490015475332


 52%|███████████████████████████████████████████████████▌                                                | 515/1000 [25:23<33:30,  4.15s/it]

Avg f1_micro 0.1329936676053181, Avg f_macro 0.07768552371124125


 52%|███████████████████████████████████████████████████▌                                                | 516/1000 [25:30<40:12,  4.99s/it]

Avg f1_micro 0.13273592793941633, Avg f_macro 0.07753497037071559


 52%|███████████████████████████████████████████████████▋                                                | 517/1000 [25:33<34:04,  4.23s/it]

Avg f1_micro 0.13247918533218342, Avg f_macro 0.07738499944156527


 52%|███████████████████████████████████████████████████▊                                                | 518/1000 [25:34<25:39,  3.19s/it]

Avg f1_micro 0.13222343400914832, Avg f_macro 0.07723560755075144


 52%|███████████████████████████████████████████████████▉                                                | 519/1000 [25:36<24:25,  3.05s/it]

Avg f1_micro 0.1322897986192784, Avg f_macro 0.07721524350280522


 52%|████████████████████████████████████████████████████                                                | 520/1000 [25:38<20:20,  2.54s/it]

Avg f1_micro 0.13203539516039517, Avg f_macro 0.07706675264991521


 52%|████████████████████████████████████████████████████                                                | 521/1000 [25:39<17:29,  2.19s/it]

Avg f1_micro 0.1317819682982831, Avg f_macro 0.0769188318194931


 52%|████████████████████████████████████████████████████▏                                               | 522/1000 [25:41<16:33,  2.08s/it]

Avg f1_micro 0.13200843962338216, Avg f_macro 0.07704515042301349


 52%|████████████████████████████████████████████████████▎                                               | 523/1000 [25:43<15:33,  1.96s/it]

Avg f1_micro 0.13271205637362427, Avg f_macro 0.07753518518957245


 52%|████████████████████████████████████████████████████▍                                               | 524/1000 [25:45<16:40,  2.10s/it]

Avg f1_micro 0.13284046847978148, Avg f_macro 0.07759926138407917


 52%|████████████████████████████████████████████████████▌                                               | 525/1000 [25:52<27:14,  3.44s/it]

Avg f1_micro 0.13258743901601047, Avg f_macro 0.07745145326715712


 53%|████████████████████████████████████████████████████▌                                               | 526/1000 [25:54<23:42,  3.00s/it]

Avg f1_micro 0.1323353716414553, Avg f_macro 0.0773042071582842


 53%|████████████████████████████████████████████████████▋                                               | 527/1000 [25:55<19:33,  2.48s/it]

Avg f1_micro 0.13208426087932731, Avg f_macro 0.07715751985817361


 53%|████████████████████████████████████████████████████▊                                               | 528/1000 [25:56<17:34,  2.23s/it]

Avg f1_micro 0.13183410129432857, Avg f_macro 0.07701138819177555


 53%|████████████████████████████████████████████████████▉                                               | 529/1000 [25:59<18:44,  2.39s/it]

Avg f1_micro 0.13196295932590832, Avg f_macro 0.07707584891563063


 53%|█████████████████████████████████████████████████████                                               | 530/1000 [26:00<15:43,  2.01s/it]

Avg f1_micro 0.1323429034278091, Avg f_macro 0.07730778127616718


 53%|█████████████████████████████████████████████████████                                               | 531/1000 [26:03<16:44,  2.14s/it]

Avg f1_micro 0.13247031792229533, Avg f_macro 0.07731912883183038


 53%|█████████████████████████████████████████████████████▏                                              | 532/1000 [26:07<21:57,  2.82s/it]

Avg f1_micro 0.13245627597131357, Avg f_macro 0.0772991054067079


 53%|█████████████████████████████████████████████████████▎                                              | 533/1000 [26:10<21:03,  2.71s/it]

Avg f1_micro 0.13258299965617037, Avg f_macro 0.07736254256562798


 53%|█████████████████████████████████████████████████████▍                                              | 534/1000 [26:13<22:24,  2.88s/it]

Avg f1_micro 0.13264682674795034, Avg f_macro 0.07742574213219255


 54%|█████████████████████████████████████████████████████▌                                              | 535/1000 [26:15<21:22,  2.76s/it]

Avg f1_micro 0.13239888875402894, Avg f_macro 0.07728102111886136


 54%|█████████████████████████████████████████████████████▌                                              | 536/1000 [26:17<18:06,  2.34s/it]

Avg f1_micro 0.13215187590187594, Avg f_macro 0.07713684010931124


 54%|█████████████████████████████████████████████████████▋                                              | 537/1000 [26:19<17:12,  2.23s/it]

Avg f1_micro 0.1323713323713324, Avg f_macro 0.07730356231891526


 54%|█████████████████████████████████████████████████████▊                                              | 538/1000 [26:20<13:55,  1.81s/it]

Avg f1_micro 0.13212528900261244, Avg f_macro 0.07715987540010687


 54%|█████████████████████████████████████████████████████▉                                              | 539/1000 [26:20<11:36,  1.51s/it]

Avg f1_micro 0.13188015859629962, Avg f_macro 0.07701672164240723


 54%|██████████████████████████████████████████████████████                                              | 540/1000 [26:22<11:16,  1.47s/it]

Avg f1_micro 0.13163593608038054, Avg f_macro 0.07687409808381018


 54%|██████████████████████████████████████████████████████                                              | 541/1000 [26:24<12:26,  1.63s/it]

Avg f1_micro 0.1313926164203429, Avg f_macro 0.07673200178420979


 54%|██████████████████████████████████████████████████████▏                                             | 542/1000 [26:29<19:42,  2.58s/it]

Avg f1_micro 0.13115019461882935, Avg f_macro 0.07659042982519833


 54%|██████████████████████████████████████████████████████▎                                             | 543/1000 [26:31<19:21,  2.54s/it]

Avg f1_micro 0.13127698984052577, Avg f_macro 0.07665400382388325


 54%|██████████████████████████████████████████████████████▍                                             | 544/1000 [26:33<17:18,  2.28s/it]

Avg f1_micro 0.13103567184449538, Avg f_macro 0.07651309572861877


 55%|██████████████████████████████████████████████████████▌                                             | 545/1000 [26:35<16:34,  2.19s/it]

Avg f1_micro 0.13125395501542292, Avg f_macro 0.07663482792518486


 55%|██████████████████████████████████████████████████████▌                                             | 546/1000 [26:36<15:41,  2.07s/it]

Avg f1_micro 0.13147143861429578, Avg f_macro 0.07675611421626904


 55%|██████████████████████████████████████████████████████▋                                             | 547/1000 [26:38<14:42,  1.95s/it]

Avg f1_micro 0.1321451654175603, Avg f_macro 0.0772251767740699


 55%|██████████████████████████████████████████████████████▊                                             | 548/1000 [26:40<15:01,  1.99s/it]

Avg f1_micro 0.13190402460475453, Avg f_macro 0.07708425491864276


 55%|██████████████████████████████████████████████████████▉                                             | 549/1000 [26:42<15:15,  2.03s/it]

Avg f1_micro 0.13166376226485518, Avg f_macro 0.07694384643973813


 55%|███████████████████████████████████████████████████████                                             | 550/1000 [26:45<17:42,  2.36s/it]

Avg f1_micro 0.1320304342122524, Avg f_macro 0.07720798894116081


 55%|███████████████████████████████████████████████████████                                             | 551/1000 [26:48<18:11,  2.43s/it]

Avg f1_micro 0.1325167673625024, Avg f_macro 0.07732713441106279


 55%|███████████████████████████████████████████████████████▏                                            | 552/1000 [26:51<18:10,  2.43s/it]

Avg f1_micro 0.13263901959554136, Avg f_macro 0.07738833726740343


 55%|███████████████████████████████████████████████████████▎                                            | 553/1000 [26:53<18:33,  2.49s/it]

Avg f1_micro 0.13276082968668865, Avg f_macro 0.07744931877525825


 55%|███████████████████████████████████████████████████████▍                                            | 554/1000 [26:56<19:57,  2.68s/it]

Avg f1_micro 0.1325211891998896, Avg f_macro 0.07730951856086248


 56%|███████████████████████████████████████████████████████▌                                            | 555/1000 [26:58<17:14,  2.32s/it]

Avg f1_micro 0.1328830128830129, Avg f_macro 0.07753058249138345


 56%|███████████████████████████████████████████████████████▌                                            | 556/1000 [27:00<17:51,  2.41s/it]

Avg f1_micro 0.133003726888619, Avg f_macro 0.0776159591415788


 56%|███████████████████████████████████████████████████████▋                                            | 557/1000 [27:03<17:52,  2.42s/it]

Avg f1_micro 0.13312400745075792, Avg f_macro 0.07767609406432482


 56%|███████████████████████████████████████████████████████▊                                            | 558/1000 [27:05<17:51,  2.42s/it]

Avg f1_micro 0.1332438568997709, Avg f_macro 0.07773601344971333


 56%|███████████████████████████████████████████████████████▉                                            | 559/1000 [27:07<17:26,  2.37s/it]

Avg f1_micro 0.13336327754932406, Avg f_macro 0.07782056440955284


 56%|████████████████████████████████████████████████████████                                            | 560/1000 [27:08<13:50,  1.89s/it]

Avg f1_micro 0.13401798598227171, Avg f_macro 0.07827683721120245


 56%|████████████████████████████████████████████████████████                                            | 561/1000 [27:10<14:35,  1.99s/it]

Avg f1_micro 0.13377909474166158, Avg f_macro 0.07813730630708267


 56%|████████████████████████████████████████████████████████▏                                           | 562/1000 [27:13<16:37,  2.28s/it]

Avg f1_micro 0.13383761355291607, Avg f_macro 0.07816003190245989


 56%|████████████████████████████████████████████████████████▎                                           | 563/1000 [27:16<16:59,  2.33s/it]

Avg f1_micro 0.1339551311132128, Avg f_macro 0.07824322900387648


 56%|████████████████████████████████████████████████████████▍                                           | 564/1000 [27:18<15:29,  2.13s/it]

Avg f1_micro 0.13416088442684188, Avg f_macro 0.07835779268092129


 56%|████████████████████████████████████████████████████████▍                                           | 565/1000 [27:22<19:30,  2.69s/it]

Avg f1_micro 0.1341762760346831, Avg f_macro 0.07835021087807731


 57%|████████████████████████████████████████████████████████▌                                           | 566/1000 [27:25<21:02,  2.91s/it]

Avg f1_micro 0.1341916132552175, Avg f_macro 0.07837239971205436


 57%|████████████████████████████████████████████████████████▋                                           | 567/1000 [27:27<19:09,  2.65s/it]

Avg f1_micro 0.13395494374330355, Avg f_macro 0.07823417678487261


 57%|████████████████████████████████████████████████████████▊                                           | 568/1000 [27:29<17:16,  2.40s/it]

Avg f1_micro 0.1341592484198118, Avg f_macro 0.07838986778818562


 57%|████████████████████████████████████████████████████████▉                                           | 569/1000 [27:31<17:17,  2.41s/it]

Avg f1_micro 0.13427496151573481, Avg f_macro 0.07844737436696055


 57%|████████████████████████████████████████████████████████▉                                           | 570/1000 [27:33<16:19,  2.28s/it]

Avg f1_micro 0.13439026860079492, Avg f_macro 0.07850467916826608


 57%|█████████████████████████████████████████████████████████                                           | 571/1000 [27:35<14:20,  2.01s/it]

Avg f1_micro 0.13415490911112626, Avg f_macro 0.07836719286499415


 57%|█████████████████████████████████████████████████████████▏                                          | 572/1000 [27:37<15:16,  2.14s/it]

Avg f1_micro 0.1339203725567362, Avg f_macro 0.07823018728306234


 57%|█████████████████████████████████████████████████████████▎                                          | 573/1000 [27:40<16:14,  2.28s/it]

Avg f1_micro 0.13368665462906298, Avg f_macro 0.07809365990560499


 57%|█████████████████████████████████████████████████████████▍                                          | 574/1000 [27:42<16:54,  2.38s/it]

Avg f1_micro 0.133802183105319, Avg f_macro 0.07817537826813878


 57%|█████████████████████████████████████████████████████████▍                                          | 575/1000 [27:45<17:01,  2.40s/it]

Avg f1_micro 0.1339173097433967, Avg f_macro 0.07823265780351786


 58%|█████████████████████████████████████████████████████████▌                                          | 576/1000 [27:46<15:25,  2.18s/it]

Avg f1_micro 0.13455286996953664, Avg f_macro 0.07867554092075711


 58%|█████████████████████████████████████████████████████████▋                                          | 577/1000 [27:48<14:35,  2.07s/it]

Avg f1_micro 0.13475295165069862, Avg f_macro 0.07878677419967633


 58%|█████████████████████████████████████████████████████████▊                                          | 578/1000 [27:50<14:17,  2.03s/it]

Avg f1_micro 0.1353848669592614, Avg f_macro 0.0792271661704958


 58%|█████████████████████████████████████████████████████████▉                                          | 579/1000 [27:57<23:29,  3.35s/it]

Avg f1_micro 0.13515104162772557, Avg f_macro 0.07909033168660894


 58%|█████████████████████████████████████████████████████████▉                                          | 580/1000 [28:00<23:00,  3.29s/it]

Avg f1_micro 0.13520537891227544, Avg f_macro 0.0791263828388734


 58%|██████████████████████████████████████████████████████████                                          | 581/1000 [28:05<27:58,  4.01s/it]

Avg f1_micro 0.13497266741672936, Avg f_macro 0.07899019285119892


 58%|██████████████████████████████████████████████████████████▏                                         | 582/1000 [28:10<29:06,  4.18s/it]

Avg f1_micro 0.13474075561704427, Avg f_macro 0.07885447087035494


 58%|██████████████████████████████████████████████████████████▎                                         | 583/1000 [28:11<22:58,  3.31s/it]

Avg f1_micro 0.1345096393981471, Avg f_macro 0.07871921448807302


 58%|██████████████████████████████████████████████████████████▍                                         | 584/1000 [28:16<25:45,  3.71s/it]

Avg f1_micro 0.13446957342505286, Avg f_macro 0.07865576834454321


 58%|██████████████████████████████████████████████████████████▌                                         | 585/1000 [28:19<24:28,  3.54s/it]

Avg f1_micro 0.13423971090637757, Avg f_macro 0.07852131403968075


 59%|██████████████████████████████████████████████████████████▌                                         | 586/1000 [28:21<21:28,  3.11s/it]

Avg f1_micro 0.134863875222237, Avg f_macro 0.07895614683711019


 59%|██████████████████████████████████████████████████████████▋                                         | 587/1000 [28:25<22:32,  3.28s/it]

Avg f1_micro 0.13487749237323343, Avg f_macro 0.07895268334492274


 59%|██████████████████████████████████████████████████████████▊                                         | 588/1000 [28:28<23:16,  3.39s/it]

Avg f1_micro 0.13489106320738975, Avg f_macro 0.07896013342993705


 59%|██████████████████████████████████████████████████████████▉                                         | 589/1000 [28:30<20:17,  2.96s/it]

Avg f1_micro 0.13551094255678298, Avg f_macro 0.07939200643486641


 59%|███████████████████████████████████████████████████████████                                         | 590/1000 [28:36<25:21,  3.71s/it]

Avg f1_micro 0.1352812629931274, Avg f_macro 0.07925744371209545


 59%|███████████████████████████████████████████████████████████                                         | 591/1000 [28:38<21:08,  3.10s/it]

Avg f1_micro 0.13505236068687845, Avg f_macro 0.0791233363623288


 59%|███████████████████████████████████████████████████████████▏                                        | 592/1000 [28:40<19:44,  2.90s/it]

Avg f1_micro 0.13516206953706955, Avg f_macro 0.07913044784369874


 59%|███████████████████████████████████████████████████████████▎                                        | 593/1000 [28:41<15:21,  2.26s/it]

Avg f1_micro 0.13577731056651798, Avg f_macro 0.07955912050051095


 59%|███████████████████████████████████████████████████████████▍                                        | 594/1000 [28:43<16:03,  2.37s/it]

Avg f1_micro 0.13588542957229827, Avg f_macro 0.07963562029764813


 60%|███████████████████████████████████████████████████████████▌                                        | 595/1000 [28:46<17:10,  2.54s/it]

Avg f1_micro 0.13593716274388545, Avg f_macro 0.07965456730707912


 60%|███████████████████████████████████████████████████████████▌                                        | 596/1000 [28:48<14:48,  2.20s/it]

Avg f1_micro 0.13570908025606013, Avg f_macro 0.07952091870421489


 60%|███████████████████████████████████████████████████████████▋                                        | 597/1000 [28:50<14:47,  2.20s/it]

Avg f1_micro 0.1363192828016949, Avg f_macro 0.07994606512737924


 60%|███████████████████████████████████████████████████████████▊                                        | 598/1000 [28:53<17:15,  2.58s/it]

Avg f1_micro 0.13637003093524833, Avg f_macro 0.08002140615559433


 60%|███████████████████████████████████████████████████████████▉                                        | 599/1000 [28:56<17:33,  2.63s/it]

Avg f1_micro 0.13642060962595187, Avg f_macro 0.08001147738751166


 60%|████████████████████████████████████████████████████████████                                        | 600/1000 [28:58<16:11,  2.43s/it]

Avg f1_micro 0.13660990860990863, Avg f_macro 0.08015590270297691


 60%|████████████████████████████████████████████████████████████                                        | 601/1000 [29:00<15:32,  2.34s/it]

Avg f1_micro 0.13721455102486718, Avg f_macro 0.08057716298688766


 60%|████████████████████████████████████████████████████████████▏                                       | 602/1000 [29:01<12:17,  1.85s/it]

Avg f1_micro 0.13698661987698532, Avg f_macro 0.08044331387893602


 60%|████████████████████████████████████████████████████████████▎                                       | 603/1000 [29:04<13:47,  2.08s/it]

Avg f1_micro 0.13675944471964374, Avg f_macro 0.08030990871495769


 60%|████████████████████████████████████████████████████████████▍                                       | 604/1000 [29:06<14:28,  2.19s/it]

Avg f1_micro 0.13653302179792248, Avg f_macro 0.08017694528993292


 60%|████████████████████████████████████████████████████████████▌                                       | 605/1000 [29:08<14:01,  2.13s/it]

Avg f1_micro 0.13672057052222342, Avg f_macro 0.08031990350708455


 61%|████████████████████████████████████████████████████████████▌                                       | 606/1000 [29:11<15:35,  2.37s/it]

Avg f1_micro 0.1364949590197115, Avg f_macro 0.08018736241218836


 61%|████████████████████████████████████████████████████████████▋                                       | 607/1000 [29:14<17:04,  2.61s/it]

Avg f1_micro 0.136544665292606, Avg f_macro 0.08022000267180586


 61%|████████████████████████████████████████████████████████████▊                                       | 608/1000 [29:19<20:53,  3.20s/it]

Avg f1_micro 0.13632008525100633, Avg f_macro 0.08008806187793775


 61%|████████████████████████████████████████████████████████████▉                                       | 609/1000 [29:21<18:43,  2.87s/it]

Avg f1_micro 0.13650675177768776, Avg f_macro 0.08019113097642577


 61%|█████████████████████████████████████████████████████████████                                       | 610/1000 [29:23<17:51,  2.75s/it]

Avg f1_micro 0.13628297021739647, Avg f_macro 0.0800596701059726


 61%|█████████████████████████████████████████████████████████████                                       | 611/1000 [29:26<18:12,  2.81s/it]

Avg f1_micro 0.13660547490334726, Avg f_macro 0.08033780485211668


 61%|█████████████████████████████████████████████████████████████▏                                      | 612/1000 [29:29<17:28,  2.70s/it]

Avg f1_micro 0.13638226334304768, Avg f_macro 0.08020653392915571


 61%|█████████████████████████████████████████████████████████████▎                                      | 613/1000 [29:31<15:46,  2.45s/it]

Avg f1_micro 0.13697544072747989, Avg f_macro 0.0806194650864219


 61%|█████████████████████████████████████████████████████████████▍                                      | 614/1000 [29:33<16:42,  2.60s/it]

Avg f1_micro 0.13675235369046446, Avg f_macro 0.08048816302602056


 62%|█████████████████████████████████████████████████████████████▌                                      | 615/1000 [29:36<16:47,  2.62s/it]

Avg f1_micro 0.13718039864381326, Avg f_macro 0.08076379202923029


 62%|█████████████████████████████████████████████████████████████▌                                      | 616/1000 [29:44<25:53,  4.05s/it]

Avg f1_micro 0.1369577031914694, Avg f_macro 0.08063268197723479


 62%|█████████████████████████████████████████████████████████████▋                                      | 617/1000 [29:45<21:19,  3.34s/it]

Avg f1_micro 0.13714091599018666, Avg f_macro 0.08073353199486835


 62%|█████████████████████████████████████████████████████████████▊                                      | 618/1000 [29:47<18:04,  2.84s/it]

Avg f1_micro 0.13772806661156176, Avg f_macro 0.08114226953748722


 62%|█████████████████████████████████████████████████████████████▉                                      | 619/1000 [29:49<15:48,  2.49s/it]

Avg f1_micro 0.13750556569619574, Avg f_macro 0.08101118348007609


 62%|██████████████████████████████████████████████████████████████                                      | 620/1000 [29:52<16:58,  2.68s/it]

Avg f1_micro 0.1375525997300191, Avg f_macro 0.08104181060349534


 62%|██████████████████████████████████████████████████████████████                                      | 621/1000 [29:55<18:47,  2.97s/it]

Avg f1_micro 0.1373310979591173, Avg f_macro 0.08091130849302272


 62%|██████████████████████████████████████████████████████████████▏                                     | 622/1000 [30:00<22:22,  3.55s/it]

Avg f1_micro 0.13711030841255922, Avg f_macro 0.0807812260034841


 62%|██████████████████████████████████████████████████████████████▎                                     | 623/1000 [30:03<20:12,  3.22s/it]

Avg f1_micro 0.1372112549480126, Avg f_macro 0.08088086631946108


 62%|██████████████████████████████████████████████████████████████▍                                     | 624/1000 [30:05<17:47,  2.84s/it]

Avg f1_micro 0.13739200614200614, Avg f_macro 0.08098018727545095


 62%|██████████████████████████████████████████████████████████████▌                                     | 625/1000 [30:09<20:16,  3.24s/it]

Avg f1_micro 0.13717217893217895, Avg f_macro 0.08085061897581024


 63%|██████████████████████████████████████████████████████████████▌                                     | 626/1000 [30:12<20:32,  3.30s/it]

Avg f1_micro 0.13718126034419964, Avg f_macro 0.080844344946972


 63%|██████████████████████████████████████████████████████████████▋                                     | 627/1000 [30:15<18:53,  3.04s/it]

Avg f1_micro 0.1372814497216411, Avg f_macro 0.08091476863924157


 63%|██████████████████████████████████████████████████████████████▊                                     | 628/1000 [30:17<18:04,  2.91s/it]

Avg f1_micro 0.1370628486870525, Avg f_macro 0.08078592346624916


 63%|██████████████████████████████████████████████████████████████▉                                     | 629/1000 [30:20<18:01,  2.92s/it]

Avg f1_micro 0.13684494272729567, Avg f_macro 0.08065748797584177


 63%|███████████████████████████████████████████████████████████████                                     | 630/1000 [30:21<14:55,  2.42s/it]

Avg f1_micro 0.13662772853249044, Avg f_macro 0.08052946021714995


 63%|███████████████████████████████████████████████████████████████                                     | 631/1000 [30:23<13:31,  2.20s/it]

Avg f1_micro 0.13680739932720917, Avg f_macro 0.08062823625936864


 63%|███████████████████████████████████████████████████████████████▏                                    | 632/1000 [30:26<13:59,  2.28s/it]

Avg f1_micro 0.13690738761941296, Avg f_macro 0.08067646865628596


 63%|███████████████████████████████████████████████████████████████▎                                    | 633/1000 [30:30<17:24,  2.84s/it]

Avg f1_micro 0.13688857658051973, Avg f_macro 0.08066185902401468


 63%|███████████████████████████████████████████████████████████████▍                                    | 634/1000 [30:32<16:57,  2.78s/it]

Avg f1_micro 0.13667266399916242, Avg f_macro 0.08053463211703674


 64%|███████████████████████████████████████████████████████████████▌                                    | 635/1000 [30:34<14:04,  2.31s/it]

Avg f1_micro 0.13645743145743147, Avg f_macro 0.08040780592472645


 64%|███████████████████████████████████████████████████████████████▌                                    | 636/1000 [30:35<12:52,  2.12s/it]

Avg f1_micro 0.13663595750859903, Avg f_macro 0.0805434330642578


 64%|███████████████████████████████████████████████████████████████▋                                    | 637/1000 [30:39<16:03,  2.65s/it]

Avg f1_micro 0.1364214583602339, Avg f_macro 0.08041699125410984


 64%|███████████████████████████████████████████████████████████████▊                                    | 638/1000 [30:42<15:57,  2.64s/it]

Avg f1_micro 0.1365211112468166, Avg f_macro 0.08051485983029012


 64%|███████████████████████████████████████████████████████████████▉                                    | 639/1000 [30:44<14:54,  2.48s/it]

Avg f1_micro 0.13630746318539746, Avg f_macro 0.08038885848470281


 64%|████████████████████████████████████████████████████████████████                                    | 640/1000 [30:46<14:47,  2.46s/it]

Avg f1_micro 0.13609448277417027, Avg f_macro 0.08026325089332047


 64%|████████████████████████████████████████████████████████████████                                    | 641/1000 [30:52<20:37,  3.45s/it]

Avg f1_micro 0.13588216688840712, Avg f_macro 0.0801380352132997


 64%|████████████████████████████████████████████████████████████████▏                                   | 642/1000 [30:53<15:45,  2.64s/it]

Avg f1_micro 0.13567051242284886, Avg f_macro 0.08001320961327897


 64%|████████████████████████████████████████████████████████████████▎                                   | 643/1000 [30:55<14:34,  2.45s/it]

Avg f1_micro 0.13584831877988954, Avg f_macro 0.08014797393218005


 64%|████████████████████████████████████████████████████████████████▍                                   | 644/1000 [30:59<17:24,  2.93s/it]

Avg f1_micro 0.13585920204709023, Avg f_macro 0.08012704022524601


 64%|████████████████████████████████████████████████████████████████▌                                   | 645/1000 [31:02<16:59,  2.87s/it]

Avg f1_micro 0.13590696555812834, Avg f_macro 0.08010617142903118


 65%|████████████████████████████████████████████████████████████████▌                                   | 646/1000 [31:06<18:45,  3.18s/it]

Avg f1_micro 0.13589008171051514, Avg f_macro 0.08010124403815508


 65%|████████████████████████████████████████████████████████████████▋                                   | 647/1000 [31:08<18:14,  3.10s/it]

Avg f1_micro 0.13593764984800533, Avg f_macro 0.08013199945695236


 65%|████████████████████████████████████████████████████████████████▊                                   | 648/1000 [31:10<15:33,  2.65s/it]

Avg f1_micro 0.13572786952416582, Avg f_macro 0.08000833896396324


 65%|████████████████████████████████████████████████████████████████▉                                   | 649/1000 [31:11<13:04,  2.24s/it]

Avg f1_micro 0.13551873567281889, Avg f_macro 0.07988505955107578


 65%|█████████████████████████████████████████████████████████████████                                   | 650/1000 [31:14<13:56,  2.39s/it]

Avg f1_micro 0.13531024531024533, Avg f_macro 0.07976215945945873


 65%|█████████████████████████████████████████████████████████████████                                   | 651/1000 [31:18<17:10,  2.95s/it]

Avg f1_micro 0.13532183808681503, Avg f_macro 0.07979324677211702


 65%|█████████████████████████████████████████████████████████████████▏                                  | 652/1000 [31:20<15:39,  2.70s/it]

Avg f1_micro 0.13549772483821562, Avg f_macro 0.07992648821367307


 65%|█████████████████████████████████████████████████████████████████▎                                  | 653/1000 [31:21<12:15,  2.12s/it]

Avg f1_micro 0.13529022449389982, Avg f_macro 0.07980408930369808


 65%|█████████████████████████████████████████████████████████████████▍                                  | 654/1000 [31:22<09:18,  1.61s/it]

Avg f1_micro 0.13508335870721191, Avg f_macro 0.07968206470231627


 66%|█████████████████████████████████████████████████████████████████▌                                  | 655/1000 [31:24<10:13,  1.78s/it]

Avg f1_micro 0.13548781159468182, Avg f_macro 0.07994209208445015


 66%|█████████████████████████████████████████████████████████████████▌                                  | 656/1000 [31:26<10:22,  1.81s/it]

Avg f1_micro 0.1352812752965192, Avg f_macro 0.07982022913919946


 66%|█████████████████████████████████████████████████████████████████▋                                  | 657/1000 [31:28<10:52,  1.90s/it]

Avg f1_micro 0.13537978172681367, Avg f_macro 0.07988899591372123


 66%|█████████████████████████████████████████████████████████████████▊                                  | 658/1000 [31:31<12:17,  2.16s/it]

Avg f1_micro 0.13517403737768477, Avg f_macro 0.07976758406582803


 66%|█████████████████████████████████████████████████████████████████▉                                  | 659/1000 [31:32<11:04,  1.95s/it]

Avg f1_micro 0.13496891744236203, Avg f_macro 0.07964654069091782


 66%|██████████████████████████████████████████████████████████████████                                  | 660/1000 [31:36<13:47,  2.43s/it]

Avg f1_micro 0.13501694433512618, Avg f_macro 0.07966360516094537


 66%|██████████████████████████████████████████████████████████████████                                  | 661/1000 [31:40<16:55,  3.00s/it]

Avg f1_micro 0.13500179010769028, Avg f_macro 0.07965114671354388


 66%|██████████████████████████████████████████████████████████████████▏                                 | 662/1000 [31:42<14:55,  2.65s/it]

Avg f1_micro 0.1351755034156847, Avg f_macro 0.07974662404910823


 66%|██████████████████████████████████████████████████████████████████▎                                 | 663/1000 [31:45<15:52,  2.82s/it]

Avg f1_micro 0.135223001399472, Avg f_macro 0.07979393096775379


 66%|██████████████████████████████████████████████████████████████████▍                                 | 664/1000 [31:46<12:31,  2.24s/it]

Avg f1_micro 0.1350193523009788, Avg f_macro 0.07967375938497102


 66%|██████████████████████████████████████████████████████████████████▌                                 | 665/1000 [31:48<12:18,  2.20s/it]

Avg f1_micro 0.13511706756067657, Avg f_macro 0.07974191914529438


 67%|██████████████████████████████████████████████████████████████████▌                                 | 666/1000 [31:49<10:27,  1.88s/it]

Avg f1_micro 0.13491418908085573, Avg f_macro 0.0796221865339651


 67%|██████████████████████████████████████████████████████████████████▋                                 | 667/1000 [31:52<11:20,  2.04s/it]

Avg f1_micro 0.13501176900727127, Avg f_macro 0.07966939631593985


 67%|██████████████████████████████████████████████████████████████████▊                                 | 668/1000 [31:54<11:42,  2.12s/it]

Avg f1_micro 0.13480965558061367, Avg f_macro 0.07955013075259262


 67%|██████████████████████████████████████████████████████████████████▉                                 | 669/1000 [31:55<10:55,  1.98s/it]

Avg f1_micro 0.1349818384571748, Avg f_macro 0.07964476006814503


 67%|███████████████████████████████████████████████████████████████████                                 | 670/1000 [31:58<11:20,  2.06s/it]

Avg f1_micro 0.13537738795201482, Avg f_macro 0.07988125331893173


 67%|███████████████████████████████████████████████████████████████████                                 | 671/1000 [32:00<12:20,  2.25s/it]

Avg f1_micro 0.13517563327548424, Avg f_macro 0.07976220525139233


 67%|███████████████████████████████████████████████████████████████████▏                                | 672/1000 [32:03<12:20,  2.26s/it]

Avg f1_micro 0.13556971715453858, Avg f_macro 0.08001553530310156


 67%|███████████████████████████████████████████████████████████████████▎                                | 673/1000 [32:10<21:21,  3.92s/it]

Avg f1_micro 0.13549209994232284, Avg f_macro 0.07997093569641048


 67%|███████████████████████████████████████████████████████████████████▍                                | 674/1000 [32:13<18:54,  3.48s/it]

Avg f1_micro 0.13558780899285353, Avg f_macro 0.0800171377370851


 68%|███████████████████████████████████████████████████████████████████▌                                | 675/1000 [32:15<16:54,  3.12s/it]

Avg f1_micro 0.13568323446101224, Avg f_macro 0.08006320288282441


 68%|███████████████████████████████████████████████████████████████████▌                                | 676/1000 [32:19<17:19,  3.21s/it]

Avg f1_micro 0.13569384675153906, Avg f_macro 0.08004338552155789


 68%|███████████████████████████████████████████████████████████████████▋                                | 677/1000 [32:22<16:44,  3.11s/it]

Avg f1_micro 0.13578883368395925, Avg f_macro 0.08010979115594259


 68%|███████████████████████████████████████████████████████████████████▊                                | 678/1000 [32:23<14:50,  2.77s/it]

Avg f1_micro 0.13595728673162302, Avg f_macro 0.08020233887231605


 68%|███████████████████████████████████████████████████████████████████▉                                | 679/1000 [32:31<21:47,  4.07s/it]

Avg f1_micro 0.1358797845911248, Avg f_macro 0.08015435169815807


 68%|████████████████████████████████████████████████████████████████████                                | 680/1000 [32:34<20:14,  3.79s/it]

Avg f1_micro 0.13592505941770647, Avg f_macro 0.08018353647507255


 68%|████████████████████████████████████████████████████████████████████                                | 681/1000 [32:37<18:44,  3.53s/it]

Avg f1_micro 0.13597020127857135, Avg f_macro 0.08021263554045423


 68%|████████████████████████████████████████████████████████████████████▏                               | 682/1000 [32:37<14:10,  2.67s/it]

Avg f1_micro 0.1357708314819752, Avg f_macro 0.08009502170535092


 68%|████████████████████████████████████████████████████████████████████▎                               | 683/1000 [32:39<13:09,  2.49s/it]

Avg f1_micro 0.13586487126018604, Avg f_macro 0.0801607683792816


 68%|████████████████████████████████████████████████████████████████████▍                               | 684/1000 [32:42<13:04,  2.48s/it]

Avg f1_micro 0.13595863606828518, Avg f_macro 0.08020601741836322


 68%|████████████████████████████████████████████████████████████████████▌                               | 685/1000 [32:44<11:45,  2.24s/it]

Avg f1_micro 0.1361251198112512, Avg f_macro 0.08029747891535413


 69%|████████████████████████████████████████████████████████████████████▌                               | 686/1000 [32:49<16:18,  3.12s/it]

Avg f1_micro 0.13592668669199282, Avg f_macro 0.08018042719681863


 69%|████████████████████████████████████████████████████████████████████▋                               | 687/1000 [32:51<14:16,  2.74s/it]

Avg f1_micro 0.1357288312528487, Avg f_macro 0.08006371624020027


 69%|████████████████████████████████████████████████████████████████████▊                               | 688/1000 [32:53<13:47,  2.65s/it]

Avg f1_micro 0.13582224864928352, Avg f_macro 0.08010884326762893


 69%|████████████████████████████████████████████████████████████████████▉                               | 689/1000 [32:58<17:12,  3.32s/it]

Avg f1_micro 0.13562511911568514, Avg f_macro 0.07999257499002714


 69%|█████████████████████████████████████████████████████████████████████                               | 690/1000 [33:00<15:04,  2.92s/it]

Avg f1_micro 0.13542856097203923, Avg f_macro 0.07987664372192566


 69%|█████████████████████████████████████████████████████████████████████                               | 691/1000 [33:02<14:01,  2.72s/it]

Avg f1_micro 0.13552200733821573, Avg f_macro 0.07994194525054805


 69%|█████████████████████████████████████████████████████████████████████▏                              | 692/1000 [33:05<13:34,  2.64s/it]

Avg f1_micro 0.13532616628714894, Avg f_macro 0.07982642220827847


 69%|█████████████████████████████████████████████████████████████████████▎                              | 693/1000 [33:09<15:33,  3.04s/it]

Avg f1_micro 0.13513089043392074, Avg f_macro 0.07971123256584228


 69%|█████████████████████████████████████████████████████████████████████▍                              | 694/1000 [33:13<17:14,  3.38s/it]

Avg f1_micro 0.1349361773353128, Avg f_macro 0.07959637488202984


 70%|█████████████████████████████████████████████████████████████████████▌                              | 695/1000 [33:16<16:48,  3.31s/it]

Avg f1_micro 0.13474202456216847, Avg f_macro 0.07948184772392619


 70%|█████████████████████████████████████████████████████████████████████▌                              | 696/1000 [33:18<15:09,  2.99s/it]

Avg f1_micro 0.1345484296992918, Avg f_macro 0.07936764966685159


 70%|█████████████████████████████████████████████████████████████████████▋                              | 697/1000 [33:23<18:14,  3.61s/it]

Avg f1_micro 0.1343553903453473, Avg f_macro 0.0792537792943023


 70%|█████████████████████████████████████████████████████████████████████▊                              | 698/1000 [33:33<27:50,  5.53s/it]

Avg f1_micro 0.13426523730964993, Avg f_macro 0.07920535632318516


 70%|█████████████████████████████████████████████████████████████████████▉                              | 699/1000 [33:36<23:25,  4.67s/it]

Avg f1_micro 0.13407315542508677, Avg f_macro 0.07909204393931794


 70%|██████████████████████████████████████████████████████████████████████                              | 700/1000 [33:41<24:26,  4.89s/it]

Avg f1_micro 0.13404035250463822, Avg f_macro 0.07906834101940463


 70%|██████████████████████████████████████████████████████████████████████                              | 701/1000 [33:42<18:19,  3.68s/it]

Avg f1_micro 0.13456240621005244, Avg f_macro 0.07943105855480254


 70%|██████████████████████████████████████████████████████████████████████▏                             | 702/1000 [33:46<18:14,  3.67s/it]

Avg f1_micro 0.13437072187072188, Avg f_macro 0.07931790889874156


 70%|██████████████████████████████████████████████████████████████████████▎                             | 703/1000 [33:48<15:37,  3.16s/it]

Avg f1_micro 0.1345352016404648, Avg f_macro 0.07940829187734527


 70%|██████████████████████████████████████████████████████████████████████▍                             | 704/1000 [33:50<14:29,  2.94s/it]

Avg f1_micro 0.13462819141086185, Avg f_macro 0.07947305282638312


 70%|██████████████████████████████████████████████████████████████████████▌                             | 705/1000 [33:53<13:41,  2.79s/it]

Avg f1_micro 0.13472091738049186, Avg f_macro 0.07951792950480117


 71%|██████████████████████████████████████████████████████████████████████▌                             | 706/1000 [33:55<12:40,  2.59s/it]

Avg f1_micro 0.13488420220006622, Avg f_macro 0.07964136964242421


 71%|██████████████████████████████████████████████████████████████████████▋                             | 707/1000 [33:57<11:42,  2.40s/it]

Avg f1_micro 0.13504702511067432, Avg f_macro 0.07973078374880994


 71%|██████████████████████████████████████████████████████████████████████▊                             | 708/1000 [33:57<09:08,  1.88s/it]

Avg f1_micro 0.13485628072492478, Avg f_macro 0.07961816964746983


 71%|██████████████████████████████████████████████████████████████████████▉                             | 709/1000 [33:58<07:21,  1.52s/it]

Avg f1_micro 0.13466607440514353, Avg f_macro 0.07950587321637326


 71%|███████████████████████████████████████████████████████████████████████                             | 710/1000 [34:02<11:11,  2.31s/it]

Avg f1_micro 0.13447640387781232, Avg f_macro 0.0793938931132516


 71%|███████████████████████████████████████████████████████████████████████                             | 711/1000 [34:05<11:20,  2.36s/it]

Avg f1_micro 0.13456856083438362, Avg f_macro 0.07943850242126548


 71%|███████████████████████████████████████████████████████████████████████▏                            | 712/1000 [34:07<11:26,  2.38s/it]

Avg f1_micro 0.13437956004669488, Avg f_macro 0.07932693149089852


 71%|███████████████████████████████████████████████████████████████████████▎                            | 713/1000 [34:09<11:00,  2.30s/it]

Avg f1_micro 0.13419108941549335, Avg f_macro 0.0792156735224681


 71%|███████████████████████████████████████████████████████████████████████▍                            | 714/1000 [34:12<11:25,  2.40s/it]

Avg f1_micro 0.1345633708028666, Avg f_macro 0.07950488726503366


 72%|███████████████████████████████████████████████████████████████████████▌                            | 715/1000 [34:14<10:44,  2.26s/it]

Avg f1_micro 0.1343751702842612, Avg f_macro 0.07939369161850914


 72%|███████████████████████████████████████████████████████████████████████▌                            | 716/1000 [34:16<10:59,  2.32s/it]

Avg f1_micro 0.1341874954654284, Avg f_macro 0.0792828065743492


 72%|███████████████████████████████████████████████████████████████████████▋                            | 717/1000 [34:19<11:08,  2.36s/it]

Avg f1_micro 0.13427928417468166, Avg f_macro 0.07932719751512572


 72%|███████████████████████████████████████████████████████████████████████▊                            | 718/1000 [34:21<10:43,  2.28s/it]

Avg f1_micro 0.13444045508808738, Avg f_macro 0.07944884022982146


 72%|███████████████████████████████████████████████████████████████████████▉                            | 719/1000 [34:24<11:53,  2.54s/it]

Avg f1_micro 0.1344852759664999, Avg f_macro 0.07947742320585786


 72%|████████████████████████████████████████████████████████████████████████                            | 720/1000 [34:25<10:02,  2.15s/it]

Avg f1_micro 0.13429849086099085, Avg f_macro 0.07936703789584973


 72%|████████████████████████████████████████████████████████████████████████                            | 721/1000 [34:27<10:04,  2.17s/it]

Avg f1_micro 0.13480570515938062, Avg f_macro 0.0797192796370945


 72%|████████████████████████████████████████████████████████████████████████▏                           | 722/1000 [34:29<09:32,  2.06s/it]

Avg f1_micro 0.1349652540442014, Avg f_macro 0.0798067282011112


 72%|████████████████████████████████████████████████████████████████████████▎                           | 723/1000 [34:34<13:26,  2.91s/it]

Avg f1_micro 0.13477858011053032, Avg f_macro 0.07969634545117882


 72%|████████████████████████████████████████████████████████████████████████▍                           | 724/1000 [34:36<11:25,  2.49s/it]

Avg f1_micro 0.13505282700724688, Avg f_macro 0.07986251071989267


 72%|████████████████████████████████████████████████████████████████████████▌                           | 725/1000 [34:37<10:28,  2.29s/it]

Avg f1_micro 0.13555620241827138, Avg f_macro 0.08021212564763534


 73%|████████████████████████████████████████████████████████████████████████▌                           | 726/1000 [34:39<09:10,  2.01s/it]

Avg f1_micro 0.1353694858860148, Avg f_macro 0.08010164062608212


 73%|████████████████████████████████████████████████████████████████████████▋                           | 727/1000 [34:42<11:04,  2.43s/it]

Avg f1_micro 0.1351832830168456, Avg f_macro 0.0799914595523186


 73%|████████████████████████████████████████████████████████████████████████▊                           | 728/1000 [34:45<11:17,  2.49s/it]

Avg f1_micro 0.13499759169402026, Avg f_macro 0.07988158117381267


 73%|████████████████████████████████████████████████████████████████████████▉                           | 729/1000 [34:48<12:49,  2.84s/it]

Avg f1_micro 0.13500837297133594, Avg f_macro 0.0798343561591086


 73%|█████████████████████████████████████████████████████████████████████████                           | 730/1000 [34:51<13:01,  2.90s/it]

Avg f1_micro 0.1353713752001423, Avg f_macro 0.08011638345986911


 73%|█████████████████████████████████████████████████████████████████████████                           | 731/1000 [34:53<11:21,  2.53s/it]

Avg f1_micro 0.13587018316840477, Avg f_macro 0.08055398074651772


 73%|█████████████████████████████████████████████████████████████████████████▏                          | 732/1000 [34:56<11:13,  2.51s/it]

Avg f1_micro 0.1359577922077922, Avg f_macro 0.08059572546013055


 73%|█████████████████████████████████████████████████████████████████████████▎                          | 733/1000 [34:58<11:07,  2.50s/it]

Avg f1_micro 0.13577231090873657, Avg f_macro 0.08048577221939368


 73%|█████████████████████████████████████████████████████████████████████████▍                          | 734/1000 [35:01<11:02,  2.49s/it]

Avg f1_micro 0.13585981457234864, Avg f_macro 0.08052749611434153


 74%|█████████████████████████████████████████████████████████████████████████▌                          | 735/1000 [35:03<11:11,  2.53s/it]

Avg f1_micro 0.1359470801307536, Avg f_macro 0.08056910647488134


 74%|█████████████████████████████████████████████████████████████████████████▌                          | 736/1000 [35:06<11:39,  2.65s/it]

Avg f1_micro 0.13598881869941654, Avg f_macro 0.0805502172903593


 74%|█████████████████████████████████████████████████████████████████████████▋                          | 737/1000 [35:08<10:31,  2.40s/it]

Avg f1_micro 0.13614351501054353, Avg f_macro 0.08063475857335359


 74%|█████████████████████████████████████████████████████████████████████████▊                          | 738/1000 [35:10<10:17,  2.36s/it]

Avg f1_micro 0.13623004141296824, Avg f_macro 0.08069487407664172


 74%|█████████████████████████████████████████████████████████████████████████▉                          | 739/1000 [35:13<11:17,  2.59s/it]

Avg f1_micro 0.1362712276447053, Avg f_macro 0.08070869575029863


 74%|██████████████████████████████████████████████████████████████████████████                          | 740/1000 [35:18<14:02,  3.24s/it]

Avg f1_micro 0.13625599625599624, Avg f_macro 0.08068972003532074


 74%|██████████████████████████████████████████████████████████████████████████                          | 741/1000 [35:21<13:16,  3.08s/it]

Avg f1_micro 0.1362970362970363, Avg f_macro 0.08070351135903704


 74%|██████████████████████████████████████████████████████████████████████████▏                         | 742/1000 [35:23<12:39,  2.94s/it]

Avg f1_micro 0.1361133475688732, Avg f_macro 0.08059474651893052


 74%|██████████████████████████████████████████████████████████████████████████▎                         | 743/1000 [35:27<13:44,  3.21s/it]

Avg f1_micro 0.13615446912889712, Avg f_macro 0.08062086395295619


 74%|██████████████████████████████████████████████████████████████████████████▍                         | 744/1000 [35:28<10:28,  2.45s/it]

Avg f1_micro 0.1359714658101755, Avg f_macro 0.08051250257667533


 74%|██████████████████████████████████████████████████████████████████████████▌                         | 745/1000 [35:33<13:51,  3.26s/it]

Avg f1_micro 0.1359380962065526, Avg f_macro 0.08047900331892886


 75%|██████████████████████████████████████████████████████████████████████████▌                         | 746/1000 [35:34<11:12,  2.65s/it]

Avg f1_micro 0.13620270108205768, Avg f_macro 0.08063921913217426


 75%|██████████████████████████████████████████████████████████████████████████▋                         | 747/1000 [35:37<11:06,  2.64s/it]

Avg f1_micro 0.13602036814888221, Avg f_macro 0.0805312683702838


 75%|██████████████████████████████████████████████████████████████████████████▊                         | 748/1000 [35:38<09:09,  2.18s/it]

Avg f1_micro 0.13583852273691846, Avg f_macro 0.08042360624679412


 75%|██████████████████████████████████████████████████████████████████████████▉                         | 749/1000 [35:41<10:17,  2.46s/it]

Avg f1_micro 0.1358796818075857, Avg f_macro 0.08046457754834861


 75%|███████████████████████████████████████████████████████████████████████████                         | 750/1000 [35:42<08:33,  2.05s/it]

Avg f1_micro 0.1356985088985089, Avg f_macro 0.08035729144495082


 75%|███████████████████████████████████████████████████████████████████████████                         | 751/1000 [35:45<09:35,  2.31s/it]

Avg f1_micro 0.13551781847387706, Avg f_macro 0.08025029105687498


 75%|███████████████████████████████████████████████████████████████████████████▏                        | 752/1000 [35:54<18:10,  4.40s/it]

Avg f1_micro 0.13533760860888522, Avg f_macro 0.08014357524429935


 75%|███████████████████████████████████████████████████████████████████████████▎                        | 753/1000 [35:57<16:08,  3.92s/it]

Avg f1_micro 0.13542348163862106, Avg f_macro 0.08020314552949949


 75%|███████████████████████████████████████████████████████████████████████████▍                        | 754/1000 [35:58<12:44,  3.11s/it]

Avg f1_micro 0.1352438748990473, Avg f_macro 0.08009677530996434


 76%|███████████████████████████████████████████████████████████████████████████▌                        | 755/1000 [36:00<10:49,  2.65s/it]

Avg f1_micro 0.13539586976673068, Avg f_macro 0.08017990162459636


 76%|███████████████████████████████████████████████████████████████████████████▌                        | 756/1000 [36:02<09:44,  2.40s/it]

Avg f1_micro 0.13521677470090168, Avg f_macro 0.08007384355366436


 76%|███████████████████████████████████████████████████████████████████████████▋                        | 757/1000 [36:04<09:47,  2.42s/it]

Avg f1_micro 0.1350381528056561, Avg f_macro 0.07996806568899636


 76%|███████████████████████████████████████████████████████████████████████████▊                        | 758/1000 [36:06<09:20,  2.32s/it]

Avg f1_micro 0.13512385445103123, Avg f_macro 0.0800091515008989


 76%|███████████████████████████████████████████████████████████████████████████▉                        | 759/1000 [36:08<09:03,  2.25s/it]

Avg f1_micro 0.1352752064214515, Avg f_macro 0.0801233247751621


 76%|████████████████████████████████████████████████████████████████████████████                        | 760/1000 [36:12<10:07,  2.53s/it]

Avg f1_micro 0.1353165109744057, Avg f_macro 0.08014947829519478


 76%|████████████████████████████████████████████████████████████████████████████                        | 761/1000 [36:15<10:48,  2.71s/it]

Avg f1_micro 0.13535770697400132, Avg f_macro 0.08017556308061502


 76%|████████████████████████████████████████████████████████████████████████████▏                       | 762/1000 [36:17<10:39,  2.69s/it]

Avg f1_micro 0.13544253937954726, Avg f_macro 0.08023438780098166


 76%|████████████████████████████████████████████████████████████████████████████▎                       | 763/1000 [36:20<10:54,  2.76s/it]

Avg f1_micro 0.1357018982182809, Avg f_macro 0.08042047932709076


 76%|████████████████████████████████████████████████████████████████████████████▍                       | 764/1000 [36:23<10:16,  2.61s/it]

Avg f1_micro 0.1355242779326549, Avg f_macro 0.08031521691959458


 76%|████████████████████████████████████████████████████████████████████████████▌                       | 765/1000 [36:25<09:28,  2.42s/it]

Avg f1_micro 0.13534712201378868, Avg f_macro 0.08021022970793497


 77%|████████████████████████████████████████████████████████████████████████████▌                       | 766/1000 [36:27<09:14,  2.37s/it]

Avg f1_micro 0.13543152524875762, Avg f_macro 0.08025057028417931


 77%|████████████████████████████████████████████████████████████████████████████▋                       | 767/1000 [36:35<16:25,  4.23s/it]

Avg f1_micro 0.1353734777463591, Avg f_macro 0.08020802592607615


 77%|████████████████████████████████████████████████████████████████████████████▊                       | 768/1000 [36:39<15:10,  3.92s/it]

Avg f1_micro 0.1351972101972102, Avg f_macro 0.08010358839231825


 77%|████████████████████████████████████████████████████████████████████████████▉                       | 769/1000 [36:41<12:51,  3.34s/it]

Avg f1_micro 0.13534649861047782, Avg f_macro 0.08021615416380636


 77%|█████████████████████████████████████████████████████████████████████████████                       | 770/1000 [36:42<10:18,  2.69s/it]

Avg f1_micro 0.1351707239369577, Avg f_macro 0.080111977340217


 77%|█████████████████████████████████████████████████████████████████████████████                       | 771/1000 [36:44<09:15,  2.43s/it]

Avg f1_micro 0.13531965944417307, Avg f_macro 0.08022424023169099


 77%|█████████████████████████████████████████████████████████████████████████████▏                      | 772/1000 [36:45<07:42,  2.03s/it]

Avg f1_micro 0.1351443749112143, Avg f_macro 0.08012032282206444


 77%|█████████████████████████████████████████████████████████████████████████████▎                      | 773/1000 [36:46<06:47,  1.80s/it]

Avg f1_micro 0.13496954389580523, Avg f_macro 0.08001667428025065


 77%|█████████████████████████████████████████████████████████████████████████████▍                      | 774/1000 [36:54<14:20,  3.81s/it]

Avg f1_micro 0.13491261824595158, Avg f_macro 0.07998929295613115


 78%|█████████████████████████████████████████████████████████████████████████████▌                      | 775/1000 [36:56<11:56,  3.19s/it]

Avg f1_micro 0.13473853744821487, Avg f_macro 0.07988608096522001


 78%|█████████████████████████████████████████████████████████████████████████████▌                      | 776/1000 [36:58<09:53,  2.65s/it]

Avg f1_micro 0.134564905312328, Avg f_macro 0.07978313498459473


 78%|█████████████████████████████████████████████████████████████████████████████▋                      | 777/1000 [36:59<08:17,  2.23s/it]

Avg f1_micro 0.13439172010600584, Avg f_macro 0.07968045398718855


 78%|█████████████████████████████████████████████████████████████████████████████▊                      | 778/1000 [37:00<07:31,  2.03s/it]

Avg f1_micro 0.13486165362772048, Avg f_macro 0.08000648596578258


 78%|█████████████████████████████████████████████████████████████████████████████▉                      | 779/1000 [37:02<06:37,  1.80s/it]

Avg f1_micro 0.13468853212113804, Avg f_macro 0.07990378187596772


 78%|██████████████████████████████████████████████████████████████████████████████                      | 780/1000 [37:04<06:52,  1.88s/it]

Avg f1_micro 0.13451585451585452, Avg f_macro 0.07980134112997289


 78%|██████████████████████████████████████████████████████████████████████████████                      | 781/1000 [37:06<07:40,  2.10s/it]

Avg f1_micro 0.1345997010529661, Avg f_macro 0.07984143046413567


 78%|██████████████████████████████████████████████████████████████████████████████▏                     | 782/1000 [37:09<07:48,  2.15s/it]

Avg f1_micro 0.1346833331488063, Avg f_macro 0.07989917799551145


 78%|██████████████████████████████████████████████████████████████████████████████▎                     | 783/1000 [37:11<08:07,  2.25s/it]

Avg f1_micro 0.13451132378335443, Avg f_macro 0.07979713562259254


 78%|██████████████████████████████████████████████████████████████████████████████▍                     | 784/1000 [37:13<07:27,  2.07s/it]

Avg f1_micro 0.13433975321730426, Avg f_macro 0.07969535356184944


 78%|██████████████████████████████████████████████████████████████████████████████▌                     | 785/1000 [37:17<10:14,  2.86s/it]

Avg f1_micro 0.13416861977371533, Avg f_macro 0.07959383081845854


 79%|██████████████████████████████████████████████████████████████████████████████▌                     | 786/1000 [37:20<09:23,  2.63s/it]

Avg f1_micro 0.13399792178418135, Avg f_macro 0.07949256640265898


 79%|██████████████████████████████████████████████████████████████████████████████▋                     | 787/1000 [37:22<09:19,  2.63s/it]

Avg f1_micro 0.13433591680097398, Avg f_macro 0.07970922133734429


 79%|██████████████████████████████████████████████████████████████████████████████▊                     | 788/1000 [37:24<08:43,  2.47s/it]

Avg f1_micro 0.1341654397491961, Avg f_macro 0.07960806750315985


 79%|██████████████████████████████████████████████████████████████████████████████▉                     | 789/1000 [37:26<08:09,  2.32s/it]

Avg f1_micro 0.13399539483189674, Avg f_macro 0.07950717007920147


 79%|███████████████████████████████████████████████████████████████████████████████                     | 790/1000 [37:28<07:44,  2.21s/it]

Avg f1_micro 0.13445869180046396, Avg f_macro 0.07982846902002948


 79%|███████████████████████████████████████████████████████████████████████████████                     | 791/1000 [37:31<08:51,  2.55s/it]

Avg f1_micro 0.13449940984707104, Avg f_macro 0.07984247739157065


 79%|███████████████████████████████████████████████████████████████████████████████▏                    | 792/1000 [37:35<09:44,  2.81s/it]

Avg f1_micro 0.13450996254026557, Avg f_macro 0.07983879127986801


 79%|███████████████████████████████████████████████████████████████████████████████▎                    | 793/1000 [37:37<09:19,  2.70s/it]

Avg f1_micro 0.13434034089771796, Avg f_macro 0.07973811184571937


 79%|███████████████████████████████████████████████████████████████████████████████▍                    | 794/1000 [37:44<13:39,  3.98s/it]

Avg f1_micro 0.13429709109809865, Avg f_macro 0.07970397263551993


 80%|███████████████████████████████████████████████████████████████████████████████▌                    | 795/1000 [37:46<11:15,  3.29s/it]

Avg f1_micro 0.1341281639394847, Avg f_macro 0.07960371606616706


 80%|███████████████████████████████████████████████████████████████████████████████▌                    | 796/1000 [37:49<11:21,  3.34s/it]

Avg f1_micro 0.13413912999340136, Avg f_macro 0.07960034842905264


 80%|███████████████████████████████████████████████████████████████████████████████▋                    | 797/1000 [37:53<11:09,  3.30s/it]

Avg f1_micro 0.13422176596580612, Avg f_macro 0.07967971705443291


 80%|███████████████████████████████████████████████████████████████████████████████▊                    | 798/1000 [37:55<10:14,  3.04s/it]

Avg f1_micro 0.13455482139692668, Avg f_macro 0.0798931509929612


 80%|███████████████████████████████████████████████████████████████████████████████▉                    | 799/1000 [37:57<08:49,  2.64s/it]

Avg f1_micro 0.1343864173651408, Avg f_macro 0.07979315956493496


 80%|████████████████████████████████████████████████████████████████████████████████                    | 800/1000 [38:00<09:48,  2.94s/it]

Avg f1_micro 0.13439700577200578, Avg f_macro 0.07980705447911517


 80%|████████████████████████████████████████████████████████████████████████████████                    | 801/1000 [38:03<08:53,  2.68s/it]

Avg f1_micro 0.13447890713808316, Avg f_macro 0.07984613569838107


 80%|████████████████████████████████████████████████████████████████████████████████▏                   | 802/1000 [38:05<09:05,  2.75s/it]

Avg f1_micro 0.1343112277027489, Avg f_macro 0.07974657692568983


 80%|████████████████████████████████████████████████████████████████████████████████▎                   | 803/1000 [38:11<11:26,  3.48s/it]

Avg f1_micro 0.13414396589988123, Avg f_macro 0.07964726612005385


 80%|████████████████████████████████████████████████████████████████████████████████▍                   | 804/1000 [38:14<11:02,  3.38s/it]

Avg f1_micro 0.1341844170202379, Avg f_macro 0.07967258046567567


 80%|████████████████████████████████████████████████████████████████████████████████▌                   | 805/1000 [38:16<10:16,  3.16s/it]

Avg f1_micro 0.13426617550841152, Avg f_macro 0.07967712798476594


 81%|████████████████████████████████████████████████████████████████████████████████▌                   | 806/1000 [38:19<09:49,  3.04s/it]

Avg f1_micro 0.1340995921641083, Avg f_macro 0.07957827298726623


 81%|████████████████████████████████████████████████████████████████████████████████▋                   | 807/1000 [38:21<08:35,  2.67s/it]

Avg f1_micro 0.13424321100901027, Avg f_macro 0.07968618921239559


 81%|████████████████████████████████████████████████████████████████████████████████▊                   | 808/1000 [38:27<11:43,  3.66s/it]

Avg f1_micro 0.13418957967225295, Avg f_macro 0.07964944887921194


 81%|████████████████████████████████████████████████████████████████████████████████▉                   | 809/1000 [38:28<09:20,  2.93s/it]

Avg f1_micro 0.1340237087455876, Avg f_macro 0.07955099467787793


 81%|█████████████████████████████████████████████████████████████████████████████████                   | 810/1000 [38:32<10:27,  3.30s/it]

Avg f1_micro 0.13385824737676588, Avg f_macro 0.07945278357333735


 81%|█████████████████████████████████████████████████████████████████████████████████                   | 811/1000 [38:33<07:41,  2.44s/it]

Avg f1_micro 0.1336931940507773, Avg f_macro 0.07935481466634187


 81%|█████████████████████████████████████████████████████████████████████████████████▏                  | 812/1000 [38:35<07:48,  2.49s/it]

Avg f1_micro 0.13377485267879358, Avg f_macro 0.07939392340580585


 81%|█████████████████████████████████████████████████████████████████████████████████▎                  | 813/1000 [38:36<06:18,  2.02s/it]

Avg f1_micro 0.1336103079645515, Avg f_macro 0.07929626790346168


 81%|█████████████████████████████████████████████████████████████████████████████████▍                  | 814/1000 [38:40<07:46,  2.51s/it]

Avg f1_micro 0.1336216677125768, Avg f_macro 0.0792671024091768


 82%|█████████████████████████████████████████████████████████████████████████████████▌                  | 815/1000 [38:42<07:40,  2.49s/it]

Avg f1_micro 0.1334577147460583, Avg f_macro 0.07916984216082197


 82%|█████████████████████████████████████████████████████████████████████████████████▌                  | 816/1000 [38:45<07:35,  2.48s/it]

Avg f1_micro 0.13353926166426167, Avg f_macro 0.07920898587277088


 82%|█████████████████████████████████████████████████████████████████████████████████▋                  | 817/1000 [38:51<10:43,  3.52s/it]

Avg f1_micro 0.13349820993639844, Avg f_macro 0.07916303444167404


 82%|█████████████████████████████████████████████████████████████████████████████████▊                  | 818/1000 [38:55<11:43,  3.87s/it]

Avg f1_micro 0.13333500919075492, Avg f_macro 0.07906625811595072


 82%|█████████████████████████████████████████████████████████████████████████████████▉                  | 819/1000 [38:58<10:03,  3.33s/it]

Avg f1_micro 0.1334774572869811, Avg f_macro 0.07914414686410846


 82%|██████████████████████████████████████████████████████████████████████████████████                  | 820/1000 [39:02<11:16,  3.76s/it]

Avg f1_micro 0.13346711892443602, Avg f_macro 0.07913473762577246


 82%|██████████████████████████████████████████████████████████████████████████████████                  | 821/1000 [39:05<10:02,  3.36s/it]

Avg f1_micro 0.13379176311575824, Avg f_macro 0.07934285609395057


 82%|██████████████████████████████████████████████████████████████████████████████████▏                 | 822/1000 [39:07<09:19,  3.14s/it]

Avg f1_micro 0.13362899941367096, Avg f_macro 0.07924633193811852


 82%|██████████████████████████████████████████████████████████████████████████████████▎                 | 823/1000 [39:09<07:57,  2.70s/it]

Avg f1_micro 0.1334666312491343, Avg f_macro 0.07915004234888628


 82%|██████████████████████████████████████████████████████████████████████████████████▍                 | 824/1000 [39:10<06:15,  2.14s/it]

Avg f1_micro 0.1333046571820844, Avg f_macro 0.07905398647224929


 82%|██████████████████████████████████████████████████████████████████████████████████▌                 | 825/1000 [39:12<06:32,  2.24s/it]

Avg f1_micro 0.13338550002186367, Avg f_macro 0.07910967860985868


 83%|██████████████████████████████████████████████████████████████████████████████████▌                 | 826/1000 [39:15<06:52,  2.37s/it]

Avg f1_micro 0.13346614711626817, Avg f_macro 0.07916523589967726


 83%|██████████████████████████████████████████████████████████████████████████████████▋                 | 827/1000 [39:16<05:27,  1.89s/it]

Avg f1_micro 0.1333047612068168, Avg f_macro 0.07906951010052408


 83%|██████████████████████████████████████████████████████████████████████████████████▊                 | 828/1000 [39:19<06:07,  2.14s/it]

Avg f1_micro 0.13334505336316932, Avg f_macro 0.07906347696522643


 83%|██████████████████████████████████████████████████████████████████████████████████▉                 | 829/1000 [39:20<05:38,  1.98s/it]

Avg f1_micro 0.13318420287660337, Avg f_macro 0.07896810485791013


 83%|███████████████████████████████████████████████████████████████████████████████████                 | 830/1000 [39:25<08:18,  2.93s/it]

Avg f1_micro 0.13302373998157133, Avg f_macro 0.07887296256290059


 83%|███████████████████████████████████████████████████████████████████████████████████                 | 831/1000 [39:27<07:18,  2.59s/it]

Avg f1_micro 0.13286366327882576, Avg f_macro 0.07877804925055053


 83%|███████████████████████████████████████████████████████████████████████████████████▏                | 832/1000 [39:28<06:08,  2.19s/it]

Avg f1_micro 0.13270397137584639, Avg f_macro 0.0786833640952013


 83%|███████████████████████████████████████████████████████████████████████████████████▎                | 833/1000 [39:30<05:39,  2.03s/it]

Avg f1_micro 0.13284478293481897, Avg f_macro 0.07876040344545573


 83%|███████████████████████████████████████████████████████████████████████████████████▍                | 834/1000 [39:33<06:06,  2.21s/it]

Avg f1_micro 0.13292530477782277, Avg f_macro 0.07879919326280063


 84%|███████████████████████████████████████████████████████████████████████████████████▌                | 835/1000 [39:35<06:06,  2.22s/it]

Avg f1_micro 0.13300563375413677, Avg f_macro 0.07885452357027034


 84%|███████████████████████████████████████████████████████████████████████████████████▌                | 836/1000 [39:38<06:50,  2.50s/it]

Avg f1_micro 0.1330458981475728, Avg f_macro 0.0788931080051278


 84%|███████████████████████████████████████████████████████████████████████████████████▋                | 837/1000 [39:39<05:21,  1.98s/it]

Avg f1_micro 0.1328869424747561, Avg f_macro 0.07879885100631642


 84%|███████████████████████████████████████████████████████████████████████████████████▊                | 838/1000 [39:44<07:52,  2.92s/it]

Avg f1_micro 0.13272836617108694, Avg f_macro 0.07870481896454277


 84%|███████████████████████████████████████████████████████████████████████████████████▉                | 839/1000 [39:46<07:27,  2.78s/it]

Avg f1_micro 0.1328085469027066, Avg f_macro 0.07875999796458504


 84%|████████████████████████████████████████████████████████████████████████████████████                | 840/1000 [39:48<06:22,  2.39s/it]

Avg f1_micro 0.1330472668865526, Avg f_macro 0.07890433130034148


 84%|████████████████████████████████████████████████████████████████████████████████████                | 841/1000 [39:49<05:27,  2.06s/it]

Avg f1_micro 0.1328890656179598, Avg f_macro 0.07881050926550161


 84%|████████████████████████████████████████████████████████████████████████████████████▏               | 842/1000 [39:52<06:15,  2.38s/it]

Avg f1_micro 0.1329291815336946, Avg f_macro 0.0788248781273111


 84%|████████████████████████████████████████████████████████████████████████████████████▎               | 843/1000 [39:55<06:07,  2.34s/it]

Avg f1_micro 0.13300874359593223, Avg f_macro 0.07883022623550329


 84%|████████████████████████████████████████████████████████████████████████████████████▍               | 844/1000 [39:56<05:29,  2.11s/it]

Avg f1_micro 0.1328511502978328, Avg f_macro 0.0787368254935181


 84%|████████████████████████████████████████████████████████████████████████████████████▌               | 845/1000 [39:59<06:06,  2.36s/it]

Avg f1_micro 0.13289116866039943, Avg f_macro 0.07875123054134718


 85%|████████████████████████████████████████████████████████████████████████████████████▌               | 846/1000 [40:02<06:16,  2.45s/it]

Avg f1_micro 0.13297049352013893, Avg f_macro 0.07878948099119323


 85%|████████████████████████████████████████████████████████████████████████████████████▋               | 847/1000 [40:04<06:15,  2.45s/it]

Avg f1_micro 0.1330496310720632, Avg f_macro 0.07884403886487541


 85%|████████████████████████████████████████████████████████████████████████████████████▊               | 848/1000 [40:06<06:04,  2.40s/it]

Avg f1_micro 0.13312858197881783, Avg f_macro 0.0788984680643272


 85%|████████████████████████████████████████████████████████████████████████████████████▉               | 849/1000 [40:08<05:28,  2.18s/it]

Avg f1_micro 0.13297177563962015, Avg f_macro 0.07880553700653647


 85%|█████████████████████████████████████████████████████████████████████████████████████               | 850/1000 [40:10<05:16,  2.11s/it]

Avg f1_micro 0.13281533825651473, Avg f_macro 0.07871282461005819


 85%|█████████████████████████████████████████████████████████████████████████████████████               | 851/1000 [40:12<05:02,  2.03s/it]

Avg f1_micro 0.13265926852883375, Avg f_macro 0.07862033010405342


 85%|█████████████████████████████████████████████████████████████████████████████████████▏              | 852/1000 [40:14<05:18,  2.16s/it]

Avg f1_micro 0.13273830694605343, Avg f_macro 0.07865846482354528


 85%|█████████████████████████████████████████████████████████████████████████████████████▎              | 853/1000 [40:17<05:38,  2.30s/it]

Avg f1_micro 0.1325826934560815, Avg f_macro 0.07856625091402178


 85%|█████████████████████████████████████████████████████████████████████████████████████▍              | 854/1000 [40:20<05:50,  2.40s/it]

Avg f1_micro 0.13266163643798304, Avg f_macro 0.07860435964961557


 86%|█████████████████████████████████████████████████████████████████████████████████████▌              | 855/1000 [40:22<05:33,  2.30s/it]

Avg f1_micro 0.1327403947579386, Avg f_macro 0.0786423792419682


 86%|█████████████████████████████████████████████████████████████████████████████████████▌              | 856/1000 [40:24<05:49,  2.42s/it]

Avg f1_micro 0.13297473230300333, Avg f_macro 0.07866732973350794


 86%|█████████████████████████████████████████████████████████████████████████████████████▋              | 857/1000 [40:30<08:22,  3.52s/it]

Avg f1_micro 0.13281956925480845, Avg f_macro 0.07857553588317713


 86%|█████████████████████████████████████████████████████████████████████████████████████▊              | 858/1000 [40:34<08:05,  3.42s/it]

Avg f1_micro 0.133053268280541, Avg f_macro 0.07869978955369229


 86%|█████████████████████████████████████████████████████████████████████████████████████▉              | 859/1000 [40:35<06:31,  2.78s/it]

Avg f1_micro 0.1328983750695043, Avg f_macro 0.07860817163803026


 86%|██████████████████████████████████████████████████████████████████████████████████████              | 860/1000 [40:37<06:00,  2.57s/it]

Avg f1_micro 0.13303453974965604, Avg f_macro 0.07868287974409899


 86%|██████████████████████████████████████████████████████████████████████████████████████              | 861/1000 [40:39<05:38,  2.43s/it]

Avg f1_micro 0.13317038813554494, Avg f_macro 0.07875741431217453


 86%|██████████████████████████████████████████████████████████████████████████████████████▏             | 862/1000 [40:41<05:28,  2.38s/it]

Avg f1_micro 0.13324791668759187, Avg f_macro 0.07876272280291834


 86%|██████████████████████████████████████████████████████████████████████████████████████▎             | 863/1000 [40:46<06:42,  2.94s/it]

Avg f1_micro 0.13325905136449748, Avg f_macro 0.07876801899125023


 86%|██████████████████████████████████████████████████████████████████████████████████████▍             | 864/1000 [40:47<05:53,  2.60s/it]

Avg f1_micro 0.13310481635134414, Avg f_macro 0.07867685230260293


 86%|██████████████████████████████████████████████████████████████████████████████████████▌             | 865/1000 [40:49<05:19,  2.36s/it]

Avg f1_micro 0.13295093795093796, Avg f_macro 0.07858589640398721


 87%|██████████████████████████████████████████████████████████████████████████████████████▌             | 866/1000 [40:52<05:27,  2.44s/it]

Avg f1_micro 0.133028361810117, Avg f_macro 0.07866011262391004


 87%|██████████████████████████████████████████████████████████████████████████████████████▋             | 867/1000 [40:55<06:12,  2.80s/it]

Avg f1_micro 0.13303969835111704, Avg f_macro 0.07865810912252498


 87%|██████████████████████████████████████████████████████████████████████████████████████▊             | 868/1000 [40:57<05:24,  2.46s/it]

Avg f1_micro 0.13317444524241762, Avg f_macro 0.07873207114295656


 87%|██████████████████████████████████████████████████████████████████████████████████████▉             | 869/1000 [41:00<05:49,  2.67s/it]

Avg f1_micro 0.1330211950177428, Avg f_macro 0.07864147037064016


 87%|███████████████████████████████████████████████████████████████████████████████████████             | 870/1000 [41:03<06:05,  2.81s/it]

Avg f1_micro 0.13286829709243503, Avg f_macro 0.07855107787596126


 87%|███████████████████████████████████████████████████████████████████████████████████████             | 871/1000 [41:06<06:06,  2.84s/it]

Avg f1_micro 0.13294537137820722, Avg f_macro 0.07858846023329209


 87%|███████████████████████████████████████████████████████████████████████████████████████▏            | 872/1000 [41:08<05:18,  2.49s/it]

Avg f1_micro 0.13307960833763588, Avg f_macro 0.07866216285098


 87%|███████████████████████████████████████████████████████████████████████████████████████▎            | 873/1000 [41:10<05:14,  2.48s/it]

Avg f1_micro 0.13315626399818842, Avg f_macro 0.07869933232206834


 87%|███████████████████████████████████████████████████████████████████████████████████████▍            | 874/1000 [41:13<05:30,  2.63s/it]

Avg f1_micro 0.13300391129338499, Avg f_macro 0.07860928731941151


 88%|███████████████████████████████████████████████████████████████████████████████████████▌            | 875/1000 [41:15<04:52,  2.34s/it]

Avg f1_micro 0.1331376211090497, Avg f_macro 0.07868271344002607


 88%|███████████████████████████████████████████████████████████████████████████████████████▌            | 876/1000 [41:16<03:57,  1.92s/it]

Avg f1_micro 0.13298563752330878, Avg f_macro 0.07859289299089363


 88%|███████████████████████████████████████████████████████████████████████████████████████▋            | 877/1000 [41:19<04:21,  2.13s/it]

Avg f1_micro 0.13306205070743268, Avg f_macro 0.07862997191691438


 88%|███████████████████████████████████████████████████████████████████████████████████████▊            | 878/1000 [41:23<05:43,  2.82s/it]

Avg f1_micro 0.13291049939683197, Avg f_macro 0.07854041614024364


 88%|███████████████████████████████████████████████████████████████████████████████████████▉            | 879/1000 [41:26<05:45,  2.85s/it]

Avg f1_micro 0.13275929291287653, Avg f_macro 0.07845106413098284


 88%|████████████████████████████████████████████████████████████████████████████████████████            | 880/1000 [41:29<05:45,  2.88s/it]

Avg f1_micro 0.13279782401941492, Avg f_macro 0.07843767277022794


 88%|████████████████████████████████████████████████████████████████████████████████████████            | 881/1000 [41:32<06:00,  3.03s/it]

Avg f1_micro 0.13280924208847025, Avg f_macro 0.07843595359219487


 88%|████████████████████████████████████████████████████████████████████████████████████████▏           | 882/1000 [41:34<05:02,  2.57s/it]

Avg f1_micro 0.13265866471648785, Avg f_macro 0.078347023939596


 88%|████████████████████████████████████████████████████████████████████████████████████████▎           | 883/1000 [41:38<05:38,  2.89s/it]

Avg f1_micro 0.13267021452185665, Avg f_macro 0.07835267094910191


 88%|████████████████████████████████████████████████████████████████████████████████████████▍           | 884/1000 [41:44<07:33,  3.91s/it]

Avg f1_micro 0.1325201350936645, Avg f_macro 0.07826403670594682


 88%|████████████████████████████████████████████████████████████████████████████████████████▌           | 885/1000 [41:46<06:17,  3.28s/it]

Avg f1_micro 0.13265288070372816, Avg f_macro 0.07833702326656965


 89%|████████████████████████████████████████████████████████████████████████████████████████▌           | 886/1000 [41:46<04:47,  2.52s/it]

Avg f1_micro 0.13250315961941245, Avg f_macro 0.07824860676175412


 89%|████████████████████████████████████████████████████████████████████████████████████████▋           | 887/1000 [41:48<04:31,  2.40s/it]

Avg f1_micro 0.13263562505388887, Avg f_macro 0.07838586876089532


 89%|████████████████████████████████████████████████████████████████████████████████████████▊           | 888/1000 [41:50<03:58,  2.13s/it]

Avg f1_micro 0.13248626061126062, Avg f_macro 0.07829759638616458


 89%|████████████████████████████████████████████████████████████████████████████████████████▉           | 889/1000 [41:54<05:11,  2.81s/it]

Avg f1_micro 0.1323372321966248, Avg f_macro 0.07820952259945348


 89%|█████████████████████████████████████████████████████████████████████████████████████████           | 890/1000 [41:55<04:06,  2.25s/it]

Avg f1_micro 0.13218853867730274, Avg f_macro 0.07812164673136421


 89%|█████████████████████████████████████████████████████████████████████████████████████████           | 891/1000 [41:57<03:55,  2.16s/it]

Avg f1_micro 0.13204017892570083, Avg f_macro 0.07803396811550409


 89%|█████████████████████████████████████████████████████████████████████████████████████████▏          | 892/1000 [41:59<03:44,  2.08s/it]

Avg f1_micro 0.13217242087757786, Avg f_macro 0.07810663983606646


 89%|█████████████████████████████████████████████████████████████████████████████████████████▎          | 893/1000 [42:00<03:16,  1.84s/it]

Avg f1_micro 0.13202441144770374, Avg f_macro 0.07801917439392081


 89%|██████████████████████████████████████████████████████████████████████████████████████▋          | 894/1000 [57:12<8:05:19, 274.71s/it]

Avg f1_micro 0.1318767331351224, Avg f_macro 0.07793190462390524


 90%|██████████████████████████████████████████████████████████████████████████████████████▊          | 895/1000 [57:17<5:39:27, 193.97s/it]

Avg f1_micro 0.13185353132280508, Avg f_macro 0.07791931776585245


 90%|██████████████████████████████████████████████████████████████████████████████████████▉          | 896/1000 [57:20<3:56:50, 136.64s/it]

Avg f1_micro 0.13192958764945373, Avg f_macro 0.07797186317013163


 90%|███████████████████████████████████████████████████████████████████████████████████████▉          | 897/1000 [57:25<2:46:29, 96.99s/it]

Avg f1_micro 0.13178250895642202, Avg f_macro 0.07788493801609582


 90%|████████████████████████████████████████████████████████████████████████████████████████          | 898/1000 [57:27<1:56:41, 68.64s/it]

Avg f1_micro 0.13163575783286252, Avg f_macro 0.07779820645928502


 90%|████████████████████████████████████████████████████████████████████████████████████████          | 899/1000 [57:31<1:22:57, 49.28s/it]

Avg f1_micro 0.13148933318566244, Avg f_macro 0.07771166785365734


 90%|██████████████████████████████████████████████████████████████████████████████████████████          | 900/1000 [57:35<59:29, 35.70s/it]

Avg f1_micro 0.13150196408529743, Avg f_macro 0.07768704995110391


 90%|██████████████████████████████████████████████████████████████████████████████████████████          | 901/1000 [57:37<41:48, 25.34s/it]

Avg f1_micro 0.13135601295978655, Avg f_macro 0.07760082681020368


 90%|██████████████████████████████████████████████████████████████████████████████████████████▏         | 902/1000 [57:38<29:34, 18.11s/it]

Avg f1_micro 0.13121038545096195, Avg f_macro 0.07751479485143406


 90%|██████████████████████████████████████████████████████████████████████████████████████████▎         | 903/1000 [57:41<22:08, 13.69s/it]

Avg f1_micro 0.13122328329969526, Avg f_macro 0.0774904767569757


 90%|██████████████████████████████████████████████████████████████████████████████████████████▍         | 904/1000 [57:43<16:20, 10.22s/it]

Avg f1_micro 0.13107812480046993, Avg f_macro 0.07740475720304099


 90%|██████████████████████████████████████████████████████████████████████████████████████████▌         | 905/1000 [57:49<13:53,  8.78s/it]

Avg f1_micro 0.13117883651032822, Avg f_macro 0.07743822410965896


 91%|██████████████████████████████████████████████████████████████████████████████████████████▌         | 906/1000 [57:51<10:46,  6.87s/it]

Avg f1_micro 0.13125479805943382, Avg f_macro 0.07747539065160318


 91%|██████████████████████████████████████████████████████████████████████████████████████████▋         | 907/1000 [57:55<09:12,  5.94s/it]

Avg f1_micro 0.13129384091346605, Avg f_macro 0.07750022484052092


 91%|██████████████████████████████████████████████████████████████████████████████████████████▊         | 908/1000 [57:58<07:38,  4.99s/it]

Avg f1_micro 0.13136950848955253, Avg f_macro 0.07753724123509206


 91%|██████████████████████████████████████████████████████████████████████████████████████████▉         | 909/1000 [58:01<06:51,  4.52s/it]

Avg f1_micro 0.1312249875781229, Avg f_macro 0.07745194173978392


 91%|███████████████████████████████████████████████████████████████████████████████████████████         | 910/1000 [58:03<05:36,  3.74s/it]

Avg f1_micro 0.13135550956979528, Avg f_macro 0.07752381558716565


 91%|███████████████████████████████████████████████████████████████████████████████████████████         | 911/1000 [58:16<09:41,  6.53s/it]

Avg f1_micro 0.13148574501483393, Avg f_macro 0.07752653368202057


 91%|███████████████████████████████████████████████████████████████████████████████████████████▏        | 912/1000 [58:18<07:24,  5.05s/it]

Avg f1_micro 0.13134157204880892, Avg f_macro 0.07744152651789554


 91%|███████████████████████████████████████████████████████████████████████████████████████████▎        | 913/1000 [58:22<07:01,  4.85s/it]

Avg f1_micro 0.13135418494126053, Avg f_macro 0.07742972491893473


 91%|██████████████████████████████████████████████████████████████████████████████████████▊        | 914/1000 [1:15:12<7:19:08, 306.38s/it]

Avg f1_micro 0.1317575173428565, Avg f_macro 0.07770970698503364


 92%|██████████████████████████████████████████████████████████████████████████████████████▉        | 915/1000 [1:15:15<5:04:54, 215.22s/it]

Avg f1_micro 0.1318320992911157, Avg f_macro 0.07774621125183809


 92%|███████████████████████████████████████████████████████████████████████████████████████        | 916/1000 [1:15:18<3:32:17, 151.64s/it]

Avg f1_micro 0.13168817778533937, Avg f_macro 0.07766133547536228


 92%|███████████████████████████████████████████████████████████████████████████████████████        | 917/1000 [1:15:20<2:27:35, 106.69s/it]

Avg f1_micro 0.1318171983112005, Avg f_macro 0.07773243232092585


 92%|████████████████████████████████████████████████████████████████████████████████████████▏       | 918/1000 [1:15:23<1:43:33, 75.77s/it]

Avg f1_micro 0.1318292243945839, Avg f_macro 0.07773853352028576


 92%|████████████████████████████████████████████████████████████████████████████████████████▏       | 919/1000 [1:15:26<1:12:35, 53.78s/it]

Avg f1_micro 0.1316857758370272, Avg f_macro 0.07765394316825062


 92%|██████████████████████████████████████████████████████████████████████████████████████████▏       | 920/1000 [1:15:31<52:18, 39.24s/it]

Avg f1_micro 0.13166341207102078, Avg f_macro 0.07765314874841892


 92%|██████████████████████████████████████████████████████████████████████████████████████████▎       | 921/1000 [1:15:36<38:02, 28.89s/it]

Avg f1_micro 0.1319276211784355, Avg f_macro 0.07774650728792808


 92%|██████████████████████████████████████████████████████████████████████████████████████████▎       | 922/1000 [1:15:40<27:50, 21.42s/it]

Avg f1_micro 0.13193947532342326, Avg f_macro 0.07775256675218559


 92%|██████████████████████████████████████████████████████████████████████████████████████████▍       | 923/1000 [1:15:42<19:56, 15.53s/it]

Avg f1_micro 0.13179652897962757, Avg f_macro 0.07766832778495678


 92%|██████████████████████████████████████████████████████████████████████████████████████████▌       | 924/1000 [1:15:44<14:36, 11.54s/it]

Avg f1_micro 0.13165389204350245, Avg f_macro 0.07758427115315487


 92%|██████████████████████████████████████████████████████████████████████████████████████████▋       | 925/1000 [1:15:49<12:05,  9.68s/it]

Avg f1_micro 0.1315115635115635, Avg f_macro 0.07750039626542174


 93%|██████████████████████████████████████████████████████████████████████████████████████████▋       | 926/1000 [1:15:54<10:19,  8.37s/it]

Avg f1_micro 0.13148953278542913, Avg f_macro 0.07748869677341444


 93%|████████████████████████████████████████████████████████████████████████████████████████       | 927/1000 [1:32:31<6:11:02, 304.96s/it]

Avg f1_micro 0.13146754959052695, Avg f_macro 0.0774770225230296


 93%|████████████████████████████████████████████████████████████████████████████████████████▏      | 928/1000 [1:32:33<4:16:44, 213.95s/it]

Avg f1_micro 0.13132588197243372, Avg f_macro 0.07739353435220736


 93%|████████████████████████████████████████████████████████████████████████████████████████▎      | 929/1000 [1:32:36<2:58:08, 150.54s/it]

Avg f1_micro 0.13139980459679063, Avg f_macro 0.07742982883741609


 93%|████████████████████████████████████████████████████████████████████████████████████████▎      | 930/1000 [1:32:37<2:03:23, 105.77s/it]

Avg f1_micro 0.13125851448432097, Avg f_macro 0.07734657095694575


 93%|█████████████████████████████████████████████████████████████████████████████████████████▍      | 931/1000 [1:32:41<1:26:27, 75.18s/it]

Avg f1_micro 0.1312709727317676, Avg f_macro 0.07736113864754957


 93%|█████████████████████████████████████████████████████████████████████████████████████████▍      | 932/1000 [1:32:44<1:00:37, 53.50s/it]

Avg f1_micro 0.131130124048579, Avg f_macro 0.07727813313397923


 93%|███████████████████████████████████████████████████████████████████████████████████████████▍      | 933/1000 [1:32:45<42:22, 37.95s/it]

Avg f1_micro 0.1312575301321282, Avg f_macro 0.07734842146165678


 93%|███████████████████████████████████████████████████████████████████████████████████████████▌      | 934/1000 [1:32:48<30:04, 27.34s/it]

Avg f1_micro 0.1313311302069332, Avg f_macro 0.07739944028236165


 94%|███████████████████████████████████████████████████████████████████████████████████████████▋      | 935/1000 [1:32:50<21:19, 19.68s/it]

Avg f1_micro 0.13172542846339638, Avg f_macro 0.07767316637118622


 94%|███████████████████████████████████████████████████████████████████████████████████████████▋      | 936/1000 [1:32:51<15:11, 14.25s/it]

Avg f1_micro 0.1315846961680295, Avg f_macro 0.07759018221908026


 94%|███████████████████████████████████████████████████████████████████████████████████████████▊      | 937/1000 [1:32:57<12:09, 11.58s/it]

Avg f1_micro 0.1316814277860169, Avg f_macro 0.0775621052383577


 94%|███████████████████████████████████████████████████████████████████████████████████████████▉      | 938/1000 [1:33:00<09:23,  9.08s/it]

Avg f1_micro 0.1315410424685478, Avg f_macro 0.07747941642680295


 94%|████████████████████████████████████████████████████████████████████████████████████████████      | 939/1000 [1:33:03<07:24,  7.29s/it]

Avg f1_micro 0.13140095616133957, Avg f_macro 0.07739690373625258


 94%|████████████████████████████████████████████████████████████████████████████████████████████      | 940/1000 [1:33:04<05:27,  5.46s/it]

Avg f1_micro 0.1312611679101041, Avg f_macro 0.07731456660461826


 94%|████████████████████████████████████████████████████████████████████████████████████████████▏     | 941/1000 [1:33:07<04:36,  4.69s/it]

Avg f1_micro 0.1312987933072949, Avg f_macro 0.07730325108927506


 94%|████████████████████████████████████████████████████████████████████████████████████████████▎     | 942/1000 [1:33:10<04:04,  4.22s/it]

Avg f1_micro 0.1311594102995377, Avg f_macro 0.07722118819002954


 94%|████████████████████████████████████████████████████████████████████████████████████████████▍     | 943/1000 [1:33:13<03:32,  3.73s/it]

Avg f1_micro 0.1310203229079157, Avg f_macro 0.07713929933722993


 94%|████████████████████████████████████████████████████████████████████████████████████████████▌     | 944/1000 [1:33:15<02:56,  3.15s/it]

Avg f1_micro 0.13088153019297089, Avg f_macro 0.07705758397776254


 94%|████████████████████████████████████████████████████████████████████████████████████████████▌     | 945/1000 [1:33:16<02:25,  2.64s/it]

Avg f1_micro 0.1307430312192217, Avg f_macro 0.07697604156085484


 95%|█████████████████████████████████████████████████████████████████████████████████████████▊     | 946/1000 [1:49:09<4:18:58, 287.75s/it]

Avg f1_micro 0.1306048250551422, Avg f_macro 0.07689467153806324


 95%|█████████████████████████████████████████████████████████████████████████████████████████▉     | 947/1000 [1:49:11<2:58:21, 201.92s/it]

Avg f1_micro 0.13073090232541132, Avg f_macro 0.07696432567884368


 95%|██████████████████████████████████████████████████████████████████████████████████████████     | 948/1000 [1:49:12<2:02:52, 141.78s/it]

Avg f1_micro 0.1305930005297094, Avg f_macro 0.07688313968129216


 95%|███████████████████████████████████████████████████████████████████████████████████████████     | 949/1000 [1:49:14<1:24:56, 99.92s/it]

Avg f1_micro 0.13045538935949896, Avg f_macro 0.07680212478173337


 95%|█████████████████████████████████████████████████████████████████████████████████████████████     | 950/1000 [1:49:15<58:27, 70.16s/it]

Avg f1_micro 0.13031806789701528, Avg f_macro 0.07672128043985786


 95%|█████████████████████████████████████████████████████████████████████████████████████████████▏    | 951/1000 [1:49:16<40:27, 49.54s/it]

Avg f1_micro 0.13018103522835386, Avg f_macro 0.07664060611762878


 95%|█████████████████████████████████████████████████████████████████████████████████████████████▎    | 952/1000 [1:49:22<29:07, 36.40s/it]

Avg f1_micro 0.13004429044345012, Avg f_macro 0.07656010127926992


 95%|█████████████████████████████████████████████████████████████████████████████████████████████▍    | 953/1000 [1:49:27<21:09, 27.02s/it]

Avg f1_micro 0.1299078326360593, Avg f_macro 0.0764797653912539


 95%|█████████████████████████████████████████████████████████████████████████████████████████████▍    | 954/1000 [1:49:31<15:26, 20.15s/it]

Avg f1_micro 0.12977166090373637, Avg f_macro 0.07639959792229033


 96%|█████████████████████████████████████████████████████████████████████████████████████████████▌    | 955/1000 [1:49:35<11:28, 15.30s/it]

Avg f1_micro 0.12978536297908028, Avg f_macro 0.07640014606784089


 96%|█████████████████████████████████████████████████████████████████████████████████████████████▋    | 956/1000 [1:49:37<08:07, 11.07s/it]

Avg f1_micro 0.1296496042311942, Avg f_macro 0.07632022959705863


 96%|█████████████████████████████████████████████████████████████████████████████████████████████▊    | 957/1000 [1:49:41<06:24,  8.95s/it]

Avg f1_micro 0.12966340521199457, Avg f_macro 0.07629853192303407


 96%|█████████████████████████████████████████████████████████████████████████████████████████████▉    | 958/1000 [1:49:46<05:30,  7.87s/it]

Avg f1_micro 0.12964403956053228, Avg f_macro 0.07626238175053265


 96%|█████████████████████████████████████████████████████████████████████████████████████████████▉    | 959/1000 [1:49:48<04:13,  6.18s/it]

Avg f1_micro 0.1297174034400312, Avg f_macro 0.07633182362864173


 96%|██████████████████████████████████████████████████████████████████████████████████████████████    | 960/1000 [1:49:50<03:18,  4.95s/it]

Avg f1_micro 0.12984269781144783, Avg f_macro 0.07640112083617141


 96%|██████████████████████████████████████████████████████████████████████████████████████████████▏   | 961/1000 [1:49:53<02:51,  4.41s/it]

Avg f1_micro 0.12988101619735337, Avg f_macro 0.07641621757922336


 96%|████████████████████████████████████████████████████████████████████████████████████████████▎   | 962/1000 [1:55:02<1:00:36, 95.69s/it]

Avg f1_micro 0.12974600474600476, Avg f_macro 0.07633678284161502


 96%|██████████████████████████████████████████████████████████████████████████████████████████████▎   | 963/1000 [1:55:05<41:46, 67.73s/it]

Avg f1_micro 0.1296112736922706, Avg f_macro 0.07625751307750119


 96%|██████████████████████████████████████████████████████████████████████████████████████████████▍   | 964/1000 [1:55:08<29:03, 48.44s/it]

Avg f1_micro 0.12964971289660088, Avg f_macro 0.07628214221331292


 96%|██████████████████████████████████████████████████████████████████████████████████████████████▌   | 965/1000 [1:55:12<20:28, 35.09s/it]

Avg f1_micro 0.12966339935251853, Avg f_macro 0.07628944914711605


 97%|██████████████████████████████████████████████████████████████████████████████████████████████▋   | 966/1000 [1:55:13<14:08, 24.94s/it]

Avg f1_micro 0.12952917223103558, Avg f_macro 0.07621047456207762


 97%|██████████████████████████████████████████████████████████████████████████████████████████████▊   | 967/1000 [1:55:17<10:11, 18.53s/it]

Avg f1_micro 0.12954295503416496, Avg f_macro 0.07621784049669111


 97%|██████████████████████████████████████████████████████████████████████████████████████████████▊   | 968/1000 [1:55:19<07:16, 13.63s/it]

Avg f1_micro 0.12982235280789, Avg f_macro 0.07638506921321855


 97%|██████████████████████████████████████████████████████████████████████████████████████████████▉   | 969/1000 [1:55:21<05:17, 10.23s/it]

Avg f1_micro 0.12994637514761354, Avg f_macro 0.0764782390764316


 97%|███████████████████████████████████████████████████████████████████████████████████████████████   | 970/1000 [1:55:24<03:56,  7.87s/it]

Avg f1_micro 0.13001859537942012, Avg f_macro 0.07651394306821992


 97%|███████████████████████████████████████████████████████████████████████████████████████████████▏  | 971/1000 [1:55:27<03:07,  6.45s/it]

Avg f1_micro 0.13009066685688725, Avg f_macro 0.07654957351934545


 97%|███████████████████████████████████████████████████████████████████████████████████████████████▎  | 972/1000 [1:55:28<02:19,  4.98s/it]

Avg f1_micro 0.12995682872226083, Avg f_macro 0.07647081881407865


 97%|███████████████████████████████████████████████████████████████████████████████████████████████▎  | 973/1000 [1:55:31<01:55,  4.29s/it]

Avg f1_micro 0.1298232656917138, Avg f_macro 0.0763922259889871


 97%|███████████████████████████████████████████████████████████████████████████████████████████████▍  | 974/1000 [1:55:34<01:38,  3.77s/it]

Avg f1_micro 0.1298953157269379, Avg f_macro 0.0764115749307213


 98%|███████████████████████████████████████████████████████████████████████████████████████████████▌  | 975/1000 [1:55:35<01:18,  3.12s/it]

Avg f1_micro 0.12976208976208978, Avg f_macro 0.0763332040846385


 98%|███████████████████████████████████████████████████████████████████████████████████████████████▋  | 976/1000 [1:55:37<01:06,  2.78s/it]

Avg f1_micro 0.12988528434225155, Avg f_macro 0.07640136385797099


 98%|███████████████████████████████████████████████████████████████████████████████████████████████▋  | 977/1000 [1:55:40<01:04,  2.82s/it]

Avg f1_micro 0.12975234136953687, Avg f_macro 0.07632316389496385


 98%|███████████████████████████████████████████████████████████████████████████████████████████████▊  | 978/1000 [1:55:47<01:30,  4.10s/it]

Avg f1_micro 0.12973328080690044, Avg f_macro 0.07630902978055182


 98%|███████████████████████████████████████████████████████████████████████████████████████████████▉  | 979/1000 [1:55:50<01:15,  3.59s/it]

Avg f1_micro 0.1298050547795185, Avg f_macro 0.0763445783825238


 98%|████████████████████████████████████████████████████████████████████████████████████████████████  | 980/1000 [1:55:52<01:04,  3.21s/it]

Avg f1_micro 0.1300807639072945, Avg f_macro 0.07652177779233754


 98%|████████████████████████████████████████████████████████████████████████████████████████████████▏ | 981/1000 [1:55:54<00:56,  2.99s/it]

Avg f1_micro 0.1301520373385817, Avg f_macro 0.07657119494035759


 98%|████████████████████████████████████████████████████████████████████████████████████████████████▏ | 982/1000 [1:55:58<00:56,  3.12s/it]

Avg f1_micro 0.13001949962235093, Avg f_macro 0.07649322020009246


 98%|████████████████████████████████████████████████████████████████████████████████████████████████▎ | 983/1000 [1:56:03<01:05,  3.84s/it]

Avg f1_micro 0.13001439331551234, Avg f_macro 0.07646384667762954


 98%|████████████████████████████████████████████████████████████████████████████████████████████████▍ | 984/1000 [1:56:08<01:03,  3.97s/it]

Avg f1_micro 0.12988226486702095, Avg f_macro 0.07638613951637178


 98%|████████████████████████████████████████████████████████████████████████████████████████████████▌ | 985/1000 [1:56:10<00:53,  3.54s/it]

Avg f1_micro 0.12995345038492248, Avg f_macro 0.0764354936894516


 99%|████████████████████████████████████████████████████████████████████████████████████████████████▋ | 986/1000 [1:56:13<00:45,  3.29s/it]

Avg f1_micro 0.13002449151029272, Avg f_macro 0.07647066165843909


 99%|████████████████████████████████████████████████████████████████████████████████████████████████▋ | 987/1000 [1:56:16<00:40,  3.11s/it]

Avg f1_micro 0.13009538868201484, Avg f_macro 0.07653792253098084


 99%|████████████████████████████████████████████████████████████████████████████████████████████████▊ | 988/1000 [1:56:18<00:36,  3.01s/it]

Avg f1_micro 0.1299637131873974, Avg f_macro 0.07646045499805475


 99%|████████████████████████████████████████████████████████████████████████████████████████████████▉ | 989/1000 [1:56:22<00:34,  3.12s/it]

Avg f1_micro 0.12983230397284998, Avg f_macro 0.07638314412343587


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████ | 990/1000 [1:56:25<00:31,  3.15s/it]

Avg f1_micro 0.12986951039981343, Avg f_macro 0.07641822287796889


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████ | 991/1000 [1:56:29<00:31,  3.54s/it]

Avg f1_micro 0.12999073188276014, Avg f_macro 0.07641873231696496


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████▏| 992/1000 [1:56:31<00:23,  2.99s/it]

Avg f1_micro 0.12985969283852347, Avg f_macro 0.07634169730454866


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████▎| 993/1000 [1:56:35<00:21,  3.14s/it]

Avg f1_micro 0.1297289177198543, Avg f_macro 0.07626481744825003


 99%|█████████████████████████████████████████████████████████████████████████████████████████████████▍| 994/1000 [1:56:37<00:17,  2.94s/it]

Avg f1_micro 0.12979961297365725, Avg f_macro 0.07631384680695401


100%|█████████████████████████████████████████████████████████████████████████████████████████████████▌| 995/1000 [1:56:39<00:12,  2.55s/it]

Avg f1_micro 0.12966916110132193, Avg f_macro 0.07623714947347968


100%|█████████████████████████████████████████████████████████████████████████████████████████████████▌| 996/1000 [1:56:44<00:14,  3.52s/it]

Avg f1_micro 0.12965052852101047, Avg f_macro 0.0762233571547312


100%|█████████████████████████████████████████████████████████████████████████████████████████████████▋| 997/1000 [1:56:48<00:10,  3.42s/it]

Avg f1_micro 0.12952048787053805, Avg f_macro 0.07614690443943058


100%|█████████████████████████████████████████████████████████████████████████████████████████████████▊| 998/1000 [1:56:53<00:07,  3.94s/it]

Avg f1_micro 0.12951595832357357, Avg f_macro 0.07611831941255644


100%|█████████████████████████████████████████████████████████████████████████████████████████████████▉| 999/1000 [1:56:56<00:03,  3.81s/it]

Avg f1_micro 0.12952931286264618, Avg f_macro 0.07613312498963004


100%|█████████████████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [1:56:58<00:00,  7.02s/it]

Avg f1_micro 0.12959978354978355, Avg f_macro 0.0761819918646404





In [294]:
np.mean([36, 46, 35, 345])

115.5

In [290]:
["".join(untokenize_id(c)) for c in ranked_generated_tokens]

[' the first time in years',
 ' the first time since 2015',
 ' the first time since 2015',
 ' the best player in history',
 ' his national team in Spain',
 ' the football team of America',
 ' the Brazilian team. Legend',
 " Ronaldo's team in 2020",
 ' the Brazilian team on field',
 ' a different team every game',
 ' the national anthem for Brazil',
 ' the World Cup of Football',
 ' the United States of America',
 ' the United States of America',
 ' the United States of America',
 ' the United States of America',
 ' the United States of America',
 ' the National team or not',
 ' Real Madrid and never scores',
 ' the best of his teams',
 ' the Ronaldo.  Nice',
 ' the club, not himself',
 ' Real Madrid. ��',
 ' the champions league right now',
 ' the Madrid Madrid football team',
 ' the Real Madrid Real Madrid',
 ' @user today in Argentina',
 ' the reds, apparently',
 ' Portugal, and not Argentina',
 ' a team in their league',
 ' this world Cup as well',
 ' the best of his ability',
 ' th

In [238]:
rouge.compute(references=gold_tok,
                      predictions=pred_tok_j)['rouge1']

AggregateScore(low=Score(precision=0.0, recall=0.0, fmeasure=0.0), mid=Score(precision=0.0, recall=0.0, fmeasure=0.0), high=Score(precision=0.0, recall=0.0, fmeasure=0.0))

In [32]:
np.array(f1_macro).max()

0.07692307692307693

In [25]:
untokenize_id(labels_ids_i)

[' United', ' States', ' women', "'s", ' national', ' soccer', ' team']

In [33]:
untokenize_batch(ranked_generated_tokens[0:10])

[[' the', ' St', '.', ' Louis', ' Louis', ' Blues', ' tonight'],
 [' the', ' @', 'All', 'S', ' considered', 'FC', ' today'],
 [' the', ' game', '.', ' ', ' That', "'s", ' all'],
 [' the', ' @', 'D', 'ynam', 'ites', ' FC', ' today'],
 [' the', ' Panthers', '!', ' 1', '-', '0', ' Panther'],
 [' the', ' @', 'Chief', 's', ' in', ' the', ' fourth'],
 [' the', ' Bills', ' in', ' my', ' head', ' right', ' now'],
 [' the', ' @', 'Rap', 'She', 'et', ' right', ' now'],
 [' the', ' Bears', '.', ' Will', ' be', ' tough', ' loss'],
 [' the', ' #', 'Fal', 'cons', ' on', ' both', ' sides']]

In [None]:
ranked_logits = sum_logits[ranked_inds_of_list]

In [None]:
ranked_generated_tokens = np.array(generated_seq_tokens)[ranked_inds_of_list]

In [None]:
ranked_generated_tokens

In [None]:
# generate token for each mask in parallel
for m in mask_inds:
    # tensor
    inp = torch.tensor(tokenized_sentence_b).cuda() if cuda else torch.tensor(tokenized_sentence_b)  # shape bs x max_len
    
    # get logits
    out = model(inp)
    logits = out.logits
    
    # get new ids
    idxs = generate_step(logits, gen_idx=m, 
                                 top_k=100, temperature=temperature, 
#                                  sample=(m < burnin)
                                )
    predicted_tokens.append(idxs[0])

In [None]:
# tokenize text
text_ids = tokenizer_return_id(text)
num_tokens=len(text_ids)
if num_tokens >= max_len:
    text_ids_max_len = text_ids[:max_len] # truncate       
else:
    text_ids_max_len = text_ids + (max_len-num_tokens) * [pad_id] # pad       
assert len(text_ids_max_len) == max_len, len(text_ids_max_len)
batch.append(text_ids_max_len)

## Old stuff

In [None]:
def load_file(filename):
    """
    :param filename:
    :return:
    """
    data = []
    with open(filename, "r") as f:
        for line in f.readlines():
            data.append(json.loads(line))
    return data

In [None]:
def tokenizer_return_id(text):
    output = tokenizer(text)
    token_ids = [i for i in output['input_ids'] if i not in tokenizer.all_special_ids]
    return token_ids

In [None]:
test_data = load_file(TEMPLAMA_NEW_DIR)
years = sorted(list(set([d["date"] for d in test_data])))
# split per year
test_data_dict = {k: {"text": [], "labels": [], "labels_ids": [], "relation": []} for k in years}

In [None]:
d = test_data[0]
year = d["date"]
relation = d['relation']
if type(d['answer']) is not list: d['answer'] = [d['answer']]
labels_string_list = [label['name'] for label in d['answer']]
labels_ids_list = [tokenizer_return_id(string) for string in labels_string_list]
num_masks_list = [len(tokens) for tokens in labels_ids_list]

In [None]:
all_answers = [a["name"] for a in d["answer"]]
multiple_masks = [" ".join([mask_token for _ in range(num_masks)]) for num_masks in num_masks_list]

In [None]:
all_masked_answers = [d["query"].replace("_X_", _mask) for _mask in multiple_masks]

In [None]:
[a["name"] for a in d["answer"]]

In [None]:
multiple_masks = [" ".join([mask_token for _ in range(num_masks)]) for num_masks in num_masks_list]

In [None]:
multiple_masks

In [None]:
def load_dynamic_templama(filename):
    """
    Our dynamically-created TempLAMA version
    :return:
    """
    single_mask = False
    lowercase = False
    
    test_data = load_file(filename)
    years = sorted(list(set([d["date"] for d in test_data])))
    # split per year
    test_data_dict = {k: {"text": [], "labels": [], "labels_ids": [], "relation": []} for k in years}
    for d in tqdm(test_data):
        year = d["date"]
        relation = d['relation']
        if type(d['answer']) is not list: d['answer'] = [d['answer']]
        labels_string_list = [label['name'] for label in d['answer']]  # list of strings with all the labels
        if lowercase:
            labels_string_list = [label['name'].lower() for label in d['answer']]
        labels_ids_list = [tokenizer_return_id(string) for string in labels_string_list]  # list of lists with ids
        num_masks_list = [len(tokens) for tokens in labels_ids_list]
        """
        If we want to consider more correct labels we have to change accepted labels
        """
        # If we evaluate only single-token labels
        if single_mask:
            # check if there is answer with one mask
            if 1 in num_masks_list:
                labels_ids_with_one_mask_index = [i for i,l in enumerate(num_masks_list) if l==1]  # list of ids where answer requires one mask/token
                # accepted_labels = list(np.array(labels_string_list)[labels_ids_with_one_mask_index])
                accepted_labels_ids = np.array(labels_ids_list)[labels_ids_with_one_mask_index].tolist()
                accepted_labels = [[tokenizer.decode(label_id)] for label_id in accepted_labels_ids]
                assert len(accepted_labels)==len(accepted_labels_ids)
                assert len(accepted_labels[0])==len(accepted_labels_ids[0])
                text = d["query"].replace("_X_", mask_token)
                if lowercase:
                    text = d["query"].lower().replace("_x_", mask_token)
                
                test_data_dict[year]["text"].append(text)
                test_data_dict[year]["labels"].append(accepted_labels)
                test_data_dict[year]["labels_ids"].append(accepted_labels_ids)
                test_data_dict[year]["relation"].append(relation)
            else:
                # skip this example
                continue
        else: 
            # accept all labels
#             all_answers = [a["name"] for a in d["answer"]]
            multiple_masks = [" ".join([mask_token for _ in range(num_masks)]) for num_masks in num_masks_list]
            all_masked_queries = [d["query"].replace("_X_", _mask) for _mask in multiple_masks]
            if lowercase:
                all_masked_queries = [d["query"].lower().replace("_x_", _mask) for _mask in multiple_masks]
#                 # todo
#                 all_answers = [seq.lower() for seq in d["answer"]]
#                 # replace "_X_" with correct mask token
#                 if single_mask:
#                     text = d["query"].lower().replace("_x_", mask_token)
#                 else:
#                     num_masks = len(all_answers[0].split())
#                     multiple_masks = " ".join([mask_token for _ in range(num_masks)])
#                     text = d["query"].lower().replace("_x_", multiple_masks)
            else:
                multiple_masks = [" ".join([mask_token for _ in range(num_masks)]) for num_masks in num_masks_list]
                # replace _X_ with as many mask tokens as the correct label
                all_masked_queries = [d["query"].replace("_X_", _mask) for _mask in multiple_masks]

                # Because we have multiple correct labels of possibly different number of tokens, 
                # we now have multiple multiple texts (depending on the number of masks)
                # so we append them all separately at the test set
            
            for i in range(len(all_answers)):
                test_data_dict[year]["text"].append(all_masked_queries[i])
                test_data_dict[year]["labels"].append(labels_string_list[i])
                test_data_dict[year]["labels_ids"].append(labels_ids_list[i])
                test_data_dict[year]["relation"].append(relation)

    return test_data_dict

In [None]:
load_dynamic_templama(TEMPLAMA_NEW_DIR)

In [None]:
test_data = load_file(filename)

### Original TempLAMA dataset (downloaded from Google Research github repo)
- 2010-2020
- 9 relations
- 1,000 subjects per relation

In [None]:
orig_templama = load_file(TEMPLAMA_NEW_DIR)

In [None]:
orig_templama


Number of examples per year:

In [None]:
Counter([x['date'] for x in orig_templama])

In [None]:
print('In total: {} examples for all years, {} unique facts.'.format(len(orig_templama), 
      len(set([x['query'] for x in orig_templama]))))

Number of facts per relation:

In [None]:
Counter([x['relation'] for x in orig_templama])

### Dynamic TempLAMA dataset (by running their code)
- 2019-2020
- 9 relations
- 5,000 subjects per relation

In [None]:
reproduced_templama = load_file(TEMPLAMA_NEW_DIR)

Number of examples per quarter:


In [None]:
Counter([x['date'] for x in reproduced_templama])

In [None]:
print('In total: {} examples for all years, {} unique facts.'.format(len(reproduced_templama), 
      len(set([x['query'] for x in reproduced_templama]))))

Number of facts per relation:


In [None]:
Counter([x['relation'] for x in reproduced_templama])

In [None]:
data = load_dynamic_templama(TEMPLAMA_NEW_DIR)

In [None]:
data['2019-Q1'].keys()

In [None]:
for quarter in data:
    quarter_dataset = data[quarter]["text"]
    num_examples = len(quarter_dataset)
    num_relations = Counter(data['2019-Q1']['relation']).items()
    print("Quarter {} - num examples {} - relations {}".format(quarter,num_examples,num_relations))
    

In [None]:
Counter(data['2019-Q1']['relation']).items()

In [None]:
data_2019_q1 = data['2019-Q1']
data_2019_q2 = data['2019-Q2']

In [None]:
next(iter(data)) 


In [None]:
list(data.keys())

In [None]:
unchanged_t, new_t, updated_t, deleted_t = {}, {}, {}, {}
quarters = list(data.keys())
t_1 = quarters[0]

for t in quarters[1:]:
    data_t = data[t]      # D_t
    data_t_1 = data[t_1]  # D_(t-1)

    unchanged_t[t] = {key:[] for key in data_t.keys()} 
    new_t[t] = {key:[] for key in data_t.keys()} 
    updated_t[t] = {key:[] for key in data_t.keys()} 
    deleted_t[t] = {key:[] for key in data_t.keys()} 

#     for i in range(0,len(data_t_1['text'])):
#         text_t_1 = data_t_1['text'][j]
#         if text_t_1 not in data_t['text']:
#             # text_(t+1) not in D_t
#             # add to D_deleted
#             for key in ['text', 'relation']:
#                 deleted_t[t][key].append(data_t_1[key])
                
    for i in range (0, len(data_t['text'])):
        text_t = data_t['text'][i]
        labels_ids_t = data_t['labels_ids'][i][0]
        if text_t in data_t_1['text']:
            t_1_index = data_t_1['text'].index(text_t)
            labels_inds_t_1 = data_t_1['labels_ids'][t_1_index][0]
            if labels_ids_t == labels_inds_t_1:
                # text_t = text_t-1 & label_t = label_t-1 
                # add to D_unchanged
                for key in data_t.keys():
                    unchanged_t[t][key].append(data_t[key])
            else:
                # text_t = text_(t-1) & label_t != label_(t-1)
                # add to D_updated
                for key in ['text', 'relation']:
                    updated_t[t][key].append(data_t[key])
        else:
            # text_t not in D_(t-1) texts 
            # add to D_new
            for key in ['text', 'relation']:
                new_t[t][key].append(data_t[key])
    for j in range(0,len(data_t_1['text'])):
        text_t_1 = data_t_1['text'][j]
        if text_t_1 not in data_t['text']:
            # text_(t+1) not in D_t
            # add to D_deleted
            for key in ['text', 'relation']:
                deleted_t[t][key].append(data_t_1[key])
    t_1 = t
    
    assert len(data_t['text']) == len(unchanged_t[t]['text']) + len(updated_t[t]['text']) + len(new_t[t]['text'])
    print('t={}: From total {} samples in D_t, {} are unchanged, {} are updated, {} are deleted and {} are new, compared to D_(t-1).'.format(t,
                                                                                                                             len(data_t['text']),
                                                                                                                    len(unchanged_t[t]['text']),
                                                                                                                   len(updated_t[t]['text']),
                                                                                                                                             len(deleted_t[t]['text']),
                                                                                                                   len(new_t[t]['text'])))

            
            

In [None]:
len(data[quarters[0]]['relation'])

In [None]:
len(updated_t['text'])

In [None]:
len(new_t['text'])

In [None]:
len(data_2019_q2['text'])

In [None]:
i=0
text_data_2019_q2['text'][i]

In [None]:
text_t = data_2019_q2['text'][i]

In [None]:
labels_ids_t = data_2019_q2['labels_ids'][i][0]

In [None]:
if text_t in data_2019_q1['text']:
    data_2019_q1['text']

In [None]:
t_1_index = data_2019_q1['text'].index(text_t)

In [None]:
labels_t_1 = data_2019_q1['labels_ids'][t_1_index][0]

In [None]:
labels_t_1 == labels_ids_t

In [None]:
labels_ids_t

In [None]:
data_2019_q2.keys()

In [None]:
unchanged_t = {key:[] for key in data_2019_q2.keys()} 

In [None]:
unchanged_t