- Fine-tuning mBERT on PersianQA and ParSQuAD Datasets 

# Setup

In [1]:
!pip install -q transformers
!pip install -q datasets

In [2]:
import json
import pandas as pd

In [1]:
from datasets import load_dataset, load_from_disk, Dataset
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
from transformers import TrainingArguments, Trainer

  from .autonotebook import tqdm as notebook_tqdm


In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
model_checkpoint = "bert-base-multilingual-uncased"
max_length = 512 # The maximum length of a feature (question and context)
doc_stride = 256 # The authorized overlap between two part of the context when splitting it is needed.
batch_size = 16
lr = 3e-5
epoch = 2


In [4]:
model_checkpoint = 'mbert_checkpoints/checkpoint-6000'

# Load Datasets

In [5]:
train_path = 'train.csv'
test_path  = 'validation.csv'

train_df = pd.read_csv(train_path)
test_df = pd.read_csv(test_path)
train_dataset = Dataset.from_pandas(train_df)
test_dataset = Dataset.from_pandas(test_df)

In [6]:
train_dataset.save_to_disk("train.hf")
test_dataset.save_to_disk("test.hf")

                                                                               

In [5]:
train_dataset = load_from_disk("train.hf").shuffle(seed=42)
test_dataset = load_from_disk("test.hf").shuffle(seed=42)



# Tokenize Datasets

In [6]:
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)

In [8]:
def prepare_train_features(examples):
    tokenized_examples = tokenizer(
        examples["question"],
        examples["context"],
        truncation="only_second",
        max_length=max_length,
        stride=doc_stride,
        return_overflowing_tokens=True,
        return_offsets_mapping=True,)
    
    sample_mapping = tokenized_examples.pop("overflow_to_sample_mapping")
    offset_mapping = tokenized_examples.pop("offset_mapping")
    tokenized_examples["start_positions"] = []
    tokenized_examples["end_positions"] = []
    for i, offsets in enumerate(offset_mapping):
        # We will label impossible answers with the index of the CLS token.
        input_ids = tokenized_examples["input_ids"][i]
        cls_index = input_ids.index(tokenizer.cls_token_id)
        # Grab the sequence corresponding to that example (to know what is the context and what is the question).
        sequence_ids = tokenized_examples.sequence_ids(i)
        # One example can give several spans, this is the index of the example containing this span of text.
        sample_index = sample_mapping[i]
        answers = examples["answers"][sample_index]
        # If no answers are given, set the cls_index as answer.
        if examples["answer_start"][sample_index] == 0:
            tokenized_examples["start_positions"].append(cls_index)
            tokenized_examples["end_positions"].append(cls_index)
        else:
            # Start/end character index of the answer in the text.
            start_char = examples["answer_start"][sample_index]
            end_char = start_char + len(examples["answers"][sample_index])
            # Start token index of the current span in the text.
            token_start_index = 0
            while sequence_ids[token_start_index] != 1:
                token_start_index += 1
            # End token index of the current span in the text.
            token_end_index = len(input_ids) - 1
            while sequence_ids[token_end_index] != 1:
                token_end_index -= 1
            # Detect if the answer is out of the span (in which case this feature is labeled with the CLS index).
            if not (offsets[token_start_index][0] <= start_char and offsets[token_end_index][1] >= end_char):
                tokenized_examples["start_positions"].append(cls_index)
                tokenized_examples["end_positions"].append(cls_index)
            else:
                # Otherwise move the token_start_index and token_end_index to the two ends of the answer.
                # Note: we could go after the last offset if the answer is the last word (edge case).
                while token_start_index < len(offsets) and offsets[token_start_index][0] <= start_char:
                    token_start_index += 1
                tokenized_examples["start_positions"].append(token_start_index - 1)
                while offsets[token_end_index][1] >= end_char:
                    token_end_index -= 1
                tokenized_examples["end_positions"].append(token_end_index + 1)

    return tokenized_examples

In [9]:
# the datasets library does cashing itself, batched is multitreading for fast-tokenizer
tokenized_train = train_dataset.map(prepare_train_features, batched=True, remove_columns=train_dataset.column_names)
tokenized_test = test_dataset.map(prepare_train_features, batched=True, remove_columns=test_dataset.column_names)

                                                                               

# Training 

In [10]:
model = AutoModelForQuestionAnswering.from_pretrained(model_checkpoint)

In [15]:
mkdir mbert_checkpoints

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


In [11]:
args = TrainingArguments(
    f"mbert_checkpoints",
    evaluation_strategy = "epoch",
    learning_rate=lr,
    per_device_train_batch_size=batch_size,
    per_device_eval_batch_size=batch_size,
    num_train_epochs=epoch,
    weight_decay=0.0001) 

In [12]:
trainer = Trainer(
    model=model,
    args=args,
    train_dataset=tokenized_train,
    eval_dataset=tokenized_test,
    tokenizer=tokenizer)

In [13]:
# start training
trainer.train()

You're using a BertTokenizerFast tokenizer. Please note that with a fast tokenizer, using the `__call__` method is faster than using a method to encode the text followed by a call to the `pad` method to get a padded encoding.


Epoch,Training Loss,Validation Loss
1,0.6698,2.116848
2,0.6163,1.995035


TrainOutput(global_step=6266, training_loss=0.5921192260508411, metrics={'train_runtime': 2500.1593, 'train_samples_per_second': 40.098, 'train_steps_per_second': 2.506, 'total_flos': 2.145795708405979e+16, 'train_loss': 0.5921192260508411, 'epoch': 2.0})

In [15]:
import torch
torch.save(model, 'mbert_checkpoints/mbert.pt')

# Test Model

In [3]:
!pip install -q sentencepiece

from tqdm import tqdm
from IPython.display import clear_output
import torch
from transformers import AutoModelForQuestionAnswering, AutoTokenizer


In [4]:
model_path = f"mbert_checkpoints/checkpoint-6000/"  ## load model trained for 4 epochs
model = AutoModelForQuestionAnswering.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)


In [14]:
class AnswerPredictor:
  def __init__(self, model, tokenizer, device='cuda', n_best=10, max_length=512, stride=256, no_answer=False):
      """Initializes PyTorch Question Answering Prediction
      It's best to leave use the default values.
      Args:
          model: Fine-tuned torch model
          tokenizer: Transformers tokenizer
          device (torch.device): Running device
          n_best (int): Number of best possible answers
          max_length (int): Tokenizer max length
          stride (int): Tokenizer stride
          no_answer (bool): If True, model can return "no answer"
      """
      self.model = model.eval().to(device)
      self.tokenizer = tokenizer
      self.device = device
      self.max_length = max_length
      self.stride = stride
      self.no_answer = no_answer
      self.n_best = n_best


  def model_pred(self, questions, contexts, batch_size=1):
      n = len(contexts)
      if n%batch_size!=0:
          raise Exception("batch_size must be divisible by sample length")

      tokens = self.tokenizer(questions, contexts, add_special_tokens=True, 
                              return_token_type_ids=True, return_tensors="pt", padding=True, 
                              return_offsets_mapping=True, truncation="only_second", 
                              max_length=self.max_length, stride=self.stride)

      start_logits, end_logits = [], []
      for i in tqdm(range(0, n-batch_size+1, batch_size)):
          with torch.no_grad():
              out = self.model(tokens['input_ids'][i:i+batch_size].to(self.device), 
                          tokens['attention_mask'][i:i+batch_size].to(self.device), 
                          tokens['token_type_ids'][i:i+batch_size].to(self.device))

              start_logits.append(out.start_logits)
              end_logits.append(out.end_logits)

      return tokens, torch.stack(start_logits).view(n, -1), torch.stack(end_logits).view(n, -1)


  def __call__(self, questions, contexts, batch_size=1, answer_max_len=100):
      """Creates model prediction
      
      Args: 
          questions (list): Question strings
          contexts (list): Contexts strings
          batch_size (int): Batch size
          answer_max_len (int): Sets the longests possible length for any answer
        
      Returns:
          dict: The best prediction of the model
              (e.g {0: {"text": str, "score": int}})
      """
      questions = [questions]
      contexts = [contexts]
      tokens, starts, ends = self.model_pred(questions, contexts, batch_size=batch_size)
      start_indexes = starts.argsort(dim=-1, descending=True)[:, :self.n_best]
      end_indexes = ends.argsort(dim=-1, descending=True)[:, :self.n_best]

      preds = {}
      for i, (c, q) in enumerate(zip(contexts, questions)):  
          min_null_score = starts[i][0] + ends[i][0] # 0 is CLS Token
          start_context = tokens['input_ids'][i].tolist().index(self.tokenizer.sep_token_id)
          
          offset = tokens['offset_mapping'][i]
          valid_answers = []
          for start_index in start_indexes[i]:
              # Don't consider answers that are in questions
              if start_index<start_context:
                  continue
              for end_index in end_indexes[i]:
                  # Don't consider out-of-scope answers, either because the indices are out of bounds or correspond
                  # to part of the input_ids that are not in the context.
                  if (start_index >= len(offset) or end_index >= len(offset)
                      or offset[start_index] is None or offset[end_index] is None):
                      continue
                  # Don't consider answers with a length that is either < 0 or > max_answer_length.
                  if end_index < start_index or (end_index-start_index+1) > answer_max_len:
                      continue

                  start_char = offset[start_index][0]
                  end_char = offset[end_index][1]
                  valid_answers.append({"score": (starts[i][start_index] + ends[i][end_index]).item(),
                                        "text": c[start_char: end_char]})
                  
          if len(valid_answers) > 0:
              best_answer = sorted(valid_answers, key=lambda x: x["score"], reverse=True)[0]
          else:
              best_answer = {"text": "", "score": min_null_score}

          if self.no_answer:
              preds[i] = best_answer if best_answer["score"] >= min_null_score else {"text": "", "score": min_null_score}
          else:
              preds[i] = best_answer

      return preds


In [15]:
predictor = AnswerPredictor(model, tokenizer, device='cuda', n_best=10, no_answer=True)


In [7]:
test_dataset = load_from_disk("test.hf").shuffle(seed=42)



In [19]:
context = test_dataset[9]['context'] 
question = test_dataset[9]['question'] 

preds = predictor(question, context, batch_size=1)
print('\n\n Model Prediction: ', preds[0]['text'].strip())

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.96it/s]



 Model Prediction:  جامعه اروپا





In [18]:
preds

{0: {'text': '', 'score': tensor(18.4328, device='cuda:0')}}

In [20]:
from nltk.translate.bleu_score import sentence_bleu


def compute_f1(prediction, answer):
    pred_tokens = prediction.split()
    answer_tokens = answer.split()
    
    if len(pred_tokens) == 0 or len(answer_tokens) == 0:
        return int(pred_tokens == answer_tokens)
    
    common_tokens = set(pred_tokens) & set(answer_tokens)
    
    if len(common_tokens) == 0:
        return 0
    
    prec = len(common_tokens) / len(pred_tokens)
    rec = len(common_tokens) / len(answer_tokens)
    
    return 2 * (prec * rec) / (prec + rec)

    
    prec = len(common_tokens) / len(pred_tokens)
    rec = len(common_tokens) / len(answer_tokens)
    
    return 2 * (prec * rec) / (prec + rec)

def compute_exact_match(prediction, answer):
    return int(prediction == answer)

def bleu(prediction, answer) : 
  reference = [answer.split(' ')]
  candidate = pred.split(' ')
  BLEU = sentence_bleu(reference, candidate)
  BLEU1 = sentence_bleu(reference, candidate, weights=(1, 0, 0, 0))
  BLEU4 = sentence_bleu(reference, candidate, weights=(0, 0, 0, 1))

  return BLEU, BLEU1, BLEU4


In [21]:
predictor = AnswerPredictor(model, tokenizer, device='cuda', n_best=10, no_answer=True)

EH = 0
F1 = 0
BLEU = 0
BLEU1 = 0
BLEU4 = 0
for example in test_dataset: 

  #print(len(example['answers']))
  #if len(example['answers']) != 2: 
    #print(example['answers'])
  if example['answers'] == [] :
    context = example['context'] 
    question = example['question'] 
    preds = predictor([question], [context], batch_size=1)
    pred = preds[0]['text'].strip()
    if pred == [] : 
      EH += 1
      F1 += 1

    continue

  context = example['context'] 
  question = example['question'] 
  answer = example['answers']
  preds = predictor(question, context, batch_size=1)
  pred = preds[0]['text'].strip()

  EH += compute_exact_match(pred, answer)
  F1 += compute_f1(pred, answer)
  b, b1, b4 = bleu(pred, answer)
  BLEU += b
  BLEU1 += b1
  BLEU4 += b4

EH /= len(test_dataset)
F1 /= len(test_dataset)
BLEU /= len(test_dataset)
BLEU1 /= len(test_dataset)
BLEU4 /= len(test_dataset)

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.39it/s]
The hypothesis contains 0 counts of 2-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.03it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.65it/s]
100%|

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.65it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.26it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.79it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.57it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.59it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.64it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.54it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 84.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.79it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.05it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.82it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.45it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.86it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.19it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.62it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.19it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 81.93it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.62it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.94it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.61it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.03it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 44.40it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.64it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.79it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.35it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.84it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.79it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.92it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.28it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.41it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.86it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.03it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.11it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.22it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.91it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.34it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.26it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.40it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.50it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.45it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.13it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.75it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.62it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.73it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.32it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.12it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.67it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.78it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.27it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.25it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.36it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.84it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 82.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.73it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.72it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.61it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.02it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.82it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.69it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.77it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 83.76it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 80.19it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.76it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.73it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.42it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.92it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.22it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.31it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.74it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.45it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.38it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.44it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.26it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.64it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 80.04it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 80.23it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.89it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 81.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.24it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.36it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.96it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 81.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.37it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.11it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.53it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.33it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.08it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.31it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.11it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.97it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.34it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.52it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.37it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.24it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.33it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.50it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.05it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.73it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.30it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.99it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.35it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.14it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.01it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.57it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.18it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.28it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.42it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.71it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.43it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.01it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.50it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.20it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.00it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.57it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.04it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.44it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.63it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.36it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.74it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.69it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.49it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.99it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.33it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.38it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.12it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.70it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.47it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.44it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.37it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.21it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.23it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.53it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.62it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.00it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.78it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.28it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.74it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.65it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.04it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.05it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.22it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.49it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.76it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.71it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.24it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.92it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.82it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.39it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.08it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.20it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.12it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.18it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.77it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.89it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.59it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.04it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.15it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.86it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.85it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.69it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.95it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.57it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.12it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.42it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.62it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.96it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.39it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 65.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 50.69it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 63.96it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.58it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.88it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.84it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 65.39it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.44it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.32it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.86it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.49it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.61it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.19it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.43it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.35it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.02it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.91it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.46it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.38it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.34it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.15it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.35it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.85it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.60it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.20it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.91it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.15it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.69it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.84it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.92it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.57it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.29it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.55it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.03it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.43it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.63it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.05it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.65it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 57.02it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.34it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 55.92it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 56.08it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.10it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.08it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.59it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.79it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.47it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.16it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 63.39it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.02it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 63.34it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.93it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.53it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.31it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 63.43it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 61.60it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.71it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 56.05it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.01it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 75.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 78.18it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.46it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.68it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.56it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.88it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.50it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.50it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.40it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.75it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.23it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.29it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.98it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 77.75it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.88it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.83it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.82it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.00it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.31it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.51it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.99it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.33it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.42it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.25it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.86it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.43it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.25it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.56it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.51it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.33it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.04it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.87it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.80it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.00it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 76.08it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.46it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.23it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.04it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.37it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.33it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.85it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.17it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.06it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.26it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.75it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 62.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 63.20it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.67it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.42it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 59.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 58.39it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 60.84it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.73it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.54it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.31it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.60it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.30it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 70.20it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.03it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.41it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.71it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.29it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 68.73it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.43it/s]
100%|███████████████████████████████████

100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 66.18it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 67.06it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.88it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.21it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.52it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.26it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.07it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 73.66it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 69.94it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 71.63it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 74.09it/s]
100%|████████████████████████████████████████████| 1/1 [00:00<00:00, 72.17it/s]
100%|███████████████████████████████████

In [22]:
print('Exact match of mBERT on testset : ' + str(EH))
print('F1 score of mBERT on testset : ' + str(F1))
# print('BLEU score of mBERT on testset : ' + str(BLEU))
print('BLEU1 score of mBERT on testset : ' + str(BLEU1))
# print('BLEU4 score of mBERT on testset : ' + str(BLEU4))
     


Exact match of mBERT on testset : 0.5347758887171561
F1 score of mBERT on testset : 0.6979428122111423
BLEU1 score of mBERT on testset : 0.6557083500410094
