In [11]:

import logging
from tqdm import tqdm
import numpy as np

import torch
import torch.nn as nn
from torch.utils.data import DataLoader

from models import Model
from data.dataset import ResponseSelectionDataset
from models.utils.checkpointing import load_checkpoint
from models.utils.scorer import calculate_candidates_ranking, logits_mrr, logits_recall_at_k

class Evaluation(object):
    def __init__(self, hparams, model=None, split = "test"):

        self.hparams = hparams
        self.model = model
        self._logger = logging.getLogger(__name__)
        self.device = (torch.device("cuda", self.hparams.gpu_ids[0])
        if self.hparams.gpu_ids[0] >= 0 else torch.device("cpu"))
        self.split = split
        print("Evaluation Split :", self.split)

        do_valid, do_test = False, False
        if split == "valid":
            do_valid = True
        else:
            do_test = True
        self._build_dataloader(do_valid=do_valid, do_test=do_test)
        self._dataloader = self.valid_dataloader if split == 'valid' else self.test_dataloader

        #if model is None:
        #	print("No pre-defined model!")
        #	self._build_model()

    def _build_dataloader(self, do_valid=False, do_test=False):

        if do_valid:
            self.valid_dataset = ResponseSelectionDataset(
                self.hparams,
                split="valid",
            )
            self.valid_dataloader = DataLoader(
                self.valid_dataset,
                batch_size=self.hparams.eval_batch_size,
                num_workers=self.hparams.cpu_workers,
                drop_last=False,
            )

        if do_test:
            self.test_dataset = ResponseSelectionDataset(
                self.hparams,
                split="test",
            )

            self.test_dataloader = DataLoader(
                self.test_dataset,
                batch_size=self.hparams.eval_batch_size,
                num_workers=self.hparams.cpu_workers,
                drop_last=False,
            )

    def _build_model(self):
        self.model = Model(self.hparams)
        self.model = self.model.to(self.device)
        # Use Multi-GPUs
        if -1 not in self.hparams.gpu_ids and len(self.hparams.gpu_ids) > 1:
            self.model = nn.DataParallel(self.model, self.hparams.gpu_ids)

    def run_evaluate(self, evaluation_path):
        self._logger.info("Evaluation")
        #model_state_dict, optimizer_state_dict = load_checkpoint(evaluation_path)

        # 		if isinstance(self.model, nn.DataParallel):
        # 			self.model.module.load_state_dict(model_state_dict)
        # 		else:
        # 			self.model.load_state_dict(model_state_dict)

        k_list = self.hparams.recall_k_list
        total_mrr = 0
        #total_R_10 =[0.0]*len(k_list)
        total_examples, total_correct = 0, 0
        #self.model.eval()
        with torch.no_grad():
            for batch_idx, batch in enumerate(tqdm(self._dataloader)):
                print(batch_idx)
                buffer_batch = batch.copy()
                for key in batch:
                    print(batch[key])
                    print(key)            


In [4]:

import os
import argparse
import collections
import logging
from datetime import datetime
arg_parser = argparse.ArgumentParser(description="Bert / Response Selection (PyTorch)")
arg_parser.add_argument("--model", dest="model", type=str,
                      default="bert_base",
                      help="Model Name")
arg_parser.add_argument("--root_dir", dest="root_dir", type=str,
                      default="./results_v1",
                      help="model train logs, checkpoints")
arg_parser.add_argument("--data_dir", dest="data_dir", type=str,
                      default="./data/ubuntu_corpus_v1/%s_%s.pkl",
                      help="ubuntu corpus v1 pkl path") # ubuntu_train.pkl, ubuntu_valid_pkl, ubuntu_test.pkl
arg_parser.add_argument("--bert_pretrained_dir", dest="bert_pretrained_dir", type=str,
                      default="./resources",
                      help="bert pretrained directory")
arg_parser.add_argument("--bert_pretrained", dest="bert_pretrained", type=str,
                      default="bert-post-uncased",
                      help="bert pretrained directory")  # bert-base-uncased, bert-post-uncased -> under bert_pretrained_dir
arg_parser.add_argument("--train_type", dest="train_type", type=str,
                      default="fine_tuning",
                      help="Train type") # fine_tuning, post_training
arg_parser.add_argument("--evaluate", dest="evaluate", type=str,
                      help="Evaluation Checkpoint", default="")

args = arg_parser.parse_known_args()[0]

In [12]:

from config.hparams import *
from data.data_utils import InputExamples
#from train import ResponseSelection
from post_train import BERTDomainPostTraining

PARAMS_MAP = {
# fine-tuning (ft)
"bert_base_ft" : BASE_PARAMS,
"bert_dpt_ft" : DPT_FINETUNING_PARAMS,

# post-training (pt)
"bert_ubuntu_pt" : POST_TRAINING_PARAMS,
}


hparams = PARAMS_MAP['bert_base_ft']
hparams["root_dir"] = args.root_dir
root_dir = os.path.join(hparams["root_dir"], args.model, args.train_type, "eval")


hparams["data_dir"] = args.data_dir
hparams["bert_pretrained_dir"] = args.bert_pretrained_dir
#hparams["bert_pretrained"] = args.bert_pretrained

hparams = collections.namedtuple("HParams", sorted(hparams.keys()))(**hparams)
print('22222222222222222222')
print(args.data_dir)
print(args.evaluate)

model = Evaluation(hparams)
model.run_evaluate(args.evaluate)

22222222222222222222
./data/ubuntu_corpus_v1/%s_%s.pkl

Evaluation Split : test
100000 examples has been loaded!
200000 examples has been loaded!
300000 examples has been loaded!
400000 examples has been loaded!
500000 examples has been loaded!
total test examples 500000
./resources/bert-base-uncased
./resources/bert-base-uncased/bert-base-uncased-vocab.txt


  0%|          | 9/5000 [00:02<2:03:31,  1.48s/it]

0
tensor([[ 101, 4658, 2036,  ...,    0,    0,    0],
        [ 101, 4658, 2036,  ...,    0,    0,    0],
        [ 101, 4658, 2036,  ...,    0,    0,    0],
        ...,
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ..., 2065, 2049,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0.,

  1%|          | 26/5000 [00:02<1:00:58,  1.36it/s]

16
tensor([[  101,  2053, 20385,  ...,     0,     0,     0],
        [  101,  2053, 20385,  ...,     0,     0,     0],
        [  101,  2053, 20385,  ...,     0,     0,     0],
        ...,
        [  101,  2417, 12707,  ...,     0,     0,     0],
        [  101,  2417, 12707,  ...,     0,     0,     0],
        [  101,  2417, 12707,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
  

  1%|          | 41/5000 [00:02<30:23,  2.72it/s]  

tensor([[ 101, 2659, 5813,  ...,    0,    0,    0],
        [ 101, 2659, 5813,  ...,    0,    0,    0],
        [ 101, 2659, 5813,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ..., 3422, 1012,  102],
        [ 101, 1045, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

  1%|          | 57/5000 [00:02<15:27,  5.33it/s]

48
tensor([[  101,  2064,  2079,  ...,     0,     0,     0],
        [  101,  2064,  2079,  ...,     0,     0,     0],
        [  101,  2064,  2079,  ...,  2015,  4151,   102],
        ...,
        [  101, 17371,  2546,  ...,     0,     0,     0],
        [  101, 17371,  2546,  ...,     0,     0,     0],
        [  101, 17371,  2546,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
  

  1%|▏         | 71/5000 [00:03<08:13, 10.00it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
62
tensor([[ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572, 

  2%|▏         | 89/5000 [00:03<04:38, 17.62it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
76
tensor([[  101,  2667,  2000,  ...,     0,     0,     0],
        [  101,  2667,  2000,  ...,     0,     0,     0],
        [  101,  2667,  2000,  ...,     0,     0,     0],
        ...,
        [  101, 17698,  1045,  ...,     0,     0,     0],
        [  101, 17698,  1045,  ...,  1056,  2011,   102],
        [  101, 17698,  1045,  ...,  9080,  2140,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

  2%|▏         | 97/5000 [00:03<03:44, 21.87it/s]

89
tensor([[  101, 22718,  2011,  ...,     0,     0,     0],
        [  101, 22718,  2011,  ...,     0,     0,     0],
        [  101, 22718,  2011,  ...,     0,     0,     0],
        ...,
        [  101,  2064,  1045,  ...,  1045, 25606,   102],
        [  101,  2064,  1045,  ...,     0,     0,     0],
        [  101,  2064,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
  

  2%|▏         | 113/5000 [00:03<02:30, 32.48it/s]

102
tensor([[ 101, 2572, 2368,  ...,    0,    0,    0],
        [ 101, 2572, 2368,  ...,    0,    0,    0],
        [ 101, 2572, 2368,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2699,  ...,    0,    0,    0],
        [ 101, 1045, 2699,  ...,    0,    0,    0],
        [ 101, 1045, 2699,  ..., 2295, 1045,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  3%|▎         | 132/5000 [00:04<01:40, 48.21it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
115
tensor([[ 101, 1041, 4942,  ...,    0,    0,    0],
        [ 101, 1041, 4942,  ...,    0,    0,    0],
        [ 101, 1041, 4942,  ..., 2031, 2000,  102],
        ...,
        [ 101, 2056, 2054,  ...,    0,    0,    0],
        [ 101, 2056, 2054,  ..., 2193, 1035,  102],
        [ 101, 2056, 2054,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ...

  3%|▎         | 140/5000 [00:04<01:30, 53.64it/s]

132
tensor([[  101,  2748, 30522,  ..., 22090,  2046,   102],
        [  101,  2748, 30522,  ...,  1035,  1035,   102],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  2707,  ...,     0,     0,     0],
        [  101,  1045,  2707,  ...,     0,     0,     0],
        [  101,  1045,  2707,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  3%|▎         | 156/5000 [00:04<01:26, 55.94it/s]


label
145
tensor([[ 101, 2009, 1055,  ...,    0,    0,    0],
        [ 101, 2009, 1055,  ...,    0,    0,    0],
        [ 101, 2009, 1055,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0.

  3%|▎         | 170/5000 [00:04<01:20, 60.34it/s]

158
tensor([[  101,  2515,  1996,  ...,     0,     0,     0],
        [  101,  2515,  1996,  ...,     0,     0,     0],
        [  101,  2515,  1996,  ...,     0,     0,     0],
        ...,
        [  101, 10334,  4282,  ...,     0,     0,     0],
        [  101, 10334,  4282,  ...,     0,     0,     0],
        [  101, 10334,  4282,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  4%|▎         | 185/5000 [00:04<01:15, 64.18it/s]

174
tensor([[ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 2061, 1012,  ...,    0,    0,    0],
        [ 101, 2061, 1012,  ...,    0,    0,    0],
        [ 101, 2061, 1012,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  4%|▍         | 199/5000 [00:05<01:17, 61.92it/s]

186
tensor([[  101, 15501,  1045,  ...,     0,     0,     0],
        [  101, 15501,  1045,  ...,     0,     0,     0],
        [  101, 15501,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  2023,  2003,  ...,     0,     0,     0],
        [  101,  2023,  2003,  ...,     0,     0,     0],
        [  101,  2023,  2003,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  4%|▍         | 206/5000 [00:05<01:22, 58.18it/s]

199
tensor([[  101,  7632,  1045,  ...,     0,     0,     0],
        [  101,  7632,  1045,  ...,     0,     0,     0],
        [  101,  7632,  1045,  ...,     0,     0,     0],
        ...,
        [  101, 26726, 11338,  ...,     0,     0,     0],
        [  101, 26726, 11338,  ...,     0,     0,     0],
        [  101, 26726, 11338,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  4%|▍         | 220/5000 [00:05<01:20, 59.31it/s]

210
tensor([[  101, 30522,  2061,  ...,     0,     0,     0],
        [  101, 30522,  2061,  ...,     0,     0,     0],
        [  101, 30522,  2061,  ...,     0,     0,     0],
        ...,
        [  101,  2021,  2059,  ...,     0,     0,     0],
        [  101,  2021,  2059,  ...,     0,     0,     0],
        [  101,  2021,  2059,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  5%|▍         | 239/5000 [00:05<01:05, 72.21it/s]

227
tensor([[  101, 26021,  2053,  ...,     0,     0,     0],
        [  101, 26021,  2053,  ...,     0,     0,     0],
        [  101, 26021,  2053,  ...,     0,     0,     0],
        ...,
        [  101,  2101,  2158,  ...,     0,     0,     0],
        [  101,  2101,  2158,  ...,     0,     0,     0],
        [  101,  2101,  2158,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  5%|▌         | 256/5000 [00:05<01:09, 68.47it/s]

tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
245
tensor([[ 101, 2008, 1055,  ...,    0,    0,    0],
        [ 101, 2008, 1055,

  5%|▌         | 264/5000 [00:06<01:13, 64.65it/s]

260
tensor([[ 101, 7592, 2035,  ...,    0,    0,    0],
        [ 101, 7592, 2035,  ...,    0,    0,    0],
        [ 101, 7592, 2035,  ...,    0,    0,    0],
        ...,
        [ 101, 2038, 1057,  ...,    0,    0,    0],
        [ 101, 2038, 1057,  ...,    0,    0,    0],
        [ 101, 2038, 1057,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  6%|▌         | 280/5000 [00:06<01:07, 69.97it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
271
tensor([[ 101, 2302, 1997,  ..., 3367, 1011,  102],
        [ 101, 2302, 1997,  ...,    0,    0,    0],
        [ 101, 2302, 1997,  ...,    0,    0,    0],
        ...,
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ...

  6%|▌         | 296/5000 [00:06<01:10, 66.76it/s]

286
tensor([[  101,  8840,  2140,  ...,     0,     0,     0],
        [  101,  8840,  2140,  ...,     0,     0,     0],
        [  101,  8840,  2140,  ...,   102,     0,     0],
        ...,
        [  101,  4689, 12193,  ...,     0,     0,     0],
        [  101,  4689, 12193,  ...,     0,     0,     0],
        [  101,  4689, 12193,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

  6%|▌         | 310/5000 [00:06<01:16, 61.32it/s]

298
tensor([[ 101, 1047, 7393,  ...,    0,    0,    0],
        [ 101, 1047, 7393,  ..., 2140, 1035,  102],
        [ 101, 1047, 7393,  ...,    0,    0,    0],
        ...,
        [ 101, 3419, 2050,  ...,    0,    0,    0],
        [ 101, 3419, 2050,  ...,    0,    0,    0],
        [ 101, 3419, 2050,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  6%|▋         | 317/5000 [00:07<01:30, 51.73it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
312
tensor([[ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,

  6%|▋         | 323/5000 [00:07<01:33, 50.00it/s]


tensor([[ 101, 7632, 2072,  ...,    0,    0,    0],
        [ 101, 7632, 2072,  ...,    0,    0,    0],
        [ 101, 7632, 2072,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

  7%|▋         | 339/5000 [00:07<01:29, 52.27it/s]

330
tensor([[ 101, 5672, 1011,  ...,    0,    0,    0],
        [ 101, 5672, 1011,  ...,    0,    0,    0],
        [ 101, 5672, 1011,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2467,  ...,    0,    0,    0],
        [ 101, 1045, 2467,  ...,    0,    0,    0],
        [ 101, 1045, 2467,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  7%|▋         | 358/5000 [00:07<01:09, 66.85it/s]

346
tensor([[ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        ...,
        [ 101, 1011, 1011,  ...,    0,    0,    0],
        [ 101, 1011, 1011,  ...,    0,    0,    0],
        [ 101, 1011, 1011,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  8%|▊         | 376/5000 [00:07<01:02, 74.09it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
364
tensor([[  101,  2053, 30522,  ...,     0,     0,     0],
        [  101,  2053, 30522,  ...,     0,     0,     0],
        [  101,  2053, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  6289,  3100,  ...,     0,     0,     0],
        [  101,  6289,  3100,  ...,     0,     0,     0],
        [  101,  6289,  3100,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  .

  8%|▊         | 392/5000 [00:08<01:03, 72.17it/s]

label
380
tensor([[  101,  2115, 20315,  ...,     0,     0,     0],
        [  101,  2115, 20315,  ...,     0,     0,     0],
        [  101,  2115, 20315,  ...,     0,     0,     0],
        ...,
        [  101,  2006,  3676,  ...,  1011,  2130,   102],
        [  101,  2006,  3676,  ...,     0,     0,     0],
        [  101,  2006,  3676,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0.,

  8%|▊         | 409/5000 [00:08<01:04, 70.97it/s]

397
tensor([[ 101, 1045, 1049,  ..., 2051,  102,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2000,  ...,    0,    0,    0],
        [ 101, 2129, 2000,  ...,    0,    0,    0],
        [ 101, 2129, 2000,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  9%|▊         | 429/5000 [00:08<00:56, 81.41it/s]

415
tensor([[ 101, 1045, 3728,  ...,    0,    0,    0],
        [ 101, 1045, 3728,  ...,    0,    0,    0],
        [ 101, 1045, 3728,  ...,    0,    0,    0],
        ...,
        [ 101, 3087, 2113,  ...,    0,    0,    0],
        [ 101, 3087, 2113,  ...,    0,    0,    0],
        [ 101, 3087, 2113,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

  9%|▉         | 448/5000 [00:08<00:53, 85.33it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
433
tensor([[ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        ...,
        [ 101, 3968, 4115,  ..., 2052, 3499,  102],
        [ 101, 3968, 4115,  ..., 2226, 1011,  102],
        [ 101, 3968, 4115,  ...,   

  9%|▉         | 458/5000 [00:08<00:54, 83.51it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
450
tensor([[  101,  2021,  1045,  ...,     0,     0,     0],
        [  101,  202

 10%|▉         | 477/5000 [00:09<00:54, 82.62it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
467
tensor([[  101,  2469, 30522,  ...,     0,     0,     0],
        [  101,  2469, 30522,  ...,     0,     0,     0],
        [  101,  2469, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  7632,  2003,  ...,     0,     0,     0],
        [  101,  7632,  2003,  ...,     0,     0,     0],
        [  101,  7632,  2003,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  .

 10%|▉         | 494/5000 [00:09<01:05, 69.12it/s]

481
tensor([[  101,  7484,  8758,  ...,     0,     0,     0],
        [  101,  7484,  8758,  ...,  1005,  1056,   102],
        [  101,  7484,  8758,  ...,     0,     0,     0],
        ...,
        [  101,  1008, 11603,  ...,     0,     0,     0],
        [  101,  1008, 11603,  ...,     0,     0,     0],
        [  101,  1008, 11603,  ...,  7827,  1042,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 10%|█         | 502/5000 [00:09<01:11, 62.56it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
497
tensor([[ 101, 2342, 2393,  ...,    0,    0,    0],
        [ 101, 2342, 2393,  ...,    0,    0,    0],
        [ 101, 2342, 2393,  ...,    0,    0,    0],
        ...,
        [ 101, 3531, 3198,  ...,    0,    0,    0],
        [ 101, 3531, 3198,  ...,    0,    0,    0],
        [ 101, 3531, 3198,  ...,   

 10%|█         | 518/5000 [00:09<01:07, 65.96it/s]

508
tensor([[ 101, 2033, 2232,  ...,    0,    0,    0],
        [ 101, 2033, 2232,  ...,    0,    0,    0],
        [ 101, 2033, 2232,  ...,    0,    0,    0],
        ...,
        [ 101, 2619, 2074,  ...,    0,    0,    0],
        [ 101, 2619, 2074,  ...,    0,    0,    0],
        [ 101, 2619, 2074,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 11%|█         | 533/5000 [00:09<01:04, 69.74it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
523
tensor([[ 101, 1048, 2890,  ...,    0,    0,    0],
        [ 101, 1048, 2890,  ...,    0,    0,    0],
        [ 101, 1048, 2890,  ...,    0,    0,    0],
        ...,
        [ 101, 2061, 2572,  ...,    0,    0,    0],
        [ 101, 2061, 2572,  ...,    0,    0,    0],
        [ 101, 2061, 2572,  ...,   

 11%|█         | 541/5000 [00:10<01:09, 64.01it/s]

536
tensor([[ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 11%|█         | 555/5000 [00:10<01:15, 58.68it/s]

tensor([[  101,  7632, 10047,  ...,     0,     0,     0],
        [  101,  7632, 10047,  ...,     0,     0,     0],
        [  101,  7632, 10047,  ...,     0,     0,     0],
        ...,
        [  101,  2004,  2146,  ...,     0,     0,     0],
        [  101,  2004,  2146,  ...,     0,     0,     0],
        [  101,  2004,  2146,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 11%|█▏        | 569/5000 [00:10<01:13, 60.00it/s]

560
tensor([[ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        ...,
        [ 101, 1024, 1006,  ...,    0,    0,    0],
        [ 101, 1024, 1006,  ...,    0,    0,    0],
        [ 101, 1024, 1006,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 12%|█▏        | 583/5000 [00:10<01:17, 57.16it/s]

573
tensor([[ 101, 2045, 2015,  ...,    0,    0,    0],
        [ 101, 2045, 2015,  ...,    0,    0,    0],
        [ 101, 2045, 2015,  ...,    0,    0,    0],
        ...,
        [ 101, 8840, 2140,  ...,    0,    0,    0],
        [ 101, 8840, 2140,  ...,    0,    0,    0],
        [ 101, 8840, 2140,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 12%|█▏        | 590/5000 [00:11<01:22, 53.64it/s]

586
tensor([[ 101, 2054, 2024,  ...,    0,    0,    0],
        [ 101, 2054, 2024,  ...,    0,    0,    0],
        [ 101, 2054, 2024,  ...,    0,    0,    0],
        ...,
        [ 101, 3844, 2039,  ...,    0,    0,    0],
        [ 101, 3844, 2039,  ...,    0,    0,    0],
        [ 101, 3844, 2039,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 12%|█▏        | 606/5000 [00:11<01:19, 55.20it/s]

597
tensor([[ 101, 2515, 8285,  ...,    0,    0,    0],
        [ 101, 2515, 8285,  ...,    0,    0,    0],
        [ 101, 2515, 8285,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 2153,  ...,    0,    0,    0],
        [ 101, 7592, 2153,  ..., 1996, 3105,  102],
        [ 101, 7592, 2153,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 12%|█▏        | 614/5000 [00:11<01:22, 52.94it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
611
tensor([[ 101, 4931, 2064,  ...,    0,    0,    0],
        [ 101, 4931, 2064,

 13%|█▎        | 630/5000 [00:11<01:26, 50.77it/s]

621
tensor([[  101,  1057, 18384,  ...,     0,     0,     0],
        [  101,  1057, 18384,  ...,     0,     0,     0],
        [  101,  1057, 18384,  ...,     0,     0,     0],
        ...,
        [  101,  2054,  2003,  ...,     0,     0,     0],
        [  101,  2054,  2003,  ...,     0,     0,     0],
        [  101,  2054,  2003,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 13%|█▎        | 638/5000 [00:11<01:19, 54.78it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
635
tensor([[  101,  7592,  3071,  ...,  3931,  1035,   102],
        [  101,  7592,  3071,  ...,     0,     0,     0],
        [  101,  7592,  3071,  ...,     0,     0,     0],
        ...,
        [  101,  4283, 30522,  ...,     0,     0,     0],
        [  101,  4283, 30522,  ...,     0,     0,     0],
     

 13%|█▎        | 654/5000 [00:12<01:13, 59.29it/s]

645
tensor([[ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        ...,
        [ 101, 7632, 2035,  ...,    0,    0,    0],
        [ 101, 7632, 2035,  ...,    0,    0,    0],
        [ 101, 7632, 2035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 13%|█▎        | 670/5000 [00:12<01:09, 62.25it/s]

661
tensor([[ 101, 4931, 2073,  ...,    0,    0,    0],
        [ 101, 4931, 2073,  ...,    0,    0,    0],
        [ 101, 4931, 2073,  ...,    0,    0,    0],
        ...,
        [ 101, 1058, 2213,  ...,    0,    0,    0],
        [ 101, 1058, 2213,  ...,    0,    0,    0],
        [ 101, 1058, 2213,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 14%|█▎        | 685/5000 [00:12<01:07, 63.77it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
675
tensor([[  101, 23281, 23281,  ...,     0,     0,     0],
        [  101, 23281, 23281,  ...,     0,     0,     0],
        [  101, 23281, 23281,  ...,     0,     0,     0],
        ...,
        [  101,  2339,  6187,  ...,     0,     0,     0],
        [  101,  2339,  6187,  ...,     0,     0,     0],
        [  101,  2339,  6187,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  .

 14%|█▍        | 700/5000 [00:12<01:04, 66.72it/s]

686
tensor([[ 101, 1045, 1053,  ...,    0,    0,    0],
        [ 101, 1045, 1053,  ...,    0,    0,    0],
        [ 101, 1045, 1053,  ...,    0,    0,    0],
        ...,
        [ 101, 3087, 2031,  ...,    0,    0,    0],
        [ 101, 3087, 2031,  ...,    0,    0,    0],
        [ 101, 3087, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 14%|█▍        | 714/5000 [00:13<01:12, 59.40it/s]

703
tensor([[ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        ...,
        [ 101, 1998, 7276,  ...,    0,    0,    0],
        [ 101, 1998, 7276,  ...,    0,    0,    0],
        [ 101, 1998, 7276,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 14%|█▍        | 722/5000 [00:13<01:10, 61.03it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
718
tensor([[  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        ...,
        [  101,  2151, 20996,  ...,     0,     0,     0],
        [  101,  2151, 20996,  ...,     0,     0,     0],
     

 15%|█▍        | 737/5000 [00:13<01:11, 59.59it/s]

729
tensor([[ 101, 4658, 2288,  ...,    0,    0,    0],
        [ 101, 4658, 2288,  ...,    0,    0,    0],
        [ 101, 4658, 2288,  ...,    0,    0,    0],
        ...,
        [ 101, 2151, 2393,  ...,    0,    0,    0],
        [ 101, 2151, 2393,  ...,    0,    0,    0],
        [ 101, 2151, 2393,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 15%|█▍        | 744/5000 [00:13<01:17, 54.85it/s]

739
tensor([[  101,  2049,  2066,  ...,     0,     0,     0],
        [  101,  2049,  2066,  ...,     0,     0,     0],
        [  101,  2049,  2066,  ...,     0,     0,     0],
        ...,
        [  101, 20064,  2015,  ...,     0,     0,     0],
        [  101, 20064,  2015,  ...,     0,     0,     0],
        [  101, 20064,  2015,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 15%|█▌        | 760/5000 [00:13<01:11, 59.18it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
750
tensor([[ 101, 2064, 2031,  ...,    0,    0,    0],
        [ 101, 2064, 2031,  ...,    0,    0,    0],
        [ 101, 2064, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 2061, 2275,  ...,    0,    0,    0],
        [ 101, 2061, 2275,  ...,    0,    0,    0],
        [ 101, 2061, 2275,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ...

 16%|█▌        | 775/5000 [00:14<01:09, 60.54it/s]

766
tensor([[ 101, 1998, 1045,  ...,    0,    0,    0],
        [ 101, 1998, 1045,  ..., 1035, 1035,  102],
        [ 101, 1998, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 2054, 3084,  ...,    0,    0,    0],
        [ 101, 2054, 3084,  ...,    0,    0,    0],
        [ 101, 2054, 3084,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 16%|█▌        | 795/5000 [00:14<00:57, 73.74it/s]

782
tensor([[ 101, 2129, 2079,  ..., 2000, 6592,  102],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 16%|█▋        | 813/5000 [00:14<01:01, 67.65it/s]

801
tensor([[  101,  2009, 18989,  ...,     0,     0,     0],
        [  101,  2009, 18989,  ...,     0,     0,     0],
        [  101,  2009, 18989,  ...,     0,     0,     0],
        ...,
        [  101,  2035,  2009,  ...,     0,     0,     0],
        [  101,  2035,  2009,  ...,     0,     0,     0],
        [  101,  2035,  2009,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 16%|█▋        | 821/5000 [00:14<00:59, 70.16it/s]

813
tensor([[  101,  2012, 30522,  ...,     0,     0,     0],
        [  101,  2012, 30522,  ...,     0,     0,     0],
        [  101,  2012, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2054, 16293,  ...,     0,     0,     0],
        [  101,  2054, 16293,  ...,     0,     0,     0],
        [  101,  2054, 16293,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 17%|█▋        | 829/5000 [00:14<01:02, 66.29it/s]

824
tensor([[ 101, 2106, 2017,  ...,    0,    0,    0],
        [ 101, 2106, 2017,  ...,    0,    0,    0],
        [ 101, 2106, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 3728,  ...,    0,    0,    0],
        [ 101, 1045, 3728,  ...,    0,    0,    0],
        [ 101, 1045, 3728,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 17%|█▋        | 842/5000 [00:15<01:21, 51.22it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
834
tensor([[  101,  2059,  2272,  ...,     0,     0,     0],
        [  101,  2059,  2272,  ...,     0,     0,     0],
        [  101,  2059,  2272,  ...,     0,     0,     0],
        ...,
        [  101,  1998, 25781,  ...,     0,     0,     0],
        [  101,  1998, 25781,  ...,     0,     0,     0],
     

 17%|█▋        | 857/5000 [00:15<01:09, 59.32it/s]

846
tensor([[  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ..., 29176,  1998,   102],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        ...,
        [  101,  2009,  2758,  ...,     0,     0,     0],
        [  101,  2009,  2758,  ...,     0,     0,     0],
        [  101,  2009,  2758,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 17%|█▋        | 870/5000 [00:15<01:15, 54.54it/s]

858
tensor([[  101, 16500,  1064,  ...,     0,     0,     0],
        [  101, 16500,  1064,  ...,     0,     0,     0],
        [  101, 16500,  1064,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 18%|█▊        | 877/5000 [00:15<01:18, 52.84it/s]

874
tensor([[ 101, 2151, 2393,  ...,    0,    0,    0],
        [ 101, 2151, 2393,  ...,    0,    0,    0],
        [ 101, 2151, 2393,  ...,    0,    0,    0],
        ...,
        [ 101, 4957, 3685,  ...,    0,    0,    0],
        [ 101, 4957, 3685,  ...,    0,    0,    0],
        [ 101, 4957, 3685,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0

 18%|█▊        | 894/5000 [00:16<01:12, 56.25it/s]

tensor([[ 101, 2040, 2079,  ...,    0,    0,    0],
        [ 101, 2040, 2079,  ...,    0,    0,    0],
        [ 101, 2040, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 2707, 2007,  ...,    0,    0,    0],
        [ 101, 2707, 2007,  ...,    0,    0,    0],
        [ 101, 2707, 2007,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 18%|█▊        | 913/5000 [00:16<01:01, 66.14it/s]

902
tensor([[  101, 11562,  2006,  ...,     0,     0,     0],
        [  101, 11562,  2006,  ...,     0,     0,     0],
        [  101, 11562,  2006,  ...,     0,     0,     0],
        ...,
        [  101,  1008,  8712,  ...,     0,     0,     0],
        [  101,  1008,  8712,  ...,     0,     0,     0],
        [  101,  1008,  8712,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 19%|█▊        | 932/5000 [00:16<00:53, 76.72it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
920
tensor([[ 101, 1057, 5603,  ...,    0,    0,    0],
        [ 101, 1057, 5603,  ...,    0,    0,    0],
        [ 101, 1057, 5603,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ..., 2505, 2000,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ...

 19%|█▉        | 949/5000 [00:16<00:54, 74.91it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
935
tensor([[  101,  2017,  2064,  ...,     0,     0,     0],
        [  101,  2017,  2064,  ...,     0,     0,     0],
        [  101,  2017,  2064,  ...,     0,     0,     0],
        ...,
        [  101, 12098,  2290,  ...,     0,     0,     0],
        [  101, 12098,  2290,  ...,     0,     0,     0],
     

 19%|█▉        | 967/5000 [00:16<00:49, 80.84it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
951
tensor([[ 101, 2085, 1045,  ...,    0,    0,    0],
        [ 101, 2085, 1045,  ...,    0,    0,    0],
        [ 101, 2085, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ...

 20%|█▉        | 976/5000 [00:17<00:50, 80.41it/s]

967
tensor([[  101, 17371, 30522,  ...,     0,     0,     0],
        [  101, 17371, 30522,  ...,     0,     0,     0],
        [  101, 17371, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 20%|█▉        | 994/5000 [00:17<00:51, 77.75it/s]

984
tensor([[  101, 18411,  2860,  ...,     0,     0,     0],
        [  101, 18411,  2860,  ...,     0,     0,     0],
        [  101, 18411,  2860,  ...,     0,     0,     0],
        ...,
        [  101,  7929,  2054,  ...,     0,     0,     0],
        [  101,  7929,  2054,  ...,     0,     0,     0],
        [  101,  7929,  2054,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
 

 20%|██        | 1010/5000 [00:17<00:51, 78.13it/s]

1000
tensor([[  101, 10514,  2361,  ...,     0,     0,     0],
        [  101, 10514,  2361,  ...,     0,     0,     0],
        [  101, 10514,  2361,  ...,  1997,  2686,   102],
        ...,
        [  101,  2079,  2017,  ...,     0,     0,     0],
        [  101,  2079,  2017,  ...,     0,     0,     0],
        [  101,  2079,  2017,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 21%|██        | 1026/5000 [00:17<00:57, 68.53it/s]

1016
tensor([[ 101, 4931, 1045,  ...,    0,    0,    0],
        [ 101, 4931, 1045,  ...,    0,    0,    0],
        [ 101, 4931, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 2079, 1050,  ...,    0,    0,    0],
        [ 101, 2079, 1050,  ...,    0,    0,    0],
        [ 101, 2079, 1050,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 21%|██        | 1043/5000 [00:18<00:56, 69.58it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1031
tensor([[  101,  2543, 14876,  ...,     0,     0,     0],
        [  101,  2543, 14876,  ...,     0,     0,     0],
        [  101,  2543, 14876,  ...,     0,     0,     0],
        ...,
        [  101,  2005,  1060,  ...,     0,     0,     0],
        [  101,  2005,  1060,  ...,     0,     0,     0],
        [  101,  2005,  1060,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 21%|██        | 1051/5000 [00:18<01:02, 63.19it/s]

1044
tensor([[  101,  1037,  5896,  ...,     0,     0,     0],
        [  101,  1037,  5896,  ...,     0,     0,     0],
        [  101,  1037,  5896,  ...,     0,     0,     0],
        ...,
        [  101,  2151,  9374,  ...,     0,     0,     0],
        [  101,  2151,  9374,  ...,     0,     0,     0],
        [  101,  2151,  9374,  ..., 15599,  2196,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 21%|██▏       | 1065/5000 [00:18<01:05, 60.01it/s]

1056
tensor([[ 101, 2292, 2033,  ..., 3503,  102,    0],
        [ 101, 2292, 2033,  ...,    0,    0,    0],
        [ 101, 2292, 2033,  ...,    0,    0,    0],
        ...,
        [ 101, 1037, 2047,  ...,    0,    0,    0],
        [ 101, 1037, 2047,  ...,    0,    0,    0],
        [ 101, 1037, 2047,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 22%|██▏       | 1084/5000 [00:18<00:58, 66.89it/s]

1072
tensor([[  101,  4931,  1045,  ...,     0,     0,     0],
        [  101,  4931,  1045,  ...,     0,     0,     0],
        [  101,  4931,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  2168, 24471,  ...,     0,     0,     0],
        [  101,  2168, 24471,  ...,  2156,  2026,   102],
        [  101,  2168, 24471,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 22%|██▏       | 1095/5000 [00:18<00:52, 74.45it/s]

1086
tensor([[ 101, 3067, 1055,  ...,    0,    0,    0],
        [ 101, 3067, 1055,  ...,    0,    0,    0],
        [ 101, 3067, 1055,  ...,    0,    0,    0],
        ...,
        [ 101, 2017, 2031,  ...,    0,    0,    0],
        [ 101, 2017, 2031,  ...,    0,    0,    0],
        [ 101, 2017, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 22%|██▏       | 1114/5000 [00:19<00:49, 78.11it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1105
tensor([[  101,  1008, 23378,  ...,     0,     0,     0],
        [  101,  1008, 23378,  ...,     0,     0,     0],
        [  101,  1008, 23378,  ...,     0,     0,     0],
        ...,
        [  101,  2342,  2393,  ...,     0,     0,     0],
        [  101,  2342,  2393,  ...,     0,     0,     0],
        [  101,  2342,  2393,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 23%|██▎       | 1133/5000 [00:19<00:46, 83.37it/s]

1121
tensor([[ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 9413, 2099,  ...,    0,    0,    0],
        [ 101, 9413, 2099,  ...,    0,    0,    0],
        [ 101, 9413, 2099,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 23%|██▎       | 1153/5000 [00:19<00:43, 88.70it/s]


tensor([[  101,  5736,  2003,  ...,     0,     0,     0],
        [  101,  5736,  2003,  ...,  2031,  2178,   102],
        [  101,  5736,  2003,  ...,     0,     0,     0],
        ...,
        [  101,  2004,  1999,  ...,     0,     0,     0],
        [  101,  2004,  1999,  ..., 17421,  2006,   102],
        [  101,  2004,  1999,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
    

 23%|██▎       | 1172/5000 [00:19<00:45, 84.70it/s]

1157
tensor([[ 101, 5034, 2100,  ...,    0,    0,    0],
        [ 101, 5034, 2100,  ...,    0,    0,    0],
        [ 101, 5034, 2100,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 24%|██▎       | 1181/5000 [00:19<00:48, 78.55it/s]

1173
tensor([[  101,  2030, 17598,  ...,     0,     0,     0],
        [  101,  2030, 17598,  ...,     0,     0,     0],
        [  101,  2030, 17598,  ...,     0,     0,     0],
        ...,
        [  101, 24903, 18098,  ...,     0,     0,     0],
        [  101, 24903, 18098,  ...,     0,     0,     0],
        [  101, 24903, 18098,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 24%|██▍       | 1200/5000 [00:20<00:48, 77.61it/s]

1189
tensor([[ 101, 2025, 4385,  ...,    0,    0,    0],
        [ 101, 2025, 4385,  ...,    0,    0,    0],
        [ 101, 2025, 4385,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2310,  ..., 2061, 2101,  102],
        [ 101, 1045, 2310,  ...,    0,    0,    0],
        [ 101, 1045, 2310,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 24%|██▍       | 1217/5000 [00:20<00:47, 79.22it/s]

1207
tensor([[  101,  2030, 15990,  ...,     0,     0,     0],
        [  101,  2030, 15990,  ...,     0,     0,     0],
        [  101,  2030, 15990,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 25%|██▍       | 1236/5000 [00:20<00:45, 83.46it/s]

1224
tensor([[ 101, 2151, 4784,  ...,    0,    0,    0],
        [ 101, 2151, 4784,  ...,    0,    0,    0],
        [ 101, 2151, 4784,  ...,    0,    0,    0],
        ...,
        [ 101, 2052, 2619,  ...,    0,    0,    0],
        [ 101, 2052, 2619,  ...,    0,    0,    0],
        [ 101, 2052, 2619,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 25%|██▌       | 1258/5000 [00:20<00:40, 91.73it/s]

1243
tensor([[ 101, 1045, 9573,  ...,    0,    0,    0],
        [ 101, 1045, 9573,  ...,    0,    0,    0],
        [ 101, 1045, 9573,  ...,    0,    0,    0],
        ...,
        [ 101, 2073, 9033,  ...,    0,    0,    0],
        [ 101, 2073, 9033,  ...,    0,    0,    0],
        [ 101, 2073, 9033,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 26%|██▌       | 1277/5000 [00:20<00:43, 84.81it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1262
tensor([[ 101, 2021, 1997,  ...,    0,    0,    0],
        [ 101, 2021, 1997,  ...,    0,    0,    0],
        [ 101, 2021, 1997,  ...,    0,    0,    0],
        ...,
        [ 101, 7632, 3972,  ...,    0,    0,    0],
        [ 101, 7632, 3972,  ...,    0,    0,    0],
        [ 101, 7632, 3972,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 26%|██▌       | 1287/5000 [00:21<00:44, 82.57it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1281
tensor([[  101,  2393, 30522,  ...,     0,     0,     0],
        [  101,  2393, 30522,  ...,     0,     0,     0],
        [  101,  2393, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2066,  3729,  ...,     0,     0,     0],
        [  101,  2066,  3729,  ...,     0,     0,     0],
    

 26%|██▌       | 1305/5000 [00:21<00:47, 78.24it/s]

1295
tensor([[  101,  1045,  2215,  ...,     0,     0,     0],
        [  101,  1045,  2215,  ...,     0,     0,     0],
        [  101,  1045,  2215,  ...,     0,     0,     0],
        ...,
        [  101,  2895, 19362,  ...,     0,     0,     0],
        [  101,  2895, 19362,  ...,     0,     0,     0],
        [  101,  2895, 19362,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 26%|██▋       | 1321/5000 [00:21<00:48, 75.72it/s]

1311
tensor([[  101,  1001, 25781,  ...,     0,     0,     0],
        [  101,  1001, 25781,  ...,     0,     0,     0],
        [  101,  1001, 25781,  ...,     0,     0,     0],
        ...,
        [  101,  2008,  1999,  ...,     0,     0,     0],
        [  101,  2008,  1999,  ...,     0,     0,     0],
        [  101,  2008,  1999,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 27%|██▋       | 1339/5000 [00:21<00:48, 75.44it/s]

1327
tensor([[ 101, 1045, 2001,  ...,    0,    0,    0],
        [ 101, 1045, 2001,  ...,    0,    0,    0],
        [ 101, 1045, 2001,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 27%|██▋       | 1357/5000 [00:21<00:45, 79.53it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1344
tensor([[ 101, 2061, 1045,  ...,    0,    0,    0],
        [ 101, 2061, 1045,  ...,    0,    0,    0],
        [ 101, 2061, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 3046, 4851,  ...,    0,    0,    0],
        [ 101, 3046, 4851,  ...,    0,    0,    0],
        [ 101, 3046, 4851,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 27%|██▋       | 1366/5000 [00:22<00:44, 82.11it/s]

tensor([[  101,  3531,  2393,  ...,     0,     0,     0],
        [  101,  3531,  2393,  ...,     0,     0,     0],
        [  101,  3531,  2393,  ...,     0,     0,     0],
        ...,
        [  101, 14931, 12190,  ...,     0,     0,     0],
        [  101, 14931, 12190,  ...,     0,     0,     0],
        [  101, 14931, 12190,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 28%|██▊       | 1383/5000 [00:22<00:48, 74.37it/s]

1374
tensor([[ 101, 2009, 2573,  ...,    0,    0,    0],
        [ 101, 2009, 2573,  ...,    0,    0,    0],
        [ 101, 2009, 2573,  ...,    0,    0,    0],
        ...,
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 28%|██▊       | 1399/5000 [00:22<00:47, 76.41it/s]

1390
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ..., 1035, 1011,  102],
        ...,
        [ 101, 8840, 2035,  ...,    0,    0,    0],
        [ 101, 8840, 2035,  ...,    0,    0,    0],
        [ 101, 8840, 2035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 28%|██▊       | 1415/5000 [00:22<00:46, 76.85it/s]

1406
tensor([[ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        ...,
        [ 101, 7570, 5649,  ...,    0,    0,    0],
        [ 101, 7570, 5649,  ...,    0,    0,    0],
        [ 101, 7570, 5649,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 29%|██▊       | 1431/5000 [00:22<00:47, 75.89it/s]

1422
tensor([[ 101, 1045, 2228,  ...,    0,    0,    0],
        [ 101, 1045, 2228,  ...,    0,    0,    0],
        [ 101, 1045, 2228,  ...,    0,    0,    0],
        ...,
        [ 101, 2339, 8572,  ...,    0,    0,    0],
        [ 101, 2339, 8572,  ...,    0,    0,    0],
        [ 101, 2339, 8572,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 29%|██▉       | 1447/5000 [00:23<00:50, 70.79it/s]

1438
tensor([[  101,  2129,  2015,  ...,     0,     0,     0],
        [  101,  2129,  2015,  ...,     0,     0,     0],
        [  101,  2129,  2015,  ...,     0,     0,     0],
        ...,
        [  101, 15338, 19021,  ...,     0,     0,     0],
        [  101, 15338, 19021,  ...,     0,     0,     0],
        [  101, 15338, 19021,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 29%|██▉       | 1464/5000 [00:23<00:52, 66.77it/s]


label
1452
tensor([[  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        ...,
        [  101, 24404,  3070,  ...,     0,     0,     0],
        [  101, 24404,  3070,  ...,     0,     0,     0],
        [  101, 24404,  3070,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0

 30%|██▉       | 1478/5000 [00:23<01:03, 55.49it/s]

1466
tensor([[  101,  1043,  6155,  ...,     0,     0,     0],
        [  101,  1043,  6155,  ...,     0,     0,     0],
        [  101,  1043,  6155,  ...,     0,     0,     0],
        ...,
        [  101,  2079,  1045,  ...,     0,     0,     0],
        [  101,  2079,  1045,  ...,  3642, 18442,   102],
        [  101,  2079,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 30%|██▉       | 1484/5000 [00:23<01:02, 56.46it/s]

1478
tensor([[  101,  7632, 23408,  ...,     0,     0,     0],
        [  101,  7632, 23408,  ..., 11603,  1011,   102],
        [  101,  7632, 23408,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 30%|███       | 1500/5000 [00:24<00:53, 65.39it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1491
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049

 30%|███       | 1519/5000 [00:24<00:45, 77.07it/s]

1508
tensor([[ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 31%|███       | 1538/5000 [00:24<00:44, 77.54it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1528
tensor([[  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0],
        ...,
        [  101,  2006, 12191,  ...,     0,     0,     0],
        [  101,  2006, 12191,  ...,     0,     0,     0],
    

 31%|███       | 1557/5000 [00:24<00:44, 77.92it/s]

tensor([[ 101, 2008, 2003,  ...,    0,    0,    0],
        [ 101, 2008, 2003,  ..., 5448,  102,    0],
        [ 101, 2008, 2003,  ...,    0,    0,    0],
        ...,
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ..., 3191, 2059,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 32%|███▏      | 1576/5000 [00:24<00:41, 83.41it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1561
tensor([[ 101, 2689, 2117,  ...,    0,    0,    0],
        [ 101, 2689, 2117

 32%|███▏      | 1585/5000 [00:25<00:42, 80.30it/s]

1579
tensor([[  101,  2025, 10437,  ...,     0,     0,     0],
        [  101,  2025, 10437,  ...,     0,     0,     0],
        [  101,  2025, 10437,  ...,     0,     0,     0],
        ...,
        [  101,  2064, 10334,  ...,     0,     0,     0],
        [  101,  2064, 10334,  ...,     0,     0,     0],
        [  101,  2064, 10334,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 32%|███▏      | 1602/5000 [00:25<00:44, 75.86it/s]

1591
tensor([[ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        ...,
        [ 101, 2339, 2079,  ...,    0,    0,    0],
        [ 101, 2339, 2079,  ...,    0,    0,    0],
        [ 101, 2339, 2079,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 32%|███▏      | 1617/5000 [00:25<00:59, 56.89it/s]

1607
tensor([[ 101, 2092, 1035,  ...,    0,    0,    0],
        [ 101, 2092, 1035,  ...,    0,    0,    0],
        [ 101, 2092, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 2038, 3087,  ...,    0,    0,    0],
        [ 101, 2038, 3087,  ...,    0,    0,    0],
        [ 101, 2038, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 32%|███▎      | 1625/5000 [00:25<00:57, 59.05it/s]

1618
tensor([[  101,  1045, 21189,  ...,     0,     0,     0],
        [  101,  1045, 21189,  ...,     0,     0,     0],
        [  101,  1045, 21189,  ...,     0,     0,     0],
        ...,
        [  101,  2038, 10334,  ...,     0,     0,     0],
        [  101,  2038, 10334,  ...,     0,     0,     0],
        [  101,  2038, 10334,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 33%|███▎      | 1640/5000 [00:25<00:51, 65.25it/s]

tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1633
tensor([[  101, 26822,  6784,  ...,     0,     0,     0],
        [  101, 26822,  6784,  ...,     0,     0,     0],
        [  101, 26822,  6784,  ...,     0,     0,     0],
        ...,
        [  101,  2023,  2003,  ...,     0,     0,     0],
        [  101,  2023,  2003,  ...,     0,     0,     0],
    

 33%|███▎      | 1654/5000 [00:26<00:56, 58.97it/s]


tensor([[ 101, 2045, 2003,  ...,    0,    0,    0],
        [ 101, 2045, 2003,  ...,    0,    0,    0],
        [ 101, 2045, 2003,  ..., 6279, 1999,  102],
        ...,
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

 33%|███▎      | 1672/5000 [00:26<00:49, 66.65it/s]

1660
tensor([[ 101, 9262, 3559,  ...,    0,    0,    0],
        [ 101, 9262, 3559,  ...,    0,    0,    0],
        [ 101, 9262, 3559,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 34%|███▍      | 1691/5000 [00:26<00:43, 75.30it/s]

1677
tensor([[ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        ...,
        [ 101, 2084, 2595,  ...,    0,    0,    0],
        [ 101, 2084, 2595,  ...,    0,    0,    0],
        [ 101, 2084, 2595,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 34%|███▍      | 1709/5000 [00:26<00:41, 79.70it/s]

1694
tensor([[ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 34%|███▍      | 1719/5000 [00:26<00:40, 80.34it/s]

1710
tensor([[ 101, 2003, 4763,  ...,    0,    0,    0],
        [ 101, 2003, 4763,  ...,    0,    0,    0],
        [ 101, 2003, 4763,  ...,    0,    0,    0],
        ...,
        [ 101, 2012, 2072,  ...,    0,    0,    0],
        [ 101, 2012, 2072,  ...,    0,    0,    0],
        [ 101, 2012, 2072,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 35%|███▍      | 1737/5000 [00:27<00:40, 80.16it/s]

1726
tensor([[ 101, 4931, 1045,  ...,    0,    0,    0],
        [ 101, 4931, 1045,  ...,    0,    0,    0],
        [ 101, 4931, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 3531, 2562,  ...,    0,    0,    0],
        [ 101, 3531, 2562,  ...,    0,    0,    0],
        [ 101, 3531, 2562,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 35%|███▌      | 1754/5000 [00:27<00:43, 75.44it/s]

1743
tensor([[  101, 10303,  2065,  ...,     0,     0,     0],
        [  101, 10303,  2065,  ...,     0,     0,     0],
        [  101, 10303,  2065,  ...,     0,     0,     0],
        ...,
        [  101,  2139, 15599,  ...,     0,     0,     0],
        [  101,  2139, 15599,  ...,     0,     0,     0],
        [  101,  2139, 15599,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 35%|███▌      | 1773/5000 [00:27<00:40, 79.82it/s]

1759
tensor([[ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        ...,
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 36%|███▌      | 1791/5000 [00:27<00:39, 81.18it/s]

1776
tensor([[  101,  1045,  1049,  ...,     0,     0,     0],
        [  101,  1045,  1049,  ...,  2544, 26424,   102],
        [  101,  1045,  1049,  ...,     0,     0,     0],
        ...,
        [  101,  4283,  4364,  ...,  1996,  2132,   102],
        [  101,  4283,  4364,  ...,     0,     0,     0],
        [  101,  4283,  4364,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 36%|███▌      | 1809/5000 [00:28<00:40, 79.33it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1793
tensor([[  101,  2129,  1045,  ...,     0,     0,     0],
        [  101,  21

 37%|███▋      | 1829/5000 [00:28<00:36, 86.06it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1811
tensor([[  101, 21953, 30522,  ...,  2008, 28667,   102],
        [  101, 21953, 30522,  ...,     0,     0,     0],
        [  101, 21953, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 37%|███▋      | 1839/5000 [00:28<00:42, 75.09it/s]

1830
tensor([[  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0],
        ...,
        [  101,  4511, 30522,  ...,     0,     0,     0],
        [  101,  4511, 30522,  ...,     0,     0,     0],
        [  101,  4511, 30522,  ...,  2614,  2066,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 37%|███▋      | 1858/5000 [00:28<00:41, 75.53it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
1844
tensor([[ 101, 1006, 2066,  ...,    0,    0,    0],
        [ 101, 1006, 2066,  ...,    0,    0,    0],
        [ 101, 1006, 2066,  ...,    0,    0,    0],
        ...,
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 37%|███▋      | 1866/5000 [00:28<00:48, 64.59it/s]

1858
tensor([[  101, 27187,  1064,  ...,     0,     0,     0],
        [  101, 27187,  1064,  ...,     0,     0,     0],
        [  101, 27187,  1064,  ...,     0,     0,     0],
        ...,
        [  101,  2515,  1050,  ...,     0,     0,     0],
        [  101,  2515,  1050,  ...,     0,     0,     0],
        [  101,  2515,  1050,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 38%|███▊      | 1883/5000 [00:29<00:45, 67.95it/s]

1872
tensor([[ 101, 7929, 2079,  ...,    0,    0,    0],
        [ 101, 7929, 2079,  ...,    0,    0,    0],
        [ 101, 7929, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 38%|███▊      | 1891/5000 [00:29<00:44, 70.12it/s]

1883
tensor([[ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ..., 2065, 2017,  102],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 8909, 2243,  ...,    0,    0,    0],
        [ 101, 8909, 2243,  ...,    0,    0,    0],
        [ 101, 8909, 2243,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 38%|███▊      | 1906/5000 [00:29<00:51, 60.37it/s]

1896
tensor([[  101,  3114, 30522,  ...,     0,     0,     0],
        [  101,  3114, 30522,  ...,     0,     0,     0],
        [  101,  3114, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  7929, 27233,  ...,     0,     0,     0],
        [  101,  7929, 27233,  ...,     0,     0,     0],
        [  101,  7929, 27233,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 38%|███▊      | 1913/5000 [00:29<00:54, 56.76it/s]

1909
tensor([[ 101, 2092, 1012,  ...,    0,    0,    0],
        [ 101, 2092, 1012,  ...,    0,    0,    0],
        [ 101, 2092, 1012,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 39%|███▊      | 1931/5000 [00:29<00:46, 65.30it/s]

tensor([[ 101, 2021, 2059,  ...,    0,    0,    0],
        [ 101, 2021, 2059,  ...,  102,    0,    0],
        [ 101, 2021, 2059,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 39%|███▉      | 1948/5000 [00:30<00:46, 65.89it/s]

1938
tensor([[ 101, 2320, 1045,  ...,    0,    0,    0],
        [ 101, 2320, 1045,  ...,    0,    0,    0],
        [ 101, 2320, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 39%|███▉      | 1966/5000 [00:30<00:42, 70.71it/s]

1954
tensor([[ 101, 7929, 1012,  ...,    0,    0,    0],
        [ 101, 7929, 1012,  ..., 3046, 2000,  102],
        [ 101, 7929, 1012,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2131,  ...,    0,    0,    0],
        [ 101, 1045, 2131,  ...,    0,    0,    0],
        [ 101, 1045, 2131,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 40%|███▉      | 1976/5000 [00:30<00:39, 76.93it/s]

1967
tensor([[ 101, 2003, 3087,  ...,    0,    0,    0],
        [ 101, 2003, 3087,  ...,    0,    0,    0],
        [ 101, 2003, 3087,  ...,    0,    0,    0],
        ...,
        [ 101, 2000, 2022,  ...,    0,    0,    0],
        [ 101, 2000, 2022,  ...,    0,    0,    0],
        [ 101, 2000, 2022,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 40%|███▉      | 1993/5000 [00:30<00:39, 76.62it/s]


tensor([[  101,  4931,  2515,  ...,     0,     0,     0],
        [  101,  4931,  2515,  ...,     0,     0,     0],
        [  101,  4931,  2515,  ...,     0,     0,     0],
        ...,
        [  101,  7592,  1045,  ..., 26221,  2005,   102],
        [  101,  7592,  1045,  ...,     0,     0,     0],
        [  101,  7592,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
    

 40%|████      | 2013/5000 [00:30<00:34, 85.67it/s]

2000
tensor([[  101, 10047,  2383,  ...,     0,     0,     0],
        [  101, 10047,  2383,  ...,     0,     0,     0],
        [  101, 10047,  2383,  ...,     0,     0,     0],
        ...,
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 41%|████      | 2031/5000 [00:31<00:35, 83.96it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2019
tensor([[  101, 23281, 30522,  ...,     0,     0,     0],
        [  101, 23281, 30522,  ...,     0,     0,     0],
        [  101, 23281, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2043,  1045,  ...,     0,     0,     0],
        [  101,  2043,  1045,  ...,     0,     0,     0],
        [  101,  2043,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 41%|████      | 2051/5000 [00:31<00:35, 82.94it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2035
tensor([[  101, 10334,  2113,  ...,     0,     0,     0],
        [  101, 103

 41%|████      | 2060/5000 [00:31<00:39, 73.68it/s]

2051
tensor([[ 101, 2763, 1037,  ...,    0,    0,    0],
        [ 101, 2763, 1037,  ...,    0,    0,    0],
        [ 101, 2763, 1037,  ...,    0,    0,    0],
        ...,
        [ 101, 2089, 2025,  ...,    0,    0,    0],
        [ 101, 2089, 2025,  ...,    0,    0,    0],
        [ 101, 2089, 2025,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 42%|████▏     | 2076/5000 [00:31<00:43, 67.47it/s]

2067
tensor([[  101,  3198, 30522,  ...,     0,     0,     0],
        [  101,  3198, 30522,  ...,     0,     0,     0],
        [  101,  3198, 30522,  ...,     0,     0,     0],
        ...,
        [  101, 16780, 30522,  ...,     0,     0,     0],
        [  101, 16780, 30522,  ...,     0,     0,     0],
        [  101, 16780, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 42%|████▏     | 2093/5000 [00:32<00:39, 72.88it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2083
tensor([[ 101, 3087, 2113,  ...,    0,    0,    0],
        [ 101, 3087, 2113,  ...,    0,    0,    0],
        [ 101, 3087, 2113,  ...,    0,    0,    0],
        ...,
        [ 101, 2151, 2204,  ...,    0,    0,    0],
        [ 101, 2151, 2204,  ...,    0,    0,    0],
        [ 101, 2151, 2204,  ...,  

 42%|████▏     | 2101/5000 [00:32<00:43, 66.76it/s]

2097
tensor([[ 101, 8038, 2100,  ...,    0,    0,    0],
        [ 101, 8038, 2100,  ...,    0,    0,    0],
        [ 101, 8038, 2100,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 42%|████▏     | 2118/5000 [00:32<00:40, 70.73it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2109
tensor([[ 101, 1062, 2666,  ...,    0,    0,    0],
        [ 101, 1062, 2666,  ...,    0,    0,    0],
        [ 101, 1062, 2666,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ..., 2041, 1998,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 43%|████▎     | 2134/5000 [00:32<00:43, 65.80it/s]

tensor([[  101, 19219,  2080,  ...,     0,     0,     0],
        [  101, 19219,  2080,  ...,     0,     0,     0],
        [  101, 19219,  2080,  ...,     0,     0,     0],
        ...,
        [  101,  1996,  9808,  ...,     0,     0,     0],
        [  101,  1996,  9808,  ...,  2079,  1050,   102],
        [  101,  1996,  9808,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 43%|████▎     | 2150/5000 [00:32<00:41, 68.99it/s]

2138
tensor([[ 101, 3046, 2000,  ...,    0,    0,    0],
        [ 101, 3046, 2000,  ...,    0,    0,    0],
        [ 101, 3046, 2000,  ...,    0,    0,    0],
        ...,
        [ 101, 1034, 1037,  ...,    0,    0,    0],
        [ 101, 1034, 1037,  ...,    0,    0,    0],
        [ 101, 1034, 1037,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 43%|████▎     | 2168/5000 [00:33<00:36, 77.40it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2155
tensor([[  101,  6583, 21823,  ...,     0,     0,     0],
        [  101,  6583, 21823,  ...,     0,     0,     0],
        [  101,  6583, 21823,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  2228,  ...,     0,     0,     0],
        [  101,  1045,  2228,  ...,     0,     0,     0],
        [  101,  1045,  2228,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 44%|████▎     | 2186/5000 [00:33<00:35, 79.02it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2174
tensor([[ 101, 1028, 1035,  ...,    0,    0,    0],
        [ 101, 1028, 1035,  ...,    0,    0,    0],
        [ 101, 1028, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 4165, 2066,  ...,    0,    0,    0],
        [ 101, 4165, 2066,  ...,    0,    0,    0],
        [ 101, 4165, 2066,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 44%|████▍     | 2203/5000 [00:33<00:39, 71.12it/s]

2188
tensor([[ 101, 7592, 3087,  ...,    0,    0,    0],
        [ 101, 7592, 3087,  ...,    0,    0,    0],
        [ 101, 7592, 3087,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 3531,  ...,    0,    0,    0],
        [ 101, 7592, 3531,  ...,    0,    0,    0],
        [ 101, 7592, 3531,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 44%|████▍     | 2212/5000 [00:33<00:37, 74.56it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2204
tensor([[  101,  2348,  2045,  ...,     0,     0,     0],
        [  101,  2348,  2045,  ...,     0,     0,     0],
        [  101,  2348,  2045,  ...,     0,     0,     0],
        ...,
        [  101, 15775, 12274,  ...,     0,     0,     0],
        [  101, 15775, 12274,  ...,     0,     0,     0],
        [  101, 15775, 12274,  ...,  1035, 24471,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 45%|████▍     | 2231/5000 [00:33<00:36, 76.88it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2222
tensor([[ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087

 45%|████▍     | 2248/5000 [00:34<00:36, 74.79it/s]

2237
tensor([[ 101, 1005, 1056,  ...,    0,    0,    0],
        [ 101, 1005, 1056,  ...,    0,    0,    0],
        [ 101, 1005, 1056,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 3266,  ...,    0,    0,    0],
        [ 101, 1045, 3266,  ...,    0,    0,    0],
        [ 101, 1045, 3266,  ..., 1012, 2003,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 45%|████▌     | 2266/5000 [00:34<00:35, 77.18it/s]

2255
tensor([[  101, 14931, 12190,  ...,     0,     0,     0],
        [  101, 14931, 12190,  ...,     0,     0,     0],
        [  101, 14931, 12190,  ...,   102,     0,     0],
        ...,
        [  101,  2425,  2008,  ...,     0,     0,     0],
        [  101,  2425,  2008,  ...,     0,     0,     0],
        [  101,  2425,  2008,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 46%|████▌     | 2285/5000 [00:34<00:33, 81.00it/s]

tensor([[ 101, 1999, 1035,  ...,    0,    0,    0],
        [ 101, 1999, 1035,  ...,    0,    0,    0],
        [ 101, 1999, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2052,  ...,    0,    0,    0],
        [ 101, 1045, 2052,  ...,    0,    0,    0],
        [ 101, 1045, 2052,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 46%|████▌     | 2304/5000 [00:34<00:31, 85.25it/s]

2288
tensor([[  101,  4931,  2035,  ...,     0,     0,     0],
        [  101,  4931,  2035,  ...,     0,     0,     0],
        [  101,  4931,  2035,  ...,     0,     0,     0],
        ...,
        [  101, 16215, 26807,  ...,     0,     0,     0],
        [  101, 16215, 26807,  ...,     0,     0,     0],
        [  101, 16215, 26807,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 46%|████▋     | 2323/5000 [00:35<00:32, 82.46it/s]

2307
tensor([[  101, 18168,  2290,  ...,     0,     0,     0],
        [  101, 18168,  2290,  ...,     0,     0,     0],
        [  101, 18168,  2290,  ...,     0,     0,     0],
        ...,
        [  101,  1040, 25509,  ...,     0,     0,     0],
        [  101,  1040, 25509,  ...,     0,     0,     0],
        [  101,  1040, 25509,  ...,  4654,  2063,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 47%|████▋     | 2344/5000 [00:35<00:30, 87.99it/s]

tensor([[ 101, 2031, 2017,  ...,    0,    0,    0],
        [ 101, 2031, 2017,  ...,    0,    0,    0],
        [ 101, 2031, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 4010,  ...,    0,    0,    0],
        [ 101, 2129, 4010,  ...,    0,    0,    0],
        [ 101, 2129, 4010,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 47%|████▋     | 2353/5000 [00:35<00:32, 81.36it/s]


tensor([[  101, 10334,  4282,  ...,     0,     0,     0],
        [  101, 10334,  4282,  ...,     0,     0,     0],
        [  101, 10334,  4282,  ...,     0,     0,     0],
        ...,
        [  101,  1038,  4115,  ...,     0,     0,     0],
        [  101,  1038,  4115,  ...,     0,     0,     0],
        [  101,  1038,  4115,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
    

 47%|████▋     | 2370/5000 [00:35<00:35, 73.06it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2359
tensor([[ 101, 1037, 9573,  ...,    0,    0,    0],
        [ 101, 1037, 9573,  ...,    0,    0,    0],
        [ 101, 1037, 9573,  ...,    0,    0,    0],
        ...,
        [ 101, 1024, 1007,  ...,    0,    0,    0],
        [ 101, 1024, 1007,  ...,    0,    0,    0],
        [ 101, 1024, 1007,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 48%|████▊     | 2386/5000 [00:35<00:36, 70.98it/s]

2372
tensor([[ 101, 2053, 2801,  ...,    0,    0,    0],
        [ 101, 2053, 2801,  ...,    0,    0,    0],
        [ 101, 2053, 2801,  ...,    0,    0,    0],
        ...,
        [ 101, 4300, 2906,  ...,    0,    0,    0],
        [ 101, 4300, 2906,  ...,    0,    0,    0],
        [ 101, 4300, 2906,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 48%|████▊     | 2395/5000 [00:36<00:37, 70.04it/s]

2389
tensor([[ 101, 4931, 4364,  ..., 2017, 2064,  102],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2069,  ...,    0,    0,    0],
        [ 101, 1045, 2069,  ...,    0,    0,    0],
        [ 101, 1045, 2069,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 48%|████▊     | 2413/5000 [00:36<00:35, 72.58it/s]

2402
tensor([[  101, 17012,  1045,  ...,     0,     0,     0],
        [  101, 17012,  1045,  ...,     0,     0,     0],
        [  101, 17012,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  5791, 30522,  ...,     0,     0,     0],
        [  101,  5791, 30522,  ...,     0,     0,     0],
        [  101,  5791, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 49%|████▊     | 2430/5000 [00:36<00:33, 76.72it/s]

tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2421
tensor([[ 101, 2009, 3138,  ...,    0,    0,    0],
        [ 101, 2009, 3138

 49%|████▉     | 2450/5000 [00:36<00:29, 85.86it/s]

2437
tensor([[ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 3752, 7427,  ...,    0,    0,    0],
        [ 101, 3752, 7427,  ...,    0,    0,    0],
        [ 101, 3752, 7427,  ..., 2339, 2024,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 49%|████▉     | 2468/5000 [00:36<00:33, 76.38it/s]

2456
tensor([[  101,  2821, 23644,  ...,     0,     0,     0],
        [  101,  2821, 23644,  ...,     0,     0,     0],
        [  101,  2821, 23644,  ...,  2544,  1035,   102],
        ...,
        [  101, 20228, 11514,  ...,     0,     0,     0],
        [  101, 20228, 11514,  ...,     0,     0,     0],
        [  101, 20228, 11514,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 50%|████▉     | 2487/5000 [00:37<00:30, 81.73it/s]

2472
tensor([[  101,  7987, 15068,  ...,     0,     0,     0],
        [  101,  7987, 15068,  ...,     0,     0,     0],
        [  101,  7987, 15068,  ..., 12458,  2401,   102],
        ...,
        [  101,  7632,  7955,  ...,     0,     0,     0],
        [  101,  7632,  7955,  ...,     0,     0,     0],
        [  101,  7632,  7955,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 50%|█████     | 2505/5000 [00:37<00:30, 82.27it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2491
tensor([[ 101, 2534, 2080,  ...,    0,    0,    0],
        [ 101, 2534, 2080

 50%|█████     | 2524/5000 [00:37<00:30, 81.14it/s]

2509
tensor([[  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0],
        ...,
        [  101,  1052, 30522,  ...,     0,     0,     0],
        [  101,  1052, 30522,  ...,     0,     0,     0],
        [  101,  1052, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 51%|█████     | 2533/5000 [00:37<00:32, 74.87it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2525
tensor([[ 101, 1007, 1045,  ..., 2112, 2551,  102],
        [ 101, 1007, 1045,  ...,    0,    0,    0],
        [ 101, 1007, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 1996, 3291,  ...,    0,    0,    0],
        [ 101, 1996, 3291,  ...,    0,    0,    0],
        [ 101, 1996, 3291,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 51%|█████     | 2549/5000 [00:37<00:34, 71.39it/s]

2538
tensor([[  101,  7632,  1045,  ...,     0,     0,     0],
        [  101,  7632,  1045,  ...,     0,     0,     0],
        [  101,  7632,  1045,  ..., 18584,  1035,   102],
        ...,
        [  101,  1037,  2767,  ...,     0,     0,     0],
        [  101,  1037,  2767,  ...,     0,     0,     0],
        [  101,  1037,  2767,  ...,  1743,  1656,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 51%|█████▏    | 2564/5000 [00:38<00:38, 63.77it/s]

2554
tensor([[ 101, 1045, 2310,  ...,    0,    0,    0],
        [ 101, 1045, 2310,  ...,    0,    0,    0],
        [ 101, 1045, 2310,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 52%|█████▏    | 2583/5000 [00:38<00:31, 76.01it/s]

2570
tensor([[ 101, 3531, 1012,  ...,    0,    0,    0],
        [ 101, 3531, 1012,  ...,    0,    0,    0],
        [ 101, 3531, 1012,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 5993,  ...,    0,    0,    0],
        [ 101, 1045, 5993,  ...,    0,    0,    0],
        [ 101, 1045, 5993,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 52%|█████▏    | 2602/5000 [00:38<00:30, 79.91it/s]

2589
tensor([[ 101, 2017, 2052,  ...,    0,    0,    0],
        [ 101, 2017, 2052,  ...,    0,    0,    0],
        [ 101, 2017, 2052,  ...,    0,    0,    0],
        ...,
        [ 101, 3087, 2478,  ...,    0,    0,    0],
        [ 101, 3087, 2478,  ...,    0,    0,    0],
        [ 101, 3087, 2478,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 52%|█████▏    | 2622/5000 [00:38<00:28, 84.14it/s]


tensor([[  101,  7929,  1045,  ...,     0,     0,     0],
        [  101,  7929,  1045,  ...,     0,     0,     0],
        [  101,  7929,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  2007, 19219,  ...,     0,     0,     0],
        [  101,  2007, 19219,  ...,     0,     0,     0],
        [  101,  2007, 19219,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
    

 53%|█████▎    | 2640/5000 [00:39<00:28, 81.95it/s]

2625
tensor([[ 101, 7592, 3071,  ...,    0,    0,    0],
        [ 101, 7592, 3071,  ...,    0,    0,    0],
        [ 101, 7592, 3071,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 53%|█████▎    | 2649/5000 [00:39<00:34, 67.39it/s]

2641
tensor([[ 101, 2053, 2028,  ...,    0,    0,    0],
        [ 101, 2053, 2028,  ...,    0,    0,    0],
        [ 101, 2053, 2028,  ...,    0,    0,    0],
        ...,
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 53%|█████▎    | 2664/5000 [00:39<00:37, 62.04it/s]

tensor([[ 101, 2295, 2097,  ...,    0,    0,    0],
        [ 101, 2295, 2097,  ...,    0,    0,    0],
        [ 101, 2295, 2097,  ...,    0,    0,    0],
        ...,
        [ 101, 4364, 1045,  ...,    0,    0,    0],
        [ 101, 4364, 1045,  ...,    0,    0,    0],
        [ 101, 4364, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 53%|█████▎    | 2671/5000 [00:39<00:39, 58.65it/s]

tensor([[ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 3191, 2069,  ...,    0,    0,    0],
        [ 101, 3191, 2069,  ...,    0,    0,    0],
        [ 101, 3191, 2069,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 54%|█████▎    | 2684/5000 [00:39<00:42, 54.95it/s]

tensor([[  101,  2129,  2272,  ...,  2521,  2004,   102],
        [  101,  2129,  2272,  ..., 27717,  1035,   102],
        [  101,  2129,  2272,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  1049,  ...,     0,     0,     0],
        [  101,  1045,  1049,  ...,     0,     0,     0],
        [  101,  1045,  1049,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 54%|█████▍    | 2699/5000 [00:40<00:38, 59.38it/s]

2689
tensor([[ 101, 3160, 1045,  ...,    0,    0,    0],
        [ 101, 3160, 1045,  ..., 1996, 2946,  102],
        [ 101, 3160, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2514,  ...,    0,    0,    0],
        [ 101, 1045, 2514,  ...,    0,    0,    0],
        [ 101, 1045, 2514,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 54%|█████▍    | 2718/5000 [00:40<00:31, 71.38it/s]

2705
tensor([[ 101, 2323, 2022,  ..., 1996, 9703,  102],
        [ 101, 2323, 2022,  ...,    0,    0,    0],
        [ 101, 2323, 2022,  ...,    0,    0,    0],
        ...,
        [ 101, 2017, 2123,  ...,    0,    0,    0],
        [ 101, 2017, 2123,  ...,    0,    0,    0],
        [ 101, 2017, 2123,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 55%|█████▍    | 2735/5000 [00:40<00:30, 73.24it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2722
tensor([[ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ..., 2811, 1996,  102],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 55%|█████▌    | 2751/5000 [00:40<00:31, 72.29it/s]

2739
tensor([[ 101, 3087, 2182,  ...,    0,    0,    0],
        [ 101, 3087, 2182,  ...,    0,    0,    0],
        [ 101, 3087, 2182,  ...,    0,    0,    0],
        ...,
        [ 101, 3531, 2292,  ...,    0,    0,    0],
        [ 101, 3531, 2292,  ...,    0,    0,    0],
        [ 101, 3531, 2292,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 55%|█████▌    | 2767/5000 [00:41<00:30, 74.02it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2756
tensor([[  101, 10166, 30522,  ...,     0,     0,     0],
        [  101, 10166, 30522,  ...,     0,     0,     0],
        [  101, 10166, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2821,  2049,  ...,     0,     0,     0],
        [  101,  2821,  2049,  ...,     0,     0,     0],
        [  101,  2821,  2049,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 56%|█████▌    | 2786/5000 [00:41<00:27, 81.44it/s]

2771
tensor([[  101, 17012,  1045,  ...,     0,     0,     0],
        [  101, 17012,  1045,  ...,     0,     0,     0],
        [  101, 17012,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  2475,  1013,  ...,     0,     0,     0],
        [  101,  2475,  1013,  ...,     0,     0,     0],
        [  101,  2475,  1013,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 56%|█████▌    | 2804/5000 [00:41<00:27, 79.95it/s]

2788
tensor([[ 101, 2029, 3444,  ...,    0,    0,    0],
        [ 101, 2029, 3444,  ...,    0,    0,    0],
        [ 101, 2029, 3444,  ...,    0,    0,    0],
        ...,
        [ 101, 2061, 2053,  ...,    0,    0,    0],
        [ 101, 2061, 2053,  ...,    0,    0,    0],
        [ 101, 2061, 2053,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 56%|█████▋    | 2813/5000 [00:41<00:30, 71.79it/s]

2804
tensor([[ 101, 1045, 2079,  ...,    0,    0,    0],
        [ 101, 1045, 2079,  ...,    0,    0,    0],
        [ 101, 1045, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 1057,  ...,    0,    0,    0],
        [ 101, 7592, 1057,  ...,    0,    0,    0],
        [ 101, 7592, 1057,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 57%|█████▋    | 2829/5000 [00:41<00:28, 75.12it/s]

2820
tensor([[ 101, 2005, 1057,  ...,    0,    0,    0],
        [ 101, 2005, 1057,  ...,    0,    0,    0],
        [ 101, 2005, 1057,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 2035,  ...,    0,    0,    0],
        [ 101, 7592, 2035,  ...,    0,    0,    0],
        [ 101, 7592, 2035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 57%|█████▋    | 2846/5000 [00:42<00:28, 76.72it/s]

2836
tensor([[  101,  2061,  1040,  ...,     0,     0,     0],
        [  101,  2061,  1040,  ...,  1007,  2021,   102],
        [  101,  2061,  1040,  ...,     0,     0,     0],
        ...,
        [  101, 19067,  1035,  ...,     0,     0,     0],
        [  101, 19067,  1035,  ...,     0,     0,     0],
        [  101, 19067,  1035,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 57%|█████▋    | 2862/5000 [00:42<00:28, 75.09it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2853
tensor([[ 101, 7632, 4364,  ...,    0,    0,    0],
        [ 101, 7632, 4364

 58%|█████▊    | 2879/5000 [00:42<00:28, 74.46it/s]

2868
tensor([[  101,  1045,  2342,  ...,     0,     0,     0],
        [  101,  1045,  2342,  ...,     0,     0,     0],
        [  101,  1045,  2342,  ...,     0,     0,     0],
        ...,
        [  101,  2057, 15150,  ...,     0,     0,     0],
        [  101,  2057, 15150,  ...,  1996,  2617,   102],
        [  101,  2057, 15150,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 58%|█████▊    | 2895/5000 [00:42<00:28, 73.92it/s]

2884
tensor([[  101,  1996, 13316,  ...,     0,     0,     0],
        [  101,  1996, 13316,  ...,     0,     0,     0],
        [  101,  1996, 13316,  ...,     0,     0,     0],
        ...,
        [  101,  2515,  3087,  ...,     0,     0,     0],
        [  101,  2515,  3087,  ...,     0,     0,     0],
        [  101,  2515,  3087,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 58%|█████▊    | 2911/5000 [00:42<00:30, 69.63it/s]

2900
tensor([[  101,  1060, 21759,  ...,     0,     0,     0],
        [  101,  1060, 21759,  ...,     0,     0,     0],
        [  101,  1060, 21759,  ...,  1012,  2699,   102],
        ...,
        [  101,  3160,  1012,  ...,     0,     0,     0],
        [  101,  3160,  1012,  ...,     0,     0,     0],
        [  101,  3160,  1012,  ...,  2059,  4372,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 58%|█████▊    | 2919/5000 [00:43<00:34, 59.68it/s]

2911
tensor([[ 101, 2106, 1035,  ...,    0,    0,    0],
        [ 101, 2106, 1035,  ...,    0,    0,    0],
        [ 101, 2106, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 5361,  ...,    0,    0,    0],
        [ 101, 1045, 5361,  ...,    0,    0,    0],
        [ 101, 1045, 5361,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 59%|█████▊    | 2934/5000 [00:43<00:33, 61.85it/s]

2926
tensor([[ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 59%|█████▉    | 2947/5000 [00:43<00:35, 57.28it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2937
tensor([[ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045

 59%|█████▉    | 2963/5000 [00:43<00:32, 62.90it/s]

2948
tensor([[  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2323,  1045,  ...,     0,     0,     0],
        [  101,  2323,  1045,  ...,     0,     0,     0],
        [  101,  2323,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 60%|█████▉    | 2980/5000 [00:44<00:29, 68.99it/s]

2964
tensor([[ 101, 2027, 2024,  ...,    0,    0,    0],
        [ 101, 2027, 2024,  ...,    0,    0,    0],
        [ 101, 2027, 2024,  ...,    0,    0,    0],
        ...,
        [ 101, 2043, 1045,  ...,    0,    0,    0],
        [ 101, 2043, 1045,  ...,    0,    0,    0],
        [ 101, 2043, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 60%|█████▉    | 2997/5000 [00:44<00:26, 75.26it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
2982
tensor([[ 101, 1045, 3945,  ...,    0,    0,    0],
        [ 101, 1045, 3945,  ...,    0,    0,    0],
        [ 101, 1045, 3945,  ...,    0,    0,    0],
        ...,
        [ 101, 7592, 4364,  ...,    0,    0,    0],
        [ 101, 7592, 4364,  ..., 1035, 1035,  102],
        [ 101, 7592, 4364,  ...,  

 60%|██████    | 3013/5000 [00:44<00:29, 67.26it/s]

2998
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ..., 5327, 2027,  102],
        ...,
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ..., 2000, 2695,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 60%|██████    | 3020/5000 [00:44<00:31, 63.11it/s]

3013
tensor([[  101, 15624,  2008,  ...,     0,     0,     0],
        [  101, 15624,  2008,  ...,     0,     0,     0],
        [  101, 15624,  2008,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 61%|██████    | 3034/5000 [00:44<00:33, 58.56it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3023
tensor([[ 101, 1045, 2113,  ...,    0,    0,    0],
        [ 101, 1045, 2113,  ...,    0,    0,    0],
        [ 101, 1045, 2113,  ...,    0,    0,    0],
        ...,
        [ 101, 4921, 2063,  ...,    0,    0,    0],
        [ 101, 4921, 2063,  ...,    0,    0,    0],
        [ 101, 4921, 2063,  ...,  

 61%|██████    | 3040/5000 [00:45<00:35, 55.12it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3039
tensor([[ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1040,  ...,    0,    0,    0],
        [ 101, 1045, 1040,  ...,    0,    0,    0],
        [ 101, 1045, 1040,  ...,  

 61%|██████    | 3055/5000 [00:45<00:31, 61.15it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3048
tensor([[ 101, 2653, 1064,  ..., 3736, 2515,  102],
        [ 101, 2653, 1064,  ...,    0,    0,    0],
        [ 101, 2653, 1064,  ...,    0,    0,    0],
        ...,
        [ 101, 2074, 4487,  ...,    0,    0,    0],
        [ 101, 2074, 4487,  ...,    0,    0,    0],
        [ 101, 2074, 4487,  ...,  

 61%|██████▏   | 3068/5000 [00:45<00:33, 57.28it/s]


tensor([[ 101, 2129, 2000,  ...,    0,    0,    0],
        [ 101, 2129, 2000,  ...,    0,    0,    0],
        [ 101, 2129, 2000,  ...,    0,    0,    0],
        ...,
        [ 101, 6203, 2935,  ..., 4957, 1045,  102],
        [ 101, 6203, 2935,  ...,    0,    0,    0],
        [ 101, 6203, 2935,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

 62%|██████▏   | 3083/5000 [00:45<00:30, 63.16it/s]

3071
tensor([[  101,  1048, 13102,  ...,     0,     0,     0],
        [  101,  1048, 13102,  ...,     0,     0,     0],
        [  101,  1048, 13102,  ...,     0,     0,     0],
        ...,
        [  101,  2009,  2950,  ...,     0,     0,     0],
        [  101,  2009,  2950,  ...,     0,     0,     0],
        [  101,  2009,  2950,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 62%|██████▏   | 3090/5000 [00:45<00:31, 60.85it/s]

3087
tensor([[  101,  2895, 19362,  ...,     0,     0,     0],
        [  101,  2895, 19362,  ...,     0,     0,     0],
        [  101,  2895, 19362,  ...,     0,     0,     0],
        ...,
        [  101,  7632,  2035,  ...,     0,     0,     0],
        [  101,  7632,  2035,  ...,     0,     0,     0],
        [  101,  7632,  2035,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 62%|██████▏   | 3107/5000 [00:46<00:29, 63.22it/s]

3098
tensor([[ 101, 1045, 2064,  ..., 2003, 9398,  102],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 63%|██████▎   | 3126/5000 [00:46<00:25, 72.88it/s]

3115
tensor([[ 101, 1045, 2052,  ...,    0,    0,    0],
        [ 101, 1045, 2052,  ...,    0,    0,    0],
        [ 101, 1045, 2052,  ...,    0,    0,    0],
        ...,
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 63%|██████▎   | 3146/5000 [00:46<00:22, 83.16it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3134
tensor([[  101,  4283, 18712,  ...,     0,     0,     0],
        [  101,  4283, 18712,  ...,     0,     0,     0],
        [  101,  4283, 18712,  ...,     0,     0,     0],
        ...,
        [  101,  2672,  2115,  ...,     0,     0,     0],
        [  101,  2672,  2115,  ...,     0,     0,     0],
    

 63%|██████▎   | 3164/5000 [00:46<00:23, 79.24it/s]

3149
tensor([[ 101, 2106, 2017,  ...,    0,    0,    0],
        [ 101, 2106, 2017,  ..., 4942, 7159,  102],
        [ 101, 2106, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 64%|██████▎   | 3181/5000 [00:47<00:24, 74.60it/s]

tensor([[  101, 10047,  6806,  ...,     0,     0,     0],
        [  101, 10047,  6806,  ...,     0,     0,     0],
        [  101, 10047,  6806,  ...,     0,     0,     0],
        ...,
        [  101,  2013,  2026,  ...,     0,     0,     0],
        [  101,  2013,  2026,  ...,     0,     0,     0],
        [  101,  2013,  2026,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 64%|██████▍   | 3189/5000 [00:47<00:24, 73.36it/s]

3181
tensor([[  101,  1999,  2755,  ...,     0,     0,     0],
        [  101,  1999,  2755,  ...,     0,     0,     0],
        [  101,  1999,  2755,  ...,     0,     0,     0],
        ...,
        [  101,  7929, 30522,  ...,     0,     0,     0],
        [  101,  7929, 30522,  ...,     0,     0,     0],
        [  101,  7929, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 64%|██████▍   | 3205/5000 [00:47<00:25, 70.74it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3196
tensor([[ 101, 2061, 2053,  ..., 1006, 2030,  102],
        [ 101, 2061, 2053

 64%|██████▍   | 3222/5000 [00:47<00:23, 75.89it/s]

3209
tensor([[ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 6187, 1050,  ...,    0,    0,    0],
        [ 101, 6187, 1050,  ...,    0,    0,    0],
        [ 101, 6187, 1050,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 65%|██████▍   | 3238/5000 [00:47<00:22, 76.88it/s]

3225
tensor([[ 101, 3087, 2031,  ..., 2084, 2008,  102],
        [ 101, 3087, 2031,  ...,    0,    0,    0],
        [ 101, 3087, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 2074, 2543,  ...,    0,    0,    0],
        [ 101, 2074, 2543,  ...,    0,    0,    0],
        [ 101, 2074, 2543,  ..., 2152, 3177,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 65%|██████▌   | 3254/5000 [00:48<00:24, 72.19it/s]

3241
tensor([[  101,  6300,  2050,  ...,     0,     0,     0],
        [  101,  6300,  2050,  ...,     0,     0,     0],
        [  101,  6300,  2050,  ...,     0,     0,     0],
        ...,
        [  101, 20878,  1012,  ...,     0,     0,     0],
        [  101, 20878,  1012,  ...,     0,     0,     0],
        [  101, 20878,  1012,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 65%|██████▌   | 3270/5000 [00:48<00:24, 71.82it/s]

3257
tensor([[  101, 28286,  2595,  ...,     0,     0,     0],
        [  101, 28286,  2595,  ...,  1042,  4523,   102],
        [  101, 28286,  2595,  ...,     0,     0,     0],
        ...,
        [  101,  2044,  2008,  ...,     0,     0,     0],
        [  101,  2044,  2008,  ...,     0,     0,     0],
        [  101,  2044,  2008,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 66%|██████▌   | 3286/5000 [00:48<00:26, 65.63it/s]

3273
tensor([[ 101, 2478, 1035,  ...,    0,    0,    0],
        [ 101, 2478, 1035,  ...,    0,    0,    0],
        [ 101, 2478, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 2291, 2003,  ...,    0,    0,    0],
        [ 101, 2291, 2003,  ...,    0,    0,    0],
        [ 101, 2291, 2003,  ..., 1011, 1058,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 66%|██████▌   | 3299/5000 [00:48<00:30, 55.46it/s]

3289
tensor([[ 101, 1045, 2128,  ...,    0,    0,    0],
        [ 101, 1045, 2128,  ...,    0,    0,    0],
        [ 101, 1045, 2128,  ..., 8569, 3372,  102],
        ...,
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 66%|██████▌   | 3308/5000 [00:48<00:27, 60.61it/s]


tensor([[  101,  1045,  2074,  ..., 21189,  9262,   102],
        [  101,  1045,  2074,  ...,     0,     0,     0],
        [  101,  1045,  2074,  ...,     0,     0,     0],
        ...,
        [  101,  1045,  2106,  ...,     0,     0,     0],
        [  101,  1045,  2106,  ...,     0,     0,     0],
        [  101,  1045,  2106,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
    

 66%|██████▋   | 3322/5000 [00:49<00:34, 49.30it/s]

3313
tensor([[  101,  7929,  3201,  ...,     0,     0,     0],
        [  101,  7929,  3201,  ...,     0,     0,     0],
        [  101,  7929,  3201,  ...,     0,     0,     0],
        ...,
        [  101,  2025, 10751,  ...,     0,     0,     0],
        [  101,  2025, 10751,  ...,     0,     0,     0],
        [  101,  2025, 10751,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 67%|██████▋   | 3338/5000 [00:49<00:28, 57.87it/s]


tensor([[ 101, 2085, 2008,  ...,    0,    0,    0],
        [ 101, 2085, 2008,  ...,    0,    0,    0],
        [ 101, 2085, 2008,  ...,    0,    0,    0],
        ...,
        [ 101, 1998, 2053,  ...,    0,    0,    0],
        [ 101, 1998, 2053,  ...,    0,    0,    0],
        [ 101, 1998, 2053,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

 67%|██████▋   | 3346/5000 [00:49<00:27, 60.66it/s]

3338
tensor([[ 101, 2030, 2003,  ...,    0,    0,    0],
        [ 101, 2030, 2003,  ...,    0,    0,    0],
        [ 101, 2030, 2003,  ...,    0,    0,    0],
        ...,
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 67%|██████▋   | 3360/5000 [00:49<00:28, 58.51it/s]

tensor([[  101,  7592,  2064,  ...,     0,     0,     0],
        [  101,  7592,  2064,  ...,     0,     0,     0],
        [  101,  7592,  2064,  ...,     0,     0,     0],
        ...,
        [  101, 17012,  1012,  ...,     0,     0,     0],
        [  101, 17012,  1012,  ...,     0,     0,     0],
        [  101, 17012,  1012,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 67%|██████▋   | 3374/5000 [00:50<00:27, 59.97it/s]

tensor([[  101, 24665, 12171,  ...,     0,     0,     0],
        [  101, 24665, 12171,  ...,     0,     0,     0],
        [  101, 24665, 12171,  ...,     0,     0,     0],
        ...,
        [  101,  3087,  2412,  ...,     0,     0,     0],
        [  101,  3087,  2412,  ...,     0,     0,     0],
        [  101,  3087,  2412,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 68%|██████▊   | 3387/5000 [00:50<00:28, 57.58it/s]

3378
tensor([[ 101, 2429, 2000,  ..., 2131, 2019,  102],
        [ 101, 2429, 2000,  ...,    0,    0,    0],
        [ 101, 2429, 2000,  ..., 1035, 1998,  102],
        ...,
        [ 101, 2107, 1037,  ...,    0,    0,    0],
        [ 101, 2107, 1037,  ...,    0,    0,    0],
        [ 101, 2107, 1037,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 68%|██████▊   | 3396/5000 [00:50<00:27, 58.55it/s]

3392
tensor([[ 101, 3438, 7737,  ...,    0,    0,    0],
        [ 101, 3438, 7737,  ...,    0,    0,    0],
        [ 101, 3438, 7737,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 68%|██████▊   | 3413/5000 [00:50<00:26, 59.48it/s]

3403
tensor([[ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 1037, 2312,  ...,    0,    0,    0],
        [ 101, 1037, 2312,  ...,    0,    0,    0],
        [ 101, 1037, 2312,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 69%|██████▊   | 3428/5000 [00:50<00:24, 63.92it/s]

3419
tensor([[ 101, 2129, 2092,  ...,    0,    0,    0],
        [ 101, 2129, 2092,  ...,    0,    0,    0],
        [ 101, 2129, 2092,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 2009,  ...,    0,    0,    0],
        [ 101, 2515, 2009,  ...,    0,    0,    0],
        [ 101, 2515, 2009,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 69%|██████▊   | 3435/5000 [00:51<00:25, 60.99it/s]

3431
tensor([[ 101, 2151, 9722,  ...,    0,    0,    0],
        [ 101, 2151, 9722,  ..., 1996, 3332,  102],
        [ 101, 2151, 9722,  ..., 2003, 2919,  102],
        ...,
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 69%|██████▉   | 3448/5000 [00:51<00:33, 45.81it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3442
tensor([[ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,    0,    0,    0],
        [ 101, 2003, 2009,  ...,  

 69%|██████▉   | 3457/5000 [00:51<00:29, 52.79it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3453
tensor([[ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031

 69%|██████▉   | 3472/5000 [00:51<00:25, 60.67it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3464
tensor([[ 101, 2009, 3065,  ...,    0,    0,    0],
        [ 101, 2009, 3065,  ...,    0,    0,    0],
        [ 101, 2009, 3065,  ...,    0,    0,    0],
        ...,
        [ 101, 1998, 2069,  ...,    0,    0,    0],
        [ 101, 1998, 2069,  ...,    0,    0,    0],
        [ 101, 1998, 2069,  ...,  

 70%|██████▉   | 3486/5000 [00:52<00:26, 56.08it/s]

3474
tensor([[ 101, 7632, 3071,  ...,    0,    0,    0],
        [ 101, 7632, 3071,  ...,    0,    0,    0],
        [ 101, 7632, 3071,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 70%|██████▉   | 3492/5000 [00:52<00:31, 48.50it/s]

3490
tensor([[ 101, 7632, 2064,  ...,    0,    0,    0],
        [ 101, 7632, 2064,  ..., 6728, 6305,  102],
        [ 101, 7632, 2064,  ...,    0,    0,    0],
        ...,
        [ 101, 6289, 2232,  ...,    0,    0,    0],
        [ 101, 6289, 2232,  ...,    0,    0,    0],
        [ 101, 6289, 2232,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 70%|███████   | 3508/5000 [00:52<00:28, 51.74it/s]

3501
tensor([[ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        [ 101, 2064, 2619,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2215,  ...,    0,    0,    0],
        [ 101, 1045, 2215,  ...,    0,    0,    0],
        [ 101, 1045, 2215,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 70%|███████   | 3523/5000 [00:52<00:25, 57.70it/s]

3514
tensor([[ 101, 2106, 2017,  ...,    0,    0,    0],
        [ 101, 2106, 2017,  ...,    0,    0,    0],
        [ 101, 2106, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 71%|███████   | 3538/5000 [00:52<00:24, 60.30it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3527
tensor([[ 101, 1057, 8569,  ...,    0,    0,    0],
        [ 101, 1057, 8569,  ...,    0,    0,    0],
        [ 101, 1057, 8569,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2001,  ...,    0,    0,    0],
        [ 101, 1045, 2001,  ...,    0,    0,    0],
        [ 101, 1045, 2001,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 71%|███████   | 3552/5000 [00:53<00:24, 59.63it/s]

3541
tensor([[ 101, 1045, 2145,  ...,    0,    0,    0],
        [ 101, 1045, 2145,  ...,    0,    0,    0],
        [ 101, 1045, 2145,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0],
        [ 101, 1045, 2572,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 71%|███████   | 3561/5000 [00:53<00:23, 60.80it/s]

tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3555
tensor([[  101,  1998,  2017,  ...,     0,     0,     0],
        [  101,  19

 72%|███████▏  | 3578/5000 [00:53<00:21, 65.30it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3568
tensor([[ 101, 1045, 2288,  ...,    0,    0,    0],
        [ 101, 1045, 2288

 72%|███████▏  | 3593/5000 [00:53<00:22, 63.66it/s]

3578
tensor([[  101,  2862, 30522,  ...,     0,     0,     0],
        [  101,  2862, 30522,  ...,     0,     0,     0],
        [  101,  2862, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2191,  2009,  ...,     0,     0,     0],
        [  101,  2191,  2009,  ...,     0,     0,     0],
        [  101,  2191,  2009,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 72%|███████▏  | 3601/5000 [00:53<00:21, 65.58it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3595
tensor([[  101,  2092,  1045,  ...,     0,     0,     0],
        [  101,  2092,  1045,  ...,     0,     0,     0],
        [  101,  2092,  1045,  ...,     0,     0,     0],
        ...,
        [  101,  7632, 30522,  ...,     0,     0,     0],
        [  101,  7632, 30522,  ...,     0,     0,     0],
    

 72%|███████▏  | 3615/5000 [00:54<00:23, 59.30it/s]

3605
tensor([[ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 2009, 2758,  ...,    0,    0,    0],
        [ 101, 2009, 2758,  ...,    0,    0,    0],
        [ 101, 2009, 2758,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 73%|███████▎  | 3631/5000 [00:54<00:22, 61.04it/s]

3621
tensor([[ 101, 2079, 2017,  ..., 1045, 2079,  102],
        [ 101, 2079, 2017,  ...,    0,    0,    0],
        [ 101, 2079, 2017,  ...,    0,    0,    0],
        ...,
        [ 101, 2044, 1037,  ...,    0,    0,    0],
        [ 101, 2044, 1037,  ...,    0,    0,    0],
        [ 101, 2044, 1037,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 73%|███████▎  | 3640/5000 [00:54<00:24, 56.54it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3637
tensor([[ 101, 2424, 1011,  ...,    0,    0,    0],
        [ 101, 2424, 1011,  ...,    0,    0,    0],
        [ 101, 2424, 1011,  ...,    0,    0,    0],
        ...,
        [ 101, 2633, 2288,  ...,    0,    0,    0],
        [ 101, 2633, 2288,  ...,    0,    0,    0],
        [ 101, 2633, 2288,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 73%|███████▎  | 3655/5000 [00:54<00:22, 60.56it/s]

3646
tensor([[ 101, 2045, 2024,  ...,    0,    0,    0],
        [ 101, 2045, 2024,  ...,    0,    0,    0],
        [ 101, 2045, 2024,  ..., 2080, 5371,  102],
        ...,
        [ 101, 2053, 2009,  ...,    0,    0,    0],
        [ 101, 2053, 2009,  ...,    0,    0,    0],
        [ 101, 2053, 2009,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 73%|███████▎  | 3673/5000 [00:55<00:18, 70.71it/s]

3659
tensor([[  101,  2821, 23644,  ...,     0,     0,     0],
        [  101,  2821, 23644,  ...,     0,     0,     0],
        [  101,  2821, 23644,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2064,  ...,     0,     0,     0],
        [  101,  2129,  2064,  ...,     0,     0,     0],
        [  101,  2129,  2064,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 74%|███████▍  | 3691/5000 [00:55<00:16, 77.97it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3678
tensor([[ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        ...,
        [ 101, 2821, 1999,  ...,    0,    0,    0],
        [ 101, 2821, 1999,  ...,    0,    0,    0],
        [ 101, 2821, 1999,  ...,  

 74%|███████▍  | 3711/5000 [00:55<00:15, 82.21it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3696
tensor([[ 101, 6519, 1057,  ...,    0,    0,    0],
        [ 101, 6519, 1057

 75%|███████▍  | 3730/5000 [00:55<00:14, 86.79it/s]

3713
tensor([[ 101, 9765, 1035,  ...,    0,    0,    0],
        [ 101, 9765, 1035,  ...,    0,    0,    0],
        [ 101, 9765, 1035,  ...,    0,    0,    0],
        ...,
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 75%|███████▌  | 3750/5000 [00:55<00:13, 90.53it/s]

3733
tensor([[  101,  2003,  1050,  ...,     0,     0,     0],
        [  101,  2003,  1050,  ...,     0,     0,     0],
        [  101,  2003,  1050,  ...,     0,     0,     0],
        ...,
        [  101,  2029, 16500,  ...,     0,     0,     0],
        [  101,  2029, 16500,  ...,     0,     0,     0],
        [  101,  2029, 16500,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 75%|███████▌  | 3760/5000 [00:56<00:14, 83.56it/s]

3750
tensor([[ 101, 1045, 2001,  ...,    0,    0,    0],
        [ 101, 1045, 2001,  ..., 2005, 2490,  102],
        [ 101, 1045, 2001,  ..., 8790, 3973,  102],
        ...,
        [ 101, 2106, 2151,  ...,    0,    0,    0],
        [ 101, 2106, 2151,  ...,    0,    0,    0],
        [ 101, 2106, 2151,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 76%|███████▌  | 3780/5000 [00:56<00:13, 88.34it/s]

3769
tensor([[  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2052, 10334,  ...,     0,     0,     0],
        [  101,  2052, 10334,  ...,     0,     0,     0],
        [  101,  2052, 10334,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 76%|███████▌  | 3799/5000 [00:56<00:13, 87.21it/s]

3786
tensor([[ 101, 2009, 1055,  ...,    0,    0,    0],
        [ 101, 2009, 1055,  ...,    0,    0,    0],
        [ 101, 2009, 1055,  ...,    0,    0,    0],
        ...,
        [ 101, 3398, 6585,  ...,    0,    0,    0],
        [ 101, 3398, 6585,  ...,    0,    0,    0],
        [ 101, 3398, 6585,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 76%|███████▋  | 3817/5000 [00:56<00:13, 86.58it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3805
tensor([[  101,  3087,  2182,  ...,     0,     0,     0],
        [  101,  3087,  2182,  ...,     0,     0,     0],
        [  101,  3087,  2182,  ...,     0,     0,     0],
        ...,
        [  101,  1050, 17258,  ...,     0,     0,     0],
        [  101,  1050, 17258,  ...,     0,     0,     0],
    

 77%|███████▋  | 3835/5000 [00:56<00:13, 84.73it/s]

3821
tensor([[  101,  2388, 11263,  ...,     0,     0,     0],
        [  101,  2388, 11263,  ...,  1035,  3643,   102],
        [  101,  2388, 11263,  ...,     0,     0,     0],
        ...,
        [  101,  2040,  2056,  ...,     0,     0,     0],
        [  101,  2040,  2056,  ..., 11602,  3995,   102],
        [  101,  2040,  2056,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 77%|███████▋  | 3852/5000 [00:57<00:15, 74.83it/s]

3838
tensor([[ 101, 2003, 2023,  ...,    0,    0,    0],
        [ 101, 2003, 2023,  ...,    0,    0,    0],
        [ 101, 2003, 2023,  ...,    0,    0,    0],
        ...,
        [ 101, 2092, 2017,  ...,    0,    0,    0],
        [ 101, 2092, 2017,  ...,    0,    0,    0],
        [ 101, 2092, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 77%|███████▋  | 3861/5000 [00:57<00:15, 74.68it/s]

3854
tensor([[  101, 18833,  1064,  ...,  2991,  2067,   102],
        [  101, 18833,  1064,  ...,     0,     0,     0],
        [  101, 18833,  1064,  ...,  3207,  1998,   102],
        ...,
        [  101,  2129,  2064,  ...,     0,     0,     0],
        [  101,  2129,  2064,  ...,     0,     0,     0],
        [  101,  2129,  2064,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 78%|███████▊  | 3877/5000 [00:57<00:16, 66.79it/s]

3868
tensor([[ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,  102,    0,    0],
        ...,
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0],
        [ 101, 2065, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 78%|███████▊  | 3891/5000 [00:57<00:16, 65.73it/s]

3882
tensor([[  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0],
        [  101,  1045,  2031,  ...,     0,     0,     0],
        ...,
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0],
        [  101,  2748, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 78%|███████▊  | 3906/5000 [00:58<00:17, 61.10it/s]

3892
tensor([[ 101, 3087, 2113,  ...,    0,    0,    0],
        [ 101, 3087, 2113,  ..., 2071, 2017,  102],
        [ 101, 3087, 2113,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 78%|███████▊  | 3924/5000 [00:58<00:14, 72.20it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
3910
tensor([[  101,  5665,  2074,  ..., 12083,  2044,   102],
        [  101,  5665,  2074,  ...,     0,     0,     0],
        [  101,  5665,  2074,  ...,     0,     0,     0],
        ...,
        [  101,  1055,  2007,  ...,     0,     0,     0],
        [  101,  1055,  2007,  ...,     0,     0,     0],
        [  101,  1055,  2007,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 79%|███████▉  | 3942/5000 [00:58<00:13, 77.27it/s]

3927
tensor([[  101, 22563,  1011,  ...,     0,     0,     0],
        [  101, 22563,  1011,  ...,     0,     0,     0],
        [  101, 22563,  1011,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 79%|███████▉  | 3950/5000 [00:58<00:14, 72.26it/s]

3945
tensor([[  101,  1006, 17521,  ...,     0,     0,     0],
        [  101,  1006, 17521,  ...,     0,     0,     0],
        [  101,  1006, 17521,  ...,     0,     0,     0],
        ...,
        [  101, 16948, 30522,  ...,     0,     0,     0],
        [  101, 16948, 30522,  ...,     0,     0,     0],
        [  101, 16948, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 79%|███████▉  | 3966/5000 [00:58<00:15, 65.73it/s]

tensor([[ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        [ 101, 2003, 2045,  ...,    0,    0,    0],
        ...,
        [ 101, 2021, 1059,  ...,    0,    0,    0],
        [ 101, 2021, 1059,  ..., 1998, 1035,  102],
        [ 101, 2021, 1059,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 80%|███████▉  | 3982/5000 [00:59<00:14, 68.21it/s]

3970
tensor([[ 101, 2054, 6433,  ...,    0,    0,    0],
        [ 101, 2054, 6433,  ...,    0,    0,    0],
        [ 101, 2054, 6433,  ...,    0,    0,    0],
        ...,
        [ 101, 2821, 3100,  ...,    0,    0,    0],
        [ 101, 2821, 3100,  ...,    0,    0,    0],
        [ 101, 2821, 3100,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 80%|███████▉  | 3998/5000 [00:59<00:13, 71.82it/s]

3986
tensor([[ 101, 1057, 8569,  ...,    0,    0,    0],
        [ 101, 1057, 8569,  ...,    0,    0,    0],
        [ 101, 1057, 8569,  ...,    0,    0,    0],
        ...,
        [ 101, 2079, 2017,  ...,    0,    0,    0],
        [ 101, 2079, 2017,  ...,    0,    0,    0],
        [ 101, 2079, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 80%|████████  | 4014/5000 [00:59<00:13, 73.34it/s]

4002
tensor([[  101,  4617,  2003,  ...,     0,     0,     0],
        [  101,  4617,  2003,  ...,     0,     0,     0],
        [  101,  4617,  2003,  ...,     0,     0,     0],
        ...,
        [  101,  7929, 30522,  ...,     0,     0,     0],
        [  101,  7929, 30522,  ...,     0,     0,     0],
        [  101,  7929, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 81%|████████  | 4029/5000 [00:59<00:16, 58.60it/s]

4018
tensor([[  101, 10166,  2026,  ...,     0,     0,     0],
        [  101, 10166,  2026,  ...,     0,     0,     0],
        [  101, 10166,  2026,  ...,     0,     0,     0],
        ...,
        [  101,  2129,  2079,  ...,     0,     0,     0],
        [  101,  2129,  2079,  ...,  7077,  2100,   102],
        [  101,  2129,  2079,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 81%|████████  | 4036/5000 [00:59<00:16, 59.08it/s]

tensor([[ 101, 1999, 1037,  ...,    0,    0,    0],
        [ 101, 1999, 1037,  ...,    0,    0,    0],
        [ 101, 1999, 1037,  ...,    0,    0,    0],
        ...,
        [ 101, 2074, 1037,  ...,    0,    0,    0],
        [ 101, 2074, 1037,  ...,    0,    0,    0],
        [ 101, 2074, 1037,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 81%|████████  | 4053/5000 [01:00<00:16, 59.18it/s]

4042
tensor([[ 101, 2029, 2544,  ...,    0,    0,    0],
        [ 101, 2029, 2544,  ...,    0,    0,    0],
        [ 101, 2029, 2544,  ...,    0,    0,    0],
        ...,
        [ 101, 2009, 2001,  ...,    0,    0,    0],
        [ 101, 2009, 2001,  ...,    0,    0,    0],
        [ 101, 2009, 2001,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 81%|████████▏ | 4069/5000 [01:00<00:14, 64.17it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4059
tensor([[ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 4067, 2017,  ...,    0,    0,    0],
        [ 101, 4067, 2017,  ...,    0,    0,    0],
        [ 101, 4067, 2017,  ...,  

 82%|████████▏ | 4086/5000 [01:00<00:13, 70.19it/s]

4070
tensor([[ 101, 5622, 2497,  ...,    0,    0,    0],
        [ 101, 5622, 2497,  ...,    0,    0,    0],
        [ 101, 5622, 2497,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0],
        [ 101, 1045, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 82%|████████▏ | 4094/5000 [01:00<00:13, 68.24it/s]

4086
tensor([[  101,  7632, 30522,  ...,     0,     0,     0],
        [  101,  7632, 30522,  ...,     0,     0,     0],
        [  101,  7632, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2054,  2003,  ...,     0,     0,     0],
        [  101,  2054,  2003,  ...,     0,     0,     0],
        [  101,  2054,  2003,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 82%|████████▏ | 4111/5000 [01:01<00:14, 62.65it/s]

tensor([[  101,  1045,  2572,  ...,     0,     0,     0],
        [  101,  1045,  2572,  ...,     0,     0,     0],
        [  101,  1045,  2572,  ...,     0,     0,     0],
        ...,
        [  101,  6853, 21307,  ...,     0,     0,     0],
        [  101,  6853, 21307,  ...,     0,     0,     0],
        [  101,  6853, 21307,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 83%|████████▎ | 4129/5000 [01:01<00:11, 73.29it/s]

tensor([[  101, 22834, 14399,  ...,  1011,  1006,   102],
        [  101, 22834, 14399,  ...,     0,     0,     0],
        [  101, 22834, 14399,  ...,     0,     0,     0],
        ...,
        [  101,  2003,  2008,  ...,  2926, 16755,   102],
        [  101,  2003,  2008,  ...,     0,     0,     0],
        [  101,  2003,  2008,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 83%|████████▎ | 4146/5000 [01:01<00:11, 77.35it/s]

4132
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ..., 5310, 1011,  102],
        ...,
        [ 101, 2024, 2017,  ...,    0,    0,    0],
        [ 101, 2024, 2017,  ...,    0,    0,    0],
        [ 101, 2024, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 83%|████████▎ | 4165/5000 [01:01<00:09, 84.32it/s]

4149
tensor([[  101, 19067, 11452,  ...,     0,     0,     0],
        [  101, 19067, 11452,  ...,     0,     0,     0],
        [  101, 19067, 11452,  ...,     0,     0,     0],
        ...,
        [  101, 11111,  2078,  ...,     0,     0,     0],
        [  101, 11111,  2078,  ...,     0,     0,     0],
        [  101, 11111,  2078,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 84%|████████▎ | 4175/5000 [01:01<00:10, 80.87it/s]

4166
tensor([[  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0],
        [  101,  1035,  1035,  ...,     0,     0,     0],
        ...,
        [  101, 10334,  2064,  ...,     0,     0,     0],
        [  101, 10334,  2064,  ...,  5371,   102,     0],
        [  101, 10334,  2064,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 84%|████████▍ | 4194/5000 [01:02<00:09, 84.01it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4183
tensor([[ 101, 2054, 2515,  ...,    0,    0,    0],
        [ 101, 2054, 2515,  ...,    0,    0,    0],
        [ 101, 2054, 2515,  ...,    0,    0,    0],
        ...,
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,  

 84%|████████▍ | 4213/5000 [01:02<00:09, 82.64it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4203
tensor([[ 101, 7592, 1045,  ...,    0,    0,    0],
        [ 101, 7592, 1045,  ..., 1998, 2071,  102],
        [ 101, 7592, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 2342, 1037,  ...,    0,    0,    0],
        [ 101, 2342, 1037,  ...,    0,    0,    0],
        [ 101, 2342, 1037,  ...,  

 85%|████████▍ | 4232/5000 [01:02<00:08, 85.78it/s]

4220
tensor([[  101, 18833,  5956,  ...,     0,     0,     0],
        [  101, 18833,  5956,  ...,  2026, 12191,   102],
        [  101, 18833,  5956,  ...,     0,     0,     0],
        ...,
        [  101,  2469, 30522,  ...,     0,     0,     0],
        [  101,  2469, 30522,  ...,     0,     0,     0],
        [  101,  2469, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 85%|████████▌ | 4251/5000 [01:02<00:08, 84.46it/s]

4238
tensor([[ 101, 1037, 3231,  ...,    0,    0,    0],
        [ 101, 1037, 3231,  ...,    0,    0,    0],
        [ 101, 1037, 3231,  ..., 1035, 1035,  102],
        ...,
        [ 101, 4931, 2026,  ...,    0,    0,    0],
        [ 101, 4931, 2026,  ...,    0,    0,    0],
        [ 101, 4931, 2026,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 85%|████████▌ | 4271/5000 [01:02<00:08, 87.91it/s]


tensor([[ 101, 7570, 2094,  ...,    0,    0,    0],
        [ 101, 7570, 2094,  ...,    0,    0,    0],
        [ 101, 7570, 2094,  ...,    0,    0,    0],
        ...,
        [ 101, 2054, 2515,  ...,    0,    0,    0],
        [ 101, 2054, 2515,  ...,    0,    0,    0],
        [ 101, 2054, 2515,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

 86%|████████▌ | 4289/5000 [01:03<00:08, 85.16it/s]

4273
tensor([[  101,  1057,  8569,  ..., 20544,  2170,   102],
        [  101,  1057,  8569,  ...,     0,     0,     0],
        [  101,  1057,  8569,  ...,     0,     0,     0],
        ...,
        [  101,  7592, 30522,  ...,     0,     0,     0],
        [  101,  7592, 30522,  ...,     0,     0,     0],
        [  101,  7592, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 86%|████████▌ | 4307/5000 [01:03<00:08, 85.15it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4291
tensor([[ 101, 3087, 2012,  ...,    0,    0,    0],
        [ 101, 3087, 2012,  ...,    0,    0,    0],
        [ 101, 3087, 2012,  ...,    0,    0,    0],
        ...,
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 86%|████████▋ | 4317/5000 [01:03<00:08, 80.88it/s]

4308
tensor([[ 101, 1045, 2113,  ...,    0,    0,    0],
        [ 101, 1045, 2113,  ...,    0,    0,    0],
        [ 101, 1045, 2113,  ...,    0,    0,    0],
        ...,
        [ 101, 7632, 1045,  ...,    0,    0,    0],
        [ 101, 7632, 1045,  ...,    0,    0,    0],
        [ 101, 7632, 1045,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 87%|████████▋ | 4336/5000 [01:03<00:07, 85.95it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4326
tensor([[ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        [ 101, 2129, 2079,  ...,    0,    0,    0],
        ...,
        [ 101, 7632, 2129,  ..., 1045, 5223,  102],
        [ 101, 7632, 2129,  ...,    0,    0,    0],
        [ 101, 7632, 2129,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 87%|████████▋ | 4354/5000 [01:03<00:08, 78.04it/s]

4343
tensor([[  101,  7592,  2003,  ...,  2172,  2062,   102],
        [  101,  7592,  2003,  ...,     0,     0,     0],
        [  101,  7592,  2003,  ..., 24844, 18349,   102],
        ...,
        [  101,  7632,  4364,  ...,     0,     0,     0],
        [  101,  7632,  4364,  ...,     0,     0,     0],
        [  101,  7632,  4364,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 87%|████████▋ | 4370/5000 [01:04<00:09, 65.05it/s]

4355
tensor([[ 101, 1053, 2054,  ...,    0,    0,    0],
        [ 101, 1053, 2054,  ...,    0,    0,    0],
        [ 101, 1053, 2054,  ...,    0,    0,    0],
        ...,
        [ 101, 2029, 2003,  ...,    0,    0,    0],
        [ 101, 2029, 2003,  ...,    0,    0,    0],
        [ 101, 2029, 2003,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 88%|████████▊ | 4384/5000 [01:04<00:10, 58.91it/s]

4371
tensor([[ 101, 4283, 1047,  ...,    0,    0,    0],
        [ 101, 4283, 1047,  ...,    0,    0,    0],
        [ 101, 4283, 1047,  ...,    0,    0,    0],
        ...,
        [ 101, 2339, 6187,  ...,    0,    0,    0],
        [ 101, 2339, 6187,  ...,    0,    0,    0],
        [ 101, 2339, 6187,  ..., 4965, 2005,  102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 88%|████████▊ | 4391/5000 [01:04<00:10, 58.25it/s]

tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4385
tensor([[  101,  2008,  2009,  ...,     0,     0,     0],
        [  101,  2008,  2009,  ...,     0,     0,     0],
        [  101,  2008,  2009,  ...,     0,     0,     0],
        ...,
        [  101, 25520,  2050,  ...,     0,     0,     0],
        [  101, 25520,  2050,  ...,     0,     0,     0],
    

 88%|████████▊ | 4406/5000 [01:04<00:09, 59.86it/s]

4397
tensor([[ 101, 2026, 2132,  ...,    0,    0,    0],
        [ 101, 2026, 2132,  ...,    0,    0,    0],
        [ 101, 2026, 2132,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 88%|████████▊ | 4425/5000 [01:05<00:08, 69.61it/s]

4414
tensor([[ 101, 2707, 2595,  ...,    0,    0,    0],
        [ 101, 2707, 2595,  ...,    0,    0,    0],
        [ 101, 2707, 2595,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 89%|████████▉ | 4443/5000 [01:05<00:07, 75.39it/s]

4431
tensor([[ 101, 2064, 1037,  ...,    0,    0,    0],
        [ 101, 2064, 1037,  ...,    0,    0,    0],
        [ 101, 2064, 1037,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 89%|████████▉ | 4462/5000 [01:05<00:06, 82.24it/s]

4450
tensor([[  101,  7592, 30522,  ...,     0,     0,     0],
        [  101,  7592, 30522,  ...,  1037,  5536,   102],
        [  101,  7592, 30522,  ...,     0,     0,     0],
        ...,
        [  101,  2053,  4140,  ...,     0,     0,     0],
        [  101,  2053,  4140,  ...,     0,     0,     0],
        [  101,  2053,  4140,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 90%|████████▉ | 4481/5000 [01:05<00:06, 84.04it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4467
tensor([[ 101, 2045, 2020,  ...,    0,    0,    0],
        [ 101, 2045, 2020,  ...,    0,    0,    0],
        [ 101, 2045, 2020,  ...,    0,    0,    0],
        ...,
        [ 101, 2317, 2527,  ...,    0,    0,    0],
        [ 101, 2317, 2527,  ...,    0,    0,    0],
        [ 101, 2317, 2527,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..

 90%|████████▉ | 4498/5000 [01:06<00:06, 72.86it/s]

4483
tensor([[ 101, 1045, 2179,  ...,    0,    0,    0],
        [ 101, 1045, 2179,  ...,    0,    0,    0],
        [ 101, 1045, 2179,  ...,    0,    0,    0],
        ...,
        [ 101, 2053, 2009,  ...,    0,    0,    0],
        [ 101, 2053, 2009,  ...,    0,    0,    0],
        [ 101, 2053, 2009,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 90%|█████████ | 4506/5000 [01:06<00:06, 73.68it/s]

4499
tensor([[ 101, 1045, 2074,  ..., 2011, 9212,  102],
        [ 101, 1045, 2074,  ...,    0,    0,    0],
        [ 101, 1045, 2074,  ...,    0,    0,    0],
        ...,
        [ 101, 4067, 2017,  ...,    0,    0,    0],
        [ 101, 4067, 2017,  ...,    0,    0,    0],
        [ 101, 4067, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 90%|█████████ | 4522/5000 [01:06<00:07, 67.06it/s]

4513
tensor([[  101,  2003,  1043,  ...,     0,     0,     0],
        [  101,  2003,  1043,  ...,     0,     0,     0],
        [  101,  2003,  1043,  ...,  2004,  5851,   102],
        ...,
        [  101,  7632, 30522,  ...,     0,     0,     0],
        [  101,  7632, 30522,  ...,  2026,  2132,   102],
        [  101,  7632, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 91%|█████████ | 4542/5000 [01:06<00:05, 78.13it/s]

4529
tensor([[ 101, 2672, 1045,  ...,    0,    0,    0],
        [ 101, 2672, 1045,  ...,    0,    0,    0],
        [ 101, 2672, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 6187,  ...,    0,    0,    0],
        [ 101, 1045, 6187,  ...,    0,    0,    0],
        [ 101, 1045, 6187,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 91%|█████████ | 4560/5000 [01:06<00:05, 80.46it/s]

4547
tensor([[ 101, 1045, 2097,  ...,    0,    0,    0],
        [ 101, 1045, 2097,  ...,    0,    0,    0],
        [ 101, 1045, 2097,  ...,    0,    0,    0],
        ...,
        [ 101, 2339, 2003,  ...,    0,    0,    0],
        [ 101, 2339, 2003,  ...,    0,    0,    0],
        [ 101, 2339, 2003,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 92%|█████████▏| 4577/5000 [01:07<00:05, 72.98it/s]

tensor([[  101,  1045,  2864,  ...,     0,     0,     0],
        [  101,  1045,  2864,  ...,     0,     0,     0],
        [  101,  1045,  2864,  ...,  1037, 16542,   102],
        ...,
        [  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0],
        [  101,  2003,  2045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 92%|█████████▏| 4585/5000 [01:07<00:05, 70.02it/s]


tensor([[ 101, 1045, 4299,  ...,    0,    0,    0],
        [ 101, 1045, 4299,  ...,    0,    0,    0],
        [ 101, 1045, 4299,  ...,    0,    0,    0],
        ...,
        [ 101, 2030, 2323,  ...,    0,    0,    0],
        [ 101, 2030, 2323,  ...,    0,    0,    0],
        [ 101, 2030, 2323,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 

 92%|█████████▏| 4602/5000 [01:07<00:05, 74.86it/s]

4592
tensor([[ 101, 1043, 6199,  ...,    0,    0,    0],
        [ 101, 1043, 6199,  ...,    0,    0,    0],
        [ 101, 1043, 6199,  ...,    0,    0,    0],
        ...,
        [ 101, 3087, 2182,  ...,    0,    0,    0],
        [ 101, 3087, 2182,  ...,    0,    0,    0],
        [ 101, 3087, 2182,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 92%|█████████▏| 4621/5000 [01:07<00:04, 82.62it/s]

4608
tensor([[ 101, 2064, 2061,  ...,    0,    0,    0],
        [ 101, 2064, 2061,  ..., 1999, 1035,  102],
        [ 101, 2064, 2061,  ...,    0,    0,    0],
        ...,
        [ 101, 1015, 1011,  ...,    0,    0,    0],
        [ 101, 1015, 1011,  ...,    0,    0,    0],
        [ 101, 1015, 1011,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 93%|█████████▎| 4639/5000 [01:07<00:04, 75.31it/s]

4625
tensor([[  101,  1045, 10468,  ...,  2140,  1035,   102],
        [  101,  1045, 10468,  ...,     0,     0,     0],
        [  101,  1045, 10468,  ...,     0,     0,     0],
        ...,
        [  101,  5292,  2053,  ...,     0,     0,     0],
        [  101,  5292,  2053,  ...,     0,     0,     0],
        [  101,  5292,  2053,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 93%|█████████▎| 4657/5000 [01:08<00:04, 79.91it/s]

4642
tensor([[ 101, 1045, 2074,  ...,    0,    0,    0],
        [ 101, 1045, 2074,  ...,    0,    0,    0],
        [ 101, 1045, 2074,  ...,    0,    0,    0],
        ...,
        [ 101, 6203, 2035,  ...,    0,    0,    0],
        [ 101, 6203, 2035,  ...,    0,    0,    0],
        [ 101, 6203, 2035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 93%|█████████▎| 4666/5000 [01:08<00:04, 80.84it/s]

4658
tensor([[  101,  2066,  1040,  ...,     0,     0,     0],
        [  101,  2066,  1040,  ...,     0,     0,     0],
        [  101,  2066,  1040,  ...,     0,     0,     0],
        ...,
        [  101, 10021,  3160,  ...,     0,     0,     0],
        [  101, 10021,  3160,  ...,     0,     0,     0],
        [  101, 10021,  3160,  ...,  2179,  2012,   102]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 94%|█████████▎| 4683/5000 [01:08<00:04, 70.80it/s]

4673
tensor([[ 101, 1045, 5458,  ...,    0,    0,    0],
        [ 101, 1045, 5458,  ...,    0,    0,    0],
        [ 101, 1045, 5458,  ...,    0,    0,    0],
        ...,
        [ 101, 2073, 2483,  ...,    0,    0,    0],
        [ 101, 2073, 2483,  ...,    0,    0,    0],
        [ 101, 2073, 2483,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 94%|█████████▍| 4700/5000 [01:08<00:04, 68.58it/s]

4686
tensor([[  101,  2478, 11603,  ...,     0,     0,     0],
        [  101,  2478, 11603,  ...,     0,     0,     0],
        [  101,  2478, 11603,  ...,     0,     0,     0],
        ...,
        [  101,  2748,  2288,  ...,     0,     0,     0],
        [  101,  2748,  2288,  ...,     0,     0,     0],
        [  101,  2748,  2288,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 94%|█████████▍| 4709/5000 [01:08<00:04, 68.37it/s]

4702
tensor([[  101,  4364,  2009,  ...,     0,     0,     0],
        [  101,  4364,  2009,  ...,  2884,  2061,   102],
        [  101,  4364,  2009,  ...,     0,     0,     0],
        ...,
        [  101,  2030, 26759,  ...,     0,     0,     0],
        [  101,  2030, 26759,  ...,     0,     0,     0],
        [  101,  2030, 26759,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 95%|█████████▍| 4726/5000 [01:09<00:04, 64.92it/s]

4716
tensor([[ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        [ 101, 2064, 3087,  ...,    0,    0,    0],
        ...,
        [ 101, 2079, 2017,  ...,    0,    0,    0],
        [ 101, 2079, 2017,  ..., 2094,  102,    0],
        [ 101, 2079, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 95%|█████████▍| 4741/5000 [01:09<00:04, 64.20it/s]

4732
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049,  ...,    0,    0,    0],
        ...,
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 95%|█████████▍| 4748/5000 [01:09<00:04, 54.78it/s]


label
4743
tensor([[ 101, 1998, 1045,  ...,    0,    0,    0],
        [ 101, 1998, 1045,  ...,    0,    0,    0],
        [ 101, 1998, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 2140, 1035,  ...,    0,    0,    0],
        [ 101, 2140, 1035,  ...,    0,    0,    0],
        [ 101, 2140, 1035,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0

 95%|█████████▌| 4764/5000 [01:09<00:03, 63.00it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4756
tensor([[  101,  2054,  1055,  ...,     0,     0,     0],
        [  101,  20

 96%|█████████▌| 4779/5000 [01:09<00:03, 63.48it/s]

tensor([[ 101, 2106, 1045,  ...,    0,    0,    0],
        [ 101, 2106, 1045,  ...,    0,    0,    0],
        [ 101, 2106, 1045,  ...,    0,    0,    0],
        ...,
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0],
        [ 101, 1045, 2342,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0

 96%|█████████▌| 4795/5000 [01:10<00:02, 68.88it/s]

4783
tensor([[ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ...,    0,    0,    0],
        [ 101, 1035, 1035,  ..., 2592, 2055,  102],
        ...,
        [ 101, 2017, 2064,  ...,    0,    0,    0],
        [ 101, 2017, 2064,  ...,    0,    0,    0],
        [ 101, 2017, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 96%|█████████▌| 4811/5000 [01:10<00:02, 70.50it/s]

4799
tensor([[ 101, 7632, 3124,  ...,    0,    0,    0],
        [ 101, 7632, 3124,  ...,    0,    0,    0],
        [ 101, 7632, 3124,  ...,    0,    0,    0],
        ...,
        [ 101, 8840, 2140,  ...,    0,    0,    0],
        [ 101, 8840, 2140,  ...,  102,    0,    0],
        [ 101, 8840, 2140,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 97%|█████████▋| 4828/5000 [01:10<00:02, 75.26it/s]

4816
tensor([[ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        [ 101, 2515, 3087,  ...,    0,    0,    0],
        ...,
        [ 101, 2071, 2017,  ...,    0,    0,    0],
        [ 101, 2071, 2017,  ...,    0,    0,    0],
        [ 101, 2071, 2017,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 97%|█████████▋| 4845/5000 [01:10<00:02, 75.22it/s]

tensor([[0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4835
tensor([[  101,  5292,  2000,  ...,     0,     0,     0],
        [  101,  52

 97%|█████████▋| 4861/5000 [01:11<00:01, 70.33it/s]

4847
tensor([[ 101, 1996, 2117,  ...,    0,    0,    0],
        [ 101, 1996, 2117,  ...,    0,    0,    0],
        [ 101, 1996, 2117,  ...,    0,    0,    0],
        ...,
        [ 101, 2065, 2002,  ...,    0,    0,    0],
        [ 101, 2065, 2002,  ...,    0,    0,    0],
        [ 101, 2065, 2002,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 97%|█████████▋| 4869/5000 [01:11<00:01, 67.40it/s]

tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4863
tensor([[  101,  2061,  2017,  ...,     0,     0,     0],
        [  101,  2061,  2017,  ...,     0,     0,     0],
        [  101,  2061,  2017,  ...,  4025,  2000,   102],
        ...,
        [  101,  7592, 30522,  ...,     0,     0,     0],
        [  101,  7592, 30522,  ...,  2001,  5327,   102],
        [  101,  7592, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  

 98%|█████████▊| 4885/5000 [01:11<00:01, 68.47it/s]

4874
tensor([[ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        [ 101, 1045, 2031,  ...,    0,    0,    0],
        ...,
        [ 101, 4326, 1037,  ...,    0,    0,    0],
        [ 101, 4326, 1037,  ..., 2127, 7170,  102],
        [ 101, 4326, 1037,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 98%|█████████▊| 4902/5000 [01:11<00:01, 74.73it/s]

tensor([[  101,  2057,  2224,  ...,     0,     0,     0],
        [  101,  2057,  2224,  ...,     0,     0,     0],
        [  101,  2057,  2224,  ...,     0,     0,     0],
        ...,
        [  101,  4931, 30522,  ..., 13675,  2239,   102],
        [  101,  4931, 30522,  ...,     0,     0,     0],
        [  101,  4931, 30522,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
     

 98%|█████████▊| 4922/5000 [01:11<00:01, 77.79it/s]

4910
tensor([[ 101, 2065, 2008,  ...,    0,    0,    0],
        [ 101, 2065, 2008,  ...,    0,    0,    0],
        [ 101, 2065, 2008,  ...,    0,    0,    0],
        ...,
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0],
        [ 101, 2129, 2064,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 99%|█████████▉| 4941/5000 [01:12<00:00, 75.82it/s]

4927
tensor([[ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        [ 101, 4931, 4364,  ...,    0,    0,    0],
        ...,
        [ 101, 1996, 2524,  ...,    0,    0,    0],
        [ 101, 1996, 2524,  ...,    0,    0,    0],
        [ 101, 1996, 2524,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

 99%|█████████▉| 4949/5000 [01:12<00:00, 65.01it/s]

4943
tensor([[  101,  1038,  8737,  ...,     0,     0,     0],
        [  101,  1038,  8737,  ...,     0,     0,     0],
        [  101,  1038,  8737,  ...,     0,     0,     0],
        ...,
        [  101,  2035, 11631,  ...,     0,     0,     0],
        [  101,  2035, 11631,  ...,     0,     0,     0],
        [  101,  2035, 11631,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 99%|█████████▉| 4956/5000 [01:12<00:00, 57.36it/s]

4953
tensor([[  101, 11752,  1064,  ...,     0,     0,     0],
        [  101, 11752,  1064,  ...,  2039,  1999,   102],
        [  101, 11752,  1064,  ...,     0,     0,     0],
        ...,
        [  101,  2002,  1045,  ...,     0,     0,     0],
        [  101,  2002,  1045,  ...,     0,     0,     0],
        [  101,  2002,  1045,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 1, 1, 1],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 1, 1, 1],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


 99%|█████████▉| 4964/5000 [01:12<00:00, 58.27it/s]

4963
tensor([[ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        [ 101, 2054, 2003,  ...,    0,    0,    0],
        ...,
        [ 101, 2123, 2102,  ...,    0,    0,    0],
        [ 101, 2123, 2102,  ...,    0,    0,    0],
        [ 101, 2123, 2102,  ...,    0,    0,    0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 

100%|█████████▉| 4981/5000 [01:12<00:00, 57.00it/s]

4972
tensor([[  101,  2074,  1037,  ...,     0,     0,     0],
        [  101,  2074,  1037,  ...,     0,     0,     0],
        [  101,  2074,  1037,  ...,     0,     0,     0],
        ...,
        [  101, 20648,  1037,  ...,     0,     0,     0],
        [  101, 20648,  1037,  ...,     0,     0,     0],
        [  101, 20648,  1037,  ...,     0,     0,     0]])
anno_sent
tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,


100%|█████████▉| 4996/5000 [01:13<00:00, 62.31it/s]

tensor([[0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        ...,
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0],
        [0, 0, 0,  ..., 0, 0, 0]])
segment_ids
tensor([[1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        ...,
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0],
        [1, 1, 1,  ..., 0, 0, 0]])
attention_mask
tensor([1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0.,
        0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0.,
        0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0.,
        0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.,
        0., 0., 0., 0., 0., 0., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
        1., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
label
4984
tensor([[ 101, 1045, 1049,  ...,    0,    0,    0],
        [ 101, 1045, 1049

100%|██████████| 5000/5000 [01:13<00:00, 67.93it/s]
