In [3]:
import os
import glob
import codecs
import csv
import pandas as pd
import logging
import math
import numpy as np
from tqdm import tqdm, tqdm_notebook, trange
import torch
from torch.utils.data import (DataLoader, RandomSampler, SequentialSampler, TensorDataset)
from tensorboardX import SummaryWriter
from transformers import (BertConfig, BertTokenizer, BertForSequenceClassification, AdamW, get_linear_schedule_with_warmup)

In [24]:
train_articles = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/train"
dev_articles = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/dev"
train_SI_labels = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/train_SI_labels"
dev_SI_labels = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/dev_SI_labels"

device = torch.device("cuda")
n_gpu = torch.cuda.device_count()
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger("LOG")
MODEL_CLASSES = {"bert": (BertConfig, BertForSequenceClassification, BertTokenizer)}
args = {"data_dir": "datasets/upsampling/",
        "model_type": "bert",
        "model_name": "google-bert/bert-base-multilingual-uncased",
        "output_dir": "datasets/upsampling/output_model_SI",
        "max_seq_length": 128,
        "train_batch_size": 8,
        "eval_batch_size": 8,
        "num_train_epochs": 1,
        "weight_decay": 0,
        "learning_rate": 4e-5,
        "adam_epsilon": 1e-8,
        "warmup_ratio": 0.06,
        "warmup_steps": 0,
        "max_grad_norm": 1.0,
        "gradient_accumulation_steps": 1,
        "logging_steps": 50,
        "save_steps": 2000,
        "overwrite_output_dir": False}

In [25]:
def merge_overlapping(indices_list):
  """
  Merges overlapping indices and sorts indices from list of tuples
  """
  # If no propaganda, return empty list
  if indices_list == []:
    return []

  # Sort the list
  indices_list = sorted(indices_list)
  i = 0

  # Going through tuples from the beginning, see if it overlaps with the nex one 
  # and merge it if so
  while True:
    if i == len(indices_list)- 1: ###!!!! - 1
      break
    
    # If the next one is within the range of current, just delete next one. If
    # overlapping, then merge the range
    elif indices_list[i][1] >= indices_list[i + 1][0]:
      if indices_list[i][1] >= indices_list[i + 1][1]:
        pass
      else:
        indices_list[i] = (indices_list[i][0], indices_list[i+1][1])
      indices_list.pop(i+1)

    # Go to next element if not overlapping
    else:
      i += 1

  return indices_list


In [26]:
def article_to_sequences(article_id, article, tokenizer):
  """
  Divides article into sequences, dividing first by sentences then to powersets
  of the sentences
  """
  # Split the lines by sentences
  curr = 0
  lines = article.split("\n")
  sequences = []
  seq_starts = []
  seq_ends = []

  # For each lines, do:
  for line in lines:
    # If an empty line, just continue
    if line == "":
      curr += 1
      continue

    # Tokenize the line
    tokenized = tokenizer.tokenize(line)

    # For each token, do:
    seq_start = 0
    for ind, token in enumerate(tokenized):
      # Get the token without ## sign
      mod_start_token = token.replace("##", "")

      # Find the start of the sequence in line
      seq_start = line.lower().find(mod_start_token, seq_start)

      # Update the end of the sequence
      seq_end = seq_start

      # For each following tokens in the line, do
      for iter in range(1, len(tokenized) + 1 - ind):
        # Also modify this token
        mod_end_token = tokenized[ind + iter - 1].replace("##", "")
        # Find the end of the token
        seq_end = line.lower().find(mod_end_token, seq_end) + len(mod_end_token)

        sequences.append(tokenizer.convert_tokens_to_string(tokenized[ind: ind + iter]))
        seq_starts.append(curr + seq_start)
        seq_ends.append(curr + seq_end)

      # Update the start of the sequence
      seq_start += len(mod_start_token)

    # Update the current whereabouts
    curr += len(line) + 1

  dataframe = pd.DataFrame(None, range(len(sequences)), ["id", "seq_starts", "seq_ends", "label", "text"])
  dataframe["id"] = [article_id] * len(sequences)
  dataframe["seq_starts"] = seq_starts
  dataframe["seq_ends"] = seq_ends
  dataframe["label"] = [0] * len(sequences)
  dataframe["text"] = sequences
  return dataframe


In [27]:
def article_labels_to_sequences(article, indices_list):
  """
  Divides article into sequences, where each are tagged to be propaganda or not
  """
  # Start at 0 indices, and split the article into lines
  curr = 0
  lines = article.split("\n")
  sequences = {}

  # For each lines, do:
  for line in lines:
    # If an empty line, just continue after adding \n character
    if line == "":
      curr += 1
      continue

    # If nothing in indices_list or current line is not part of propaganda, 
    # just mark it to be none 
    elif indices_list == [] or curr + len(line) <= indices_list[0][0]:
      sequences[line] = 0

    # If current line is part of propaganda, do:
    else:
      # If the propaganda is contained within the line, add it accordingly
      # and pop that indices range
      if curr + len(line) >= indices_list[0][1]:
        sequences[line[:indices_list[0][0] - curr]] = 0
        sequences[line[indices_list[0][0] - curr:indices_list[0][1] - curr]] = 1
        sequences[line[indices_list[0][1] - curr:]] = 0
        indices_list.pop(0)
      # If the propaganda goes over to the next line, add accordingly and 
      # modify that indices range
      else:
        sequences[line[:indices_list[0][0] - curr]] = 0
        sequences[line[indices_list[0][0] - curr:]] = 1
        #indices_list[0][0] = curr + len(line) + 2   #!!!!!!!!!!!!!!!!
        indices_list[0] = (curr + len(line) + 2, indices_list[0][1])  #!!!!
        indices_list[0] = tuple(indices_list[0])                        #!!!
    # Add the current line length plus \n character
    curr += len(line) + 1

  dataframe = pd.DataFrame(None, range(len(sequences)), ["label", "text"])
  dataframe["label"] = sequences.values()  #!!!!!!!!!!!!
  dataframe["text"] = sequences.keys()
  return dataframe

In [28]:
def articles_to_dataframe(article_folder, label_folder):
  """
  Preprocesses the articles into dataframes with sequences with binary tags
  """
  # First sort the filenames and make sure we have label file for each articles
  article_filenames = sorted(glob.glob(os.path.join(article_folder, "*.txt")))
  label_filenames = sorted(glob.glob(os.path.join(label_folder, "*.labels.tsv"))) #!!! format
  assert len(article_filenames) == len(label_filenames)

  # Initialize sequences
  sequences = []

  # For each article, do:
  for i in range(len(article_filenames)):
    # Get the id name
    article_id = os.path.basename(article_filenames[i]).split(".")[0][7:]

    # Read in the article
    with codecs.open(article_filenames[i], "r", encoding="utf8") as f:
      article = f.read()

    # Read in the label file and store indices for SI task

    with open(label_filenames[i], "r") as f:
      reader = csv.reader(f, delimiter="\t")
      indices_list = []
      for row in reader:
        indices_list.append([int(row[1]), int(row[2])])

      # Merge the indices if overlapping
      indices_list = merge_overlapping(indices_list)

    # Add to the sequences
    sequences.append(article_labels_to_sequences(article, indices_list))

  # Concatenate all dataframes
  dataframe = pd.concat(sequences, ignore_index=True)

  return dataframe

In [29]:
def convert_dataframe_to_features(dataframe, max_seq_length, tokenizer):
  """
  Converts dataframe into features dataframe, where each feature will
  take form of [CLS] + A + [SEP]
  """
  # Create features
  features = pd.DataFrame(None, range(dataframe.shape[0]), 
                              ["input_ids", "input_mask", "segment_ids", "label_ids"])

  # For each sequence, do:
  for i in range(len(dataframe)):
    # Set first and second part of the sequences
    tokens = tokenizer.tokenize(dataframe["text"][i])

    # If length of the sequence is greater than max sequence length, truncate it
    if len(tokens) > max_seq_length - 2:
        tokens = tokens[:(max_seq_length - 2)]

    # Concatenate the tokens
    tokens = [tokenizer.cls_token] + tokens + [tokenizer.sep_token]

    # Compute the ids
    segment_ids = [0] * len(tokens)
    input_ids = tokenizer.convert_tokens_to_ids(tokens)
    input_mask = [1] * len(input_ids)

    # Zero-pad up to the sequence length.
    padding_length = max_seq_length - len(input_ids)
    pad_token = tokenizer.convert_tokens_to_ids([tokenizer.pad_token])[0]
    input_ids = input_ids + [pad_token] * padding_length
    input_mask = input_mask + [0] * padding_length
    segment_ids = segment_ids + [0] * padding_length
    label_id = dataframe["label"][i]

    # Assert to make sure we have same length
    assert len(input_ids) == max_seq_length
    assert len(input_mask) == max_seq_length
    assert len(segment_ids) == max_seq_length

    # Put the data into features dataframe
    features["input_ids"][i] = input_ids
    features["input_mask"][i] = input_mask
    features["segment_ids"][i] = segment_ids
    features["label_ids"][i] = label_id   ###!!!

  return features

In [30]:
def generate_training_dataset_from_articles(articles_folders, labels_folders, tokenizer):
  """
  Generates dataset to go into BERT from articles and labels
  """
  # If generating dataset for evaluation, do:
  logger.info("Generating training dataset...")
    
  # For each articles and labels folder set, turn them into dataframes
  dataframe_list = []
  for i in range(len(articles_folders)):
    logger.info("Generating dataframe for folder %s", articles_folders[i])
    dataframe_list.append(articles_to_dataframe(articles_folders[i], labels_folders[i]))

  # Concatenate the dataframes to make a total dataframe
  dataframe = pd.concat(dataframe_list, ignore_index=True)

  print(dataframe)
  print(dataframe.shape)

  # Process into features dataframe
  logger.info("Creating features from dataframe")
  features = convert_dataframe_to_features(dataframe, args['max_seq_length'], tokenizer)
      
  # Creating TensorDataset from features
  logger.info("Creating TensorDataset from features dataframe")
  all_input_ids = torch.tensor(features["input_ids"], dtype=torch.long)
  all_input_mask = torch.tensor(features["input_mask"], dtype=torch.long)
  all_segment_ids = torch.tensor(features["segment_ids"], dtype=torch.long)
  all_label_ids = torch.tensor(features["label_ids"], dtype=torch.long)

  dataset = TensorDataset(all_input_ids, all_input_mask, all_segment_ids, all_label_ids)
  return dataset

In [31]:
def train(train_dataset, model, tokenizer):
  """
  Trains the model with training dataset
  """
  # Initialize various necessary objects
  tb_writer = SummaryWriter()
  train_sampler = RandomSampler(train_dataset)
  train_dataloader = DataLoader(train_dataset, sampler=train_sampler, batch_size=args['train_batch_size'])
    
  # Compute the total time
  t_total = len(train_dataloader) // args['gradient_accumulation_steps'] * args['num_train_epochs']
  
  # Set the grouped parameters for optimizer
  no_decay = ['bias', 'LayerNorm.weight']
  optimizer_grouped_parameters = [
    {'params': [p for n, p in model.named_parameters() if not any(nd in n for nd in no_decay)], 'weight_decay': args['weight_decay']},
    {'params': [p for n, p in model.named_parameters() if any(nd in n for nd in no_decay)], 'weight_decay': 0.0}
    ]
  
  # Compute warmup steps
  warmup_steps = math.ceil(t_total * args['warmup_ratio'])
  args['warmup_steps'] = warmup_steps if args['warmup_steps'] == 0 else args['warmup_steps']
  
  # Initialize optimizer as Adam with constant weight decay and a linear scheduler with warmup
  optimizer = AdamW(optimizer_grouped_parameters, lr=args['learning_rate'], eps=args['adam_epsilon'])
  scheduler = get_linear_schedule_with_warmup(optimizer, num_warmup_steps=args['warmup_steps'], num_training_steps=t_total)

  # Initialize variables for training
  global_step = 0
  tr_loss, logging_loss = 0.0, 0.0
  model.zero_grad()
  train_iterator = trange(int(args['num_train_epochs']), desc="Epoch")
  
  # Start training!
  for _ in train_iterator:
    epoch_iterator = tqdm_notebook(train_dataloader, desc="Iteration")
    for step, batch in enumerate(epoch_iterator):
      model.train()
      batch = tuple(t.to(device) for t in batch)
      inputs = {'input_ids':      batch[0],
                'attention_mask': batch[1],
                'token_type_ids': batch[2], 
                'labels':         batch[3]}
      outputs = model(**inputs)
      loss = outputs[0]

      if args['gradient_accumulation_steps'] > 1:
        loss = loss / args['gradient_accumulation_steps']
          
      loss.backward()
      torch.nn.utils.clip_grad_norm_(model.parameters(), args['max_grad_norm'])

      tr_loss += loss.item()
      if (step + 1) % args['gradient_accumulation_steps'] == 0:
        optimizer.step()
        scheduler.step() 
        model.zero_grad()
        global_step += 1

        if args['logging_steps'] > 0 and global_step % args['logging_steps'] == 0:
          tb_writer.add_scalar('lr', scheduler.get_lr()[0], global_step)
          tb_writer.add_scalar('loss', (tr_loss - logging_loss)/args['logging_steps'], global_step)
          logging_loss = tr_loss

        if args['save_steps'] > 0 and global_step % args['save_steps'] == 0:
          output_dir = os.path.join(args['output_dir'], 'checkpoint-{}'.format(global_step))
          if not os.path.exists(output_dir):
            os.makedirs(output_dir)
          model_to_save = model.module if hasattr(model, 'module') else model
          model_to_save.save_pretrained(output_dir)
          logger.info("Saving model checkpoint to %s", output_dir)

  return global_step, tr_loss / global_step

In [32]:
config_class, model_class, tokenizer_class = MODEL_CLASSES[args["model_type"]]
config = config_class.from_pretrained(args["model_name"], num_labels=2, finetuning_task="binary")
tokenizer = tokenizer_class.from_pretrained(args["model_name"])
model = model_class(config)
model.to(device)

train_dataset = generate_training_dataset_from_articles([train_articles], [train_SI_labels], tokenizer)
global_step, tr_loss = train(train_dataset, model, tokenizer)
logger.info(" global_step = %s, average loss = %s", global_step, tr_loss)
logger.info("Saving model checkpoint to %s", args['output_dir'])
model_to_save = model.module if hasattr(model, 'module') else model
model_to_save.save_pretrained(args['output_dir'])
tokenizer.save_pretrained(args['output_dir'])
torch.save(args, os.path.join(args['output_dir'], 'training_args.bin'))

INFO:LOG:Generating training dataset...
INFO:LOG:Generating dataframe for folder C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/train
INFO:LOG:Creating features from dataframe


      label                                               text
0         0  буковинця засудили до довічного ув'язнення за ...
1         1  чоловік побив її, потім наніс ножові поранення...
2         0                                                 о.
3         0                                     друзі, у мене 
4         1                                              шален
...     ...                                                ...
9902      1                   швидкість вітру понад 130 км/год
9903      0  . тим часом крим накрив найпотужніший шторм, я...
9904      0                                                   
9905      1                повальна мобілізація теж не допомож
9906      0  е. навіть якщо призвемо зараз 4 млн українців ...

[9907 rows x 2 columns]
(9907, 2)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  epoch_iterator = tqdm_notebook(train_dataloader, desc="Iteration")


Iteration:   0%|          | 0/1239 [00:00<?, ?it/s]

Epoch: 100%|██████████| 1/1 [12:52<00:00, 772.62s/it]
INFO:LOG: global_step = 1239, average loss = 0.301520622600433
INFO:LOG:Saving model checkpoint to datasets/upsampling/output_model_SI


In [33]:
def generate_SI_eval_dataset_from_article(article_file, tokenizer):
  """
  Generates SI dataset to go into BERT from articles and labels
  """
  # If generating dataset for evaluation, do:
  logger.info("Generating evaluation dataset...")

  # Get the id name
  article_id = os.path.basename(article_file).split(".")[0][7:]

  # Read in the article
  with codecs.open(article_file, "r", encoding="utf8") as f:
    article = f.read()

  # For evaluating, do:
  dataframe = article_to_sequences(article_id, article, tokenizer)

  # Only include sequences that has alphanumeric characters in them
  bool_indices = [False] * len(dataframe)
  for i in range(len(dataframe)):
    if any(c.isalnum() for c in dataframe["text"][i]):
      bool_indices[i] = True
  dataframe = dataframe.loc[bool_indices].reset_index(drop=True)

  print(dataframe)
  print(dataframe.shape)

  # Process into features dataframe
  logger.info("Creating features from dataframe")
  features = convert_dataframe_to_features(dataframe, args['max_seq_length'], tokenizer)
      
  # Creating TensorDataset from features
  logger.info("Creating TensorDataset from features dataframe")
  all_input_ids = torch.tensor(features["input_ids"], dtype=torch.long)
  all_input_mask = torch.tensor(features["input_mask"], dtype=torch.long)
  all_segment_ids = torch.tensor(features["segment_ids"], dtype=torch.long)
  all_label_ids = torch.tensor(features["label_ids"], dtype=torch.long)

  dataset = TensorDataset(all_input_ids, all_input_mask, all_segment_ids, all_label_ids)
  return dataset, dataframe


In [34]:
def classify_per_article(eval_dataframe, eval_dataset, model, tokenizer):
  """
  Classifies a single article dataset and returns article id with indices list
  """
  # Load the eval data and initialize sampler
  eval_sampler = SequentialSampler(eval_dataset)
  eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args['eval_batch_size'])

  # Start Classification
  #preds = None
  preds = np.empty((0, 2)) #!!!!

  # For each batch, evaluate
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):
    model.eval()
    batch = tuple(t.to(device) for t in batch)

    with torch.no_grad():
      inputs = {'input_ids':      batch[0],
                'attention_mask': batch[1],
                'token_type_ids': batch[2],
                'labels':         batch[3]}
      outputs = model(**inputs)
      logits = outputs[1]

      # Get predictions
    # if preds is None:
    #   
    #   preds = logits.detach().cpu().numpy()
    # else:

      preds = np.append(preds, logits.detach().cpu().numpy(), axis=0)

  # Get the most probable prediction
  preds = np.argmax(preds, axis=1)
  eval_dataframe["label"] = preds
  print(eval_dataframe)
  # Get the propaganda indices and return them
  eval_dataframe = eval_dataframe.loc[eval_dataframe["label"] ==1].reset_index(drop=True)
  indices_list = []
  for i in range(len(eval_dataframe)):
    indices_list.append(tuple([eval_dataframe["seq_starts"][i], eval_dataframe["seq_ends"][i]]))
  indices_list = merge_overlapping(indices_list)

  return eval_dataframe["id"][0], indices_list

In [35]:
# As in Tutorial
articles_folder = dev_articles
article_filenames = sorted(glob.glob(os.path.join(articles_folder, "*.txt"))[128:])   # [59:100][100:140]128

labels_dir = 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling'
if not os.path.exists(labels_dir):
  os.makedirs(labels_dir)

for i in range(len(article_filenames)):
  eval_dataset, eval_dataframe = generate_SI_eval_dataset_from_article(article_filenames[i], tokenizer)
  article_id, indices_list = classify_per_article(eval_dataframe, eval_dataset, model, tokenizer)
  
  f = open(labels_dir + '/article{}.labels.tsv'.format(article_id), 'w')
  writer = csv.writer(f, delimiter='\t')
  for indices in indices_list:
    writer.writerow([article_id, indices[0], indices[1]])
  f.close()
  


INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


             id  seq_starts  seq_ends  label          text
0       1636698           0         2      0           " о
1       1636698           0         3      0          " ор
2       1636698           0         6      0       " орбан
3       1636698           0         7      0     " орбан "
4       1636698           0        10      0  " орбан " із
...         ...         ...       ...    ...           ...
224040  1636698        1895      1897      0            ви
224041  1636698        1895      1901      0        вибори
224042  1636698        1895      1902      0      вибори .
224043  1636698        1897      1901      0        ##бори
224044  1636698        1897      1902      0      ##бори .

[224045 rows x 5 columns]
(224045, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/28006 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


             id  seq_starts  seq_ends  label          text
0       1636698           0         2      1           " о
1       1636698           0         3      1          " ор
2       1636698           0         6      1       " орбан
3       1636698           0         7      1     " орбан "
4       1636698           0        10      1  " орбан " із
...         ...         ...       ...    ...           ...
224040  1636698        1895      1897      0            ви
224041  1636698        1895      1901      1        вибори
224042  1636698        1895      1902      0      вибори .
224043  1636698        1897      1901      1        ##бори
224044  1636698        1897      1902      0      ##бори .

[224045 rows x 5 columns]
           id  seq_starts  seq_ends  label            text
0     1637879           0         2      0              от
1     1637879           0         4      0            отру
2     1637879           0         3      0        отруинии
3     1637879           0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0     1637879           0         2      1              от
1     1637879           0         4      1            отру
2     1637879           0         3      1        отруинии
3     1637879           0        12      1    отруинии газ
4     1637879           0        14      1  отруинии газ с
...       ...         ...       ...    ...             ...
3560  1637879         245       246      1             ##п
3561  1637879         245       248      1           ##пла
3562  1637879         245       249      0         ##пла .
3563  1637879         246       248      1            ##ла
3564  1637879         246       249      0          ##ла .

[3565 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     20120           0         5      0                 знову
1     20120           0         8      0              знову по
2     20120           0        11      0           знову пошир
3     20120    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/260 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     20120           0         5      1                 знову
1     20120           0         8      1              знову по
2     20120           0        11      1           знову пошир
3     20120           0        17      1     знову поширюються
4     20120           0        20      1  знову поширюються чу
...     ...         ...       ...    ...                   ...
2072  20120         217       220      1                 ##нів
2073  20120         217       225      1            ##нівність
2074  20120         217       226      0          ##нівність .
2075  20120         220       225      1               ##ність
2076  20120         220       226      0             ##ність .

[2077 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     20220           1         6      0                 знову
1     20220           1         9      0              знову по
2     20220           1       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     20220           1         6      1                 знову
1     20220           1         9      1              знову по
2     20220           1        12      1           знову пошир
3     20220           1        18      1     знову поширюються
4     20220           1        21      1  знову поширюються чу
...     ...         ...       ...    ...                   ...
1644  20220         188       191      1                 ##нім
1645  20220         188       197      1           ##німаються
1646  20220         188       198      0         ##німаються .
1647  20220         191       197      1              ##аються
1648  20220         191       198      0            ##аються .

[1649 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20290           1         3      0                чи
1     20290           1         9      0          чи можна
2     20290           1        12      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20290           1         3      1                чи
1     20290           1         9      1          чи можна
2     20290           1        12      1       чи можна вв
3     20290           1        13      1      чи можна вва
4     20290           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
1703  20290          -1         2      0               діи
1704  20290          -1         9      1    діи віиськових
1705  20290          -1       204      0  діи віиськових .
1706  20290          -1         9      0        віиськових
1707  20290          -1       204      0      віиськових .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20330           1         2      0                 ч
1     20330           1         5      0              чому
2     20330           1         8      0           чому ке
3     20330           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/252 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20330           1         2      1                 ч
1     20330           1         5      1              чому
2     20330           1         8      1           чому ке
3     20330           1        11      1        чому керів
4     20330           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
2009  20330         201       203      1              ##мі
2010  20330         201       205      1            ##мією
2011  20330         201       206      0          ##мією .
2012  20330         203       205      1              ##єю
2013  20330         203       206      0            ##єю .

[2014 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20360           1         3      0                чи
1     20360           1         9      0          чи можна
2     20360           1        12      0       чи можна вв
3     20360           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20360           1         3      1                чи
1     20360           1         9      1          чи можна
2     20360           1        12      1       чи можна вв
3     20360           1        13      1      чи можна вва
4     20360           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2137  20360         229       232      1             ##ові
2138  20360         229       241      1    ##ові завдання
2139  20360         229       242      0  ##ові завдання .
2140  20360         233       241      0          завдання
2141  20360         233       242      0        завдання .

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20420           1         3      0                чи
1     20420           1         9      0          чи можна
2     20420           1        12      0       чи можна вв
3     20420           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/523 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20420           1         3      1                чи
1     20420           1         9      1          чи можна
2     20420           1        12      1       чи можна вв
3     20420           1        13      1      чи можна вва
4     20420           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
4178  20420         257       260      1             ##ові
4179  20420         257       269      1    ##ові завдання
4180  20420         257       270      0  ##ові завдання .
4181  20420         261       269      0          завдання
4182  20420         261       270      0        завдання .

[4183 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20460           1         2      0                 ч
1     20460           1         5      0              чому
2     20460           1         8      0           чому ке
3     20460           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20460           1         2      1                 ч
1     20460           1         5      1              чому
2     20460           1         8      1           чому ке
3     20460           1        11      1        чому керів
4     20460           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
2408  20460         215       217      1              ##тв
2409  20460         215       218      1             ##тві
2410  20460         215       219      0           ##тві .
2411  20460         217       218      1               ##і
2412  20460         217       219      0             ##і .

[2413 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     20470           1         3      0               чи
1     20470           1         9      0         чи можна
2     20470           1        11      0       чи можна в
3     20470           1        14  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/293 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     20470           1         3      1               чи
1     20470           1         9      1         чи можна
2     20470           1        11      1       чи можна в
3     20470           1        14      1    чи можна віри
4     20470           1        16      1  чи можна вірити
...     ...         ...       ...    ...              ...
2338  20470         225       227      1             ##мі
2339  20470         225       229      1           ##мією
2340  20470         225       230      0         ##мією .
2341  20470         227       229      1             ##єю
2342  20470         227       230      0           ##єю .

[2343 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20500           1         2      0                 ч
1     20500           1         5      0              чому
2     20500           1         8      0           чому ке
3     20500           1        11      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20500           1         2      1                 ч
1     20500           1         5      1              чому
2     20500           1         8      1           чому ке
3     20500           1        11      1        чому керів
4     20500           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
2138  20500         224       226      1              ##тв
2139  20500         224       227      1             ##тві
2140  20500         224       228      0           ##тві .
2141  20500         226       227      1               ##і
2142  20500         226       228      0             ##і .

[2143 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     20520           1         2      0                 ч
1     20520           1         5      0              чому
2     20520           1         8      0           чому ке
3     20520           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     20520           1         2      1                 ч
1     20520           1         5      1              чому
2     20520           1         8      1           чому ке
3     20520           1        11      1        чому керів
4     20520           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
2549  20520         228       230      1              ##тв
2550  20520         228       231      1             ##тві
2551  20520         228       232      0           ##тві .
2552  20520         230       231      1               ##і
2553  20520         230       232      0             ##і .

[2554 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     20600           1         2      0                ч
1     20600           1         5      0             чому
2     20600           1         9      0         чому укр
3     20600           1        10  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/237 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     20600           1         2      1                ч
1     20600           1         5      1             чому
2     20600           1         9      1         чому укр
3     20600           1        10      1        чому укра
4     20600           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1884  20600         193       196      1            ##лік
1885  20600         193       199      1         ##ліктах
1886  20600         193       200      0       ##ліктах .
1887  20600         196       199      1            ##тах
1888  20600         196       200      0          ##тах .

[1889 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     20650           1         3      0                  чи
1     20650           1         9      0            чи можна
2     20650           1        11      0          чи можна в
3     20650           1        14  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     20650           1         3      1                  чи
1     20650           1         9      1            чи можна
2     20650           1        11      1          чи можна в
3     20650           1        14      1       чи можна віри
4     20650           1        16      1     чи можна вірити
...     ...         ...       ...    ...                 ...
2136  20650         207       211      1              ##ного
2137  20650         207       221      1    ##ного населення
2138  20650         207       222      0  ##ного населення .
2139  20650         212       221      0           населення
2140  20650         212       222      0         населення .

[2141 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     20710           1         3      0                  чи
1     20710           1         9      0            чи можна
2     20710           1        12      0         чи можна до

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     20710           1         3      1                  чи
1     20710           1         9      1            чи можна
2     20710           1        12      1         чи можна до
3     20710           1        14      1       чи можна дові
4     20710           1        16      1     чи можна довіря
...     ...         ...       ...    ...                 ...
1645  20710         168       172      1              ##ного
1646  20710         168       182      1    ##ного населення
1647  20710         168       183      0  ##ного населення .
1648  20710         173       182      0           населення
1649  20710         173       183      0         населення .

[1650 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     20770           1         3      0                     чи
1     20770           1         9      0               чи можна
2     20770           1        12      0           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     20770           1         3      1                     чи
1     20770           1         9      1               чи можна
2     20770           1        12      1            чи можна до
3     20770           1        14      1          чи можна дові
4     20770           1        16      1        чи можна довіря
...     ...         ...       ...    ...                    ...
1703  20770         172       179      1              ##ільного
1704  20770         172       189      1    ##ільного населення
1705  20770         172       190      0  ##ільного населення .
1706  20770         180       189      0              населення
1707  20770         180       190      0            населення .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     20810           1         3      0                     чи
1     20810           1         9      0               чи можна
2     20810    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     20810           1         3      1                     чи
1     20810           1         9      1               чи можна
2     20810           1        12      1            чи можна до
3     20810           1        14      1          чи можна дові
4     20810           1        16      1        чи можна довіря
...     ...         ...       ...    ...                    ...
2548  20810         215       222      1              ##ільного
2549  20810         215       232      1    ##ільного населення
2550  20810         215       233      0  ##ільного населення .
2551  20810         223       232      0              населення
2552  20810         223       233      0            населення .

[2553 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     20880           1         3      0               чи
1     20880           1         9      0         чи можна
2     20880           1        12

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/356 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     20880           1         3      1               чи
1     20880           1         9      1         чи можна
2     20880           1        12      1      чи можна до
3     20880           1        14      1    чи можна дові
4     20880           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
2842  20880         223       226      1            ##тив
2843  20880         223       227      1           ##тиві
2844  20880         223       228      0         ##тиві .
2845  20880         226       227      1              ##і
2846  20880         226       228      0            ##і .

[2847 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     209813           0         1      0               с
1     209813           0         4      0            сказ
2     209813           0         7      0         сказ на
3     209813           0         9      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/848 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     209813           0         1      0               с
1     209813           0         4      1            сказ
2     209813           0         7      1         сказ на
3     209813           0         9      1       сказ на х
4     209813           0        14      1  сказ на харків
...      ...         ...       ...    ...             ...
6773  209813         330       337      1       ##ть ново
6774  209813         330       340      0    ##ть новость
6775  209813         333       337      0            ново
6776  209813         333       340      1         новость
6777  209813         337       340      1           ##сть

[6778 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     20990           1         2      0             ч
1     20990           1         5      0          чому
2     20990           1         8      0       чому те
3     20990           1        11      0    чому терит
4   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/385 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     20990           1         2      1             ч
1     20990           1         5      1          чому
2     20990           1         8      1       чому те
3     20990           1        11      1    чому терит
4     20990           1        13      1  чому територ
...     ...         ...       ...    ...           ...
3074  20990         251       256      0         серед
3075  20990         251       261      1    середовищі
3076  20990         251       262      0  середовищі .
3077  20990         256       261      1       ##овищі
3078  20990         256       262      0     ##овищі .

[3079 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     210018           0         3      0             нар
1     210018           0         5      0           нарко
2     210018           0         8      0        наркодил
3     210018           0        10      0      наркодилер
4     210018           0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/763 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     210018           0         3      0             нар
1     210018           0         5      1           нарко
2     210018           0         8      1        наркодил
3     210018           0        10      1      наркодилер
4     210018           0        14      1  наркодилер нам
...      ...         ...       ...    ...             ...
6095  210018         295       302      1       ##ть ново
6096  210018         295       305      0    ##ть новость
6097  210018         298       302      0            ново
6098  210018         298       305      1         новость
6099  210018         302       305      1           ##сть

[6100 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     210117           0         2      0             ле
1     210117           0         4      0           ледь
2     210117           0         7      0        ледь не
3     210117           0        10      0     ледь 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/501 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     210117           0         2      0             ле
1     210117           0         4      1           ледь
2     210117           0         7      1        ледь не
3     210117           0        10      1     ледь не за
4     210117           0        13      1  ледь не загин
...      ...         ...       ...    ...            ...
3996  210117         238       245      1      ##ть ново
3997  210117         238       248      0   ##ть новость
3998  210117         241       245      0           ново
3999  210117         241       248      1        новость
4000  210117         245       248      1          ##сть

[4001 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     210498           0         2      0                ці
1     210498           0         4      0              ціни
2     210498           0         7      0           ціни на
3     210498           0        15      0   ціни на

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/891 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     210498           0         2      0                ці
1     210498           0         4      1              ціни
2     210498           0         7      1           ціни на
3     210498           0        15      1   ціни на продукт
4     210498           0        16      1  ціни на продукти
...      ...         ...       ...    ...               ...
7122  210498         330       337      1         ##ть ново
7123  210498         330       340      0      ##ть новость
7124  210498         333       337      0              ново
7125  210498         333       340      1           новость
7126  210498         337       340      1             ##сть

[7127 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     21060           1         3      0                чи
1     21060           1         9      0          чи можна
2     21060           1        12      0       чи можна вв
3     21060        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/276 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     21060           1         3      1                чи
1     21060           1         9      1          чи можна
2     21060           1        12      1       чи можна вв
3     21060           1        13      1      чи можна вва
4     21060           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2203  21060         192       194      1              ##ар
2204  21060         192       196      1            ##арів
2205  21060         192       197      0          ##арів .
2206  21060         194       196      1              ##ів
2207  21060         194       197      0            ##ів .

[2208 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     210725           0         2      0                  мо
1     210725           0         6      0              мобіль
2     210725           0         8      0            мобільні
3     210725       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/456 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     210725           0         2      0                  мо
1     210725           0         6      1              мобіль
2     210725           0         8      1            мобільні
3     210725           0        17      1   мобільні оператор
4     210725           0        18      1  мобільні оператори
...      ...         ...       ...    ...                 ...
3642  210725         260       267      1           ##ть ново
3643  210725         260       270      0        ##ть новость
3644  210725         263       267      0                ново
3645  210725         263       270      1             новость
3646  210725         267       270      1               ##сть

[3647 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     21100           1         3      0                чи
1     21100           1         9      0          чи можна
2     21100           1        12      0       чи можн

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     21100           1         3      1                чи
1     21100           1         9      1          чи можна
2     21100           1        12      1       чи можна вв
3     21100           1        13      1      чи можна вва
4     21100           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2407  21100         205       208      1             ##ова
2408  21100         205       209      1            ##овах
2409  21100         205       210      0          ##овах .
2410  21100         208       209      1               ##х
2411  21100         208       210      0             ##х .

[2412 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     211041           0         1      0             з
1     211041           0         5      0         збили
2     211041           0         7      0       збили ж
3     211041           0         9      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/791 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     211041           0         1      0             з
1     211041           0         5      1         збили
2     211041           0         7      1       збили ж
3     211041           0         9      1     збили жін
4     211041           0        11      1   збили жінку
...      ...         ...       ...    ...           ...
6317  211041         323       330      1     ##ть ново
6318  211041         323       333      0  ##ть новость
6319  211041         326       330      0          ново
6320  211041         326       333      1       новость
6321  211041         330       333      1         ##сть

[6322 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     211142           0         2      0               за
1     211142           0         5      0            затри
2     211142           0         9      0        затримали
3     211142           0        12      0     затримали на
4     21

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/892 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     211142           0         2      0               за
1     211142           0         5      1            затри
2     211142           0         9      1        затримали
3     211142           0        12      1     затримали на
4     211142           0        15      1  затримали навід
...      ...         ...       ...    ...              ...
7125  211142         346       353      1        ##ть ново
7126  211142         346       356      0     ##ть новость
7127  211142         349       353      0             ново
7128  211142         349       356      1          новость
7129  211142         353       356      1            ##сть

[7130 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     21140           1         3      0                чи
1     21140           1         9      0          чи можна
2     21140           1        12      0       чи можна вв
3     21140           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/276 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     21140           1         3      1                чи
1     21140           1         9      1          чи можна
2     21140           1        12      1       чи можна вв
3     21140           1        13      1      чи можна вва
4     21140           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2203  21140         193       195      1              ##ар
2204  21140         193       197      1            ##арів
2205  21140         193       198      0          ##арів .
2206  21140         195       197      1              ##ів
2207  21140         195       198      0            ##ів .

[2208 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     211414           0         1      0             о
1     211414           0         4      0          опад
2     211414           0         5      0         опади
3     211414           0         8      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/582 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     211414           0         1      0             о
1     211414           0         4      1          опад
2     211414           0         5      1         опади
3     211414           0         8      1      опади та
4     211414           0        10      1    опади та о
...      ...         ...       ...    ...           ...
4644  211414         223       230      1     ##ть ново
4645  211414         223       233      0  ##ть новость
4646  211414         226       230      0          ново
4647  211414         226       233      1       новость
4648  211414         230       233      1         ##сть

[4649 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     211431           0         5      0                склад
1     211431           0         4      0          склад зброі
2     211431           0         7      0        склад зброі з
3     211431           0         2      0     склад

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     211431           0         5      0                склад
1     211431           0         4      1          склад зброі
2     211431           0         7      1        склад зброі з
3     211431           0         2      1     склад зброі знаи
4     211431           0        19      1  склад зброі знаишли
...      ...         ...       ...    ...                  ...
3644  211431         265       272      1            ##ть ново
3645  211431         265       275      0         ##ть новость
3646  211431         268       272      0                 ново
3647  211431         268       275      1              новость
3648  211431         272       275      1                ##сть

[3649 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     21220           1         2      0            ч
1     21220           1         5      0         чому
2     21220           1         9      0     чому лік
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label         text
0     21220           1         2      1            ч
1     21220           1         5      1         чому
2     21220           1         9      1     чому лік
3     21220           1        11      1   чому лікар
4     21220           1        12      1  чому лікарі
...     ...         ...       ...    ...          ...
1478  21220         153       155      1         ##ар
1479  21220         153       157      1       ##арів
1480  21220         153       158      0     ##арів .
1481  21220         155       157      1         ##ів
1482  21220         155       158      0       ##ів .

[1483 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     21250           1         3      0                чи
1     21250           1         9      0          чи можна
2     21250           1        12      0       чи можна вв
3     21250           1        13      0      чи можна вва
4     21250           1        1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     21250           1         3      1                чи
1     21250           1         9      1          чи можна
2     21250           1        12      1       чи можна вв
3     21250           1        13      1      чи можна вва
4     21250           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2137  21250         194       196      1              ##ар
2138  21250         194       198      1            ##арів
2139  21250         194       199      0          ##арів .
2140  21250         196       198      1              ##ів
2141  21250         196       199      0            ##ів .

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     21260           1         2      0              ч
1     21260           1         5      0           чому
2     21260           1         9      0       чому лік
3     21260           1        11      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/160 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     21260           1         2      1              ч
1     21260           1         5      1           чому
2     21260           1         9      1       чому лік
3     21260           1        11      1     чому лікар
4     21260           1        12      1    чому лікарі
...     ...         ...       ...    ...            ...
1268  21260         155       160      0          праці
1269  21260         155       166      1    працівників
1270  21260         155       167      0  працівників .
1271  21260         160       166      1       ##вників
1272  21260         160       167      0     ##вників .

[1273 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     21290           1         3      0               чи
1     21290           1         9      0         чи можна
2     21290           1        12      0      чи можна до
3     21290           1        14      0    чи можна дові
4     21290  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/293 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     21290           1         3      1               чи
1     21290           1         9      1         чи можна
2     21290           1        12      1      чи можна до
3     21290           1        14      1    чи можна дові
4     21290           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
2338  21290         206       207      1              ##є
2339  21290         206       211      1          ##єнтів
2340  21290         206       212      0        ##єнтів .
2341  21290         207       211      1           ##нтів
2342  21290         207       212      0         ##нтів .

[2343 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     21360           1         2      0            ч
1     21360           1         5      0         чому
2     21360           1         9      0     чому лік
3     21360           1        11      0   чому лікар
4     213

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label         text
0     21360           1         2      1            ч
1     21360           1         5      1         чому
2     21360           1         9      1     чому лік
3     21360           1        11      1   чому лікар
4     21360           1        12      1  чому лікарі
...     ...         ...       ...    ...          ...
1478  21360         158       160      1         ##ар
1479  21360         158       162      1       ##арів
1480  21360         158       163      0     ##арів .
1481  21360         160       162      1         ##ів
1482  21360         160       163      0       ##ів .

[1483 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     21520           1         2      0            ч
1     21520           1         5      0         чому
2     21520           1         9      0     чому лік
3     21520           1        11      0   чому лікар
4     21520           1        12      0  чому лікарі
...

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/237 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label         text
0     21520           1         2      1            ч
1     21520           1         5      1         чому
2     21520           1         9      1     чому лік
3     21520           1        11      1   чому лікар
4     21520           1        12      1  чому лікарі
...     ...         ...       ...    ...          ...
1884  21520         191       193      1         ##яз
1885  21520         191       195      1       ##язки
1886  21520         191       196      0     ##язки .
1887  21520         193       195      1         ##ки
1888  21520         193       196      0       ##ки .

[1889 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    21610           1         2      0               ч
1    21610           1         5      0            чому
2    21610           1        11      0      чому добро
3    21610           1        13      0    чому доброво
4    21610           1        15      0  чому д

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    21610           1         2      1               ч
1    21610           1         5      1            чому
2    21610           1        11      1      чому добро
3    21610           1        13      1    чому доброво
4    21610           1        15      1  чому доброволь
..     ...         ...       ...    ...             ...
895  21610         133       135      1            ##ту
896  21610         133         3      1        ##туаціі
897  21610         133       140      0      ##туаціі .
898  21610          -1         3      1          ##аціі
899  21610          -1       140      0        ##аціі .

[900 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     21640           1         3      0                  чи
1     21640           1        11      0          чи можливо
2     21640           1        12      0        чи можливо ,
3     21640           1        15      0     чи можливо , що

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/135 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     21640           1         3      1                  чи
1     21640           1        11      1          чи можливо
2     21640           1        12      1        чи можливо ,
3     21640           1        15      1     чи можливо , що
4     21640           1        18      1  чи можливо , що ке
...     ...         ...       ...    ...                 ...
1072  21640         136       139      1               ##шен
1073  21640         136       140      1              ##шень
1074  21640         136       141      0            ##шень .
1075  21640         139       140      1                 ##ь
1076  21640         139       141      0               ##ь .

[1077 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     21660           1         3      0            чи
1     21660           1         6      0         чи ад
2     21660           1         8      0       чи адек
3     21660           1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/147 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     21660           1         3      1            чи
1     21660           1         6      1         чи ад
2     21660           1         8      1       чи адек
3     21660           1        11      1    чи адекват
4     21660           1        13      1  чи адекватно
...     ...         ...       ...    ...           ...
1168  21660         128       130      1          ##нт
1169  21660         128       135      1     ##нтності
1170  21660         128       136      0   ##нтності .
1171  21660         130       135      1       ##ності
1172  21660         130       136      0     ##ності .

[1173 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     21760           1         3      0          по
1     21760           1         5      0        посл
2     21760           1         7      0      послід
3     21760           1         9      0    послідов
4     21760           1        11      0  послідов

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/501 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     21760           1         3      0          по
1     21760           1         5      1        посл
2     21760           1         7      1      послід
3     21760           1         9      1    послідов
4     21760           1        11      1  послідовні
...     ...         ...       ...    ...         ...
3996  21760         258       260      1        ##ур
3997  21760         258       264      1    ##урсами
3998  21760         258       265      0  ##урсами .
3999  21760         260       264      1      ##сами
4000  21760         260       265      0    ##сами .

[4001 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    21770           1         8      0               система
1    21770           1        13      0          систематичні
2    21770           1        16      0       систематичні ви
3    21770           1        19      0    систематичні випад
4    21770           1       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    21770           1         8      0               система
1    21770           1        13      1          систематичні
2    21770           1        16      1       систематичні ви
3    21770           1        19      1    систематичні випад
4    21770           1        21      1  систематичні випадки
..     ...         ...       ...    ...                   ...
813  21770         116       128      0          керівництвом
814  21770         116         4      1    керівництвом арміі
815  21770         116       135      0  керівництвом арміі .
816  21770          -1         4      1                 арміі
817  21770          -1       135      0               арміі .

[818 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     21840           1         5      0            пост
1     21840           1         1      0          постіи
2     21840           1         9      0        постіині
3   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     21840           1         5      0            пост
1     21840           1         1      1          постіи
2     21840           1         9      1        постіині
3     21840           1        12      1     постіині ви
4     21840           1        15      1  постіині випад
...     ...         ...       ...    ...             ...
2138  21840         190       196      1          солдат
2139  21840         190       197      1         солдата
2140  21840         190       198      1       солдата .
2141  21840         196       197      1             ##а
2142  21840         196       198      0           ##а .

[2143 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     21870           1         3      0                   чи
1     21870           1         8      0              чи може
2     21870           1        11      0           чи може ке
3     21870           1        14      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/236 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     21870           1         3      1                   чи
1     21870           1         8      1              чи може
2     21870           1        11      1           чи може ке
3     21870           1        14      1        чи може керів
4     21870           1        20      1  чи може керівництво
...     ...         ...       ...    ...                  ...
1882  21870         209       212      0                  кад
1883  21870         209       215      1               кадрів
1884  21870         209       216      1             кадрів .
1885  21870         212       215      1                ##рів
1886  21870         212       216      0              ##рів .

[1887 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     21900           1         3      0               чи
1     21900           1         9      0         чи можна
2     21900           1        12      0      чи можна до

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/244 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     21900           1         3      1               чи
1     21900           1         9      1         чи можна
2     21900           1        12      1      чи можна до
3     21900           1        14      1    чи можна дові
4     21900           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
1944  21900         188       194      1           солдат
1945  21900         188       195      1          солдата
1946  21900         188       196      1        солдата .
1947  21900         194       195      1              ##а
1948  21900         194       196      0            ##а .

[1949 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     21930           1         3      0                чи
1     21930           1         9      0          чи можна
2     21930           1        12      0       чи можна вв
3     21930           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     21930           1         3      1                чи
1     21930           1         9      1          чи можна
2     21930           1        12      1       чи можна вв
3     21930           1        13      1      чи можна вва
4     21930           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
1588  21930         174       179      0             умови
1589  21930         174       186      1      умови служби
1590  21930         174       187      0    умови служби .
1591  21930         180       186      0            служби
1592  21930         180       187      0          служби .

[1593 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     22040           1         2      0                ч
1     22040           1         5      0             чому
2     22040           1        10      0        чому приз
3     22040           1        14  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     22040           1         2      1                ч
1     22040           1         5      1             чому
2     22040           1        10      1        чому приз
3     22040           1        14      1    чому призивни
4     22040           1        16      1  чому призивники
...     ...         ...       ...    ...              ...
1370  22040         145       150      0            умови
1371  22040         145       157      1     умови служби
1372  22040         145       158      0   умови служби .
1373  22040         151       157      0           служби
1374  22040         151       158      0         служби .

[1375 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22140           1         3      0                чи
1     22140           1         9      0          чи можна
2     22140           1        12      0       чи можна вв
3     22140           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22140           1         3      1                чи
1     22140           1         9      1          чи можна
2     22140           1        12      1       чи можна вв
3     22140           1        13      1      чи можна вва
4     22140           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
1588  22140         171       173      1              ##нт
1589  22140         171       178      1         ##нтності
1590  22140         171       179      0       ##нтності .
1591  22140         173       178      1           ##ності
1592  22140         173       179      0         ##ності .

[1593 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22230           1         2      0                 ч
1     22230           1         5      0              чому
2     22230           1         8      0           чому ке
3     22230           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22230           1         2      1                 ч
1     22230           1         5      1              чому
2     22230           1         8      1           чому ке
3     22230           1        11      1        чому керів
4     22230           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
1028  22230         145       147      1              ##нт
1029  22230         145       152      1         ##нтність
1030  22230         145       153      0       ##нтність .
1031  22230         147       152      1           ##ність
1032  22230         147       153      0         ##ність .

[1033 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    22370           1         2      0                 ч
1    22370           1         5      0              чому
2    22370           1         8      0           чому ке
3    22370           1        11   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    22370           1         2      1                 ч
1    22370           1         5      1              чому
2    22370           1         8      1           чому ке
3    22370           1        11      1        чому керів
4    22370           1        17      1  чому керівництво
..     ...         ...       ...    ...               ...
939  22370         137       140      1             ##ові
940  22370         137         7      1    ##ові операціі
941  22370         137       150      0  ##ові операціі .
942  22370          -1         7      0          операціі
943  22370          -1       150      0        операціі .

[944 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22410           1         2      0                 ч
1     22410           1         5      0              чому
2     22410           1         8      0           чому ке
3     22410           1        11      0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/135 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22410           1         2      1                 ч
1     22410           1         5      1              чому
2     22410           1         8      1           чому ке
3     22410           1        11      1        чому керів
4     22410           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
1074  22410         156       159      1             ##ція
1075  22410         156       161      1           ##ціями
1076  22410         156       162      0         ##ціями .
1077  22410         159       161      1              ##ми
1078  22410         159       162      0            ##ми .

[1079 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     22430           1         2      0                  ч
1     22430           1         5      0               чому
2     22430           1         8      0            чому ке
3     22430           1    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/229 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     22430           1         2      1                  ч
1     22430           1         5      1               чому
2     22430           1         8      1            чому ке
3     22430           1        11      1         чому керів
4     22430           1        17      1   чому керівництво
...     ...         ...       ...    ...                ...
1822  22430         163       167      1             ##вати
1823  22430         163         7      1    ##вати операціі
1824  22430         163       177      0  ##вати операціі .
1825  22430          -1         7      0           операціі
1826  22430          -1       177      0         операціі .

[1827 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22690           1         3      0                чи
1     22690           1         9      0          чи можна
2     22690           1        12      0       чи можна вв
3     22690        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22690           1         3      1                чи
1     22690           1         9      1          чи можна
2     22690           1        12      1       чи можна вв
3     22690           1        13      1      чи можна вва
4     22690           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
2407  22690          -1         5      0            віиськ
2408  22690          -1       223      1        віиськовим
2409  22690          -1       224      0      віиськовим .
2410  22690         219       223      1            ##овим
2411  22690         219       224      0          ##овим .

[2412 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22700           1         2      0                 ч
1     22700           1         5      0              чому
2     22700           1         8      0           чому ке
3     22700           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22700           1         2      1                 ч
1     22700           1         5      1              чому
2     22700           1         8      1           чому ке
3     22700           1        11      1        чому керів
4     22700           1        17      1  чому керівництво
...     ...         ...       ...    ...               ...
1588  22700         163       165      1              ##мі
1589  22700         163       167      1            ##мією
1590  22700         163       168      0          ##мією .
1591  22700         165       167      1              ##єю
1592  22700         165       168      0            ##єю .

[1593 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     22710           1         3      0               чи
1     22710           1         9      0         чи можна
2     22710           1        12      0      чи можна до
3     22710           1        14  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/252 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     22710           1         3      1               чи
1     22710           1         9      1         чи можна
2     22710           1        12      1      чи можна до
3     22710           1        14      1    чи можна дові
4     22710           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
2008  22710         193       200      0          команду
2009  22710         193       205      1     командування
2010  22710         193       206      0   командування .
2011  22710         200       205      1          ##вання
2012  22710         200       206      0        ##вання .

[2013 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     22750           1         3      0                   чи
1     22750           1         8      0              чи може
2     22750           1        11      0           чи може ке
3     22750           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/366 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     22750           1         3      1                   чи
1     22750           1         8      1              чи може
2     22750           1        11      1           чи може ке
3     22750           1        14      1        чи може керів
4     22750           1        20      1  чи може керівництво
...     ...         ...       ...    ...                  ...
2917  22750         216       218      1                 ##пе
2918  22750         216       220      1               ##пеку
2919  22750         216       221      0             ##пеку .
2920  22750         218       220      1                 ##ку
2921  22750         218       221      0               ##ку .

[2922 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     22920           1         3      0               чи
1     22920           1         9      0         чи можна
2     22920           1        12      0      чи можна до

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/252 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     22920           1         3      1               чи
1     22920           1         9      1         чи можна
2     22920           1        12      1      чи можна до
3     22920           1        14      1    чи можна дові
4     22920           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
2007  22920         202       205      1            ##рів
2008  22920         202       211      1      ##рівництва
2009  22920         202       212      0    ##рівництва .
2010  22920         205       211      1         ##ництва
2011  22920         205       212      0       ##ництва .

[2012 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     22960           1         3      0                чи
1     22960           1         9      0          чи можна
2     22960           1        12      0       чи можна вв
3     22960           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     22960           1         3      1                чи
1     22960           1         9      1          чи можна
2     22960           1        12      1       чи можна вв
3     22960           1        13      1      чи можна вва
4     22960           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
1423  22960         162       167      0             фронт
1424  22960         162       168      1            фронті
1425  22960         162       169      0          фронті .
1426  22960         167       168      1               ##і
1427  22960         167       169      0             ##і .

[1428 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     22990           1         2      0               ч
1     22990           1         5      0            чому
2     22990           1        11      0      чому добро
3     22990           1        13      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     22990           1         2      1               ч
1     22990           1         5      1            чому
2     22990           1        11      1      чому добро
3     22990           1        13      1    чому доброво
4     22990           1        15      1  чому доброволь
...     ...         ...       ...    ...             ...
1703  22990         174       178      1          ##ивні
1704  22990         174       181      1       ##ивність
1705  22990         174       182      0     ##ивність .
1706  22990         178       181      1           ##сть
1707  22990         178       182      0         ##сть .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     23020           1         3      0               чи
1     23020           1         9      0         чи можна
2     23020           1        12      0      чи можна до
3     23020           1        14      0    чи можна дові
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     23020           1         3      1               чи
1     23020           1         9      1         чи можна
2     23020           1        12      1      чи можна до
3     23020           1        14      1    чи можна дові
4     23020           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
1217  23020         146       149      1            ##сть
1218  23020         146         2      1        ##сть діи
1219  23020         146       154      0      ##сть діи .
1220  23020          -1         2      0              діи
1221  23020          -1       154      0            діи .

[1222 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    23150           1         6      0           добро
1    23150           1         8      0         доброво
2    23150           1        10      0       доброволь
3    23150           1        12      0     добровольці

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    23150           1         6      1           добро
1    23150           1         8      1         доброво
2    23150           1        10      1       доброволь
3    23150           1        12      1     добровольці
4    23150           1        15      1  добровольці ді
..     ...         ...       ...    ...             ...
938  23150          13        15      1              ді
939  23150          13       133      1            діях
940  23150          13       134      1          діях .
941  23150         131       133      1            ##ях
942  23150         131       134      0          ##ях .

[943 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     23260           1         3      0                    ке
1     23260           1         6      0                 керів
2     23260           1        12      0           керівництво
3     23260           1         4      0     керівни

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     23260           1         3      1                    ке
1     23260           1         6      1                 керів
2     23260           1        12      1           керівництво
3     23260           1         4      1     керівництво арміі
4     23260           1        21      1  керівництво арміі ст
...     ...         ...       ...    ...                   ...
1588  23260         177       180      1                 ##ірі
1589  23260         177       181      1                ##ірів
1590  23260         177       182      0              ##ірів .
1591  23260         180       181      1                   ##в
1592  23260         180       182      0                 ##в .

[1593 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    23310           1         3      0                су
1    23310           1         6      0             супер
2    23310           1        10      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    23310           1         3      1                су
1    23310           1         6      1             супер
2    23310           1        10      1         суперечно
3    23310           1        13      1      суперечності
4    23310           1        17      1  суперечності між
..     ...         ...       ...    ...               ...
813  23310         125       128      1             ##кти
814  23310         125       130      1           ##ктиці
815  23310         125       131      0         ##ктиці .
816  23310         128       130      1              ##ці
817  23310         128       131      0            ##ці .

[818 rows x 5 columns]
        id  seq_starts  seq_ends  label         text
0    23360           1         3      0           об
1    23360           1         4      0          обі
2    23360           1         6      0        обіця
3    23360           1         9      0     обіцянки
4    23360     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/124 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label         text
0    23360           1         3      0           об
1    23360           1         4      1          обі
2    23360           1         6      1        обіця
3    23360           1         9      1     обіцянки
4    23360           1        12      1  обіцянки ке
..     ...         ...       ...    ...          ...
983  23360         139       141      1         ##бе
984  23360         139       144      1      ##белів
985  23360         139       145      0    ##белів .
986  23360         141       144      1        ##лів
987  23360         141       145      0      ##лів .

[988 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    23470           1         3      0                    ке
1    23470           1         6      0                 керів
2    23470           1        12      0           керівництво
3    23470           1         4      0     керівництво арміі
4    23470           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    23470           1         3      1                    ке
1    23470           1         6      1                 керів
2    23470           1        12      1           керівництво
3    23470           1         4      1     керівництво арміі
4    23470           1        21      1  керівництво арміі за
..     ...         ...       ...    ...                   ...
773  23470         138       140      0                    за
774  23470         138       143      1                 заяви
775  23470         138       144      0               заяви .
776  23470         140       143      1                 ##яви
777  23470         140       144      0               ##яви .

[778 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    23510           1         3      0                  об
1    23510           1         4      0                 обі
2    23510           1         6      0             

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    23510           1         3      0                  об
1    23510           1         4      1                 обі
2    23510           1         6      1               обіця
3    23510           1         9      1            обіцянки
4    23510           1        12      1         обіцянки ке
..     ...         ...       ...    ...                 ...
589  23510          -1         3      1              ##жноі
590  23510          -1       123      1    ##жноі підтримки
591  23510          -1       124      0  ##жноі підтримки .
592  23510         114       123      0           підтримки
593  23510         114       124      0         підтримки .

[594 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    23530           1         3      0                    ке
1    23530           1         6      0                 керів
2    23530           1        12      0           керівництво
3    235

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    23530           1         3      1                    ке
1    23530           1         6      1                 керів
2    23530           1        12      1           керівництво
3    23530           1         4      1     керівництво арміі
4    23530           1        21      1  керівництво арміі ст
..     ...         ...       ...    ...                   ...
812  23530         135       136      1                   ##м
813  23530         135       139      1                ##мнів
814  23530         135       140      0              ##мнів .
815  23530         136       139      1                 ##нів
816  23530         136       140      0               ##нів .

[817 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    23540           1         3      0              су
1    23540           1         6      0           супер
2    23540           1        10      0       суперечно
3    235

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    23540           1         3      1              су
1    23540           1         6      1           супер
2    23540           1        10      1       суперечно
3    23540           1        13      1    суперечності
4    23540           1        15      1  суперечності в
..     ...         ...       ...    ...             ...
896  23540         125       130      0           фронт
897  23540         125       131      1          фронті
898  23540         125       132      0        фронті .
899  23540         130       131      1             ##і
900  23540         130       132      0           ##і .

[901 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    23610           1         3      0                    ке
1    23610           1         6      0                 керів
2    23610           1        12      0           керівництво
3    23610           1         4      0     керівництво 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    23610           1         3      1                    ке
1    23610           1         6      1                 керів
2    23610           1        12      1           керівництво
3    23610           1         4      1     керівництво арміі
4    23610           1        21      1  керівництво арміі за
..     ...         ...       ...    ...                   ...
773  23610         138       140      0                    за
774  23610         138       143      1                 заяви
775  23610         138       144      0               заяви .
776  23610         140       143      1                 ##яви
777  23610         140       144      0               ##яви .

[778 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     23740           1         3      0                су
1     23740           1         6      0             супер
2     23740           1        10      0         супере

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/159 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     23740           1         3      1                су
1     23740           1         6      1             супер
2     23740           1        10      1         суперечно
3     23740           1        13      1      суперечності
4     23740           1        17      1  суперечності між
...     ...         ...       ...    ...               ...
1267  23740         166       171      0             рівня
1268  23740         166       172      1            рівнях
1269  23740         166       173      0          рівнях .
1270  23740         171       172      1               ##х
1271  23740         171       173      0             ##х .

[1272 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     23780           1         3      0                су
1     23780           1         6      0             супер
2     23780           1        10      0         суперечно
3     23780           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/159 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     23780           1         3      1                су
1     23780           1         6      1             супер
2     23780           1        10      1         суперечно
3     23780           1        13      1      суперечності
4     23780           1        17      1  суперечності між
...     ...         ...       ...    ...               ...
1267  23780         166       171      0             рівня
1268  23780         166       172      1            рівнях
1269  23780         166       173      0          рівнях .
1270  23780         171       172      1               ##х
1271  23780         171       173      0             ##х .

[1272 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     23820           1         3      0                су
1     23820           1         6      0             супер
2     23820           1        10      0         суперечно
3     23820           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/159 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     23820           1         3      1                су
1     23820           1         6      1             супер
2     23820           1        10      1         суперечно
3     23820           1        13      1      суперечності
4     23820           1        17      1  суперечності між
...     ...         ...       ...    ...               ...
1267  23820         166       171      0             рівня
1268  23820         166       172      1            рівнях
1269  23820         166       173      0          рівнях .
1270  23820         171       172      1               ##х
1271  23820         171       173      0             ##х .

[1272 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     23850           1         3      0                    ке
1     23850           1         6      0                 керів
2     23850           1        12      0           керівництво
3     23850    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/129 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     23850           1         3      1                    ке
1     23850           1         6      1                 керів
2     23850           1        12      1           керівництво
3     23850           1         4      1     керівництво арміі
4     23850           1        21      1  керівництво арміі за
...     ...         ...       ...    ...                   ...
1027  23850         136       138      1                  ##ів
1028  23850         136       141      1               ##івель
1029  23850         136       142      0             ##івель .
1030  23850         138       141      1                 ##ель
1031  23850         138       142      0               ##ель .

[1032 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     30030           0         2      0                    на
1     30030           0         8      0              на львів
2     30030           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/534 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     30030           0         2      0                    на
1     30030           0         8      1              на львів
2     30030           0        12      1          на львівщині
3     30030           0        18      1    на львівщині право
4     30030           0        20      1  на львівщині правоох
...     ...         ...       ...    ...                   ...
4267  30030         284       286      1                    не
4268  30030         284       296      1          незалежності
4269  30030         284       298      1        незалежності .
4270  30030         286       296      1          ##залежності
4271  30030         286       298      0        ##залежності .

[4272 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     30250           0         2      0           на
1     30250           0         4      0         на р
2     30250           0         7      0      на рест
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


         id  seq_starts  seq_ends  label         text
0     30250           0         2      0           на
1     30250           0         4      1         на р
2     30250           0         7      1      на рест
3     30250           0         9      1    на рестав
4     30250           0        11      1  на реставра
...     ...         ...       ...    ...          ...
4838  30250         338       342      0         нови
4839  30250         338       343      1        новин
4840  30250         338       344      1      новин ?
4841  30250         342       343      1          ##н
4842  30250         342       344      1        ##н ?

[4843 rows x 5 columns]


INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                        text
0      30260           0         8      0                    сьогодні
1      30260           0        14      0              сьогодні стало
2      30260           0        21      0       сьогодні стало відомо
3      30260           0        22      0     сьогодні стало відомо ,
4      30260           0        25      0  сьогодні стало відомо , що
...      ...         ...       ...    ...                         ...
15555  30260         573       577      0                        нови
15556  30260         573       579      0                      новини
15557  30260         573       580      0                    новини ?
15558  30260         577       579      0                        ##ни
15559  30260         577       580      0                      ##ни ?

[15560 rows x 5 columns]
(15560, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1945 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                        text
0      30260           0         8      0                    сьогодні
1      30260           0        14      1              сьогодні стало
2      30260           0        21      1       сьогодні стало відомо
3      30260           0        22      1     сьогодні стало відомо ,
4      30260           0        25      1  сьогодні стало відомо , що
...      ...         ...       ...    ...                         ...
15555  30260         573       577      0                        нови
15556  30260         573       579      1                      новини
15557  30260         573       580      1                    новини ?
15558  30260         577       579      1                        ##ни
15559  30260         577       580      1                      ##ни ?

[15560 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     30320           0         2      0                  за
1     30320 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/862 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     30320           0         2      0                  за
1     30320           0        10      1          за останні
2     30320           0        12      1        за останніми
3     30320           0        16      1    за останніми пов
4     30320           0        18      1  за останніми повід
...     ...         ...       ...    ...                 ...
6884  30320         348       351      1                 пов
6885  30320         348       353      1               повно
6886  30320         348       354      1             повно ?
6887  30320         351       353      1                ##но
6888  30320         351       354      1              ##но ?

[6889 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     30370           0         1      0                      в
1     30370           0         6      0                 в раді
2     30370           0        13      0          в

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     30370           0         1      0                      в
1     30370           0         6      1                 в раді
2     30370           0        13      1          в раді почали
3     30370           0        16      1       в раді почали об
4     30370           0        21      1  в раді почали обговор
...     ...         ...       ...    ...                    ...
4742  30370         327       330      1                  ##рое
4743  30370         327       332      1                ##роект
4744  30370         327       333      1              ##роект ?
4745  30370         330       332      1                   ##кт
4746  30370         330       333      1                 ##кт ?

[4747 rows x 5 columns]
         id  seq_starts  seq_ends  label                     text
0     30410           0         1      0                        у
1     30410           0         6      0                   у раді
2     304

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                     text
0     30410           0         1      0                        у
1     30410           0         6      1                   у раді
2     30410           0        14      1           у раді можливо
3     30410           0        15      1         у раді можливо ,
4     30410           0        22      1  у раді можливо , почали
...     ...         ...       ...    ...                      ...
4357  30410         294       296      1                     ##ма
4358  30410         294       299      1                  ##мацію
4359  30410         294       300      1                ##мацію ?
4360  30410         296       299      1                    ##цію
4361  30410         296       300      1                  ##цію ?

[4362 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     30550           0         2      0          ви
1     30550           0         5      0       виход
2     30550           0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     30550           0         2      0          ви
1     30550           0         5      1       виход
2     30550           0         7      1     виходяч
3     30550           0         8      1    виходячи
4     30550           0        10      1  виходячи з
...     ...         ...       ...    ...         ...
3814  30550         270       272      1        ##ді
3815  30550         270       273      1       ##діа
3816  30550         270       274      1     ##діа .
3817  30550         272       273      1         ##а
3818  30550         272       274      0       ##а .

[3819 rows x 5 columns]
         id  seq_starts  seq_ends  label                       text
0     30610           0         8      0                   сьогодні
1     30610           0        17      0          сьогодні відбувся
2     30610           0        20      0       сьогодні відбувся ма
3     30610           0        23      0    сьогодні відбувся масов

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/206 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                       text
0     30610           0         8      0                   сьогодні
1     30610           0        17      1          сьогодні відбувся
2     30610           0        20      1       сьогодні відбувся ма
3     30610           0        23      1    сьогодні відбувся масов
4     30610           0         1      1  сьогодні відбувся масовии
...     ...         ...       ...    ...                        ...
1641  30610         206       210      1                     ##ання
1642  30610         206         9      1          ##ання інформаціі
1643  30610         206       127      0        ##ання інформаціі .
1644  30610          -1         9      1                 інформаціі
1645  30610          -1       127      0               інформаціі .

[1646 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     30820           1         3      0             ма
1     30820           1         5      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/193 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     30820           1         3      0             ма
1     30820           1         5      1           мані
2     30820           1         7      1         маніпу
3     30820           1        10      1      маніпулят
4     30820           1        14      1  маніпулятивні
...     ...         ...       ...    ...            ...
1533  30820         182       185      1          ##кти
1534  30820         182       188      1       ##ктивно
1535  30820         182       189      1     ##ктивно ?
1536  30820         185       188      1          ##вно
1537  30820         185       189      1        ##вно ?

[1538 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     30850           0         2      0              на
1     30850           0         6      0          на при
2     30850           0         9      0       на прикар
3     30850           0        12      0    на прикарпат
4     30850       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/276 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     30850           0         2      0              на
1     30850           0         6      1          на при
2     30850           0         9      1       на прикар
3     30850           0        12      1    на прикарпат
4     30850           0        14      1  на прикарпатті
...     ...         ...       ...    ...             ...
2202  30850         185       191      0          здоров
2203  30850         185       193      1        здоровям
2204  30850         185       194      1      здоровям ?
2205  30850         191       193      1            ##ям
2206  30850         191       194      1          ##ям ?

[2207 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     30870           0         2      0                 ви
1     30870           0         8      0           виявлено
2     30870           0        11      0        виявлено 13
3     30870           0        14      0     виявле

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/365 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     30870           0         2      0                 ви
1     30870           0         8      1           виявлено
2     30870           0        11      1        виявлено 13
3     30870           0        14      1     виявлено 13 ви
4     30870           0        17      1  виявлено 13 випад
...     ...         ...       ...    ...                ...
2915  30870         227       229      1               ##ді
2916  30870         227       230      1              ##діа
2917  30870         227       231      1            ##діа ?
2918  30870         229       230      1                ##а
2919  30870         229       231      1              ##а ?

[2920 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     30910           0         2      0             ма
1     30910           0         3      0            маг
2     30910           0         5      0          магні
3     30910           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     30910           0         2      0             ма
1     30910           0         3      1            маг
2     30910           0         5      1          магні
3     30910           0         3      1      магнітнии
4     30910           0        13      1  магнітнии што
...     ...         ...       ...    ...            ...
4744  30910         301       302      0              з
4745  30910         301       304      1            змі
4746  30910         301       305      1          змі ?
4747  30910         302       304      1           ##мі
4748  30910         302       305      1         ##мі ?

[4749 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     31030           1         3      0               чи
1     31030           1         8      0          чи може
2     31030           1        10      0        чи можемо
3     31030           1        13      0     чи можемо ми
4     31030  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/311 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     31030           1         3      1               чи
1     31030           1         8      1          чи може
2     31030           1        10      1        чи можемо
3     31030           1        13      1     чи можемо ми
4     31030           1        16      1  чи можемо ми до
...     ...         ...       ...    ...              ...
2476  31030         206       208      1               ду
2477  31030         206       211      1            думки
2478  31030         206       212      1          думки .
2479  31030         208       211      1            ##мки
2480  31030         208       212      0          ##мки .

[2481 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     31050           1         3      0             на
1     31050           1         5      0           наці
2     31050           1         8      0        націона
3     31050           1        12      0    національні

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/328 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     31050           1         3      0             на
1     31050           1         5      1           наці
2     31050           1         8      1        націона
3     31050           1        12      1    національні
4     31050           1        14      1  національні з
...     ...         ...       ...    ...            ...
2618  31050         225       229      1           одну
2619  31050         225       235      1     одну думку
2620  31050         225       236      0   одну думку .
2621  31050         230       235      0          думку
2622  31050         230       236      0        думку .

[2623 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     31060           1         6      0              знову
1     31060           1         9      0           знову на
2     31060           1        11      0         знову наці
3     31060           1        14      0      знову націона
4  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     31060           1         6      1              знову
1     31060           1         9      1           знову на
2     31060           1        11      1         знову наці
3     31060           1        14      1      знову націона
4     31060           1        18      1  знову національні
...     ...         ...       ...    ...                ...
3311  31060         238       240      1               ##ма
3312  31060         238       243      1            ##мацію
3313  31060         238       244      0          ##мацію .
3314  31060         240       243      1              ##цію
3315  31060         240       244      0            ##цію .

[3316 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     31210           0         1      0                   е
1     31210           0         3      0                 екс
2     31210           0         6      0              експер
3     31210

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     31210           0         1      0                   е
1     31210           0         3      1                 екс
2     31210           0         6      1              експер
3     31210           0         8      1            експерти
4     31210           0        12      1        експерти поп
...     ...         ...       ...    ...                 ...
3477  31210          -1         4      1             ##ічноі
3478  31210          -1       231      1    ##ічноі проблеми
3479  31210          -1       232      0  ##ічноі проблеми .
3480  31210         223       231      0            проблеми
3481  31210         223       232      0          проблеми .

[3482 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     31250           0         2      0            ви
1     31250           0         4      0          виру
2     31250           0         7      0       вирубка
3     31250           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     31250           0         2      0            ви
1     31250           0         4      1          виру
2     31250           0         7      1       вирубка
3     31250           0         9      1     вирубка л
4     31250           0        12      1  вирубка лісі
...     ...         ...       ...    ...           ...
3394  31250         248       250      1          ##ру
3395  31250         248       253      1       ##рубки
3396  31250         248       254      0     ##рубки .
3397  31250         250       253      1         ##бки
3398  31250         250       254      0       ##бки .

[3399 rows x 5 columns]
         id  seq_starts  seq_ends  label                          text
0     31290           0         2      0                            за
1     31290           0        10      0                    за останні
2     31290           0        15      0               за останні роки
3     31290           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                          text
0     31290           0         2      0                            за
1     31290           0        10      1                    за останні
2     31290           0        15      1               за останні роки
3     31290           0        25      1     за останні роки кількість
4     31290           0        28      1  за останні роки кількість ви
...     ...         ...       ...    ...                           ...
2405  31290          -1         4      1                       ##ціині
2406  31290          -1       225      1               ##ціині рішення
2407  31290          -1       226      0             ##ціині рішення .
2408  31290         218       225      0                       рішення
2409  31290         218       226      0                     рішення .

[2410 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     31300           0         1      0             е
1     31300  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/293 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     31300           0         1      0             е
1     31300           0         3      1           екс
2     31300           0         6      1        експер
3     31300           0         8      1      експерти
4     31300           0        12      1  експерти поп
...     ...         ...       ...    ...           ...
2337  31300         176       178      1          ##ту
2338  31300         176         3      1      ##туаціі
2339  31300         176        94      0    ##туаціі .
2340  31300          -1         3      1        ##аціі
2341  31300          -1        94      0      ##аціі .

[2342 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     31390           0         2      0                 за
1     31390           0        10      0         за останні
2     31390           0        12      0       за останні м
3     31390           0        15      0    за останні міся
4     31390    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     31390           0         2      0                 за
1     31390           0        10      1         за останні
2     31390           0        12      1       за останні м
3     31390           0        15      1    за останні міся
4     31390           0        17      1  за останні місяці
...     ...         ...       ...    ...                ...
2269  31390         222       225      1              ##нен
2270  31390         222       226      1             ##нень
2271  31390         222       227      1           ##нень .
2272  31390         225       226      1                ##ь
2273  31390         225       227      0              ##ь .

[2274 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     31430           0         3      0             під
1     31430           0         5      0           підви
2     31430           0        10      0      підвищення
3     31430           0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/356 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     31430           0         3      0             під
1     31430           0         5      1           підви
2     31430           0        10      1      підвищення
3     31430           0        13      1   підвищення ці
4     31430           0        14      1  підвищення цін
...     ...         ...       ...    ...             ...
2842  31430         217       220      1           ##шен
2843  31430         217       221      1          ##шень
2844  31430         217       222      0        ##шень .
2845  31430         220       221      1             ##ь
2846  31430         220       222      0           ##ь .

[2847 rows x 5 columns]
         id  seq_starts  seq_ends  label                    text
0     31470           0         2      0                      на
1     31470           0         9      0               на вулиця
2     31470           0        10      0              на вулицях
3     31470           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                    text
0     31470           0         2      0                      на
1     31470           0         9      1               на вулиця
2     31470           0        10      1              на вулицях
3     31470           0        16      1        на вулицях міста
4     31470           0        22      1  на вулицях міста знову
...     ...         ...       ...    ...                     ...
1703  31470         197       199      1                    ##ви
1704  31470         197       201      1                  ##вища
1705  31470         197       202      0                ##вища .
1706  31470         199       201      1                    ##ща
1707  31470         199       202      1                  ##ща .

[1708 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     315327           0         3      0            суд
1     315327           0         6      0         судити
2     315327           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/937 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     315327           0         3      0            суд
1     315327           0         6      1         судити
2     315327           0         8      1       судитиму
3     315327           0        10      1     судитимуть
4     315327           0        12      1   судитимуть ж
...      ...         ...       ...    ...            ...
7488  315327         358       367      1    ##лати нови
7489  315327         358       369      1  ##лати новину
7490  315327         363       367      0           нови
7491  315327         363       369      0         новину
7492  315327         367       369      1           ##ну

[7493 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     315330           0         6      0                  вперше
1     315330           0        11      0             вперше пред
2     315330           0        15      0         вперше представ
3     315330           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/570 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                    text
0     315330           0         6      0                  вперше
1     315330           0        11      1             вперше пред
2     315330           0        15      1         вперше представ
3     315330           0        18      1      вперше представить
4     315330           0        22      1  вперше представить укр
...      ...         ...       ...    ...                     ...
4548  315330         325       334      1             ##лати нови
4549  315330         325       336      1           ##лати новину
4550  315330         330       334      0                    нови
4551  315330         330       336      0                  новину
4552  315330         334       336      1                    ##ну

[4553 rows x 5 columns]
          id  seq_starts  seq_ends  label                     text
0     315420           0         5      0                    будут
1     315420           0         6      0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1250 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     315420           0         5      0                    будут
1     315420           0         6      1                   будуть
2     315420           0        15      1          будуть контролю
3     315420           0        19      1      будуть контролювати
4     315420           0        23      1  будуть контролювати усі
...      ...         ...       ...    ...                      ...
9993  315420         397       406      1              ##лати нови
9994  315420         397       408      1            ##лати новину
9995  315420         402       406      0                     нови
9996  315420         402       408      0                   новину
9997  315420         406       408      1                     ##ну

[9998 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     315425           0         2      0             12
1     315425           0         4      0           12 в


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/775 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     315425           0         2      0             12
1     315425           0         4      1           12 в
2     315425           0         6      1         12 веж
3     315425           0         9      1      12 веж мо
4     315425           0        13      1  12 веж мобіль
...      ...         ...       ...    ...            ...
6194  315425         302       311      1    ##лати нови
6195  315425         302       313      1  ##лати новину
6196  315425         307       311      0           нови
6197  315425         307       313      0         новину
6198  315425         311       313      1           ##ну

[6199 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     315445           0         2      0                 су
1     315445           0         4      0               сумс
2     315445           0         7      0            сумська
3     315445           0        15      0    су

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     315445           0         2      1                 су
1     315445           0         4      1               сумс
2     315445           0         7      1            сумська
3     315445           0        15      1    сумська депутат
4     315445           0        17      1  сумська депутатка
...      ...         ...       ...    ...                ...
3559  315445         243       252      1        ##лати нови
3560  315445         243       254      1      ##лати новину
3561  315445         248       252      0               нови
3562  315445         248       254      0             новину
3563  315445         252       254      1               ##ну

[3564 rows x 5 columns]
           id  seq_starts  seq_ends  label            text
0      315491           0         3      0             при
1      315491           0         5      0           приму
2      315491           0         9      0       примусова
3      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1303 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0      315491           0         3      0             при
1      315491           0         5      1           приму
2      315491           0         9      1       примусова
3      315491           0        12      1    примусова мо
4      315491           0        14      1  примусова мобі
...       ...         ...       ...    ...             ...
10419  315491         389       398      1     ##лати нови
10420  315491         389       400      1   ##лати новину
10421  315491         394       398      0            нови
10422  315491         394       400      0          новину
10423  315491         398       400      1            ##ну

[10424 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     315628           0         5      0                  сезон
1     315628           0        13      0          сезон питання
2     315628           0        15      0        сезон питання н
3     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/708 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     315628           0         5      0                  сезон
1     315628           0        13      1          сезон питання
2     315628           0        15      1        сезон питання н
3     315628           0        16      1       сезон питання ну
4     315628           0        21      1  сезон питання ну коли
...      ...         ...       ...    ...                    ...
5655  315628         283       292      1            ##лати нови
5656  315628         283       294      1          ##лати новину
5657  315628         288       292      0                   нови
5658  315628         288       294      0                 новину
5659  315628         292       294      1                   ##ну

[5660 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     315917           0         1      0              т
1     315917           0         3      0            тре
2     315917           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     315917           0         1      0              т
1     315917           0         3      1            тре
2     315917           0         6      1         трешов
3     315917           0         7      1        трешові
4     315917           0        12      1   трешові зато
...      ...         ...       ...    ...            ...
3230  315917         215       224      1    ##лати нови
3231  315917         215       226      1  ##лати новину
3232  315917         220       224      0           нови
3233  315917         220       226      0         новину
3234  315917         224       226      1           ##ну

[3235 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     315993           0         1      0                  4
1     315993           0         2      0                4 ,
2     315993           0         3      0              4 , 6
3     315993           0         7      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/643 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     315993           0         1      0                  4
1     315993           0         2      1                4 ,
2     315993           0         3      1              4 , 6
3     315993           0         7      1          4 , 6 млн
4     315993           0        15      1  4 , 6 млн доларів
...      ...         ...       ...    ...                ...
5138  315993         322       331      1        ##лати нови
5139  315993         322       333      1      ##лати новину
5140  315993         327       331      0               нови
5141  315993         327       333      0             новину
5142  315993         331       333      1               ##ну

[5143 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     316025          -1         4      0           маиже
1     316025          -1         7      0         маиже в
2     316025          -1        10      0      маиже втри
3     31602

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     316025          -1         4      0           маиже
1     316025          -1         7      1         маиже в
2     316025          -1        10      1      маиже втри
3     316025          -1        12      1    маиже втричі
4     316025          -1        14      1  маиже втричі з
...      ...         ...       ...    ...             ...
7612  316025         363       372      1     ##лати нови
7613  316025         363       374      1   ##лати новину
7614  316025         368       372      0            нови
7615  316025         368       374      0          новину
7616  316025         372       374      1            ##ну

[7617 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     316222           0         3      0            укр
1     316222           0         5      0          укрит
2     316222           0         7      0        укриття
3     316222           0         8      0      укри

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     316222           0         3      1            укр
1     316222           0         5      1          укрит
2     316222           0         7      1        укриття
3     316222           0         8      1      укриття ,
4     316222           0        12      1  укриття , две
...      ...         ...       ...    ...            ...
7005  316222         358       367      1    ##лати нови
7006  316222         358       369      1  ##лати новину
7007  316222         363       367      0           нови
7008  316222         363       369      0         новину
7009  316222         367       369      1           ##ну

[7010 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     316438           0         1      0               в
1     316438           0         7      0         в голов
2     316438           0         8      0        в голове
3     316438           0        11      0     в голове не
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/581 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     316438           0         1      0               в
1     316438           0         7      1         в голов
2     316438           0         8      1        в голове
3     316438           0        11      1     в голове не
4     316438           0        14      1  в голове не ук
...      ...         ...       ...    ...             ...
4642  316438         263       272      1     ##лати нови
4643  316438         263       274      1   ##лати новину
4644  316438         268       272      0            нови
4645  316438         268       274      0          новину
4646  316438         272       274      1            ##ну

[4647 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     316588           0         2      0                на
1     316588           0         6      0            на 100
2     316588           0        10      0        на 100 тис
3     316588           0        11     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/776 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     316588           0         2      0                на
1     316588           0         6      1            на 100
2     316588           0        10      1        на 100 тис
3     316588           0        11      0      на 100 тис .
4     316588           0        15      0  на 100 тис . мал
...      ...         ...       ...    ...               ...
6202  316588         298       307      1       ##лати нови
6203  316588         298       309      1     ##лати новину
6204  316588         303       307      0              нови
6205  316588         303       309      0            новину
6206  316588         307       309      1              ##ну

[6207 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     316698           0         3      0            при
1     316698           0         5      0          приві
2     316698           0         6      0         привіз
3     316698           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/776 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     316698           0         3      0            при
1     316698           0         5      1          приві
2     316698           0         6      1         привіз
3     316698           0         2      1     привіз бои
4     316698           0        13      1  привіз боиову
...      ...         ...       ...    ...            ...
6201  316698         331       340      1    ##лати нови
6202  316698         331       342      1  ##лати новину
6203  316698         336       340      0           нови
6204  316698         336       342      0         новину
6205  316698         340       342      1           ##ну

[6206 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     316701           0         4      0               коли
1     316701           0        11      0        коли сказал
2     316701           0        12      0       коли сказали
3     316701           0        13      0     к

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     316701           0         4      0               коли
1     316701           0        11      1        коли сказал
2     316701           0        12      1       коли сказали
3     316701           0        13      1     коли сказали ,
4     316701           0        16      1  коли сказали , що
...      ...         ...       ...    ...                ...
3557  316701         205       214      1        ##лати нови
3558  316701         205       216      1      ##лати новину
3559  316701         210       214      0               нови
3560  316701         210       216      0             новину
3561  316701         214       216      1               ##ну

[3562 rows x 5 columns]
           id  seq_starts  seq_ends  label            text
0      316718           0         3      0             пер
1      316718           0         5      0           переп
2      316718           0         9      0       переплата
3      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1433 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0      316718           0         3      0             пер
1      316718           0         5      1           переп
2      316718           0         9      1       переплата
3      316718           0        12      1    переплата за
4      316718           0        14      1  переплата за т
...       ...         ...       ...    ...             ...
11459  316718         364       373      1     ##лати нови
11460  316718         364       375      1   ##лати новину
11461  316718         369       373      0            нови
11462  316718         369       375      0          новину
11463  316718         373       375      1            ##ну

[11464 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     31780           0         2      0             по
1     31780           0         4      0           поже
2     31780           0         8      0       пожежник
3     31780           0         9      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     31780           0         2      0             по
1     31780           0         4      1           поже
2     31780           0         8      1       пожежник
3     31780           0         9      1      пожежники
4     31780           0        13      1  пожежники лік
...     ...         ...       ...    ...            ...
2405  31780         206       210      1         ##гора
2406  31780         206       213      1      ##горання
2407  31780         206       215      0    ##горання .
2408  31780         210       213      1          ##ння
2409  31780         210       215      0        ##ння .

[2410 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     31990           0         6      0            велика
1     31990           0         9      0         велика по
2     31990           0        11      0       велика поже
3     31990           0        13      0     велика пожежа
4     31

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     31990           0         6      0            велика
1     31990           0         9      1         велика по
2     31990           0        11      1       велика поже
3     31990           0        13      1     велика пожежа
4     31990           0        16      1  велика пожежа на
...     ...         ...       ...    ...               ...
3647  31990         257       259      1              ##пе
3648  31990         257       261      1            ##пеку
3649  31990         257       263      0          ##пеку .
3650  31990         259       261      1              ##ку
3651  31990         259       263      0            ##ку .

[3652 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     32070           0         5      0                 скоро
1     32070           0        10      0            скорочення
2     32070           0        14      0        скорочення пер
3     32070    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     32070           0         5      0                 скоро
1     32070           0        10      1            скорочення
2     32070           0        14      1        скорочення пер
3     32070           0        18      1    скорочення персона
4     32070           0        20      1  скорочення персоналу
...     ...         ...       ...    ...                   ...
3478  32070         260       262      1                  ##бі
3479  32070         260       266      1              ##бітних
3480  32070         260       268      0            ##бітних .
3481  32070         262       266      1                ##тних
3482  32070         262       268      0              ##тних .

[3483 rows x 5 columns]
          id  seq_starts  seq_ends  label                        text
0     321621           0         2      0                          15
1     321621           0         8      0                    15 років
2     321

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                        text
0     321621           0         2      0                          15
1     321621           0         8      1                    15 років
2     321621           0        17      1           15 років отримали
3     321621           0        22      1      15 років отримали кола
4     321621           0        26      1  15 років отримали колабора
...      ...         ...       ...    ...                         ...
4841  321621         282       291      1                 ##лати нови
4842  321621         282       293      1               ##лати новину
4843  321621         287       291      0                        нови
4844  321621         287       293      0                      новину
4845  321621         291       293      1                        ##ну

[4846 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     321855           0         2      0                 го
1     321855 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/656 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     321855           0         2      0                 го
1     321855           0         4      1               готу
2     321855           0        10      1         готуватися
3     321855           0        13      1      готуватися до
4     321855           0        17      1  готуватися до під
...      ...         ...       ...    ...                ...
5236  321855         282       291      1        ##лати нови
5237  321855         282       293      1      ##лати новину
5238  321855         287       291      0               нови
5239  321855         287       293      0             новину
5240  321855         291       293      1               ##ну

[5241 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     322088           0         2      0             ро
1     322088           0         3      0            роз
2     322088           0         5      0          розпо
3     322088   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/735 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     322088           0         2      1             ро
1     322088           0         3      1            роз
2     322088           0         5      1          розпо
3     322088           0         8      1       розпочат
4     322088           0         9      1      розпочато
...      ...         ...       ...    ...            ...
5868  322088         303       312      1    ##лати нови
5869  322088         303       314      1  ##лати новину
5870  322088         308       312      0           нови
5871  322088         308       314      0         новину
5872  322088         312       314      1           ##ну

[5873 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     322102           0         3      0            сил
1     322102           0         6      0         сильні
2     322102           0         8      0       сильні с
3     322102           0        10      0     сильні сні
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     322102           0         3      0            сил
1     322102           0         6      1         сильні
2     322102           0         8      1       сильні с
3     322102           0        10      1     сильні сні
4     322102           0        12      1   сильні сніго
...      ...         ...       ...    ...            ...
4358  322102         246       255      1    ##лати нови
4359  322102         246       257      1  ##лати новину
4360  322102         251       255      0           нови
4361  322102         251       257      0         новину
4362  322102         255       257      1           ##ну

[4363 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     322206           0         1      0              з
1     322206           0         4      0           збер
2     322206           0         7      0        зберіга
3     322206           0         8      0       зберігав
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/657 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     322206           0         1      0              з
1     322206           0         4      1           збер
2     322206           0         7      1        зберіга
3     322206           0         8      1       зберігав
4     322206           0        11      1    зберігав на
...      ...         ...       ...    ...            ...
5244  322206         293       302      1    ##лати нови
5245  322206         293       304      1  ##лати новину
5246  322206         298       302      0           нови
5247  322206         298       304      0         новину
5248  322206         302       304      1           ##ну

[5249 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     322316          -1         8      0             віиськово
1     322316          -1        11      0           віиськовозо
2     322316          -1        14      0        віиськовозобов
3     322316          -1        18 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     322316          -1         8      0             віиськово
1     322316          -1        11      1           віиськовозо
2     322316          -1        14      1        віиськовозобов
3     322316          -1        18      1    віиськовозобовязан
4     322316          -1        20      1  віиськовозобовязаним
...      ...         ...       ...    ...                   ...
3310  322316         235       244      1           ##лати нови
3311  322316         235       246      1         ##лати новину
3312  322316         240       244      0                  нови
3313  322316         240       246      0                новину
3314  322316         244       246      1                  ##ну

[3315 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     322364           0         2      0             ма
1     322364           0         2      0          мамаи
2     322364           0         7  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/468 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     322364           0         2      0             ма
1     322364           0         2      1          мамаи
2     322364           0         7      1        мамаи з
3     322364           0         9      1      мамаи зни
4     322364           0        11      1    мамаи знищу
...      ...         ...       ...    ...            ...
3732  322364         238       247      1    ##лати нови
3733  322364         238       249      1  ##лати новину
3734  322364         243       247      0           нови
3735  322364         243       249      0         новину
3736  322364         247       249      1           ##ну

[3737 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     322445           0         5      0              добре
1     322445           0         6      0            добре ,
2     322445           0        11      0       добре , якщо
3     322445           0        15      0   доб

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     322445           0         5      0              добре
1     322445           0         6      1            добре ,
2     322445           0        11      1       добре , якщо
3     322445           0        15      1   добре , якщо жив
4     322445           0        16      1  добре , якщо живі
...      ...         ...       ...    ...                ...
7005  322445         392       401      1        ##лати нови
7006  322445         392       403      1      ##лати новину
7007  322445         397       401      0               нови
7008  322445         397       403      0             новину
7009  322445         401       403      1               ##ну

[7010 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     32260           0         4      0                 уряд
1     32260           0         7      0              урядові
2     32260           0        13      0        урядові с

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     32260           0         4      0                 уряд
1     32260           0         7      1              урядові
2     32260           0        13      1        урядові стати
3     32260           0        16      1     урядові статисти
4     32260           0        19      1  урядові статистичні
...     ...         ...       ...    ...                  ...
2269  32260          -1         5      1             ##рськоі
2270  32260          -1       222      1    ##рськоі політики
2271  32260          -1       224      0  ##рськоі політики .
2272  32260         214       222      0             політики
2273  32260         214       224      0           політики .

[2274 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     322649           0         6      0           рівень
1     322649           0         8      0         рівень з
2     322649           0        11      0      рівень 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1031 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     322649           0         6      0           рівень
1     322649           0         8      1         рівень з
2     322649           0        11      1      рівень зрад
3     322649           0        12      1     рівень зради
4     322649           0        15      1  рівень зради та
...      ...         ...       ...    ...              ...
8238  322649          -1         1      1             ##уи
8239  322649          -1        33      1           ##уися
8240  322649          -1       371      1         ##уися :
8241  322649          31        33      1             ##ся
8242  322649          31       371      1           ##ся :

[8243 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     322869           0         3      0            пол
1     322869           0         6      0         полтав
2     322869           0         8      0       полтавці
3     322869           0         9     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/534 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     322869           0         3      0            пол
1     322869           0         6      1         полтав
2     322869           0         8      1       полтавці
3     322869           0         9      1     полтавці ,
4     322869           0        12      1  полтавці , ло
...      ...         ...       ...    ...            ...
4266  322869         244       253      1    ##лати нови
4267  322869         244       255      1  ##лати новину
4268  322869         249       253      0           нови
4269  322869         249       255      0         новину
4270  322869         253       255      1           ##ну

[4271 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     322871           0         1      0               у
1     322871           0         3      0             ухи
2     322871           0         6      0          ухилян
3     322871           0         9      0       ухилянтам
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     322871           0         1      0               у
1     322871           0         3      1             ухи
2     322871           0         6      1          ухилян
3     322871           0         9      1       ухилянтам
4     322871           0        14      1  ухилянтам блок
...      ...         ...       ...    ...             ...
7613  322871         363       372      1     ##лати нови
7614  322871         363       374      1   ##лати новину
7615  322871         368       372      0            нови
7616  322871         368       374      0          новину
7617  322871         372       374      1            ##ну

[7618 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     323118           0         4      0             нова
1     323118           0         7      0          нова па
2     323118           0        10      0       нова панде
3     323118           0        13      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/892 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     323118           0         4      0             нова
1     323118           0         7      1          нова па
2     323118           0        10      1       нова панде
3     323118           0        13      1    нова пандемія
4     323118           0        14      1  нова пандемія ?
...      ...         ...       ...    ...              ...
7125  323118         346       355      1      ##лати нови
7126  323118         346       357      1    ##лати новину
7127  323118         351       355      0             нови
7128  323118         351       357      0           новину
7129  323118         355       357      1             ##ну

[7130 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     323292           0         2      0              76
1     323292           0         6      0          76 нар
2     323292           0         8      0        76 нарко
3     323292           0        11 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     323292           0         2      0              76
1     323292           0         6      1          76 нар
2     323292           0         8      1        76 нарко
3     323292           0        11      1     76 наркозак
4     323292           0        14      1  76 наркозаклад
...      ...         ...       ...    ...             ...
5553  323292         296       305      1     ##лати нови
5554  323292         296       307      1   ##лати новину
5555  323292         301       305      0            нови
5556  323292         301       307      0          новину
5557  323292         305       307      1            ##ну

[5558 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     32330           0         4      0          мали
1     32330           0        35      0         малии
2     32330           0         0      0       малии б
3     32330           0         9      0     малии біз
4   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     32330           0         4      0          мали
1     32330           0        35      1         малии
2     32330           0         0      1       малии б
3     32330           0         9      1     малии біз
4     32330           0        12      1  малии бізнес
...     ...         ...       ...    ...           ...
2765  32330         206       210      1          прав
2766  32330         206       212      1        правди
2767  32330         206       214      0      правди .
2768  32330         210       212      1          ##ди
2769  32330         210       214      0        ##ди .

[2770 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     32430           0         2      0               не
1     32430           0         4      0             необ
2     32430           0         7      0          необхід
3     32430           0        12      0     необхідність
4     32430           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     32430           0         2      1               не
1     32430           0         4      1             необ
2     32430           0         7      1          необхід
3     32430           0        12      1     необхідність
4     32430           0        15      1  необхідність ім
...     ...         ...       ...    ...              ...
3231  32430         287       288      0                в
3232  32430         287         5      1         в краіні
3233  32430         287       297      0       в краіні .
3234  32430          -1         5      0           краіні
3235  32430          -1       297      0         краіні .

[3236 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     32470           0         2      0             за
1     32470           0         5      0          закор
2     32470           0         8      0       закордон
3     32470           0        10      0     закордонні

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/511 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     32470           0         2      0             за
1     32470           0         5      1          закор
2     32470           0         8      1       закордон
3     32470           0        10      1     закордонні
4     32470           0        13      1  закордонні ін
...     ...         ...       ...    ...            ...
4083  32470         305       306      0              в
4084  32470         305         5      1       в краіні
4085  32470         305       315      0     в краіні .
4086  32470          -1         5      0         краіні
4087  32470          -1       315      0       краіні .

[4088 rows x 5 columns]
         id  seq_starts  seq_ends  label                          text
0     32500           0         2      0                            за
1     32500           0         7      0                   за останніи
2     32500           0        15      0               за останніи рік
3     32500        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                          text
0     32500           0         2      0                            за
1     32500           0         7      1                   за останніи
2     32500           0        15      1               за останніи рік
3     32500           0        25      1     за останніи рік кількість
4     32500           0        28      1  за останніи рік кількість ви
...     ...         ...       ...    ...                           ...
3390  32500         246       248      1                          ##ош
3391  32500         246         1      1                        ##ошеи
3392  32500         246       252      0                      ##ошеи .
3393  32500          -1         1      1                          ##еи
3394  32500          -1       252      0                        ##еи .

[3395 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     32510           0         2      0                 де
1  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     32510           0         2      1                 де
1     32510           0         5      1              десят
2     32510           0         7      1            десятки
3     32510           0         4      1      десятки дітеи
4     32510           0        17      1  десятки дітеи зал
...     ...         ...       ...    ...                ...
4742  32510         287       289      1               ##ош
4743  32510         287         1      1             ##ошеи
4744  32510         287       293      0           ##ошеи .
4745  32510          -1         1      1               ##еи
4746  32510          -1       293      0             ##еи .

[4747 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     32520          -1         6      0             історіі
1     32520          -1        11      0         історіі про
2     32520          -1        14      0      історіі про ки
3     32520

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     32520          -1         6      0             історіі
1     32520          -1        11      1         історіі про
2     32520          -1        14      1      історіі про ки
3     32520          -1        17      1   історіі про кинут
4     32520          -1        18      1  історіі про кинуті
...     ...         ...       ...    ...                 ...
4741  32520         289       291      1                ##ош
4742  32520         289         1      1              ##ошеи
4743  32520         289       295      0            ##ошеи .
4744  32520          -1         1      1                ##еи
4745  32520          -1       295      0              ##еи .

[4746 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     32600           0         2      0              не
1     32600           0         4      0            недо
2     32600           0         8      0        недостат
3     32600    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/805 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     32600           0         2      1              не
1     32600           0         4      1            недо
2     32600           0         8      1        недостат
3     32600           0        10      1      недостатня
4     32600           0        14      1  недостатня під
...     ...         ...       ...    ...             ...
6429  32600         319       321      1            ##ош
6430  32600         319         1      1          ##ошеи
6431  32600         319       325      0        ##ошеи .
6432  32600          -1         1      1            ##еи
6433  32600          -1       325      0          ##еи .

[6434 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    32680           1         2      0                ч
1    32680           1         5      0             чому
2    32680           1        12      0      чому журнал
3    32680           1        15      0   чому журналіст
4    3

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/55 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    32680           1         2      1                ч
1    32680           1         5      1             чому
2    32680           1        12      1      чому журнал
3    32680           1        15      1   чому журналіст
4    32680           1        16      1  чому журналісти
..     ...         ...       ...    ...              ...
429  32680          98       105      1          продукт
430  32680          98       106      1         продукту
431  32680          98       107      1       продукту ?
432  32680         105       106      1              ##у
433  32680         105       107      1            ##у ?

[434 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    32770           1         3      0               чи
1    32770           1         9      0         чи можна
2    32770           1        12      0      чи можна до
3    32770           1        14      0    чи можна дові
4    32

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/58 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    32770           1         3      1               чи
1    32770           1         9      1         чи можна
2    32770           1        12      1      чи можна до
3    32770           1        14      1    чи можна дові
4    32770           1        16      1  чи можна довіря
..     ...         ...       ...    ...              ...
458  32770         127       131      1           ##сько
459  32770         127       134      1        ##ськості
460  32770         127       135      1      ##ськості ?
461  32770         131       134      1            ##сті
462  32770         131       135      1          ##сті ?

[463 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    32880           1         3      0               чи
1    32880           1         9      0         чи можна
2    32880           1        12      0      чи можна до
3    32880           1        14      0    чи можна дові
4    32

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    32880           1         3      1               чи
1    32880           1         9      1         чи можна
2    32880           1        12      1      чи можна до
3    32880           1        14      1    чи можна дові
4    32880           1        16      1  чи можна довіря
..     ...         ...       ...    ...              ...
588  32880          43        44      0                з
589  32880          43       118      1              змі
590  32880          43       119      1            змі ?
591  32880         116       118      1             ##мі
592  32880         116       119      1           ##мі ?

[593 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    32920           1         2      0               ч
1    32920           1         5      0            чому
2    32920           1        11      0      чому деякі
3    32920           1        13      0    чому деякі з
4    32920  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    32920           1         2      1               ч
1    32920           1         5      1            чому
2    32920           1        11      1      чому деякі
3    32920           1        13      1    чому деякі з
4    32920           1        15      1  чому деякі змі
..     ...         ...       ...    ...             ...
588  32920         109       110      0               в
589  32920         109         5      1        в краіні
590  32920         109       118      1      в краіні ?
591  32920          -1         5      0          краіні
592  32920          -1       118      1        краіні ?

[593 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    32930           1         3      0               чи
1    32930           1         9      0         чи можна
2    32930           1        12      0      чи можна до
3    32930           1        14      0    чи можна дові
4    32930         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/62 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    32930           1         3      1               чи
1    32930           1         9      1         чи можна
2    32930           1        12      1      чи можна до
3    32930           1        14      1    чи можна дові
4    32930           1        16      1  чи можна довіря
..     ...         ...       ...    ...              ...
490  32930         112       114      1             ##єм
491  32930         112       117      1          ##ємств
492  32930         112       118      1        ##ємств ?
493  32930         114       117      1            ##ств
494  32930         114       118      1          ##ств ?

[495 rows x 5 columns]
        id  seq_starts  seq_ends  label        text
0    32940           1         2      0           ч
1    32940           1         5      0        чому
2    32940           1         7      0      чому у
3    32940           1         9      0    чому у з
4    32940           1        11

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label        text
0    32940           1         2      1           ч
1    32940           1         5      1        чому
2    32940           1         7      1      чому у
3    32940           1         9      1    чому у з
4    32940           1        11      1  чому у змі
..     ...         ...       ...    ...         ...
589  32940         114       121      1     продукт
590  32940         114       122      1    продукту
591  32940         114       123      1  продукту ?
592  32940         121       122      1         ##у
593  32940         121       123      1       ##у ?

[594 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    32970           1         2      0                ч
1    32970           1         5      0             чому
2    32970           1         9      0         чому укр
3    32970           1        10      0        чому укра
4    32970           1         5      0  чому украінські
..     ...

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/84 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    32970           1         2      1                ч
1    32970           1         5      1             чому
2    32970           1         9      1         чому укр
3    32970           1        10      1        чому укра
4    32970           1         5      1  чому украінські
..     ...         ...       ...    ...              ...
660  32970         116       117      0                в
661  32970         116         5      1         в краіні
662  32970         116       125      1       в краіні ?
663  32970          -1         5      0           краіні
664  32970          -1       125      1         краіні ?

[665 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    33000           1         2      0               ч
1    33000           1         5      0            чому
2    33000           1        11      0      чому деякі
3    33000           1        13      0    чому деякі з
4    33000  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    33000           1         2      1               ч
1    33000           1         5      1            чому
2    33000           1        11      1      чому деякі
3    33000           1        13      1    чому деякі з
4    33000           1        15      1  чому деякі змі
..     ...         ...       ...    ...             ...
773  33000         119       120      0               в
774  33000         119         5      1        в краіні
775  33000         119       128      1      в краіні ?
776  33000          -1         5      0          краіні
777  33000          -1       128      1        краіні ?

[778 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    33010           1         2      0                ч
1    33010           1         5      0             чому
2    33010           1         9      0         чому укр
3    33010           1        10      0        чому укра
4    33010         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    33010           1         2      1                ч
1    33010           1         5      1             чому
2    33010           1         9      1         чому укр
3    33010           1        10      1        чому укра
4    33010           1         5      1  чому украінські
..     ...         ...       ...    ...              ...
814  33010         124       131      1          продукт
815  33010         124       132      1         продукту
816  33010         124       133      1       продукту ?
817  33010         131       132      1              ##у
818  33010         131       133      1            ##у ?

[819 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    33030           1         2      0               ч
1    33030           1         5      0            чому
2    33030           1        11      0      чому деякі
3    33030           1        13      0    чому деякі з
4    33030  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/124 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    33030           1         2      1               ч
1    33030           1         5      1            чому
2    33030           1        11      1      чому деякі
3    33030           1        13      1    чому деякі з
4    33030           1        15      1  чому деякі змі
..     ...         ...       ...    ...             ...
983  33030          50        51      0               с
984  33030          50       149      1           сфери
985  33030          50       150      1         сфери ?
986  33030         145       149      1          ##фери
987  33030         145       150      1        ##фери ?

[988 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    33100           1         2      0                ч
1    33100           1         5      0             чому
2    33100           1         9      0         чому укр
3    33100           1        10      0        чому укра
4    33100         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    33100           1         2      1                ч
1    33100           1         5      1             чому
2    33100           1         9      1         чому укр
3    33100           1        10      1        чому укра
4    33100           1         5      1  чому украінські
..     ...         ...       ...    ...              ...
896  33100         139       141      1             ##ру
897  33100         139       146      1        ##рутства
898  33100         139       147      1      ##рутства ?
899  33100         141       146      1          ##тства
900  33100         141       147      1        ##тства ?

[901 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     33110           1         2      0               ч
1     33110           1         5      0            чому
2     33110           1        11      0      чому деякі
3     33110           1        13      0    чому деякі з
4     3

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     33110           1         2      1               ч
1     33110           1         5      1            чому
2     33110           1        11      1      чому деякі
3     33110           1        13      1    чому деякі з
4     33110           1        15      1  чому деякі змі
...     ...         ...       ...    ...             ...
1029  33110         154       157      1           ##іку
1030  33110         154         5      1    ##іку краіни
1031  33110         154       165      1  ##іку краіни ?
1032  33110          -1         5      0          краіни
1033  33110          -1       165      1        краіни ?

[1034 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     33120           1         2      0                ч
1     33120           1         5      0             чому
2     33120           1         9      0         чому укр
3     33120           1        10      0        чому укра
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/141 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     33120           1         2      1                ч
1     33120           1         5      1             чому
2     33120           1         9      1         чому укр
3     33120           1        10      1        чому укра
4     33120           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1121  33120         137       139      0               на
1122  33120         137       145      1         на ринку
1123  33120         137       146      1       на ринку ?
1124  33120         140       145      0            ринку
1125  33120         140       146      1          ринку ?

[1126 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     33160           1         2      0                ч
1     33160           1         5      0             чому
2     33160           1         9      0         чому укр
3     33160           1        10      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     33160           1         2      1                ч
1     33160           1         5      1             чому
2     33160           1         9      1         чому укр
3     33160           1        10      1        чому укра
4     33160           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1028  33160         156       159      1            ##нес
1029  33160         156       160      1           ##несу
1030  33160         156       161      1         ##несу ?
1031  33160         159       160      1              ##у
1032  33160         159       161      1            ##у ?

[1033 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     33190           1         2      0               ч
1     33190           1         5      0            чому
2     33190           1        11      0      чому деякі
3     33190           1        13      0    чому де

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     33190           1         2      1               ч
1     33190           1         5      1            чому
2     33190           1        11      1      чому деякі
3     33190           1        13      1    чому деякі з
4     33190           1        15      1  чому деякі змі
...     ...         ...       ...    ...             ...
1028  33190         125       127      1            ##єм
1029  33190         125       130      1         ##ємств
1030  33190         125       131      1       ##ємств ?
1031  33190         127       130      1           ##ств
1032  33190         127       131      1         ##ств ?

[1033 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    33210           1         2      0                ч
1    33210           1         5      0             чому
2    33210           1        11      0       чому деякі
3    33210           1        14      0    чому деякі ме
4    3

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/124 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    33210           1         2      1                ч
1    33210           1         5      1             чому
2    33210           1        11      1       чому деякі
3    33210           1        14      1    чому деякі ме
4    33210           1        16      1  чому деякі меді
..     ...         ...       ...    ...              ...
984  33210         142       145      1            ##нес
985  33210         142       147      1          ##несів
986  33210         142       148      1        ##несів ?
987  33210         145       147      1             ##ів
988  33210         145       148      1           ##ів ?

[989 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    33230           1         2      0               ч
1    33230           1         5      0            чому
2    33230           1        11      0      чому деякі
3    33230           1        13      0    чому деякі з
4    33230  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    33230           1         2      1               ч
1    33230           1         5      1            чому
2    33230           1        11      1      чому деякі
3    33230           1        13      1    чому деякі з
4    33230           1        15      1  чому деякі змі
..     ...         ...       ...    ...             ...
854  33230         117       120      1           ##нес
855  33230         117       122      1         ##несам
856  33230         117       123      1       ##несам ?
857  33230         120       122      1            ##ам
858  33230         120       123      1          ##ам ?

[859 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    33340           0         2      0              ме
1    33340           0         4      0            меді
2    33340           0         5      0           медіа
3    33340           0        11      0     медіа часто
4    33340           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/124 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    33340           0         2      0              ме
1    33340           0         4      1            меді
2    33340           0         5      1           медіа
3    33340           0        11      1     медіа часто
4    33340           0        14      1  медіа часто ро
..     ...         ...       ...    ...             ...
982  33340         139       140      0               з
983  33340         139       142      1             змі
984  33340         139       143      1           змі ?
985  33340         140       142      1            ##мі
986  33340         140       143      1          ##мі ?

[987 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    33380           0         3      0                деп
1    33380           0         6      0             депрес
2    33380           0         8      0           депресія
3    33380           0        14      0     депресія серед
4    3338

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    33380           0         3      0                деп
1    33380           0         6      0             депрес
2    33380           0         8      0           депресія
3    33380           0        14      0     депресія серед
4    33380           0        17      0  депресія серед мо
..     ...         ...       ...    ...                ...
813  33380          -1         2      0                неі
814  33380          -1       123      1          неі увагу
815  33380          -1       124      1        неі увагу ?
816  33380         118       123      0              увагу
817  33380         118       124      1            увагу ?

[818 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     334143           0         3      0                   " не
1     334143           0         9      0             " не треба
2     334143           0        12      0          " не треба па
3     33

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     334143           0         3      1                   " не
1     334143           0         9      1             " не треба
2     334143           0        12      1          " не треба па
3     334143           0        15      1       " не треба панік
4     334143           0        20      1  " не треба панікувати
...      ...         ...       ...    ...                    ...
2990  334143         212       218      1                 подпис
2991  334143         212       223      1            подписаться
2992  334143         215       218      1                  ##пис
2993  334143         215       223      1             ##писаться
2994  334143         218       223      1                ##аться

[2995 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    33460           0         3      0            деп
1    33460           0         6      0         депрес
2    33460           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/102 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    33460           0         3      0            деп
1    33460           0         6      0         депрес
2    33460           0         8      0       депресія
3    33460           0        10      0     депресія у
4    33460           0        13      0  депресія у мо
..     ...         ...       ...    ...            ...
811  33460         103       105      1           ##го
812  33460         103       106      1          ##гою
813  33460         103       107      1        ##гою ?
814  33460         105       106      1            ##ю
815  33460         105       107      1          ##ю ?

[816 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    33490           0         3      0            пор
1    33490           0         5      0          поруш
2    33490           0         9      0      порушення
3    33490           0        11      0    порушення п
4    33490           0        13      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/58 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    33490           0         3      1            пор
1    33490           0         5      1          поруш
2    33490           0         9      1      порушення
3    33490           0        11      1    порушення п
4    33490           0        13      1  порушення пси
..     ...         ...       ...    ...            ...
458  33490          86        87      0              з
459  33490          86        89      1            змі
460  33490          86        90      1          змі ?
461  33490          87        89      1           ##мі
462  33490          87        90      1         ##мі ?

[463 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     33550           0         3      0            деп
1     33550           0         6      0         депрес
2     33550           0         8      0       депресія
3     33550           0        10      0     депресія у
4     33550           0        13   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     33550           0         3      0            деп
1     33550           0         6      0         депрес
2     33550           0         8      0       депресія
3     33550           0        10      0     депресія у
4     33550           0        13      0  депресія у ма
...     ...         ...       ...    ...            ...
1644  33550         152       158      0         здоров
1645  33550         152       159      1        здоровя
1646  33550         152       160      1      здоровя ?
1647  33550         158       159      1            ##я
1648  33550         158       160      1          ##я ?

[1649 rows x 5 columns]
         id  seq_starts  seq_ends  label                      text
0     33810           0         3      0                       під
1     33810           0         5      0                     підви
2     33810           0        10      0                підвищення
3     33810           0        17  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/141 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                      text
0     33810           0         3      0                       під
1     33810           0         5      1                     підви
2     33810           0        10      1                підвищення
3     33810           0        17      1         підвищення якості
4     33810           0        24      1  підвищення якості освіти
...     ...         ...       ...    ...                       ...
1120  33810          -1         3      1                    ##ьноі
1121  33810          -1       164      1            ##ьноі системи
1122  33810          -1       165      1          ##ьноі системи ?
1123  33810         157       164      1                   системи
1124  33810         157       165      1                 системи ?

[1125 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     33910           0         1      0               б
1     33910           0         2      0              бю


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     33910           0         1      1               б
1     33910           0         2      1              бю
2     33910           0         4      1            бюдж
3     33910           0         6      1          бюджет
4     33910           0         8      1        бюджетні
...     ...         ...       ...    ...             ...
1216  33910         123       126      1           ##сть
1217  33910         123       133      1    ##сть освіти
1218  33910         123       134      1  ##сть освіти ?
1219  33910         127       133      0          освіти
1220  33910         127       134      1        освіти ?

[1221 rows x 5 columns]
         id  seq_starts  seq_ends  label                    text
0     34210           0         6      0                  жителі
1     34210           0         5      0           жителі раиону
2     34210           0        16      0        жителі раиону ви
3     34210           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                    text
0     34210           0         6      0                  жителі
1     34210           0         5      1           жителі раиону
2     34210           0        16      1        жителі раиону ви
3     34210           0        21      1   жителі раиону виходят
4     34210           0        22      1  жителі раиону виходять
...     ...         ...       ...    ...                     ...
2137  34210         178       181      0                     сто
2138  34210         178       184      1                  сторін
2139  34210         178       185      1                сторін ?
2140  34210         181       184      1                   ##рін
2141  34210         181       185      1                 ##рін ?

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     34250           0         5      0                  місце
1     34250           0         7      0                місцева
2  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     34250           0         5      0                  місце
1     34250           0         7      1                місцева
2     34250           0        15      1        місцева громада
3     34250           0        18      1     місцева громада об
4     34250           0        21      1  місцева громада обуре
...     ...         ...       ...    ...                    ...
2137  34250         201       206      1                ##льних
2138  34250         201       211      1           ##льних осіб
2139  34250         201       212      1         ##льних осіб ?
2140  34250         207       211      0                   осіб
2141  34250         207       212      1                 осіб ?

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     34310           0         6      0                жителі
1     34310           0         5      0         жителі раиону
2     34310       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     34310           0         6      0                жителі
1     34310           0         5      1         жителі раиону
2     34310           0        16      1      жителі раиону зв
3     34310           0        18      1    жителі раиону звер
4     34310           0        20      1  жителі раиону зверта
...     ...         ...       ...    ...                   ...
2137  34310         192       195      1                 ##лік
2138  34310         192       197      1               ##лікту
2139  34310         192       198      1             ##лікту ?
2140  34310         195       197      1                  ##ту
2141  34310         195       198      1                ##ту ?

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     34320           0         3      0           акт
1     34320           0         5      0         актив
2     34320           0         8      0      активіст

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     34320           0         3      1           акт
1     34320           0         5      1         актив
2     34320           0         8      1      активіст
3     34320           0         9      1     активісти
4     34320           0        12      1  активісти зв
...     ...         ...       ...    ...           ...
2407  34320         199       202      1         ##них
2408  34320         199       207      1    ##них осіб
2409  34320         199       208      1  ##них осіб ?
2410  34320         203       207      0          осіб
2411  34320         203       208      1        осіб ?

[2412 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     34370           0         5      0              місце
1     34370           0         7      0            місцеві
2     34370           0        10      0         місцеві ме
3     34370           0        14      0     місцеві мешкан
4     34370    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/329 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     34370           0         5      0              місце
1     34370           0         7      1            місцеві
2     34370           0        10      1         місцеві ме
3     34370           0        14      1     місцеві мешкан
4     34370           0        16      1   місцеві мешканці
...     ...         ...       ...    ...                ...
2620  34370         232       239      1          ##льність
2621  34370         232       245      1    ##льність влади
2622  34370         232       246      1  ##льність влади ?
2623  34370         240       245      0              влади
2624  34370         240       246      1            влади ?

[2625 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     34410           0         2      0                 ме
1     34410           0         6      0             мешкан
2     34410           0         8      0           мешканці
3     34410    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/244 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     34410           0         2      0                 ме
1     34410           0         6      1             мешкан
2     34410           0         8      1           мешканці
3     34410           0        14      1     мешканці міста
4     34410           0        17      1  мешканці міста ви
...     ...         ...       ...    ...                ...
1945  34410         207       212      0              цього
1946  34410         207       220      1      цього питання
1947  34410         207       221      1    цього питання ?
1948  34410         213       220      0            питання
1949  34410         213       221      1          питання ?

[1950 rows x 5 columns]
         id  seq_starts  seq_ends  label                     text
0     34530           0         5      0                    місце
1     34530           0         7      0                  місцеві
2     34530           0        14      0           місцев

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                     text
0     34530           0         5      0                    місце
1     34530           0         7      1                  місцеві
2     34530           0        14      1           місцеві органи
3     34530           0        20      1     місцеві органи влади
4     34530           0        23      1  місцеві органи влади за
...     ...         ...       ...    ...                      ...
2548  34530         216       220      1                   ##ивні
2549  34530         216       223      1                ##ивність
2550  34530         216       224      1              ##ивність ?
2551  34530         220       223      1                    ##сть
2552  34530         220       224      1                  ##сть ?

[2553 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     34580           0         2      0                  ме
1     34580           0         6      0              мешкан


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     34580           0         2      0                  ме
1     34580           0         6      1              мешкан
2     34580           0         8      1            мешканці
3     34580           0         5      1     мешканці раиону
4     34580           0        18      1  мешканці раиону ви
...     ...         ...       ...    ...                 ...
2767  34580         227       228      1                 ##м
2768  34580         227       237      1        ##м громадян
2769  34580         227       238      1      ##м громадян ?
2770  34580         229       237      0            громадян
2771  34580         229       238      1          громадян ?

[2772 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     34600           0         2      0            ро
1     34600           0         3      0           роз
2     34600           0         4      0          розк
3     34600           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


         id  seq_starts  seq_ends  label          text
0     34600           0         2      1            ро
1     34600           0         3      1           роз
2     34600           0         4      1          розк
3     34600           0         9      1     розкриття
4     34600           0        12      1  розкриття ви
...     ...         ...       ...    ...           ...
3478  34600         239       241      1          ##уш
3479  34600         239       244      1       ##ушень
3480  34600         239       245      1     ##ушень ?
3481  34600         241       244      1         ##ень
3482  34600         241       245      1       ##ень ?

[3483 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                   text
0      395098          -1         2      0                    все
1      395098          -1         5      0                  все в
2      395098          -1        12      0           все в открыт
3      395098          -1        14      0         все в открытом
4      395098          -1        21      0  все в открытом доступ
...       ...         ...       ...    ...                    ...
17351  395098         647       654      0                антон г
17352  395098         647       657      0             антон гура
17353  395098         653       654      0                      г
17354  395098         653       657      0                   гура
17355  395098         654       657      0                  ##ура

[17356 rows x 5 columns]
(17356, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2170 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                   text
0      395098          -1         2      0                    все
1      395098          -1         5      1                  все в
2      395098          -1        12      1           все в открыт
3      395098          -1        14      1         все в открытом
4      395098          -1        21      1  все в открытом доступ
...       ...         ...       ...    ...                    ...
17351  395098         647       654      1                антон г
17352  395098         647       657      1             антон гура
17353  395098         653       654      1                      г
17354  395098         653       657      1                   гура
17355  395098         654       657      1                  ##ура

[17356 rows x 5 columns]
        id  seq_starts  seq_ends  label          text
0    40090           0         2      0            че
1    40090           0         4      0          черг
2    40090          

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/66 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label          text
0    40090           0         2      0            че
1    40090           0         4      1          черг
2    40090           0         7      1       чергове
3    40090           0        10      1    чергове за
4    40090           0        12      1  чергове затя
..     ...         ...       ...    ...           ...
520  40090         106       108      1          ##ег
521  40090         106       110      1        ##егія
522  40090         106       111      1      ##егія ?
523  40090         108       110      1          ##ія
524  40090         108       111      1        ##ія ?

[525 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     401299          -1         3      0               киів
1     401299          -1         8      0           киіврада
2     401299          -1        12      0       киіврада вид
3     401299          -1        15      0    киіврада виділи
4     401299          -

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/790 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     401299          -1         3      0               киів
1     401299          -1         8      1           киіврада
2     401299          -1        12      1       киіврада вид
3     401299          -1        15      1    киіврада виділи
4     401299          -1        17      1  киіврада виділить
...      ...         ...       ...    ...                ...
6313  401299         312       314      1                 чп
6314  401299         312         6      1         чп украіна
6315  401299         313       314      1                ##п
6316  401299         313         6      1        ##п украіна
6317  401299          -1         6      1            украіна

[6318 rows x 5 columns]
        id  seq_starts  seq_ends  label                       text
0    40220           0         9      0                  німеччина
1    40220           0        15      0            німеччина знову
2    40220           0        19      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/62 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                       text
0    40220           0         9      0                  німеччина
1    40220           0        15      1            німеччина знову
2    40220           0        19      1        німеччина знову від
3    40220           0        22      1     німеччина знову відтер
4    40220           0        25      1  німеччина знову відтермін
..     ...         ...       ...    ...                        ...
488  40220         107       109      1                       ##ми
489  40220         107       112      1                    ##мисне
490  40220         107       113      0                  ##мисне .
491  40220         109       112      1                      ##сне
492  40220         109       113      0                    ##сне .

[493 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    40250          -1         6      0            украіна
1    40250          -1        10      0         украін

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label               text
0    40250          -1         6      1            украіна
1    40250          -1        10      1         украіна че
2    40250          -1        13      1      украіна чекає
3    40250          -1        16      1   украіна чекає об
4    40250          -1        17      1  украіна чекає обі
..     ...         ...       ...    ...                ...
937  40250         121       124      1              ##іда
938  40250         121       131      1       ##ідальності
939  40250         121       132      1     ##ідальності ?
940  40250         124       131      1          ##льності
941  40250         124       132      1        ##льності ?

[942 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    40420           0         3      0                 бер
1    40420           0         6      0              берлін
2    40420           0        12      0        берлін знову
3    40420           0      

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/44 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    40420           0         3      1                 бер
1    40420           0         6      1              берлін
2    40420           0        12      1        берлін знову
3    40420           0        15      1     берлін знову не
4    40420           0        18      1  берлін знову не ви
..     ...         ...       ...    ...                 ...
344  40420          85        88      1               ##гат
345  40420          85        89      1              ##гати
346  40420          85        90      1            ##гати ?
347  40420          88        89      1                 ##и
348  40420          88        90      1               ##и ?

[349 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    40640          -1         3      0              киів
1    40640          -1         7      0           киів че
2    40640          -1        10      0        киів чекає
3    40640          -1  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    40640          -1         3      0              киів
1    40640          -1         7      1           киів че
2    40640          -1        10      1        киів чекає
3    40640          -1        13      1     киів чекає на
4    40640          -1        16      1  киів чекає на об
..     ...         ...       ...    ...               ...
853  40640         104       107      1             ##зан
854  40640         104       108      1            ##зань
855  40640         104       109      1          ##зань ?
856  40640         107       108      1               ##ь
857  40640         107       109      1             ##ь ?

[858 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    40660           0         2      0                 бр
1    40660           0         5      0              брита
2    40660           0         8      0           британія
3    40660           0        14      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/62 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    40660           0         2      0                 бр
1    40660           0         5      1              брита
2    40660           0         8      1           британія
3    40660           0        14      1     британія знову
4    40660           0        17      1  британія знову за
..     ...         ...       ...    ...                ...
489  40660         104       105      1                ##і
490  40660         104         8      1      ##і підтримки
491  40660         104       113      1    ##і підтримки ?
492  40660          -1         8      0          підтримки
493  40660          -1       113      1        підтримки ?

[494 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    40770           0         6      0            лондон
1    40770           0         8      0          лондон в
2    40770           0        11      0       лондон вкот
3    40770           0        13    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/58 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    40770           0         6      0            лондон
1    40770           0         8      1          лондон в
2    40770           0        11      1       лондон вкот
3    40770           0        13      1     лондон вкотре
4    40770           0        16      1  лондон вкотре за
..     ...         ...       ...    ...               ...
458  40770          82        85      1             ##тне
459  40770          82        88      1          ##тнерам
460  40770          82        89      1        ##тнерам ?
461  40770          85        88      1             ##рам
462  40770          85        89      1           ##рам ?

[463 rows x 5 columns]
        id  seq_starts  seq_ends  label                   text
0    40820           0         6      0                 лондон
1    40820           0        12      0           лондон знову
2    40820           0        15      0        лондон знову зв
3    40820           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/51 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                   text
0    40820           0         6      0                 лондон
1    40820           0        12      1           лондон знову
2    40820           0        15      1        лондон знову зв
3    40820           0        18      1     лондон знову зволі
4    40820           0        21      1  лондон знову зволікає
..     ...         ...       ...    ...                    ...
399  40820          99       103      1                   союз
400  40820          99       107      1               союзника
401  40820          99       108      1             союзника ?
402  40820         103       107      1                 ##ника
403  40820         103       108      1               ##ника ?

[404 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    40940           0         2      0             чи
1    40940           0         6      0         чи сто
2    40940           0         1      0       чи стоіт


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    40940           0         2      1             чи
1    40940           0         6      1         чи сто
2    40940           0         1      1       чи стоіт
3    40940           0         9      1      чи стоіть
4    40940           0        13      1  чи стоіть під
..     ...         ...       ...    ...            ...
733  40940          -1         4      0          краін
734  40940          -1       125      1       краінами
735  40940          -1       126      0     краінами .
736  40940         122       125      1          ##ами
737  40940         122       126      0        ##ами .

[738 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     40950           0         2      0             чи
1     40950           0         5      0          чи це
2     40950           0         9      0      чи це стр
3     40950           0        11      0    чи це страт
4     40950           0        13   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/141 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     40950           0         2      1             чи
1     40950           0         5      1          чи це
2     40950           0         9      1      чи це стр
3     40950           0        11      1    чи це страт
4     40950           0        13      1  чи це стратег
...     ...         ...       ...    ...            ...
1122  40950         134       140      1       ##носина
1123  40950         134       141      1      ##носинах
1124  40950         137       140      1          ##ина
1125  40950         137       141      1         ##инах
1126  40950         140       141      1            ##х

[1127 rows x 5 columns]
        id  seq_starts  seq_ends  label                   text
0    41180           0         4      0                   союз
1    41180           0        10      0             союзництво
2    41180           0        13      0          союзництво на
3    41180           0        18      0     союзниц

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                   text
0    41180           0         4      1                   союз
1    41180           0        10      1             союзництво
2    41180           0        13      1          союзництво на
3    41180           0        18      1     союзництво на межі
4    41180           0        21      1  союзництво на межі ро
..     ...         ...       ...    ...                    ...
813  41180         113       116      1                  ##пра
814  41180         113       118      1                ##праці
815  41180         113       119      0              ##праці .
816  41180         116       118      1                   ##ці
817  41180         116       119      0                 ##ці .

[818 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    41320           0         1      0              з
1    41320           0         5      0          зрада
2    41320           0         9      0      зрада аль


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    41320           0         1      0              з
1    41320           0         5      1          зрада
2    41320           0         9      1      зрада аль
3    41320           0        11      1    зрада альян
4    41320           0        13      1  зрада альянсу
..     ...         ...       ...    ...            ...
938  41320         115       118      1          ##пра
939  41320         115       120      1        ##працю
940  41320         115       121      0      ##працю .
941  41320         118       120      1           ##цю
942  41320         118       121      0         ##цю .

[943 rows x 5 columns]
        id  seq_starts  seq_ends  label                   text
0    41390           0         2      0                     за
1    41390           0         5      0                  завер
2    41390           0        10      0             завершення
3    41390           0        15      0        завершення союз
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                   text
0    41390           0         2      0                     за
1    41390           0         5      1                  завер
2    41390           0        10      1             завершення
3    41390           0        15      1        завершення союз
4    41390           0        21      1  завершення союзництва
..     ...         ...       ...    ...                    ...
772  41390         147       150      1                  ##пра
773  41390         147       152      1                ##праці
774  41390         147       153      0              ##праці .
775  41390         150       152      1                   ##ці
776  41390         150       153      0                 ##ці .

[777 rows x 5 columns]
        id  seq_starts  seq_ends  label          text
0    41420           0         2      0            ро
1    41420           0         3      0           роз
2    41420           0         6      0        розкол
3   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label          text
0    41420           0         2      1            ро
1    41420           0         3      1           роз
2    41420           0         6      1        розкол
3    41420           0         9      1     розкол чи
4    41420           0        12      1  розкол чи по
..     ...         ...       ...    ...           ...
896  41420         121       124      1         ##омо
897  41420         121       126      1       ##омогу
898  41420         121       127      0     ##омогу .
899  41420         124       126      1          ##гу
900  41420         124       127      0        ##гу .

[901 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    41430           0         2      0                сп
1    41430           0         4      0              спів
2    41430           0         7      0           співпра
3    41430           0         9      0         співпраця
4    41430           0        13      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    41430           0         2      1                сп
1    41430           0         4      1              спів
2    41430           0         7      1           співпра
3    41430           0         9      1         співпраця
4    41430           0        13      1     співпраця або
..     ...         ...       ...    ...               ...
813  41430         131       136      1           ##ності
814  41430         131         5      1    ##ності краіни
815  41430         131       144      0  ##ності краіни .
816  41430          -1         5      0            краіни
817  41430          -1       144      0          краіни .

[818 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    41480           0         3      0             пол
1    41480           0         4      0            поль
2    41480           0         8      0        польська
3    41480           0        10      0      польська а


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    41480           0         3      0             пол
1    41480           0         4      1            поль
2    41480           0         8      1        польська
3    41480           0        10      1      польська а
4    41480           0        14      1  польська агрес
..     ...         ...       ...    ...             ...
895  41480         123       124      0               у
896  41480         123       130      1         у києві
897  41480         123       131      0       у києві .
898  41480         125       130      0           києві
899  41480         125       131      0         києві .

[900 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    41510           0         8      0           завдання
1    41510           0        11      0        завдання те
2    41510           0        14      0     завдання терит
3    41510           0        16      0   завдання територ
4    4151

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/51 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    41510           0         8      0           завдання
1    41510           0        11      1        завдання те
2    41510           0        14      1     завдання терит
3    41510           0        16      1   завдання територ
4    41510           0        17      1  завдання територі
..     ...         ...       ...    ...                ...
399  41510          80        87      0            області
400  41510          80         6      1    області украіни
401  41510          80        43      1  області украіни ?
402  41510          -1         6      0            украіни
403  41510          -1        43      1          украіни ?

[404 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     41640           0         4      0                   євро
1     41640           0         6      0                 європе
2     41640           0         5      0           європеиськии
3     41640 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/311 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     41640           0         4      0                   євро
1     41640           0         6      1                 європе
2     41640           0         5      1           європеиськии
3     41640           0        17      1      європеиськии союз
4     41640           0        21      1  європеиськии союз від
...     ...         ...       ...    ...                    ...
2477  41640         220       223      1                  ##нос
2478  41640         220       225      1                ##носин
2479  41640         220       226      0              ##носин .
2480  41640         223       225      1                   ##ин
2481  41640         223       226      0                 ##ин .

[2482 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     41650           0         2      0              чи
1     41650           0         5      0           чи ви
2     41650           0         8   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/237 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     41650           0         2      1              чи
1     41650           0         5      1           чи ви
2     41650           0         8      1        чи вияви
3     41650           0         9      1       чи виявив
4     41650           0        14      1  чи виявив євро
...     ...         ...       ...    ...             ...
1884  41650         185       188      1           ##нка
1885  41650         185       189      1          ##нках
1886  41650         185       190      0        ##нках .
1887  41650         188       189      1             ##х
1888  41650         188       190      0           ##х .

[1889 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     41690           0         2      0             ро
1     41690           0         3      0            роз
2     41690           0         6      0         розкол
3     41690           0         8      0       розкол у
4     41690

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     41690           0         2      1             ро
1     41690           0         3      1            роз
2     41690           0         6      1         розкол
3     41690           0         8      1       розкол у
4     41690           0        13      1  розкол у союз
...     ...         ...       ...    ...            ...
1477  41690          -1         4      0          краін
1478  41690          -1       145      1       краінами
1479  41690          -1       146      0     краінами .
1480  41690         142       145      1          ##ами
1481  41690         142       146      0        ##ами .

[1482 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     41800           0         2      0                   чи
1     41800           0         6      0               чи під
2     41800           0        12      0         чи підводить
3     41800           0        17      0    чи підводит

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/160 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     41800           0         2      1                   чи
1     41800           0         6      1               чи під
2     41800           0        12      1         чи підводить
3     41800           0        17      1    чи підводить євро
4     41800           0        19      1  чи підводить євросо
...     ...         ...       ...    ...                  ...
1268  41800         146       148      1                 ##ри
1269  41800         146       149      1                ##риз
1270  41800         146       150      0              ##риз .
1271  41800         148       149      1                  ##з
1272  41800         148       150      0                ##з .

[1273 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     41830           0         4      0              полі
1     41830           0         6      0            політи
2     41830           0         9      0         політ

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/260 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     41830           0         4      0              полі
1     41830           0         6      1            політи
2     41830           0         9      1         політичне
3     41830           0        11      1       політичне з
4     41830           0        15      1   політичне зрада
...     ...         ...       ...    ...               ...
2071  41830          -1       201      0  краін - членів .
2072  41830         193       200      1          - членів
2073  41830         193       201      0        - членів .
2074  41830         194       200      1            членів
2075  41830         194       201      0          членів .

[2076 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     41870           0         1      0             к
1     41870           0         3      0           кри
2     41870           0         5      0         криза
3     41870           0         9      0     кр

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     41870           0         1      0             к
1     41870           0         3      1           кри
2     41870           0         5      1         криза
3     41870           0         9      1     криза від
4     41870           0        12      1  криза віднос
...     ...         ...       ...    ...           ...
2137  41870         186       189      1         ##іль
2138  41870         186       193      1     ##ільстві
2139  41870         186       194      0   ##ільстві .
2140  41870         189       193      1        ##стві
2141  41870         189       194      0      ##стві .

[2142 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     41910           0         6      0            диплом
1     41910           0         9      0         дипломати
2     41910           0        12      0      дипломатичне
3     41910           0        15      0   дипломатичне ро
4     41910         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/366 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     41910           0         6      0            диплом
1     41910           0         9      1         дипломати
2     41910           0        12      1      дипломатичне
3     41910           0        15      1   дипломатичне ро
4     41910           0        16      1  дипломатичне роз
...     ...         ...       ...    ...               ...
2918  41910         241       244      1             ##пер
2919  41910         241       247      1          ##пертів
2920  41910         241       248      0        ##пертів .
2921  41910         244       247      1             ##тів
2922  41910         244       248      0           ##тів .

[2923 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     41920           0         2      0                 сп
1     41920           0         5      0              спрот
2     41920           0         7      0            спротив
3     41920           0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     41920           0         2      1                 сп
1     41920           0         5      1              спрот
2     41920           0         7      1            спротив
3     41920           0        12      1       спротив полі
4     41920           0        17      1  спротив політично
...     ...         ...       ...    ...                ...
2138  41920         195       197      1               ##ід
2139  41920         195       201      1           ##ідерів
2140  41920         195       202      0         ##ідерів .
2141  41920         197       201      1             ##ерів
2142  41920         197       202      0           ##ерів .

[2143 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     42040           0         6      0            диплом
1     42040           0         9      0         дипломати
2     42040           0        12      0      дипломатичне
3     42040        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     42040           0         6      0            диплом
1     42040           0         9      1         дипломати
2     42040           0        12      1      дипломатичне
3     42040           0        15      1   дипломатичне ро
4     42040           0        16      1  дипломатичне роз
...     ...         ...       ...    ...               ...
1646  42040         178       181      1             ##пра
1647  42040         178       183      1           ##праці
1648  42040         178       184      0         ##праці .
1649  42040         181       183      1              ##ці
1650  42040         181       184      0            ##ці .

[1651 rows x 5 columns]
         id  seq_starts  seq_ends  label                  text
0     42130           0         4      0                  євро
1     42130           0         6      0                європе
2     42130           0         5      0          європеиськии
3     42130    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/236 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                  text
0     42130           0         4      0                  євро
1     42130           0         6      1                європе
2     42130           0         5      1          європеиськии
3     42130           0        17      1     європеиськии союз
4     42130           0        20      1  європеиськии союз за
...     ...         ...       ...    ...                   ...
1883  42130         203       204      1                   ##д
1884  42130         203       207      1                ##дків
1885  42130         203       208      0              ##дків .
1886  42130         204       207      1                 ##ків
1887  42130         204       208      0               ##ків .

[1888 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     42200           0         3      0            оон
1     42200           0         5      0          оон о
2     42200           0         7      0        оон

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     42200           0         3      0            оон
1     42200           0         5      1          оон о
2     42200           0         7      1        оон опи
3     42200           0        11      1    оон опинила
4     42200           0        13      1  оон опинилася
...     ...         ...       ...    ...            ...
2767  42200         220       222      0             та
2768  42200         220       230      1     та критики
2769  42200         220       231      0   та критики .
2770  42200         223       230      1        критики
2771  42200         223       231      0      критики .

[2772 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     42310           0         1      0           к
1     42310           0         3      0         кри
2     42310           0         5      0       криза
3     42310           0         7      0     криза г
4     42310           0        10     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     42310           0         1      0           к
1     42310           0         3      1         кри
2     42310           0         5      1       криза
3     42310           0         7      1     криза г
4     42310           0        10      1  криза гума
...     ...         ...       ...    ...         ...
3232  42310         227       234      0     питання
3233  42310         227       235      1    питаннях
3234  42310         227       236      0  питаннях .
3235  42310         234       235      1         ##х
3236  42310         234       236      0       ##х .

[3237 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     42370          -1         2      0                баи
1     42370          -1         5      0              баиду
2     42370          -1         7      0            баидужі
3     42370          -1        10      0         баидужість
4     42370          -1        11      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     42370          -1         2      0                баи
1     42370          -1         5      1              баиду
2     42370          -1         7      1            баидужі
3     42370          -1        10      1         баидужість
4     42370          -1        11      1       баидужість ?
...     ...         ...       ...    ...                ...
2548  42370          -1         2      0                діи
2549  42370          -1        10      1    діи організаціі
2550  42370          -1       104      0  діи організаціі .
2551  42370          -1        10      0        організаціі
2552  42370          -1       104      0      організаціі .

[2553 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     42410           0         1      0           к
1     42410           0         3      0         кри
2     42410           0         5      0       криза
3     42410           0         7      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     42410           0         1      0           к
1     42410           0         3      1         кри
2     42410           0         5      1       криза
3     42410           0         7      1     криза г
4     42410           0        10      1  криза гума
...     ...         ...       ...    ...         ...
2548  42410         241       244      1       ##уре
2549  42410         241       247      1    ##урення
2550  42410         241       248      0  ##урення .
2551  42410         244       247      1       ##ння
2552  42410         244       248      0     ##ння .

[2553 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     425206           0         3      0               " ар
1     425206           0         7      0           " аресто
2     425206           0        10      0        " арестович
3     425206           0        14      0    " арестович має
4     425206           0        16

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/337 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     425206           0         3      1               " ар
1     425206           0         7      1           " аресто
2     425206           0        10      1        " арестович
3     425206           0        14      1    " арестович має
4     425206           0        16      1  " арестович має ф
...      ...         ...       ...    ...                ...
2690  425206         214       217      1              ##нбо
2691  425206         214         6      1      ##нбо украіни
2692  425206         215       217      1               ##бо
2693  425206         215         6      1       ##бо украіни
2694  425206          -1         6      0            украіни

[2695 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     42580           0         6      0                 більше
1     42580           0         9      0              більше не
2     42580           0        11      0           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     42580           0         6      0                 більше
1     42580           0         9      1              більше не
2     42580           0        11      1            більше не в
3     42580           0        14      1         більше не віри
4     42580           0        16      1       більше не віримо
...     ...         ...       ...    ...                    ...
1423  42580          -1        11      0           украінського
1424  42580          -1       173      1    украінського народу
1425  42580          -1       174      0  украінського народу .
1426  42580         167       173      0                 народу
1427  42580         167       174      0               народу .

[1428 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     42600           0         3      0                  пов
1     42600           0         7      0              поворот
2     42600          

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/229 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     42600           0         3      1                  пов
1     42600           0         7      1              поворот
2     42600           0         2      1           поворотнии
3     42600           0        17      1    поворотнии момент
4     42600           0        18      1  поворотнии момент :
...     ...         ...       ...    ...                  ...
1822  42600         168       169      1                  ##т
1823  42600         168       174      1             ##тньому
1824  42600         168       175      0           ##тньому .
1825  42600         169       174      1              ##ньому
1826  42600         169       175      0            ##ньому .

[1827 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     42610           0         3      0               три
1     42610           0         5      0             триво
2     42610           0         8      0          трив

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/244 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     42610           0         3      0               три
1     42610           0         5      1             триво
2     42610           0         8      1          тривожні
3     42610           0        15      1   тривожні сигнал
4     42610           0        16      1  тривожні сигнали
...     ...         ...       ...    ...               ...
1945  42610         173       174      1               ##т
1946  42610         173       179      1          ##тньому
1947  42610         173       180      0        ##тньому .
1948  42610         174       179      1           ##ньому
1949  42610         174       180      0         ##ньому .

[1950 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     42790           0         2      0                  чи
1     42790           0         5      0               чи до
2     42790           0         7      0             чи дося
3     42790           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     42790           0         2      1                  чи
1     42790           0         5      1               чи до
2     42790           0         7      1             чи дося
3     42790           0        10      1          чи досягла
4     42790           0         6      1  чи досягла украіна
...     ...         ...       ...    ...                 ...
1588  42790         199       202      1               ##тни
1589  42790         199       206      1           ##тництва
1590  42790         199       207      0         ##тництва .
1591  42790         202       206      1              ##цтва
1592  42790         202       207      0            ##цтва .

[1593 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     42800           0         2      0                     чи
1     42800           0         5      0                  чи ви
2     42800           0         8      0           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     42800           0         2      1                     чи
1     42800           0         5      1                  чи ви
2     42800           0         8      1               чи викон
3     42800           0        13      1          чи виконувала
4     42800           0         6      1  чи виконувала украіна
...     ...         ...       ...    ...                    ...
1645  42800         208       211      0                    сто
1646  42800         208       214      1                 сторін
1647  42800         208       215      0               сторін .
1648  42800         211       214      1                  ##рін
1649  42800         211       215      0                ##рін .

[1650 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     42810           0         2      0             чи
1     42810           0         4      0           чи є
2     42810           0         6      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/260 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     42810           0         2      1             чи
1     42810           0         4      1           чи є
2     42810           0         6      1         чи є в
3     42810           0         9      1      чи є втом
4     42810           0        13      1  чи є втомлені
...     ...         ...       ...    ...            ...
2073  42810         211       214      1          ##тне
2074  42810         211       219      1     ##тнерства
2075  42810         211       220      0   ##тнерства .
2076  42810         214       219      1        ##рства
2077  42810         214       220      0      ##рства .

[2078 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     42850           0         2      0             чи
1     42850           0         5      0          чи за
2     42850           0         9      0      чи заслуг
3     42850           0        12      0   чи заслугову
4     42850           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/199 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     42850           0         2      1             чи
1     42850           0         5      1          чи за
2     42850           0         9      1      чи заслуг
3     42850           0        12      1   чи заслугову
4     42850           0        13      1  чи заслуговує
...     ...         ...       ...    ...            ...
1587  42850         197       200      0            під
1588  42850         197       206      1      підтримку
1589  42850         197       207      0    підтримку .
1590  42850         200       206      1       ##тримку
1591  42850         200       207      0     ##тримку .

[1592 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     42920           0         2      0                  чи
1     42920           0         9      0           чи можуть
2     42920           0        11      0         чи можуть в
3     42920           0        14      0      чи можуть вто

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/244 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


         id  seq_starts  seq_ends  label                text
0     42920           0         2      1                  чи
1     42920           0         9      1           чи можуть
2     42920           0        11      1         чи можуть в
3     42920           0        14      1      чи можуть втом
4     42920           0        18      1  чи можуть втомлені
...     ...         ...       ...    ...                 ...
1946  42920         141       142      1                 ##д
1947  42920         141       211      1              ##дків
1948  42920         141       212      0            ##дків .
1949  42920         208       211      1               ##ків
1950  42920         208       212      0             ##ків .

[1951 rows x 5 columns]
       id  seq_starts  seq_ends  label              text
0   42940           0         2      0                чи
1   42940           0         4      0              чи в
2   42940           0         7      0           чи втом
3   42940      

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/12 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


       id  seq_starts  seq_ends  label              text
0   42940           0         2      1                чи
1   42940           0         4      1              чи в
2   42940           0         7      1           чи втом
3   42940           0        12      1      чи втомилися
4   42940           0        16      1  чи втомилися сша
..    ...         ...       ...    ...               ...
85  42940          35        37      1              ##ги
86  42940          35         6      1      ##ги украіні
87  42940          35        46      1    ##ги украіні ?
88  42940          -1         6      0           украіні
89  42940          -1        46      1         украіні ?

[90 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     42960           0         2      0              чи
1     42960           0         8      0        чи стане
2     42960           0        10      0      чи стане в
3     42960           0        13      0   чи стане втом
4     42

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/193 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     42960           0         2      1              чи
1     42960           0         8      1        чи стане
2     42960           0        10      1      чи стане в
3     42960           0        13      1   чи стане втом
4     42960           0        14      1  чи стане втома
...     ...         ...       ...    ...             ...
1533  42960          -1         4      0           краін
1534  42960          -1       192      1        краінами
1535  42960          -1       193      0      краінами .
1536  42960         189       192      1           ##ами
1537  42960         189       193      0         ##ами .

[1538 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     42970           0         2      0                чи
1     42970           0         8      0          чи можна
2     42970           0        11      0       чи можна вв
3     42970           0        12      0      чи можна 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/135 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     42970           0         2      1                чи
1     42970           0         8      1          чи можна
2     42970           0        11      1       чи можна вв
3     42970           0        12      1      чи можна вва
4     42970           0        16      1  чи можна вважати
...     ...         ...       ...    ...               ...
1074  42970         136       142      0            сторон
1075  42970         136       143      1           сторони
1076  42970         136       144      0         сторони .
1077  42970         142       143      1               ##и
1078  42970         142       144      0             ##и .

[1079 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     42990           0         2      0               чи
1     42990           0         7      0          чи слід
2     42990           0        10      0       чи слід сп
3     42990           0        12  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/166 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     42990           0         2      1               чи
1     42990           0         7      1          чи слід
2     42990           0        10      1       чи слід сп
3     42990           0        12      1     чи слід спод
4     42990           0        15      1  чи слід сподіва
...     ...         ...       ...    ...              ...
1318  42990         168       171      1            ##нос
1319  42990         168       173      1          ##носин
1320  42990         168       174      0        ##носин .
1321  42990         171       173      1             ##ин
1322  42990         171       174      0           ##ин .

[1323 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     43090           0         2      0          чи
1     43090           0         4      0        чи є
2     43090           0         6      0      чи є в
3     43090           0         9      0   чи є втом
4     43090   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     43090           0         2      1          чи
1     43090           0         4      1        чи є
2     43090           0         6      1      чи є в
3     43090           0         9      1   чи є втом
4     43090           0        10      1  чи є втома
...     ...         ...       ...    ...         ...
1478  43090         181       184      1       ##омо
1479  43090         181       186      1     ##омоги
1480  43090         181       187      0   ##омоги .
1481  43090         184       186      1        ##ги
1482  43090         184       187      0      ##ги .

[1483 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     43110           0         2      0             чи
1     43110           0         7      0        чи може
2     43110           0         9      0      чи може в
3     43110           0        12      0   чи може втом
4     43110           0        13      0  чи може втома
...

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/221 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     43110           0         2      1             чи
1     43110           0         7      1        чи може
2     43110           0         9      1      чи може в
3     43110           0        12      1   чи може втом
4     43110           0        13      1  чи може втома
...     ...         ...       ...    ...            ...
1762  43110         202       208      0         сторон
1763  43110         202       209      1        сторони
1764  43110         202       210      0      сторони .
1765  43110         208       209      1            ##и
1766  43110         208       210      0          ##и .

[1767 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     43190           0         2      0                  чи
1     43190           0         5      0               чи не
2     43190           0         7      0             чи не є
3     43190           0        15      0     чи не є рішенн

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/237 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     43190           0         2      1                  чи
1     43190           0         5      1               чи не
2     43190           0         7      1             чи не є
3     43190           0        15      1     чи не є рішення
4     43190           0        18      1  чи не є рішення ні
...     ...         ...       ...    ...                 ...
1884  43190         203       206      1               ##тро
1885  43190         203         1      1             ##троів
1886  43190         203       209      0           ##троів .
1887  43190          -1         1      1                ##ів
1888  43190          -1       209      0              ##ів .

[1889 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     43240           0         2      0                чи
1     43240           0         7      0           чи може
2     43240           0        10      0        чи може ви
3     4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/193 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     43240           0         2      1                чи
1     43240           0         7      1           чи може
2     43240           0        10      1        чи може ви
3     43240           0        11      1       чи може виг
4     43240           0        16      1  чи може вигнання
...     ...         ...       ...    ...               ...
1533  43240         177       182      1           ##ільно
1534  43240         177       184      1         ##ільноти
1535  43240         177       185      0       ##ільноти .
1536  43240         182       184      1              ##ти
1537  43240         182       185      0            ##ти .

[1538 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     43270           0         2      0             чи
1     43270           0         4      0           чи в
2     43270           0         7      0        чи врах
3     43270           0        11      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/236 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     43270           0         2      1             чи
1     43270           0         4      1           чи в
2     43270           0         7      1        чи врах
3     43270           0        11      1    чи враховую
4     43270           0        13      1  чи враховують
...     ...         ...       ...    ...            ...
1883  43270         183       186      1          ##шен
1884  43270         183       187      1         ##шень
1885  43270         183       188      0       ##шень .
1886  43270         186       187      1            ##ь
1887  43270         186       188      0          ##ь .

[1888 rows x 5 columns]
        id  seq_starts  seq_ends  label         text
0    43470           0         3      0          пол
1    43470           0         4      0         поль
2    43470           0         6      0       польща
3    43470           0         9      0    польща сп
4    43470           0        11      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label         text
0    43470           0         3      0          пол
1    43470           0         4      1         поль
2    43470           0         6      1       польща
3    43470           0         9      1    польща сп
4    43470           0        11      1  польща спец
..     ...         ...       ...    ...          ...
812  43470         108       111      1        ##дом
813  43470         108       112      1       ##дому
814  43470         108       113      0     ##дому .
815  43470         111       112      1          ##у
816  43470         111       113      0        ##у .

[817 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    43550           0         3      0              пол
1    43550           0         4      0             поль
2    43550           0         6      0           польща
3    43550           0         9      0        польща св
4    43550           0        11      0      польща сві

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/70 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    43550           0         3      0              пол
1    43550           0         4      1             поль
2    43550           0         6      1           польща
3    43550           0         9      1        польща св
4    43550           0        11      1      польща свід
..     ...         ...       ...    ...              ...
555  43550          -1         1      0               іх
556  43550          -1       105      1    іх повернення
557  43550          -1       106      0  іх повернення .
558  43550          95       105      1       повернення
559  43550          95       106      0     повернення .

[560 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    43580           0         2      0               чи
1    43580           0         6      0           чи від
2    43580           0         9      0        чи відпов
3    43580           0        12      0     чи відповіда
4    43

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/44 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    43580           0         2      1               чи
1    43580           0         6      1           чи від
2    43580           0         9      1        чи відпов
3    43580           0        12      1     чи відповіда
4    43580           0        15      1  чи відповідають
..     ...         ...       ...    ...              ...
345  43580          89        92      1            ##жен
346  43580          89        95      1         ##женців
347  43580          89        96      1       ##женців ?
348  43580          92        95      1            ##ців
349  43580          92        96      1          ##ців ?

[350 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    43690           0         2      0                 чи
1    43690           0         7      0            чи може
2    43690           0         9      0          чи може з
3    43690           0        12      0       чи може зм

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    43690           0         2      1                 чи
1    43690           0         7      1            чи може
2    43690           0         9      1          чи може з
3    43690           0        12      1       чи може змен
4    43690           0        17      1  чи може зменшення
..     ...         ...       ...    ...                ...
589  43690          95       106      0        організація
590  43690          95       108      1      організаціями
591  43690          95       109      1    організаціями ?
592  43690         106       108      1               ##ми
593  43690         106       109      1             ##ми ?

[594 rows x 5 columns]
        id  seq_starts  seq_ends  label         text
0    43720           0         3      0          пол
1    43720           0         4      0         поль
2    43720           0         6      0       польща
3    43720           0         9      0    польща сп
4  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label         text
0    43720           0         3      0          пол
1    43720           0         4      1         поль
2    43720           0         6      1       польща
3    43720           0         9      1    польща сп
4    43720           0        11      1  польща спец
..     ...         ...       ...    ...          ...
588  43720          39        40      1          ##д
589  43720          39       103      1    ##д назад
590  43720          39       104      0  ##д назад .
591  43720          98       103      1        назад
592  43720          98       104      0      назад .

[593 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    43770           0         3      0                сша
1    43770           0         9      0          сша знову
2    43770           0        11      0        сша знову з
3    43770           0        14      0     сша знову зрад
4    43770           0        17      0  сша 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/47 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    43770           0         3      0                сша
1    43770           0         9      1          сша знову
2    43770           0        11      1        сша знову з
3    43770           0        14      1     сша знову зрад
4    43770           0        17      1  сша знову зраджує
..     ...         ...       ...    ...                ...
371  43770          70        74      1               союз
372  43770          70        78      1           союзника
373  43770          70        79      0         союзника .
374  43770          74        78      1             ##ника
375  43770          74        79      0           ##ника .

[376 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    43880           0         2      0              чи
1    43880           0         7      0         чи може
2    43880           0         9      0       чи можемо
3    43880           0        12      0    ч

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/70 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    43880           0         2      1              чи
1    43880           0         7      1         чи може
2    43880           0         9      1       чи можемо
3    43880           0        12      1    чи можемо ми
4    43880           0        14      1  чи можемо ми о
..     ...         ...       ...    ...             ...
554  43880          97        99      0              до
555  43880          97         6      1      до украіни
556  43880          97       108      1    до украіни ?
557  43880          -1         6      0         украіни
558  43880          -1       108      1       украіни ?

[559 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    43940           0         3      0                   сша
1    43940           0         6      0                сша ма
2    43940           0         8      0              сша мані
3    43940           0        10      0            сша м

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/62 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    43940           0         3      0                   сша
1    43940           0         6      1                сша ма
2    43940           0         8      1              сша мані
3    43940           0        10      1            сша маніпу
4    43940           0        12      1          сша маніпулю
..     ...         ...       ...    ...                   ...
488  43940          -1        11      0          украінського
489  43940          -1       104      1    украінського уряду
490  43940          -1       105      0  украінського уряду .
491  43940          99       104      0                 уряду
492  43940          99       105      0               уряду .

[493 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    44030           0         2      0                 чи
1    44030           0         6      0             чи під
2    44030           0        10      0         чи підр

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/47 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    44030           0         2      1                 чи
1    44030           0         6      1             чи під
2    44030           0        10      1         чи підрива
3    44030           0        13      1      чи підривають
4    44030           0        17      1  чи підривають сша
..     ...         ...       ...    ...                ...
371  44030          74        76      1                 сп
372  44030          74        80      1             спиною
373  44030          74        81      1           спиною ?
374  44030          76        80      1             ##иною
375  44030          76        81      1           ##иною ?

[376 rows x 5 columns]
        id  seq_starts  seq_ends  label                       text
0    44060           0         3      0                        сша
1    44060           0        18      0         сша використовують
2    44060           0        21      0      сша використовують ма


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/44 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


        id  seq_starts  seq_ends  label                       text
0    44060           0         3      0                        сша
1    44060           0        18      1         сша використовують
2    44060           0        21      1      сша використовують ма
3    44060           0        23      1    сша використовують мані
4    44060           0        25      1  сша використовують маніпу
..     ...         ...       ...    ...                        ...
344  44060          73        74      0                          з
345  44060          73        93      1                      з нею
346  44060          73        94      0                    з нею .
347  44060          90        93      0                        нею
348  44060          90        94      0                      нею .

[349 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      448302           0         2      0               за
1      448302           0         5      0            запор
2      448302           0         6      0           запорі
3      448302           0         9      0        запоріжжя
4      448302           0        15      0  запоріжжя знову
...       ...         ...       ...    ...              ...
18896  448302         592       601      0      ##вати нови
18897  448302         592       603      0    ##вати новину
18898  448302         597       601      0             нови
18899  448302         597       603      0           новину
18900  448302         601       603      0             ##ну

[18901 rows x 5 columns]
(18901, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2363 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      448302           0         2      0               за
1      448302           0         5      1            запор
2      448302           0         6      1           запорі
3      448302           0         9      1        запоріжжя
4      448302           0        15      1  запоріжжя знову
...       ...         ...       ...    ...              ...
18896  448302         592       601      1      ##вати нови
18897  448302         592       603      1    ##вати новину
18898  448302         597       601      0             нови
18899  448302         597       603      0           новину
18900  448302         601       603      1             ##ну

[18901 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     477269           0         4      0              полі
1     477269           0         7      0           поліція
2     477269           0         9      0         поліція у
3     477269  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label              text
0     477269           0         4      0              полі
1     477269           0         7      1           поліція
2     477269           0         9      1         поліція у
3     477269           0        15      1   поліція у школа
4     477269           0        16      1  поліція у школах
...      ...         ...       ...    ...               ...
4453  477269         266       273      1         ##ть ново
4454  477269         266       276      0      ##ть новость
4455  477269         269       273      0              ново
4456  477269         269       276      1           новость
4457  477269         273       276      1             ##сть

[4458 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      477294           0         2      0            за
1      477294           0         5      0         запор
2      477294           0         6      0        запорі
3      477294           0         9      0     запоріжжя
4      477294           0        12      0  запоріжжя то
...       ...         ...       ...    ...           ...
34941  477294         754       756      0          ##ці
34942  477294         754       760      0      ##ці тут
34943  477294         754       761      0    ##ці тут :
34944  477294         757       760      0           тут
34945  477294         757       761      0         тут :

[34946 rows x 5 columns]
(34946, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/4369 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      477294           0         2      0            за
1      477294           0         5      1         запор
2      477294           0         6      1        запорі
3      477294           0         9      1     запоріжжя
4      477294           0        12      1  запоріжжя то
...       ...         ...       ...    ...           ...
34941  477294         754       756      1          ##ці
34942  477294         754       760      1      ##ці тут
34943  477294         754       761      1    ##ці тут :
34944  477294         757       760      0           тут
34945  477294         757       761      0         тут :

[34946 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     477814           0         2      0             за
1     477814           0         4      0           запр
2     477814           0         6      0         запрош
3     477814           0        11      0    запрошувати
4    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/735 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     477814           0         2      0             за
1     477814           0         4      1           запр
2     477814           0         6      1         запрош
3     477814           0        11      1    запрошувати
4     477814           0        13      1  запрошувати у
...      ...         ...       ...    ...            ...
5872  477814         328       335      1      ##ть ново
5873  477814         328       338      0   ##ть новость
5874  477814         331       335      0           ново
5875  477814         331       338      1        новость
5876  477814         335       338      1          ##сть

[5877 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     477920           0         3      0            125
1     477920           0         7      0        125 млн
2     477920           0        10      0     125 млн гр
3     477920           0        11      0    125 млн грн
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/582 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     477920           0         3      0            125
1     477920           0         7      1        125 млн
2     477920           0        10      1     125 млн гр
3     477920           0        11      1    125 млн грн
4     477920           0        12      0  125 млн грн .
...      ...         ...       ...    ...            ...
4647  477920         270       277      1      ##ть ново
4648  477920         270       280      0   ##ть новость
4649  477920         273       277      0           ново
4650  477920         273       280      1        новость
4651  477920         277       280      1          ##сть

[4652 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     478015           0         1      0                 з
1     478015           0         5      0             злива
2     478015           0         7      0           зливали
3     478015           0        12      0      злив

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1233 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     478015           0         1      0                 з
1     478015           0         5      1             злива
2     478015           0         7      1           зливали
3     478015           0        12      1      зливали дані
4     478015           0        16      1  зливали дані род
...      ...         ...       ...    ...               ...
9858  478015         406       413      1         ##ть ново
9859  478015         406       416      0      ##ть новость
9860  478015         409       413      0              ново
9861  478015         409       416      1           новость
9862  478015         413       416      1             ##сть

[9863 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     478037           0         3      0               нас
1     478037           0         5      0             наслі
2     478037           0         8      0          наслідки
3     478037   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/385 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     478037           0         3      0               нас
1     478037           0         5      1             наслі
2     478037           0         8      1          наслідки
3     478037           0        15      1   наслідки ремонт
4     478037           0        16      1  наслідки ремонту
...      ...         ...       ...    ...               ...
3071  478037         234       241      1         ##ть ново
3072  478037         234       244      0      ##ть новость
3073  478037         237       241      0              ново
3074  478037         237       244      1           новость
3075  478037         241       244      1             ##сть

[3076 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     478449           0         5      0            росія
1     478449           0         7      0          росіяни
2     478449           0        10      0       росіяни ро
3     478449       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/534 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     478449           0         5      0            росія
1     478449           0         7      1          росіяни
2     478449           0        10      1       росіяни ро
3     478449           0        13      1    росіяни робля
4     478449           0        15      1  росіяни роблять
...      ...         ...       ...    ...              ...
4263  478449         236       243      1        ##ть ново
4264  478449         236       246      0     ##ть новость
4265  478449         239       243      0             ново
4266  478449         239       246      1          новость
4267  478449         243       246      1            ##сть

[4268 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     479045           0         1      0               п
1     479045           0         2      0              пі
2     479045           0         5      0           пішов
3     479045           0        10 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/435 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


          id  seq_starts  seq_ends  label            text
0     479045           0         1      0               п
1     479045           0         2      1              пі
2     479045           0         5      1           пішов
3     479045           0        10      1      пішов купа
4     479045           0        14      1  пішов купатися
...      ...         ...       ...    ...             ...
3474  479045         234       241      1       ##ть ново
3475  479045         234       244      0    ##ть новость
3476  479045         237       241      0            ново
3477  479045         237       244      1         новость
3478  479045         241       244      1           ##сть

[3479 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    50140           1         3      0             чи
1    50140           1         6      0          чи за
2    50140           1        10      0      чи заслуг
3    50140           1        13      0   чи заслугову
4   

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/13 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label           text
0    50140           1         3      1             чи
1    50140           1         6      1          чи за
2    50140           1        10      1      чи заслуг
3    50140           1        13      1   чи заслугову
4    50140           1        14      1  чи заслуговує
..     ...         ...       ...    ...            ...
99   50140          -1         0      1            ##і
100  50140          -1        51      1    ##і держави
101  50140          -1        52      1  ##і держави ?
102  50140          44        51      0        держави
103  50140          44        52      1      держави ?

[104 rows x 5 columns]
       id  seq_starts  seq_ends  label              text
0   50170           1         3      0                чи
1   50170           1         5      0              чи є
2   50170           1         6      0      чи є украіна
3   50170           1        15      0    чи є украіна ф
4   50170           1        17

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/10 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


       id  seq_starts  seq_ends  label              text
0   50170           1         3      1                чи
1   50170           1         5      1              чи є
2   50170           1         6      1      чи є украіна
3   50170           1        15      1    чи є украіна ф
4   50170           1        17      1  чи є украіна фік
..    ...         ...       ...    ...               ...
72  50170          34        36      1              ##ід
73  50170          34        40      1          ##ідерів
74  50170          34        41      1        ##ідерів ?
75  50170          36        40      1            ##ерів
76  50170          36        41      1          ##ерів ?

[77 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    50210           1         3      0                чи
1    50210           1         5      0              чи з
2    50210           1         7      0            чи змо
3    50210           1         9      0          чи зможе
4  

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/19 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label              text
0    50210           1         3      1                чи
1    50210           1         5      1              чи з
2    50210           1         7      1            чи змо
3    50210           1         9      1          чи зможе
4    50210           1         6      1  чи зможе украіна
..     ...         ...       ...    ...               ...
147  50210          46        52      0            статус
148  50210          46        53      1           статусу
149  50210          46        54      1         статусу ?
150  50210          52        53      1               ##у
151  50210          52        54      1             ##у ?

[152 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    50240           1         2      0                 ч
1    50240           1         5      0              чому
2    50240           1         6      0      чому украіна
3    50240           1        16      0   чому у

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/19 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label              text
0    50240           1         2      1                 ч
1    50240           1         5      1              чому
2    50240           1         6      1      чому украіна
3    50240           1        16      1   чому украіна вв
4    50240           1        17      1  чому украіна вва
..     ...         ...       ...    ...               ...
146  50240          54        56      0                ба
147  50240          54        60      1            бачить
148  50240          54        61      1          бачить ?
149  50240          56        60      1            ##чить
150  50240          56        61      1          ##чить ?

[151 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    50250           1         3      0                 чи
1    50250           1         5      0               чи є
2    50250           1        11      0         чи є справ
3    50250           1        13      0     

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/13 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label               text
0    50250           1         3      1                 чи
1    50250           1         5      1               чи є
2    50250           1        11      1         чи є справ
3    50250           1        13      1       чи є справед
4    50250           1        18      1  чи є справедливим
..     ...         ...       ...    ...                ...
99   50250          47        49      1                 як
100  50250          47        57      1         як держави
101  50250          47        58      1       як держави ?
102  50250          50        57      0            держави
103  50250          50        58      1          держави ?

[104 rows x 5 columns]
        id  seq_starts  seq_ends  label                      text
0    50290           1         3      0                        чи
1    50290           1         5      0                      чи є
2    50290           1         8      0            чи є украінців
3   

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/15 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label                      text
0    50290           1         3      1                        чи
1    50290           1         5      1                      чи є
2    50290           1         8      1            чи є украінців
3    50290           1        22      1     чи є украінців тільки
4    50290           1        25      1  чи є украінців тільки ім
..     ...         ...       ...    ...                       ...
114  50290          47        49      1                      ##ан
115  50290          47        52      1                   ##анках
116  50290          47        53      1                 ##анках ?
117  50290          49        52      1                     ##ках
118  50290          49        53      1                   ##ках ?

[119 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    50360           1         3      0                чи
1    50360           1        10      0         чи можуть
2    50360

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/32 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label              text
0    50360           1         3      1                чи
1    50360           1        10      1         чи можуть
2    50360           1        14      1     чи можуть укр
3    50360           1        15      1    чи можуть укра
4    50360           1         1      1  чи можуть украін
..     ...         ...       ...    ...               ...
246  50360          69        74      0             вплив
247  50360          69        75      1            впливу
248  50360          69        76      1          впливу ?
249  50360          74        75      1               ##у
250  50360          74        76      1             ##у ?

[251 rows x 5 columns]
        id  seq_starts  seq_ends  label                     text
0    50380           1         2      0                        ч
1    50380           1         5      0                     чому
2    50380           1         9      0          чому украінська
3    50380          

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/35 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                     text
0    50380           1         2      1                        ч
1    50380           1         5      1                     чому
2    50380           1         9      1          чому украінська
3    50380           1        21      1     чому украінська мова
4    50380           1        24      1  чому украінська мова не
..     ...         ...       ...    ...                      ...
269  50380          78        81      0                      рос
270  50380          78         6      1               росіиською
271  50380          78        89      1             росіиською ?
272  50380          -1         6      1                ##іиською
273  50380          -1        89      1              ##іиською ?

[274 rows x 5 columns]
        id  seq_starts  seq_ends  label                     text
0    50400           1         2      0                        ч
1    50400           1         5      0                     чому
2

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/41 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                     text
0    50400           1         2      1                        ч
1    50400           1         5      1                     чому
2    50400           1         9      1          чому украінська
3    50400           1        21      1     чому украінська мова
4    50400           1        24      1  чому украінська мова не
..     ...         ...       ...    ...                      ...
318  50400          80        83      0                      рос
319  50400          80         6      1               росіиською
320  50400          80        91      1             росіиською ?
321  50400          -1         6      1                ##іиською
322  50400          -1        91      1              ##іиською ?

[323 rows x 5 columns]
        id  seq_starts  seq_ends  label                     text
0    50440           1         2      0                        ч
1    50440           1         5      0                     чому
2

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/26 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                     text
0    50440           1         2      1                        ч
1    50440           1         5      1                     чому
2    50440           1         9      1          чому украінська
3    50440           1        21      1     чому украінська мова
4    50440           1        24      1  чому украінська мова не
..     ...         ...       ...    ...                      ...
203  50440          61        64      0                      рос
204  50440          61         6      1               росіиською
205  50440          61        72      1             росіиською ?
206  50440          -1         6      1                ##іиською
207  50440          -1        72      1              ##іиською ?

[208 rows x 5 columns]
        id  seq_starts  seq_ends  label                      text
0    50450           1         3      0                        чи
1    50450           1         5      0                      чи 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/38 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                      text
0    50450           1         3      1                        чи
1    50450           1         5      1                      чи є
2    50450           1         9      1           чи є украінська
3    50450           1        21      1      чи є украінська мова
4    50450           1         2      1  чи є украінська мова діи
..     ...         ...       ...    ...                       ...
293  50450          75        78      0                       рос
294  50450          75         6      1                росіиською
295  50450          75        86      1              росіиською ?
296  50450          -1         6      1                 ##іиською
297  50450          -1        86      1               ##іиською ?

[298 rows x 5 columns]
        id  seq_starts  seq_ends  label                          text
0    50470           1         3      0                            чи
1    50470           1         7      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/29 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                          text
0    50470           1         3      1                            чи
1    50470           1         7      1                        чи має
2    50470           1         9      1             чи має украінська
3    50470           1        23      1        чи має украінська мова
4    50470           1        29      1  чи має украінська мова право
..     ...         ...       ...    ...                           ...
224  50470          70        73      1                         ##ком
225  50470          70         9      1              ##ком росіиськоі
226  50470          70        85      1            ##ком росіиськоі ?
227  50470          -1         9      0                    росіиськоі
228  50470          -1        85      1                  росіиськоі ?

[229 rows x 5 columns]
        id  seq_starts  seq_ends  label                     text
0    50480           1         2      0                        ч
1    5

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/38 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                     text
0    50480           1         2      1                        ч
1    50480           1         5      1                     чому
2    50480           1         9      1          чому украінська
3    50480           1        21      1     чому украінська мова
4    50480           1        24      1  чому украінська мова не
..     ...         ...       ...    ...                      ...
293  50480          76        79      0                      рос
294  50480          76         6      1               росіиською
295  50480          76        87      1             росіиською ?
296  50480          -1         6      1                ##іиською
297  50480          -1        87      1              ##іиською ?

[298 rows x 5 columns]
        id  seq_starts  seq_ends  label                       text
0    50680           1         3      0                         чи
1    50680           1         8      0                    чи 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/107 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                       text
0    50680           1         3      1                         чи
1    50680           1         8      1                    чи може
2    50680           1         9      1         чи може украінська
3    50680           1        24      1    чи може украінська мова
4    50680           1        25      1  чи може украінська мова ,
..     ...         ...       ...    ...                        ...
851  50680         150       153      1                      ##шен
852  50680         150       155      1                    ##шеним
853  50680         150       156      0                  ##шеним .
854  50680         153       155      1                       ##им
855  50680         153       156      0                     ##им .

[856 rows x 5 columns]
        id  seq_starts  seq_ends  label          text
0    50760           1         4      0           поп
1    50760           1         6      0         попри
2    50760

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label          text
0    50760           1         4      0           поп
1    50760           1         6      1         попри
2    50760           1         9      1      попри во
3    50760           1        10      1     попри воє
4    50760           1        13      1  попри воєнні
..     ...         ...       ...    ...           ...
894  50760         107       109      1          ##ці
895  50760         107       115      1    ##ці влади
896  50760         107       116      0  ##ці влади .
897  50760         110       115      0         влади
898  50760         110       116      0       влади .

[899 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     50870           1         3      0            на
1     50870           1         7      0        на фон
2     50870           1         8      0       на фоні
3     50870           1        11      0    на фоні за
4     50870           1        13      0  на фоні заг

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     50870           1         3      0            на
1     50870           1         7      1        на фон
2     50870           1         8      1       на фоні
3     50870           1        11      1    на фоні за
4     50870           1        13      1  на фоні заго
...     ...         ...       ...    ...           ...
1423  50870         148       150      1          ##ук
1424  50870         148       154      1      ##укцією
1425  50870         148       155      0    ##укцією .
1426  50870         150       154      1        ##цією
1427  50870         150       155      0      ##цією .

[1428 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     50970           1         3      0                   чи
1     50970           1        11      0           чи можливо
2     50970           1        12      0         чи можливо ,
3     50970           1        15      0      чи можливо , що
4    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/141 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     50970           1         3      1                   чи
1     50970           1        11      1           чи можливо
2     50970           1        12      1         чи можливо ,
3     50970           1        15      1      чи можливо , що
4     50970           1        19      1  чи можливо , що укр
...     ...         ...       ...    ...                  ...
1119  50970         136       138      1                 ##ту
1120  50970         136       142      1             ##тучною
1121  50970         136       143      1           ##тучною ?
1122  50970         138       142      1               ##чною
1123  50970         138       143      1             ##чною ?

[1124 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     50990           1         3      0                   чи
1     50990           1        11      0           чи можливо
2     50990           1        12      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     50990           1         3      1                   чи
1     50990           1        11      1           чи можливо
2     50990           1        12      1         чи можливо ,
3     50990           1        15      1      чи можливо , що
4     50990           1        19      1  чи можливо , що укр
...     ...         ...       ...    ...                  ...
1369  50990         150       153      1                ##гра
1370  50990         150       159      1          ##гра влади
1371  50990         150       160      1        ##гра влади ?
1372  50990         154       159      0                влади
1373  50990         154       160      1              влади ?

[1374 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    51120           1         2      0                ч
1    51120           1         5      0             чому
2    51120           1         9      0         чому укр
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    51120           1         2      1                ч
1    51120           1         5      1             чому
2    51120           1         9      1         чому укр
3    51120           1        10      1        чому укра
4    51120           1         5      1  чому украінські
..     ...         ...       ...    ...              ...
855  51120         117       119      1             ##шт
856  51120         117       121      1           ##штів
857  51120         117       122      1         ##штів ?
858  51120         119       121      1             ##ів
859  51120         119       122      1           ##ів ?

[860 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     51200           1         2      0                    ч
1     51200           1         5      0                 чому
2     51200           1         9      0             чому укр
3     51200           1        10      0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/277 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     51200           1         2      1                    ч
1     51200           1         5      1                 чому
2     51200           1         9      1             чому укр
3     51200           1        10      1            чому укра
4     51200           1         5      1      чому украінські
...     ...         ...       ...    ...                  ...
2204  51200          -1         3      1               ##ньоі
2205  51200          -1       202      1    ##ньоі діяльності
2206  51200          -1       203      0  ##ньоі діяльності .
2207  51200         192       202      1           діяльності
2208  51200         192       203      0         діяльності .

[2209 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     51220           1         3      0                  чи
1     51220           1        11      0          чи можливо
2     51220           1        12      0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/356 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     51220           1         3      1                  чи
1     51220           1        11      1          чи можливо
2     51220           1        12      1        чи можливо ,
3     51220           1        15      1     чи можливо , що
4     51220           1        18      1  чи можливо , що зі
...     ...         ...       ...    ...                 ...
2841  51220         247       251      1              ##тері
2842  51220         247       252      1             ##терів
2843  51220         247       253      0           ##терів .
2844  51220         251       252      1                 ##в
2845  51220         251       253      0               ##в .

[2846 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     51320           1         3      0                 чи
1     51320           1         7      0             чи має
2     51320           1        10      0          чи має гр
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/229 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     51320           1         3      1                 чи
1     51320           1         7      1             чи має
2     51320           1        10      1          чи має гр
3     51320           1        14      1      чи має громад
4     51320           1        18      1  чи має громадські
...     ...         ...       ...    ...                ...
1822  51320         177       179      1               ##із
1823  51320         177         3      1           ##ізаціи
1824  51320         177       184      0         ##ізаціи .
1825  51320          -1         3      1             ##аціи
1826  51320          -1       184      0           ##аціи .

[1827 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     51360           1         3      0                   чи
1     51360           1         9      0             чи мають
2     51360           1        13      0         чи мають укр
3     5

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/229 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     51360           1         3      1                   чи
1     51360           1         9      1             чи мають
2     51360           1        13      1         чи мають укр
3     51360           1        14      1        чи мають укра
4     51360           1         5      1  чи мають украінські
...     ...         ...       ...    ...                  ...
1822  51360         189       193      1               ##тера
1823  51360         189       195      1             ##терами
1824  51360         189       196      0           ##терами .
1825  51360         193       195      1                 ##ми
1826  51360         193       196      0               ##ми .

[1827 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     51380           1         3      0               чи
1     51380           1         9      0         чи можна
2     51380           1        12      0      чи можна до

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/129 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     51380           1         3      1               чи
1     51380           1         9      1         чи можна
2     51380           1        12      1      чи можна до
3     51380           1        14      1    чи можна дові
4     51380           1        16      1  чи можна довіря
...     ...         ...       ...    ...              ...
1027  51380         124       128      1           ##сько
1028  51380         124       131      1        ##ськості
1029  51380         124       132      1      ##ськості ?
1030  51380         128       131      1            ##сті
1031  51380         128       132      1          ##сті ?

[1032 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    51410           1         3      0                 чи
1    51410           1         9      0           чи справ
2    51410           1        11      0         чи справед
3    51410           1        15      0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    51410           1         3      1                 чи
1    51410           1         9      1           чи справ
2    51410           1        11      1         чи справед
3    51410           1        15      1     чи справедливо
4    51410           1        18      1  чи справедливо по
..     ...         ...       ...    ...                ...
733  51410         118       120      0                 до
734  51410         118       124      1             до них
735  51410         118       125      1           до них ?
736  51410         121       124      1                них
737  51410         121       125      1              них ?

[738 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    51440           1         3      0                 чи
1    51440           1         9      0           чи справ
2    51440           1        11      0         чи справед
3    51440           1        15

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    51440           1         3      1                 чи
1    51440           1         9      1           чи справ
2    51440           1        11      1         чи справед
3    51440           1        15      1     чи справедливо
4    51440           1        18      1  чи справедливо ви
..     ...         ...       ...    ...                ...
733  51440         118       121      1              ##ута
734  51440         118       124      1           ##утацію
735  51440         118       125      1         ##утацію ?
736  51440         121       124      1              ##цію
737  51440         121       125      1            ##цію ?

[738 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    51480           1         3      0             чи
1    51480           1         6      0          чи ва
2    51480           1         9      0       чи варто
3    51480           1        12      0    чи ва

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    51480           1         3      1             чи
1    51480           1         6      1          чи ва
2    51480           1         9      1       чи варто
3    51480           1        12      1    чи варто до
4    51480           1        14      1  чи варто дові
..     ...         ...       ...    ...            ...
772  51480          98       101      1          ##ута
773  51480          98       104      1       ##утацію
774  51480          98       105      1     ##утацію ?
775  51480         101       104      1          ##цію
776  51480         101       105      1        ##цію ?

[777 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    51510           1         3      0               чи
1    51510           1         7      0           чи від
2    51510           1        10      0        чи відпов
3    51510           1        13      0     чи відповіда
4    51510           1        1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/88 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    51510           1         3      1               чи
1    51510           1         7      1           чи від
2    51510           1        10      1        чи відпов
3    51510           1        13      1     чи відповіда
4    51510           1        16      1  чи відповідають
..     ...         ...       ...    ...              ...
696  51510         115       118      1            ##зор
697  51510         115       122      1        ##зорість
698  51510         115       123      1      ##зорість ?
699  51510         118       122      1           ##ість
700  51510         118       123      1         ##ість ?

[701 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     51520           1         2      0                ч
1     51520           1         5      0             чому
2     51520           1         9      0         чому укр
3     51520           1        10      0        чому укра
4 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/320 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     51520           1         2      1                ч
1     51520           1         5      1             чому
2     51520           1         9      1         чому укр
3     51520           1        10      1        чому укра
4     51520           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
2548  51520         217       219      1             ##ві
2549  51520         217       221      1           ##віру
2550  51520         217       222      0         ##віру .
2551  51520         219       221      1             ##ру
2552  51520         219       222      0           ##ру .

[2553 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     51660           1         3      0               чи
1     51660           1         6      0            чи до
2     51660           1         9      0         чи дотри
3     51660           1        11      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     51660           1         3      1               чи
1     51660           1         6      1            чи до
2     51660           1         9      1         чи дотри
3     51660           1        11      1       чи дотриму
4     51660           1        16      1  чи дотримуються
...     ...         ...       ...    ...              ...
2269  51660         209       212      1            ##дан
2270  51660         209       213      1           ##дань
2271  51660         209       214      0         ##дань .
2272  51660         212       213      1              ##ь
2273  51660         212       214      0            ##ь .

[2274 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     51710           1         2      0              ч
1     51710           1         5      0           чому
2     51710           1         6      0         чому ,
3     51710           1         9      0      чому , не

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/252 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     51710           1         2      1              ч
1     51710           1         5      1           чому
2     51710           1         6      1         чому ,
3     51710           1         9      1      чому , не
4     51710           1        13      1  чому , не див
...     ...         ...       ...    ...            ...
2007  51710         194       196      1           ##із
2008  51710         194         3      1       ##ізаціи
2009  51710         194       201      0     ##ізаціи .
2010  51710          -1         3      1         ##аціи
2011  51710          -1       201      0       ##аціи .

[2012 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     51780           1         3      0                  чи
1     51780           1         8      0             чи може
2     51780           1        13      0        чи може бути
3     51780           1        15      0      чи може бути 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/166 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     51780           1         3      1                  чи
1     51780           1         8      1             чи може
2     51780           1        13      1        чи може бути
3     51780           1        15      1      чи може бути е
4     51780           1        19      1  чи може бути ефект
...     ...         ...       ...    ...                 ...
1317  51780         162       163      1                 ##ь
1318  51780         162         4      1           ##ь арміі
1319  51780         162       170      1         ##ь арміі ?
1320  51780          -1         4      1               арміі
1321  51780          -1       170      1             арміі ?

[1322 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    51990           1         2      0                   ч
1    51990           1         5      0                чому
2    51990           1        13      0        чому існують
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    51990           1         2      1                   ч
1    51990           1         5      1                чому
2    51990           1        13      1        чому існують
3    51990           1        16      1     чому існують ст
4    51990           1        19      1  чому існують стіль
..     ...         ...       ...    ...                 ...
895  51990         127       130      1               ##іль
896  51990         127       134      1           ##ільства
897  51990         127       135      1         ##ільства ?
898  51990         130       134      1              ##ства
899  51990         130       135      1            ##ства ?

[900 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     52140           1         4      0            укр
1     52140           1         5      0           укра
2     52140           1         5      0     украінські
3     52140           1        1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/166 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     52140           1         4      1            укр
1     52140           1         5      1           укра
2     52140           1         5      1     украінські
3     52140           1        13      1   украінські б
4     52140           1        14      1  украінські бі
...     ...         ...       ...    ...            ...
1316  52140         148       151      0            над
1317  52140         148       157      0      надається
1318  52140         148       158      0    надається .
1319  52140         151       157      1       ##ається
1320  52140         151       158      0     ##ається .

[1321 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52180           1         3      0               чи
1     52180           1         9      0         чи справ
2     52180           1        11      0       чи справді
3     52180           1        15      0   чи справді укр
4     52180  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52180           1         3      1               чи
1     52180           1         9      1         чи справ
2     52180           1        11      1       чи справді
3     52180           1        15      1   чи справді укр
4     52180           1        16      1  чи справді укра
...     ...         ...       ...    ...              ...
2406  52180         210       213      1            ##омо
2407  52180         210       215      1          ##омоги
2408  52180         210       216      0        ##омоги .
2409  52180         213       215      1             ##ги
2410  52180         213       216      0           ##ги .

[2411 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     52220           1         3      0            чи
1     52220           1         6      0         чи ва
2     52220           1         9      0      чи варто
3     52220           1        12      0   чи варто вв
4   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/356 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     52220           1         3      1            чи
1     52220           1         6      1         чи ва
2     52220           1         9      1      чи варто
3     52220           1        12      1   чи варто вв
4     52220           1        13      1  чи варто вва
...     ...         ...       ...    ...           ...
2840  52220         242       244      1          ##чу
2841  52220         242       247      1       ##чуття
2842  52220         242       248      0     ##чуття .
2843  52220         244       247      1         ##ття
2844  52220         244       248      0       ##ття .

[2845 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    52250           1         3      0                чи
1    52250           1         8      0           чи може
2    52250           1        11      0        чи може по
3    52250           1        13      0      чи може пояс
4    52250           1   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/48 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    52250           1         3      1                чи
1    52250           1         8      1           чи може
2    52250           1        11      1        чи може по
3    52250           1        13      1      чи може пояс
4    52250           1        17      1  чи може пояснити
..     ...         ...       ...    ...               ...
372  52250          81        84      1             ##чні
373  52250          81        87      1          ##чністю
374  52250          81        88      1        ##чністю ?
375  52250          84        87      1             ##стю
376  52250          84        88      1           ##стю ?

[377 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52270           1         2      0                ч
1     52270           1         5      0             чому
2     52270           1         9      0         чому укр
3     52270           1        10      0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52270           1         2      1                ч
1     52270           1         5      1             чому
2     52270           1         9      1         чому укр
3     52270           1        10      1        чому укра
4     52270           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1703  52270         182       187      0            серед
1704  52270         182       192      1       середовище
1705  52270         182       193      0     середовище .
1706  52270         187       192      1          ##овище
1707  52270         187       193      0        ##овище .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     52280           1         3      0                чи
1     52280           1         9      0          чи можна
2     52280           1        12      0       чи можна вв
3     52280           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     52280           1         3      1                чи
1     52280           1         9      1          чи можна
2     52280           1        12      1       чи можна вв
3     52280           1        13      1      чи можна вва
4     52280           1        17      1  чи можна вважати
...     ...         ...       ...    ...               ...
1645  52280         183       187      0              стан
1646  52280         183       192      1         становище
1647  52280         183       193      0       становище .
1648  52280         187       192      1           ##овище
1649  52280         187       193      0         ##овище .

[1650 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52300           1         2      0                ч
1     52300           1         5      0             чому
2     52300           1         9      0         чому укр
3     52300           1        10  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52300           1         2      1                ч
1     52300           1         5      1             чому
2     52300           1         9      1         чому укр
3     52300           1        10      1        чому укра
4     52300           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1703  52300         192       194      1             ##еб
1704  52300         192       200      1       ##ебування
1705  52300         192       201      0     ##ебування .
1706  52300         194       200      1         ##ування
1707  52300         194       201      0       ##ування .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     52320           1         3      0              чи
1     52320           1         7      0          чи доп
2     52320           1        10      0       чи допома
3     52320           1        12      0     чи доп

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     52320           1         3      1              чи
1     52320           1         7      1          чи доп
2     52320           1        10      1       чи допома
3     52320           1        12      1     чи допомага
4     52320           1        15      1  чи допомагають
...     ...         ...       ...    ...             ...
2136  52320         186       189      1           ##гра
2137  52320         186       192      1        ##грацію
2138  52320         186       193      0      ##грацію .
2139  52320         189       192      1           ##цію
2140  52320         189       193      0         ##цію .

[2141 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52330           1         2      0                ч
1     52330           1         5      0             чому
2     52330           1         9      0         чому укр
3     52330           1        10      0        чому укра
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/385 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52330           1         2      1                ч
1     52330           1         5      1             чому
2     52330           1         9      1         чому укр
3     52330           1        10      1        чому укра
4     52330           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
3073  52330         236       237      1              ##і
3074  52330         236       247      1    ##і підтримки
3075  52330         236       248      0  ##і підтримки .
3076  52330         238       247      0        підтримки
3077  52330         238       248      0      підтримки .

[3078 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     52400           1         3      0             як
1     52400           1         7      0         як від
2     52400           1         9      0       як відрі
3     52400           1        12      0    як відрізни

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     52400           1         3      1             як
1     52400           1         7      1         як від
2     52400           1         9      1       як відрі
3     52400           1        12      1    як відрізни
4     52400           1        14      1  як відрізнити
...     ...         ...       ...    ...            ...
1478  52400         169       171      1           ##ту
1479  52400         169         3      1       ##туаціі
1480  52400         169       176      0     ##туаціі .
1481  52400          -1         3      1         ##аціі
1482  52400          -1       176      0       ##аціі .

[1483 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52410           1         2      0                ч
1     52410           1         5      0             чому
2     52410           1         9      0         чому укр
3     52410           1        10      0        чому укра
4     52410  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52410           1         2      1                ч
1     52410           1         5      1             чому
2     52410           1         9      1         чому укр
3     52410           1        10      1        чому укра
4     52410           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1424  52410         162       164      1             ##ап
1425  52410         162         4      1        ##аптаціі
1426  52410         162       170      0      ##аптаціі .
1427  52410          -1         4      1          ##таціі
1428  52410          -1       170      0        ##таціі .

[1429 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52450           1         2      0                ч
1     52450           1         5      0             чому
2     52450           1        11      0       чому деякі
3     52450           1        15      0   чому

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52450           1         2      1                ч
1     52450           1         5      1             чому
2     52450           1        11      1       чому деякі
3     52450           1        15      1   чому деякі укр
4     52450           1        16      1  чому деякі укра
...     ...         ...       ...    ...              ...
2270  52450          -1         3      0             цієі
2271  52450          -1       199      1       цієі групи
2272  52450          -1       200      0     цієі групи .
2273  52450         194       199      0            групи
2274  52450         194       200      0          групи .

[2275 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     52520           1         3      0                 чи
1     52520           1         9      0           чи можна
2     52520           1        12      0        чи можна зв
3     52520           1        15      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/193 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     52520           1         3      1                 чи
1     52520           1         9      1           чи можна
2     52520           1        12      1        чи можна зв
3     52520           1        15      1     чи можна звину
4     52520           1        18      1  чи можна звинувач
...     ...         ...       ...    ...                ...
1532  52520         177       179      0                 до
1533  52520         177       185      1           до праці
1534  52520         177       186      0         до праці .
1535  52520         180       185      0              праці
1536  52520         180       186      0            праці .

[1537 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52560           1         2      0                ч
1     52560           1         5      0             чому
2     52560           1         9      0         чому укр
3     52560           1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52560           1         2      1                ч
1     52560           1         5      1             чому
2     52560           1         9      1         чому укр
3     52560           1        10      1        чому укра
4     52560           1         5      1  чому украінські
...     ...         ...       ...    ...              ...
1371  52560         154       158      1           ##ивні
1372  52560         154       161      1        ##ивність
1373  52560         154       162      0      ##ивність .
1374  52560         158       161      1            ##сть
1375  52560         158       162      0          ##сть .

[1376 rows x 5 columns]
        id  seq_starts  seq_ends  label                 text
0    52650           1         2      0                    ч
1    52650           1         5      0                 чому
2    52650           1         9      0             чому укр
3    52650           1        10   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                 text
0    52650           1         2      1                    ч
1    52650           1         5      1                 чому
2    52650           1         9      1             чому укр
3    52650           1        10      1            чому укра
4    52650           1         5      1      чому украінські
..     ...         ...       ...    ...                  ...
734  52650          -1         3      1               ##овоі
735  52650          -1       157      1    ##овоі діяльності
736  52650          -1       158      0  ##овоі діяльності .
737  52650         147       157      1           діяльності
738  52650         147       158      0         діяльності .

[739 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     52660           1         3      0                як
1     52660           1         9      0          як вплив
2     52660           1        11      0        як впливає
3     52

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     52660           1         3      1                як
1     52660           1         9      1          як вплив
2     52660           1        11      1        як впливає
3     52660           1        15      1    як впливає без
4     52660           1        17      1  як впливає безро
...     ...         ...       ...    ...               ...
1217  52660         155       158      1             ##дно
1218  52660         155       161      1          ##дності
1219  52660         155       162      0        ##дності .
1220  52660         158       161      1             ##сті
1221  52660         158       162      0           ##сті .

[1222 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     52720           1         4      0            укр
1     52720           1         5      0           укра
2     52720           1         5      0     украінські
3     52720           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     52720           1         4      1            укр
1     52720           1         5      1           укра
2     52720           1         5      1     украінські
3     52720           1        13      1   украінські б
4     52720           1        14      1  украінські бі
...     ...         ...       ...    ...            ...
1217  52720         150       153      1          ##ран
1218  52720         150       156      1       ##рантів
1219  52720         150       157      0     ##рантів .
1220  52720         153       156      1          ##тів
1221  52720         153       157      0        ##тів .

[1222 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     52820           1         3      0               як
1     52820           1         7      0           як укр
2     52820           1         8      0          як укра
3     52820           1         5      0    як украінські
4     52820  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     52820           1         3      1               як
1     52820           1         7      1           як укр
2     52820           1         8      1          як укра
3     52820           1         5      1    як украінські
4     52820           1        16      1  як украінські б
...     ...         ...       ...    ...              ...
1028  52820         141       145      1           ##гляд
1029  52820         141       146      1          ##гляди
1030  52820         141       147      0        ##гляди .
1031  52820         145       146      1              ##и
1032  52820         145       147      0            ##и .

[1033 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     52900           1         3      0             чи
1     52900           1         7      0         чи від
2     52900           1         9      0       чи відоб
3     52900           1        11      0     чи відобра

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/160 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     52900           1         3      1             чи
1     52900           1         7      1         чи від
2     52900           1         9      1       чи відоб
3     52900           1        11      1     чи відобра
4     52900           1        14      1  чи відображає
...     ...         ...       ...    ...            ...
1268  52900         141       144      1          ##гра
1269  52900         141         2      1       ##граціі
1270  52900         141       148      0     ##граціі .
1271  52900          -1         2      1          ##ціі
1272  52900          -1       148      0        ##ціі .

[1273 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     52990           1         3      0             чи
1     52990           1         6      0          чи ва
2     52990           1         9      0       чи варто
3     52990           1        11      0     чи варто з
4     52990           1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/221 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     52990           1         3      1             чи
1     52990           1         6      1          чи ва
2     52990           1         9      1       чи варто
3     52990           1        11      1     чи варто з
4     52990           1        14      1  чи варто змін
...     ...         ...       ...    ...            ...
1763  52990         197       200      1          ##ран
1764  52990         197       203      1       ##рантів
1765  52990         197       204      0     ##рантів .
1766  52990         200       203      1          ##тів
1767  52990         200       204      0        ##тів .

[1768 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     53020           1         2      0                ч
1     53020           1         5      0             чому
2     53020           1        11      0       чому деякі
3     53020           1        15      0   чому деякі укр
4     53020  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     53020           1         2      1                ч
1     53020           1         5      1             чому
2     53020           1        11      1       чому деякі
3     53020           1        15      1   чому деякі укр
4     53020           1        16      1  чому деякі укра
...     ...         ...       ...    ...              ...
1218  53020         172       177      0            закон
1219  53020         172       179      1          законів
1220  53020         172       180      0        законів .
1221  53020         177       179      1             ##ів
1222  53020         177       180      0           ##ів .

[1223 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53040           1         3      0                чи
1     53040           1        11      0        чи можливо
2     53040           1        14      0     чи можливо по
3     53040           1        15      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53040           1         3      1                чи
1     53040           1        11      1        чи можливо
2     53040           1        14      1     чи можливо по
3     53040           1        15      1    чи можливо пок
4     53040           1        17      1  чи можливо покра
...     ...         ...       ...    ...               ...
1218  53040         166       169      1             ##гра
1219  53040         166         2      1          ##граціі
1220  53040         166       173      0        ##граціі .
1221  53040          -1         2      1             ##ціі
1222  53040          -1       173      0           ##ціі .

[1223 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     53060           1         2      0                ч
1     53060           1         5      0             чому
2     53060           1        11      0       чому деякі
3     53060           1        15  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/147 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     53060           1         2      1                ч
1     53060           1         5      1             чому
2     53060           1        11      1       чому деякі
3     53060           1        15      1   чому деякі укр
4     53060           1        16      1  чому деякі укра
...     ...         ...       ...    ...              ...
1169  53060         166       169      1            ##ран
1170  53060         166       172      1         ##рантів
1171  53060         166       173      0       ##рантів .
1172  53060         169       172      1            ##тів
1173  53060         169       173      0          ##тів .

[1174 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     53070           1         3      0                  як
1     53070           1         9      0            як вплив
2     53070           1        11      0          як впливає
3     53070           1        15  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     53070           1         3      1                  як
1     53070           1         9      1            як вплив
2     53070           1        11      1          як впливає
3     53070           1        15      1      як впливає від
4     53070           1        19      1  як впливає відмова
...     ...         ...       ...    ...                 ...
1371  53070         163       166      0                 міг
1372  53070         163         4      1            міграціі
1373  53070         163       172      0          міграціі .
1374  53070          -1         4      1             ##раціі
1375  53070          -1       172      0           ##раціі .

[1376 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53140           1         3      0                чи
1     53140           1         7      0            чи від
2     53140           1        10      0         чи відпов
3     5

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/166 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53140           1         3      1                чи
1     53140           1         7      1            чи від
2     53140           1        10      1         чи відпов
3     53140           1        12      1       чи відповід
4     53140           1        17      1  чи відповідність
...     ...         ...       ...    ...               ...
1319  53140         160       165      1           ##увати
1320  53140         160       167      1         ##уватися
1321  53140         160       168      0       ##уватися .
1322  53140         165       167      1              ##ся
1323  53140         165       168      0            ##ся .

[1324 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53180           1         3      0                чи
1     53180           1         5      0              чи є
2     53180           1        11      0        чи є справ
3     53180           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53180           1         3      1                чи
1     53180           1         5      1              чи є
2     53180           1        11      1        чи є справ
3     53180           1        14      1     чи є справжня
4     53180           1        17      1  чи є справжня по
...     ...         ...       ...    ...               ...
1028  53180         130       134      1            ##ливо
1029  53180         130       137      1         ##ливості
1030  53180         130       138      0       ##ливості .
1031  53180         134       137      1             ##сті
1032  53180         134       138      0           ##сті .

[1033 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53620           1         3      0                чи
1     53620           1         7      0            чи укр
2     53620           1         8      0           чи укра
3     53620           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/186 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53620           1         3      1                чи
1     53620           1         7      1            чи укр
2     53620           1         8      1           чи укра
3     53620           1         5      1     чи украінські
4     53620           1        17      1  чи украінські во
...     ...         ...       ...    ...               ...
1477  53620         149       152      0               нам
1478  53620         149       155      1            наміри
1479  53620         149       156      0          наміри .
1480  53620         152       155      1             ##іри
1481  53620         152       156      0           ##іри .

[1482 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53700           1         4      0               укр
1     53700           1         5      0              укра
2     53700           1         5      0        украінські
3     53700           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53700           1         4      1               укр
1     53700           1         5      1              укра
2     53700           1         5      1        украінські
3     53700           1        14      1     украінські во
4     53700           1        17      1  украінські волон
...     ...         ...       ...    ...               ...
2134  53700         189       194      0             справ
2135  53700         189       195      1            справі
2136  53700         189       196      0          справі .
2137  53700         194       195      1               ##і
2138  53700         194       196      0             ##і .

[2139 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     53780           1         4      0               укр
1     53780           1         5      0              укра
2     53780           1         5      0        украінські
3     53780           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/252 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     53780           1         4      1               укр
1     53780           1         5      1              укра
2     53780           1         5      1        украінські
3     53780           1        14      1     украінські во
4     53780           1        17      1  украінські волон
...     ...         ...       ...    ...               ...
2005  53780          -1         2      1             ##ніх
2006  53780          -1         2      1         ##ніх діи
2007  53780          -1       122      0       ##ніх діи .
2008  53780          -1         2      0               діи
2009  53780          -1       122      0             діи .

[2010 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     543162          -1         3      0                киів
1     543162          -1         8      0            киівські
2     543162          -1        13      0       киівські клуб
3     543162       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     543162          -1         3      0                киів
1     543162          -1         8      1            киівські
2     543162          -1        13      1       киівські клуб
3     543162          -1        14      1      киівські клуби
4     543162          -1        18      1  киівські клуби від
...      ...         ...       ...    ...                 ...
3644  543162         257       264      1           ##ть ново
3645  543162         257       267      0        ##ть новость
3646  543162         260       264      0                ново
3647  543162         260       267      1             новость
3648  543162         264       267      1               ##сть

[3649 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     543590           0         1      0               т
1     543590           0         3      0             тре
2     543590           0         4      0            треш

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/952 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     543590           0         1      0               т
1     543590           0         3      1             тре
2     543590           0         4      1            треш
3     543590           0         5      1          треш -
4     543590           0        12      1  треш - історія
...      ...         ...       ...    ...             ...
7607  543590         358       363      1           на во
7608  543590         358       365      1         на волі
7609  543590         361       363      0              во
7610  543590         361       365      1            волі
7611  543590         363       365      1            ##лі

[7612 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     543890          -1        10      0            украінськии
1     543890          -1        15      0        украінськии каб
2     543890          -1        17      0      украінськии кабан
3     543890       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/892 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     543890          -1        10      0            украінськии
1     543890          -1        15      1        украінськии каб
2     543890          -1        17      1      украінськии кабан
3     543890          -1        19      1    украінськии кабан в
4     543890          -1        21      1  украінськии кабан впо
...      ...         ...       ...    ...                    ...
7129  543890         329       336      1              ##ть ново
7130  543890         329       339      0           ##ть новость
7131  543890         332       336      0                   ново
7132  543890         332       339      1                новость
7133  543890         336       339      1                  ##сть

[7134 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     544053           0         3      0             мал
1     544053           0         5      0           малюк
2     544053         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     544053           0         3      0             мал
1     544053           0         5      1           малюк
2     544053           0         9      1       малюк пер
3     544053           0        11      1     малюк перет
4     544053           0        14      1  малюк перетвор
...      ...         ...       ...    ...             ...
7007  544053         343       350      1       ##ть ново
7008  544053         343       353      0    ##ть новость
7009  544053         346       350      0            ново
7010  544053         346       353      1         новость
7011  544053         350       353      1           ##сть

[7012 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     544073           0         4      0              полі
1     544073           0         7      0           поліція
2     544073           0        11      0       поліція від
3     544073           0        12     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/365 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     544073           0         4      0              полі
1     544073           0         7      1           поліція
2     544073           0        11      1       поліція від
3     544073           0        12      1      поліція відк
4     544073           0        16      1  поліція відкрила
...      ...         ...       ...    ...               ...
2914  544073         212       219      1         ##ть ново
2915  544073         212       222      0      ##ть новость
2916  544073         215       219      0              ново
2917  544073         215       222      1           новость
2918  544073         219       222      1             ##сть

[2919 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     544139           0         2      0              ра
1     544139           0         4      0            раши
2     544139           0         7      0         рашисти
3     544139           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label            text
0     544139           0         2      0              ра
1     544139           0         4      1            раши
2     544139           0         7      1         рашисти
3     544139           0        11      1     рашисти нам
4     544139           0        14      1  рашисти намага
...      ...         ...       ...    ...             ...
5555  544139         286       293      1       ##ть ново
5556  544139         286       296      0    ##ть новость
5557  544139         289       293      0            ново
5558  544139         289       296      1         новость
5559  544139         293       296      1           ##сть

[5560 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0      544211           0         1      0               с
1      544211           0         4      0            скан
2      544211           0         7      0         скандал
3      544211           0         3      0     скандальнии
4      544211           0        14      0  скандальнии по
...       ...         ...       ...    ...             ...
36834  544211         754       761      0       ##ть ново
36835  544211         754       764      0    ##ть новость
36836  544211         757       761      0            ново
36837  544211         757       764      0         новость
36838  544211         761       764      0           ##сть

[36839 rows x 5 columns]
(36839, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/4605 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0      544211           0         1      0               с
1      544211           0         4      1            скан
2      544211           0         7      1         скандал
3      544211           0         3      1     скандальнии
4      544211           0        14      1  скандальнии по
...       ...         ...       ...    ...             ...
36834  544211         754       761      1       ##ть ново
36835  544211         754       764      0    ##ть новость
36836  544211         757       761      0            ново
36837  544211         757       764      1         новость
36838  544211         761       764      1           ##сть

[36839 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     544700           0         1      0             т
1     544700           0         3      0           тро
2     544700           0         5      0         троян
3     544700           0         4      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1064 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     544700           0         1      0             т
1     544700           0         3      1           тро
2     544700           0         5      1         троян
3     544700           0         4      1    троянськии
4     544700           0         8      1  троянськии к
...      ...         ...       ...    ...           ...
8500  544700         399       403      0          блок
8501  544700         399       409      1    блокування
8502  544700         399       410      0  блокування .
8503  544700         403       409      1      ##ування
8504  544700         403       410      0    ##ування .

[8505 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     545194           0         1      0                     у
1     545194           0         7      0               у києві
2     545194           0        12      0          у києві полі
3     545194           0         2      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/790 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     545194           0         1      0                     у
1     545194           0         7      1               у києві
2     545194           0        12      1          у києві полі
3     545194           0         2      1       у києві поліцеи
4     545194           0         4      1  у києві поліцеиськии
...      ...         ...       ...    ...                   ...
6315  545194         359       366      1             ##ть ново
6316  545194         359       369      0          ##ть новость
6317  545194         362       366      0                  ново
6318  545194         362       369      1               новость
6319  545194         366       369      1                 ##сть

[6320 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     545767           0         1      0             ж
1     545767           0         3      0           жор
2     545767           0         7     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     545767           0         1      0             ж
1     545767           0         3      1           жор
2     545767           0         7      1       жорсток
3     545767           0         8      1      жорстоко
4     545767           0        11      1   жорстоко по
...      ...         ...       ...    ...           ...
4741  545767         279       286      1     ##ть ново
4742  545767         279       289      0  ##ть новость
4743  545767         282       286      0          ново
4744  545767         282       289      1       новость
4745  545767         286       289      1         ##сть

[4746 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     545839           0         2      0            сп
1     545839           0         5      0         спала
2     545839           0         6      0        спалах
3     545839           0         9      0     спалах ге
4     545839           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label          text
0     545839           0         2      1            сп
1     545839           0         5      1         спала
2     545839           0         6      1        спалах
3     545839           0         9      1     спалах ге
4     545839           0        12      1  спалах гепат
...      ...         ...       ...    ...           ...
4741  545839         298       305      1     ##ть ново
4742  545839         298       308      0  ##ть новость
4743  545839         301       305      0          ново
4744  545839         301       308      1       новость
4745  545839         305       308      1         ##сть

[4746 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      545859           0         3      0           наш
1      545859           0         4      0          наші
2      545859           0         7      0       наші дж
3      545859           0        10      0    наші джере
4      545859           0        12      0  наші джерела
...       ...         ...       ...    ...           ...
18123  545859         583       590      0     ##ть ново
18124  545859         583       593      0  ##ть новость
18125  545859         586       590      0          ново
18126  545859         586       593      0       новость
18127  545859         590       593      0         ##сть

[18128 rows x 5 columns]
(18128, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2266 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      545859           0         3      0           наш
1      545859           0         4      1          наші
2      545859           0         7      1       наші дж
3      545859           0        10      1    наші джере
4      545859           0        12      1  наші джерела
...       ...         ...       ...    ...           ...
18123  545859         583       590      1     ##ть ново
18124  545859         583       593      0  ##ть новость
18125  545859         586       590      0          ново
18126  545859         586       593      1       новость
18127  545859         590       593      1         ##сть

[18128 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     545983           0         1      0             п
1     545983           0         2      0            пз
2     545983           0         3      0           пзд
3     545983           0         4      0          пздц
4     5459

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     545983           0         1      0             п
1     545983           0         2      1            пз
2     545983           0         3      1           пзд
3     545983           0         4      1          пздц
4     545983           0         5      1        пздц :
...      ...         ...       ...    ...           ...
3645  545983         223       230      1     ##ть ново
3646  545983         223       233      0  ##ть новость
3647  545983         226       230      0          ново
3648  545983         226       233      1       новость
3649  545983         230       233      1         ##сть

[3650 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     60010           1         4      0              або
1     60010           1         8      0          або вод
2     60010           1         1      0        або водіі
3     60010           1        13      0     або водіі до
4     60010  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     60010           1         4      1              або
1     60010           1         8      1          або вод
2     60010           1         1      1        або водіі
3     60010           1        13      1     або водіі до
4     60010           1        16      1  або водіі дотри
...     ...         ...       ...    ...              ...
1422  60010         168       171      0              три
1423  60010         168       175      1          тривати
1424  60010         168       176      0        тривати .
1425  60010         171       175      1           ##вати
1426  60010         171       176      0         ##вати .

[1427 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     60070           0         1      0            е
1     60070           0         3      0          екс
2     60070           0         6      0       експер
3     60070           0         8      0     експерти
4     600

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label         text
0     60070           0         1      0            е
1     60070           0         3      1          екс
2     60070           0         6      1       експер
3     60070           0         8      1     експерти
4     60070           0        11      1  експерти на
...     ...         ...       ...    ...          ...
3644  60070         264       267      1        ##лос
3645  60070         264       269      1      ##лості
3646  60070         264       270      0    ##лості .
3647  60070         267       269      1         ##ті
3648  60070         267       270      0       ##ті .

[3649 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     60080           0         6      0           родини
1     60080           0         8      0         родини у
2     60080           0        11      0      родини учні
3     60080           0        12      0     родини учнів
4     60080           0        15    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/435 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     60080           0         6      0           родини
1     60080           0         8      1         родини у
2     60080           0        11      1      родини учні
3     60080           0        12      1     родини учнів
4     60080           0        15      1  родини учнів ви
...     ...         ...       ...    ...              ...
3475  60080         241       244      1            ##шні
3476  60080         241       247      1         ##шність
3477  60080         241       248      0       ##шність .
3478  60080         244       247      1            ##сть
3479  60080         244       248      0          ##сть .

[3480 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     60130           0         1      0                   в
1     60130           0         5      0               впали
2     60130           0         4      0         впали маиже
3     60130           0        15  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/682 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     60130           0         1      0                   в
1     60130           0         5      1               впали
2     60130           0         4      1         впали маиже
3     60130           0        15      1     впали маиже 500
4     60130           0        18      1  впали маиже 500 ел
...     ...         ...       ...    ...                 ...
5445  60130         280       282      1                ##лі
5446  60130         280       285      1             ##лідки
5447  60130         280       286      0           ##лідки .
5448  60130         282       285      1               ##дки
5449  60130         282       286      0             ##дки .

[5450 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     60200           0         1      0              у
1     60200           0         3      0            у х
2     60200           0         5      0          у хар
3     60200        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     60200           0         1      0              у
1     60200           0         3      1            у х
2     60200           0         5      1          у хар
3     60200           0         9      1      у харкові
4     60200           0        13      1  у харкові від
...     ...         ...       ...    ...            ...
3476  60200         292       293      0              у
3477  60200         292       299      1        у місті
3478  60200         292       300      1      у місті ?
3479  60200         294       299      0          місті
3480  60200         294       300      1        місті ?

[3481 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     60260           0         2      0              15
1     60260           0         3      0            15 -
2     60260           0         4      0          15 - р
3     60260           0         4      0     15 - річнии
4     60260       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     60260           0         2      0              15
1     60260           0         3      1            15 -
2     60260           0         4      1          15 - р
3     60260           0         4      1     15 - річнии
4     60260           0        12      1  15 - річнии по
...     ...         ...       ...    ...             ...
4453  60260          -1         1      1            ##оі
4454  60260          -1       276      1    ##оі системи
4455  60260          -1       277      1  ##оі системи ?
4456  60260         269       276      1         системи
4457  60260         269       277      1       системи ?

[4458 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     60290           0         3      0           кан
1     60290           0         6      0        каніку
2     60290           0         8      0      канікули
3     60290           0        11      0   канікули ро
4     60290     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     60290           0         3      0           кан
1     60290           0         6      1        каніку
2     60290           0         8      1      канікули
3     60290           0        11      1   канікули ро
4     60290           0        12      1  канікули роз
...     ...         ...       ...    ...           ...
2766  60290         230       233      0           для
2767  60290         230       238      1      для всіх
2768  60290         230       239      1    для всіх ?
2769  60290         234       238      0          всіх
2770  60290         234       239      1        всіх ?

[2771 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     60310           0         2      0                 на
1     60310           0         4      0               на х
2     60310           0         9      0          на харків
3     60310           0        13      0      на харківщині
4     60310    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/214 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     60310           0         2      0                 на
1     60310           0         4      1               на х
2     60310           0         9      1          на харків
3     60310           0        13      1      на харківщині
4     60310           0        17      1  на харківщині від
...     ...         ...       ...    ...                ...
1703  60310          -1         2      1              ##тии
1704  60310          -1       196      1      ##тии будинок
1705  60310          -1       197      0    ##тии будинок .
1706  60310         189       196      0            будинок
1707  60310         189       197      0          будинок .

[1708 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     60390           0         1      0             в
1     60390           0         7      0       в театр
2     60390           0         8      0      в театрі
3     60390           0        10  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     60390           0         1      0             в
1     60390           0         7      1       в театр
2     60390           0         8      1      в театрі
3     60390           0        10      1    в театрі л
4     60390           0        12      1  в театрі лял
...     ...         ...       ...    ...           ...
2406  60390          44        52      0      мистецтв
2407  60390          44        83      1     мистецтві
2408  60390          44       107      0   мистецтві .
2409  60390          82        83      1           ##і
2410  60390          82       107      0         ##і .

[2411 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     60410           0         1      0                у
1     60410           0         7      0          у місце
2     60410           0        10      0       у місцевом
3     60410           0        11      0      у місцевому
4     60410           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     60410           0         1      0                у
1     60410           0         7      1          у місце
2     60410           0        10      1       у місцевом
3     60410           0        11      1      у місцевому
4     60410           0        15      1  у місцевому при
...     ...         ...       ...    ...              ...
1644  60410         179       182      1            ##ряд
1645  60410         179       184      1          ##рядів
1646  60410         179       185      0        ##рядів .
1647  60410         182       184      1             ##ів
1648  60410         182       185      0           ##ів .

[1649 rows x 5 columns]
        id  seq_starts  seq_ends  label                             text
0    60460          -1         4      0                            новии
1    60460          -1        11      0                      новии роман
2    60460          -1        18      0               новии 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                             text
0    60460          -1         4      0                            новии
1    60460          -1        11      1                      новии роман
2    60460          -1        18      1               новии роман відомо
3    60460          -1        20      1             новии роман відомого
4    60460          -1        31      1  новии роман відомого письменник
..     ...         ...       ...    ...                              ...
938  60460         146       148      1                             ##ні
939  60460         146         4      1                       ##ні лініі
940  60460         146        66      0                     ##ні лініі .
941  60460          -1         4      0                            лініі
942  60460          -1        66      0                          лініі .

[943 rows x 5 columns]
         id  seq_starts  seq_ends  label                text
0     60560           0         2      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/236 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                text
0     60560           0         2      0                  за
1     60560           0         6      1              запуск
2     60560           0        13      1       запуск нового
3     60560           0        16      1    запуск нового су
4     60560           0        18      1  запуск нового супу
...     ...         ...       ...    ...                 ...
1883  60560         172       173      1                 ##с
1884  60560         172       177      1             ##сфери
1885  60560         172       179      0           ##сфери .
1886  60560         173       177      1              ##фери
1887  60560         173       179      0            ##фери .

[1888 rows x 5 columns]
         id  seq_starts  seq_ends  label        text
0     60570           0         1      0           е
1     60570           0         3      0         екс
2     60570           0         5      0       експе
3     60570           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/260 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label        text
0     60570           0         1      0           е
1     60570           0         3      1         екс
2     60570           0         5      1       експе
3     60570           0         7      1     експеди
4     60570           0        10      1  експедиція
...     ...         ...       ...    ...         ...
2072  60570         202       205      1       ##ісі
2073  60570         202         0      1      ##ісіі
2074  60570         202        68      0    ##ісіі .
2075  60570          -1         0      1         ##і
2076  60570          -1        68      0       ##і .

[2077 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     60660           0         2      0                за
1     60660           0         6      0            запуск
2     60660           0        13      0     запуск нового
3     60660           0        15      0   запуск нового р
4     60660           0        16      0  за

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     60660           0         2      0                за
1     60660           0         6      1            запуск
2     60660           0        13      1     запуск нового
3     60660           0        15      1   запуск нового р
4     60660           0        16      1  запуск нового ре
...     ...         ...       ...    ...               ...
2270  60660         185       188      1             ##вар
2271  60660         185         1      1           ##варіі
2272  60660         185       192      0         ##варіі .
2273  60660          -1         1      1              ##іі
2274  60660          -1       192      0            ##іі .

[2275 rows x 5 columns]
         id  seq_starts  seq_ends  label                         text
0     60690           0         4      0                         диск
1     60690           0         6      0                       дискус
2     60690           0         1      0                 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                         text
0     60690           0         4      0                         диск
1     60690           0         6      1                       дискус
2     60690           0         1      1                     дискусіі
3     60690           0        16      1             дискусіі навколо
4     60690           0        27      1  дискусіі навколо можливості
...     ...         ...       ...    ...                          ...
1588  60690         191       194      1                        ##ход
1589  60690         191       196      1                      ##ходів
1590  60690         191       198      0                    ##ходів .
1591  60690         194       196      1                         ##ів
1592  60690         194       198      0                       ##ів .

[1593 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     60890           0         3      0             бор
1     60890          

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/338 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     60890           0         3      0             бор
1     60890           0         5      1           борот
2     60890           0         8      1        боротьба
3     60890           0        11      1     боротьба за
4     60890           0        14      1  боротьба за ле
...     ...         ...       ...    ...             ...
2693  60890         223       228      1         ##ільно
2694  60890         223       231      1      ##ільності
2695  60890         223       233      0    ##ільності .
2696  60890         228       231      1           ##сті
2697  60890         228       233      0         ##сті .

[2698 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     60940           0         1      0              е
1     60940           0         6      0         етичні
2     60940           0         9      0      етичні де
3     60940           0        12      0   етичні дебат
4     60940

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     60940           0         1      0              е
1     60940           0         6      1         етичні
2     60940           0         9      1      етичні де
3     60940           0        12      1   етичні дебат
4     60940           0        13      1  етичні дебати
...     ...         ...       ...    ...            ...
3232  60940         251       255      1         ##ично
3233  60940         251       258      1      ##ичності
3234  60940         251       260      0    ##ичності .
3235  60940         255       258      1          ##сті
3236  60940         255       260      0        ##сті .

[3237 rows x 5 columns]
         id  seq_starts  seq_ends  label         text
0     61050           1         2      0            л
1     61050           1         3      0           лю
2     61050           1         5      0         люба
3     61050           1         8      0      люба сп
4     61050           1        10

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label         text
0     61050           1         2      0            л
1     61050           1         3      1           лю
2     61050           1         5      1         люба
3     61050           1         8      1      люба сп
4     61050           1        10      1    люба спро
...     ...         ...       ...    ...          ...
1028  61050         124       127      1        ##іль
1029  61050         124       131      1    ##ільства
1030  61050         124       133      0  ##ільства .
1031  61050         127       131      1       ##ства
1032  61050         127       133      0     ##ства .

[1033 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    61070           1         3      0             за
1    61070           1         7      0         запали
2    61070           1         8      0        запалив
3    61070           1        11      0     запалив во
4    61070           1        14      0  запалив вог

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/74 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe
INFO:LOG:Creating TensorDataset from features dataframe


        id  seq_starts  seq_ends  label           text
0    61070           1         3      0             за
1    61070           1         7      1         запали
2    61070           1         8      1        запалив
3    61070           1        11      1     запалив во
4    61070           1        14      1  запалив вогон
..     ...         ...       ...    ...            ...
587  61070          72        77      0          плане
588  61070          72        79      1        планеті
589  61070          72        80      1      планеті !
590  61070          77        79      1           ##ті
591  61070          77        80      1         ##ті !

[592 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    61100           1         5      0           лише
1    61100           1         8      0        лише об
2    61100           1         9      0       лише обє
3    61100           1        12      0    лише обєдна
4    61100           1        14      0  

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/75 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    61100           1         5      1           лише
1    61100           1         8      1        лише об
2    61100           1         9      1       лише обє
3    61100           1        12      1    лише обєдна
4    61100           1        14      1  лише обєднані
..     ...         ...       ...    ...            ...
589  61100          88        91      1          ##тро
590  61100          88        93      1        ##трофи
591  61100          88        94      1      ##трофи !
592  61100          91        93      1           ##фи
593  61100          91        94      1         ##фи !

[594 rows x 5 columns]
        id  seq_starts  seq_ends  label                  text
0    61120           1         4      0                   пор
1    61120           1         6      0                 поруш
2    61120           1        10      0             порушення
3    61120           1        19      0    порушення природно
4    6

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/38 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                  text
0    61120           1         4      1                   пор
1    61120           1         6      1                 поруш
2    61120           1        10      1             порушення
3    61120           1        19      1    порушення природно
4    61120           1        21      1  порушення природного
..     ...         ...       ...    ...                   ...
294  61120          69        72      1                 ##мат
295  61120          69        73      1                ##маті
296  61120          69        74      1              ##маті !
297  61120          72        73      1                   ##і
298  61120          72        74      1                 ##і !

[299 rows x 5 columns]
        id  seq_starts  seq_ends  label                        text
0    61160           1         2      0                           з
1    61160           1         6      0                       збіль
2    61160           1      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/44 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                        text
0    61160           1         2      0                           з
1    61160           1         6      1                       збіль
2    61160           1        11      1                  збільшення
3    61160           1        23      1      збільшення виробництва
4    61160           1        27      1  збільшення виробництва пом
..     ...         ...       ...    ...                         ...
344  61160          79        82      1                       ##жив
345  61160          79        86      1                   ##живачів
346  61160          79        87      1                 ##живачів !
347  61160          82        86      1                      ##ачів
348  61160          82        87      1                    ##ачів !

[349 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    61330           1         4      0             бор
1    61330           1         6      0         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/35 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    61330           1         4      0             бор
1    61330           1         6      1           борот
2    61330           1         9      1        боротьба
3    61330           1        11      1      боротьба з
4    61330           1        15      1  боротьба з бул
..     ...         ...       ...    ...             ...
269  61330          68        71      1           ##іль
270  61330          68        75      1       ##ільства
271  61330          68        76      1     ##ільства !
272  61330          71        75      1          ##ства
273  61330          71        76      1        ##ства !

[274 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     61480           1         3      0               чи
1     61480           1         7      0           чи має
2     61480           1         9      0         чи маємо
3     61480           1        12      0      чи маємо ми
4     61480   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/141 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     61480           1         3      1               чи
1     61480           1         7      1           чи має
2     61480           1         9      1         чи маємо
3     61480           1        12      1      чи маємо ми
4     61480           1        16      1  чи маємо ми бор
...     ...         ...       ...    ...              ...
1119  61480         136       139      1            ##іль
1120  61480         136       143      1        ##ільстві
1121  61480         136       144      1      ##ільстві !
1122  61480         139       143      1           ##стві
1123  61480         139       144      1         ##стві !

[1124 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     61500           1         4      0             від
1     61500           1         8      0         відмова
2     61500           1        12      0     відмова від
3     61500           1        14      0   відмова 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/200 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     61500           1         4      1             від
1     61500           1         8      1         відмова
2     61500           1        12      1     відмова від
3     61500           1        14      1   відмова від р
4     61500           1        15      1  відмова від рі
...     ...         ...       ...    ...             ...
1589  61500         158       161      1           ##іль
1590  61500         158       165      1       ##ільства
1591  61500         158       166      1     ##ільства !
1592  61500         161       165      1          ##ства
1593  61500         161       166      1        ##ства !

[1594 rows x 5 columns]
        id  seq_starts  seq_ends  label         text
0    61510           1         4      0          пер
1    61510           1         6      0        персп
2    61510           1         8      0      перспек
3    61510           1        11      0   перспектив
4    61510           1    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label         text
0    61510           1         4      0          пер
1    61510           1         6      1        персп
2    61510           1         8      1      перспек
3    61510           1        11      1   перспектив
4    61510           1        12      1  перспектива
..     ...         ...       ...    ...          ...
854  61510         130       131      0            з
855  61510         130       135      1        з нас
856  61510         130       136      1      з нас !
857  61510         132       135      0          нас
858  61510         132       136      1        нас !

[859 rows x 5 columns]
        id  seq_starts  seq_ends  label           text
0    61590           1         4      0            бор
1    61590           1         6      0          борот
2    61590           1         9      0       боротьба
3    61590           1        12      0    боротьба зі
4    61590           1        14      0  боротьба зі щ
..     ...

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/88 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label           text
0    61590           1         4      0            бор
1    61590           1         6      1          борот
2    61590           1         9      1       боротьба
3    61590           1        12      1    боротьба зі
4    61590           1        14      1  боротьба зі щ
..     ...         ...       ...    ...            ...
695  61590         123       125      1           ##ро
696  61590         123       128      1        ##родою
697  61590         123       129      1      ##родою !
698  61590         125       128      1          ##дою
699  61590         125       129      1        ##дою !

[700 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     61640           1         3      0              чи
1     61640           1         7      0          чи має
2     61640           1         9      0        чи маємо
3     61640           1        12      0     чи маємо ми
4     61640           1        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/236 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     61640           1         3      1              чи
1     61640           1         7      1          чи має
2     61640           1         9      1        чи маємо
3     61640           1        12      1     чи маємо ми
4     61640           1        15      1  чи маємо ми не
...     ...         ...       ...    ...             ...
1882  61640         164       167      1           ##іль
1883  61640         164       171      1       ##ільстві
1884  61640         164       172      1     ##ільстві !
1885  61640         167       171      1          ##стві
1886  61640         167       172      1        ##стві !

[1887 rows x 5 columns]
         id  seq_starts  seq_ends  label                       text
0     61830           1         4      0                        зал
1     61830           1         6      0                      заляк
2     61830           1        12      0                залякування
3     61830        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                       text
0     61830           1         4      0                        зал
1     61830           1         6      1                      заляк
2     61830           1        12      1                залякування
3     61830           1        20      1        залякування громади
4     61830           1        26      1  залякування громади перед
...     ...         ...       ...    ...                        ...
1371  61830         158       163      0                      серед
1372  61830         158       173      1            серед мешканців
1373  61830         158       174      1          серед мешканців !
1374  61830         164       173      0                  мешканців
1375  61830         164       174      1                мешканців !

[1376 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     61840           1         4      0            бор
1     61840           1         6      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/129 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     61840           1         4      0            бор
1     61840           1         6      1          борот
2     61840           1         9      1       боротьба
3     61840           1        11      1     боротьба з
4     61840           1        14      1  боротьба з ро
...     ...         ...       ...    ...            ...
1026  61840         153       155      1           ##су
1027  61840         153       161      1     ##судження
1028  61840         153       162      1   ##судження !
1029  61840         155       161      1       ##дження
1030  61840         155       162      1     ##дження !

[1031 rows x 5 columns]
         id  seq_starts  seq_ends  label                    text
0     61850           1         4      0                     под
1     61850           1         7      0                  подола
2     61850           1        10      0               подолання
3     61850           1        19      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/207 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                    text
0     61850           1         4      0                     под
1     61850           1         7      1                  подола
2     61850           1        10      1               подолання
3     61850           1        19      1      подолання проблеми
4     61850           1        23      1  подолання проблеми під
...     ...         ...       ...    ...                     ...
1644  61850         187       189      1                    ##еч
1645  61850         187       191      1                  ##ечки
1646  61850         187       192      1                ##ечки !
1647  61850         189       191      1                    ##ки
1648  61850         189       192      1                  ##ки !

[1649 rows x 5 columns]
         id  seq_starts  seq_ends  label          text
0     61970           1         3      0            не
1     61970           1         5      0          недо
2     61970           1       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/193 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label          text
0     61970           1         3      1            не
1     61970           1         5      1          недо
2     61970           1         9      1      недостат
3     61970           1        11      1    недостатня
4     61970           1        13      1  недостатня у
...     ...         ...       ...    ...           ...
1532  61970         175       179      1        ##омад
1533  61970         175       180      1       ##омаді
1534  61970         175       181      1     ##омаді !
1535  61970         179       180      1           ##і
1536  61970         179       181      1         ##і !

[1537 rows x 5 columns]
         id  seq_starts  seq_ends  label           text
0     61980           1         4      0            бор
1     61980           1         6      0          борот
2     61980           1         9      0       боротьба
3     61980           1        11      0     боротьба з
4     61980           1        14  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/147 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label           text
0     61980           1         4      0            бор
1     61980           1         6      1          борот
2     61980           1         9      1       боротьба
3     61980           1        11      1     боротьба з
4     61980           1        14      1  боротьба з за
...     ...         ...       ...    ...            ...
1167  61980         146       150      1         ##омад
1168  61980         146       151      1        ##омаді
1169  61980         146       152      1      ##омаді !
1170  61980         150       151      1            ##і
1171  61980         150       152      1          ##і !

[1172 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     62070           1         4      0               бор
1     62070           1         6      0             борот
2     62070           1         9      0          боротьба
3     62070           1        11      0        боротьба з
4     62

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/166 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     62070           1         4      0               бор
1     62070           1         6      1             борот
2     62070           1         9      1          боротьба
3     62070           1        11      1        боротьба з
4     62070           1        17      1  боротьба з голос
...     ...         ...       ...    ...               ...
1317  62070         156       159      1             ##уре
1318  62070         156       162      1          ##урення
1319  62070         156       163      1        ##урення !
1320  62070         159       162      1             ##ння
1321  62070         159       163      1           ##ння !

[1322 rows x 5 columns]
         id  seq_starts  seq_ends  label                   text
0     62080           1        13      0           забезпечення
1     62080           1        16      0        забезпечення ти
2     62080           1        18      0      забезпечення тиші
3     62080

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/199 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                   text
0     62080           1        13      0           забезпечення
1     62080           1        16      1        забезпечення ти
2     62080           1        18      1      забезпечення тиші
3     62080           1        20      1    забезпечення тиші в
4     62080           1        22      1  забезпечення тиші в ж
...     ...         ...       ...    ...                    ...
1587  62080         160       161      0                      у
1588  62080         160       171      1            у мешканців
1589  62080         160       172      1          у мешканців !
1590  62080         162       171      0              мешканців
1591  62080         162       172      1            мешканців !

[1592 rows x 5 columns]
         id  seq_starts  seq_ends  label             text
0     62090           1         2      0                ж
1     62090           1         4      0              жод
2     62090           1         6

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/147 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label             text
0     62090           1         2      0                ж
1     62090           1         4      1              жод
2     62090           1         6      1            жодна
3     62090           1        13      1     жодна людина
4     62090           1        16      1  жодна людина не
...     ...         ...       ...    ...              ...
1168  62090         149       151      0               ти
1169  62090         149       153      1             тиші
1170  62090         149       154      1           тиші !
1171  62090         151       153      1             ##ші
1172  62090         151       154      1           ##ші !

[1173 rows x 5 columns]
         id  seq_starts  seq_ends  label              text
0     62110           1         4      0               пас
1     62110           1         8      0           пасивні
2     62110           1        11      0        пасивність
3     62110           1        13      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/179 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label              text
0     62110           1         4      0               пас
1     62110           1         8      1           пасивні
2     62110           1        11      1        пасивність
3     62110           1        13      1      пасивність у
4     62110           1        17      1  пасивність у бор
...     ...         ...       ...    ...               ...
1423  62110         146       150      1            ##омад
1424  62110         146       151      1           ##омаді
1425  62110         146       152      1         ##омаді !
1426  62110         150       151      1               ##і
1427  62110         150       152      1             ##і !

[1428 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     62190           1         4      0             без
1     62190           1         7      0          бездом
2     62190           1         9      0        бездомні
3     62190           1        12      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     62190           1         4      1             без
1     62190           1         7      1          бездом
2     62190           1         9      1        бездомні
3     62190           1        12      1     бездомні со
4     62190           1        15      1  бездомні собак
...     ...         ...       ...    ...             ...
1216  62190         136       140      1          ##омад
1217  62190         136       141      1         ##омаді
1218  62190         136       142      0       ##омаді .
1219  62190         140       141      1             ##і
1220  62190         140       142      0           ##і .

[1221 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    62260           1         3      0               чи
1    62260           1         9      0         чи справ
2    62260           1        11      0       чи справді
3    62260           1        14      0    чи справді ли
4    6

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    62260           1         3      1               чи
1    62260           1         9      1         чи справ
2    62260           1        11      1       чи справді
3    62260           1        14      1    чи справді ли
4    62260           1        16      1  чи справді лиси
..     ...         ...       ...    ...              ...
937  62260         111       114      1            ##бно
938  62260         111       117      1         ##бності
939  62260         111       118      1       ##бності ?
940  62260         114       117      1            ##сті
941  62260         114       118      1          ##сті ?

[942 rows x 5 columns]
        id  seq_starts  seq_ends  label                     text
0    62390           1         6      0                    деякі
1    62390           1        11      0               деякі наук
2    62390           1        13      0             деякі науков
3    62390           1        15

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/88 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                     text
0    62390           1         6      1                    деякі
1    62390           1        11      1               деякі наук
2    62390           1        13      1             деякі науков
3    62390           1        15      1           деякі науковці
4    62390           1        24      1  деякі науковці вважають
..     ...         ...       ...    ...                      ...
695  62390         121       122      1                      ##і
696  62390         121       125      1                   ##іфом
697  62390         121       126      0                 ##іфом .
698  62390         122       125      1                    ##фом
699  62390         122       126      0                  ##фом .

[700 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    62420           1         3      0                чи
1    62420           1         9      0          чи можна
2    62420           1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/58 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    62420           1         3      1                чи
1    62420           1         9      1          чи можна
2    62420           1        12      1       чи можна вв
3    62420           1        13      1      чи можна вва
4    62420           1        17      1  чи можна вважати
..     ...         ...       ...    ...               ...
458  62420          92        95      1               про
459  62420          92        99      1           про них
460  62420          92       100      1         про них ?
461  62420          96        99      1               них
462  62420          96       100      1             них ?

[463 rows x 5 columns]
        id  seq_starts  seq_ends  label                    text
0    62540           1         4      0                     зал
1    62540           1         6      0                   залиш
2    62540           1         9      0                залишені
3    62540           1  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                    text
0    62540           1         4      0                     зал
1    62540           1         6      1                   залиш
2    62540           1         9      1                залишені
3    62540           1        16      1         залишені машини
4    62540           1        23      1  залишені машини можуть
..     ...         ...       ...    ...                     ...
854  62540          -1         4      1                 ##ськии
855  62540          -1       155      1         ##ськии порядок
856  62540          -1       156      0       ##ськии порядок .
857  62540         148       155      0                 порядок
858  62540         148       156      0               порядок .

[859 rows x 5 columns]
        id  seq_starts  seq_ends  label                    text
0    62640           1         4      0                     зал
1    62640           1         6      0                   залиш
2    62640      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/88 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                    text
0    62640           1         4      0                     зал
1    62640           1         6      1                   залиш
2    62640           1         9      1                залишені
3    62640           1        16      1         залишені машини
4    62640           1        23      1  залишені машини можуть
..     ...         ...       ...    ...                     ...
696  62640         130       132      0                      та
697  62640         130       145      1         та використання
698  62640         130       146      0       та використання .
699  62640         133       145      1            використання
700  62640         133       146      0          використання .

[701 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    62650           1         3      0                 чи
1    62650           1         5      0               чи є
2    62650           1        1

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/79 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    62650           1         3      1                 чи
1    62650           1         5      1               чи є
2    62650           1        10      1          чи є ліку
3    62650           1        15      1     чи є лікування
4    62650           1        18      1  чи є лікування ра
..     ...         ...       ...    ...                ...
623  62650          89        91      1               ##ил
624  62650          89        93      1             ##илля
625  62650          89        94      1           ##илля ?
626  62650          91        93      1               ##ля
627  62650          91        94      1             ##ля ?

[628 rows x 5 columns]
        id  seq_starts  seq_ends  label             text
0    62740           1         3      0               чи
1    62740           1         9      0         чи можна
2    62740           1        12      0      чи можна до
3    62740           1        14      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label             text
0    62740           1         3      1               чи
1    62740           1         9      1         чи можна
2    62740           1        12      1      чи можна до
3    62740           1        14      1    чи можна дові
4    62740           1        16      1  чи можна довіря
..     ...         ...       ...    ...              ...
939  62740          13        14      1              ##і
940  62740          13       111      1             ##іф
941  62740          13       112      1           ##іф ?
942  62740         110       111      1              ##ф
943  62740         110       112      1            ##ф ?

[944 rows x 5 columns]
        id  seq_starts  seq_ends  label                       text
0    62850           1         3      0                         чи
1    62850           1         5      0                       чи є
2    62850           1        12      0                чи є велика
3    62850           1  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                       text
0    62850           1         3      1                         чи
1    62850           1         5      1                       чи є
2    62850           1        12      1                чи є велика
3    62850           1        22      1      чи є велика кількість
4    62850           1        26      1  чи є велика кількість гол
..     ...         ...       ...    ...                        ...
896  62850         150       153      1                      ##сел
897  62850         150       157      1                  ##селення
898  62850         150       158      1                ##селення ?
899  62850         153       157      1                     ##ення
900  62850         153       158      1                   ##ення ?

[901 rows x 5 columns]
        id  seq_starts  seq_ends  label                 text
0    62890           1         8      0              питання
1    62890           1        12      0          п

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                 text
0    62890           1         8      0              питання
1    62890           1        12      1          питання про
2    62890           1        15      1       питання про те
3    62890           1        16      1     питання про те ,
4    62890           1        19      1  питання про те , чи
..     ...         ...       ...    ...                  ...
733  62890         115       119      1               ##цями
734  62890         115       125      1         ##цями міста
735  62890         115       126      0       ##цями міста .
736  62890         120       125      0                міста
737  62890         120       126      0              міста .

[738 rows x 5 columns]
        id  seq_starts  seq_ends  label                 text
0    62990           1         3      0                   чи
1    62990           1         8      0              чи може
2    62990           1        12      0          чи може від


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                 text
0    62990           1         3      1                   чи
1    62990           1         8      1              чи може
2    62990           1        12      1          чи може від
3    62990           1        14      1        чи може відсу
4    62990           1        20      1  чи може відсутність
..     ...         ...       ...    ...                  ...
773  62990         114       115      1                  ##і
774  62990         114       116      1                 ##іф
775  62990         114       117      1               ##іф ?
776  62990         115       116      1                  ##ф
777  62990         115       117      1                ##ф ?

[778 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     63000           1         8      0              питання
1     63000           1        12      0          питання про
2     63000           1        15      0       питання про

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/172 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     63000           1         8      0              питання
1     63000           1        12      1          питання про
2     63000           1        15      1       питання про те
3     63000           1        16      1     питання про те ,
4     63000           1        19      1  питання про те , чи
...     ...         ...       ...    ...                  ...
1370  63000         164       167      0                  під
1371  63000         164       171      1              підходу
1372  63000         164       172      0            підходу .
1373  63000         167       171      1               ##ходу
1374  63000         167       172      0             ##ходу .

[1375 rows x 5 columns]
         id  seq_starts  seq_ends  label                 text
0     63060           1         3      0                   ви
1     63060           1         6      0                вимир
2     63060           1        10      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/130 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label                 text
0     63060           1         3      0                   ви
1     63060           1         6      1                вимир
2     63060           1        10      1            вимирання
3     63060           1        13      1         вимирання че
4     63060           1        15      1       вимирання черв
...     ...         ...       ...    ...                  ...
1028  63060          -1         3      1               ##ькоі
1029  63060          -1       145      1    ##ькоі діяльності
1030  63060          -1       147      0  ##ькоі діяльності .
1031  63060         135       145      1           діяльності
1032  63060         135       147      0         діяльності .

[1033 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    63210           1         3      0                  ви
1    63210           1         8      0             виходит
2    63210           1         9      0            

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/83 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    63210           1         3      0                  ви
1    63210           1         8      1             виходит
2    63210           1         9      1            виходити
3    63210           1        12      1         виходити зі
4    63210           1        19      1  виходити зі статус
..     ...         ...       ...    ...                 ...
659  63210         110       113      1               ##омо
660  63210         110       114      1              ##омог
661  63210         110       116      0            ##омог .
662  63210         113       114      1                 ##г
663  63210         113       116      0               ##г .

[664 rows x 5 columns]
        id  seq_starts  seq_ends  label                 text
0    63260           1         9      0             проблема
1    63260           1        13      0         проблема без
2    63260           1        15      0       проблема безха
3    63260  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/51 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                 text
0    63260           1         9      1             проблема
1    63260           1        13      1         проблема без
2    63260           1        15      1       проблема безха
3    63260           1        17      1     проблема безхать
4    63260           1        20      1  проблема безхатьків
..     ...         ...       ...    ...                  ...
399  63260         111       113      1                 ##ід
400  63260         111       116      1              ##ідною
401  63260         111       118      0            ##ідною .
402  63260         113       116      1                ##ною
403  63260         113       118      0              ##ною .

[404 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    63270           1         4      0               без
1    63270           1         6      0             безха
2    63270           1         8      0           безхать
3    63270  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/66 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    63270           1         4      1               без
1    63270           1         6      1             безха
2    63270           1         8      1           безхать
3    63270           1        10      1         безхатьки
4    63270           1        17      1  безхатьки можуть
..     ...         ...       ...    ...               ...
521  63270         107       110      1             ##них
522  63270         107       118      1     ##них проблем
523  63270         107       120      0   ##них проблем .
524  63270         111       118      1           проблем
525  63270         111       120      0         проблем .

[526 rows x 5 columns]
        id  seq_starts  seq_ends  label              text
0    63280           1         3      0                су
1    63280           1         5      0              сусп
2    63280           1         8      0           суспіль
3    63280           1        12      0       су

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/118 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label              text
0    63280           1         3      1                су
1    63280           1         5      1              сусп
2    63280           1         8      1           суспіль
3    63280           1        12      1       суспільство
4    63280           1        17      1  суспільство може
..     ...         ...       ...    ...               ...
938  63280         131       133      1              ##рі
939  63280         131       137      1          ##рішити
940  63280         131       139      0        ##рішити .
941  63280         133       137      1            ##шити
942  63280         133       139      0          ##шити .

[943 rows x 5 columns]
        id  seq_starts  seq_ends  label                         text
0    63310           1         9      0                     розвиток
1    63310           1        12      0                  розвиток со
2    63310           1        14      0                розвиток соці
3   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/70 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                         text
0    63310           1         9      0                     розвиток
1    63310           1        12      1                  розвиток со
2    63310           1        14      1                розвиток соці
3    63310           1        20      1          розвиток соціальних
4    63310           1        28      1  розвиток соціальних програм
..     ...         ...       ...    ...                          ...
554  63310         100       103      1                        ##дом
555  63310         100       108      1                   ##домності
556  63310         100       110      0                 ##домності .
557  63310         103       108      1                      ##ності
558  63310         103       110      0                    ##ності .

[559 rows x 5 columns]
        id  seq_starts  seq_ends  label         text
0    63340           1         3      0           до
1    63340           1         4      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label         text
0    63340           1         3      0           до
1    63340           1         4      1          дов
2    63340           1         6      1        довге
3    63340           1        10      1    довге пер
4    63340           1        12      1  довге переб
..     ...         ...       ...    ...          ...
854  63340         121       123      0           ра
855  63340         121       125      1         раку
856  63340         121       127      0       раку .
857  63340         123       125      1         ##ку
858  63340         123       127      0       ##ку .

[859 rows x 5 columns]
        id  seq_starts  seq_ends  label                 text
0    63360           1         4      0                  під
1    63360           1         8      0              під сон
2    63360           1        11      0           під сонцем
3    63360           1        17      0     під сонцем можна
4    63360           1        20   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                 text
0    63360           1         4      0                  під
1    63360           1         8      1              під сон
2    63360           1        11      1           під сонцем
3    63360           1        17      1     під сонцем можна
4    63360           1        20      1  під сонцем можна от
..     ...         ...       ...    ...                  ...
773  63360         112       114      1                 ##кі
774  63360         112       116      1               ##кіри
775  63360         112       118      0             ##кіри .
776  63360         114       116      1                 ##ри
777  63360         114       118      0               ##ри .

[778 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    63370           1         4      0                 пер
1    63370           1         6      0               переб
2    63370           1        12      0         перебування
3   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/83 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    63370           1         4      0                 пер
1    63370           1         6      1               переб
2    63370           1        12      1         перебування
3    63370           1        15      1      перебування на
4    63370           1        19      1  перебування на сон
..     ...         ...       ...    ...                 ...
659  63370         102       108      0              здоров
660  63370         102       109      1             здоровя
661  63370         102       111      0           здоровя .
662  63370         108       109      1                 ##я
663  63370         108       111      0               ##я .

[664 rows x 5 columns]
        id  seq_starts  seq_ends  label          text
0    63460           1         3      0            за
1    63460           1         4      0           зас
2    63460           1         6      0         засма
3    63460           1         8      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/70 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label          text
0    63460           1         3      0            за
1    63460           1         4      1           зас
2    63460           1         6      1         засма
3    63460           1         8      1       засмага
4    63460           1        13      1  засмага може
..     ...         ...       ...    ...           ...
554  63460          94        96      1          ##кі
555  63460          94        98      1        ##кіри
556  63460          94       100      0      ##кіри .
557  63460          96        98      1          ##ри
558  63460          96       100      0        ##ри .

[559 rows x 5 columns]
        id  seq_starts  seq_ends  label          text
0    63480           1         3      0            ат
1    63480           1         5      0          атом
2    63480           1         7      0        атомні
3    63480           1        10      0     атомні ел
4    63480           1        12      0   атомні елек
..  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/70 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label          text
0    63480           1         3      0            ат
1    63480           1         5      1          атом
2    63480           1         7      1        атомні
3    63480           1        10      1     атомні ел
4    63480           1        12      1   атомні елек
..     ...         ...       ...    ...           ...
554  63480          80        85      0         серед
555  63480          80        90      1    середовища
556  63480          80        91      1  середовища ?
557  63480          85        90      1       ##овища
558  63480          85        91      1     ##овища ?

[559 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    63610           1         6      0               життя
1    63610           1         8      0             життя в
2    63610           1        12      0         життя в при
3    63610           1        15      0      життя в приват
4    63610           1      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/98 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    63610           1         6      1               життя
1    63610           1         8      1             життя в
2    63610           1        12      1         життя в при
3    63610           1        15      1      життя в приват
4    63610           1        19      1  життя в приватному
..     ...         ...       ...    ...                 ...
773  63610         122       125      1               ##іль
774  63610         122       129      1           ##ільства
775  63610         122       130      1         ##ільства ?
776  63610         125       129      1              ##ства
777  63610         125       130      1            ##ства ?

[778 rows x 5 columns]
         id  seq_starts  seq_ends  label            text
0     63640           1         3      0              ме
1     63640           1         7      0          мешкан
2     63640           1         9      0        мешкання
3     63640           1     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/153 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label            text
0     63640           1         3      0              ме
1     63640           1         7      1          мешкан
2     63640           1         9      1        мешкання
3     63640           1        11      1      мешкання в
4     63640           1        15      1  мешкання в при
...     ...         ...       ...    ...             ...
1218  63640         157       159      0              ви
1219  63640         157       163      1          витрат
1220  63640         157       164      1        витрат ?
1221  63640         159       163      1          ##трат
1222  63640         159       164      1        ##трат ?

[1223 rows x 5 columns]
        id  seq_starts  seq_ends  label            text
0    63720           1         3      0              ме
1    63720           1         7      0          мешкан
2    63720           1         9      0        мешкання
3    63720           1        11      0      мешкання в
4    63720 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label            text
0    63720           1         3      0              ме
1    63720           1         7      1          мешкан
2    63720           1         9      1        мешкання
3    63720           1        11      1      мешкання в
4    63720           1        15      1  мешкання в при
..     ...         ...       ...    ...             ...
854  63720         129       131      1            ##ме
855  63720         129       135      1        ##межень
856  63720         129       136      1      ##межень ?
857  63720         131       135      1          ##жень
858  63720         131       136      1        ##жень ?

[859 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    63800          -1         5      0             єдинии
1    63800          -1        10      0          єдинии ви
2    63800          -1        13      0       єдинии вихід
3    63800          -1        15      0     єдинии вихід -
4    6380

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/83 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    63800          -1         5      1             єдинии
1    63800          -1        10      1          єдинии ви
2    63800          -1        13      1       єдинии вихід
3    63800          -1        15      1     єдинии вихід -
4    63800          -1        18      1  єдинии вихід - це
..     ...         ...       ...    ...                ...
657  63800         102       111      0          транспорт
658  63800         102       113      1        транспортом
659  63800         102       114      0      транспортом .
660  63800         111       113      1               ##ом
661  63800         111       114      0             ##ом .

[662 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    64020           1         5      0               нема
1    64020           1         8      0            нема пр
2    64020           1        11      0         нема пр що
3    64020           1        16

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/93 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    64020           1         5      1               нема
1    64020           1         8      1            нема пр
2    64020           1        11      1         нема пр що
3    64020           1        16      1    нема пр що дума
4    64020           1        18      1  нема пр що думати
..     ...         ...       ...    ...                ...
732  64020         119       122      1              ##іль
733  64020         119       126      1          ##ільства
734  64020         119       127      0        ##ільства .
735  64020         122       126      1             ##ства
736  64020         122       127      0           ##ства .

[737 rows x 5 columns]
        id  seq_starts  seq_ends  label                text
0    64050           1         5      0                нема
1    64050           1         8      0             нема пр
2    64050           1        11      0          нема пр що
3    64050           1      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label                text
0    64050           1         5      1                нема
1    64050           1         8      1             нема пр
2    64050           1        11      1          нема пр що
3    64050           1        16      1     нема пр що дума
4    64050           1        18      1   нема пр що думати
..     ...         ...       ...    ...                 ...
894  64050         119       125      1            ##альних
895  64050         119       133      1    ##альних проблем
896  64050         119       134      0  ##альних проблем .
897  64050         126       133      1             проблем
898  64050         126       134      0           проблем .

[899 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     64070           1         5      0               нема
1     64070           1         8      0            нема пр
2     64070           1        11      0         нема пр що
3     64070     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/129 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     64070           1         5      1               нема
1     64070           1         8      1            нема пр
2     64070           1        11      1         нема пр що
3     64070           1        16      1    нема пр що дума
4     64070           1        18      1  нема пр що думати
...     ...         ...       ...    ...                ...
1026  64070         126       128      1               ##ви
1027  64070         126       136      1       ##визначення
1028  64070         126       137      0     ##визначення .
1029  64070         128       136      1         ##значення
1030  64070         128       137      0       ##значення .

[1031 rows x 5 columns]
         id  seq_starts  seq_ends  label               text
0     64090           1         5      0               нема
1     64090           1         8      0            нема пр
2     64090           1        11      0         нема пр що
3     64090    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/129 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


         id  seq_starts  seq_ends  label               text
0     64090           1         5      1               нема
1     64090           1         8      1            нема пр
2     64090           1        11      1         нема пр що
3     64090           1        16      1    нема пр що дума
4     64090           1        18      1  нема пр що думати
...     ...         ...       ...    ...                ...
1026  64090         134       136      1               ##ви
1027  64090         134       144      1       ##визначення
1028  64090         134       145      0     ##визначення .
1029  64090         136       144      1         ##значення
1030  64090         136       145      0       ##значення .

[1031 rows x 5 columns]
        id  seq_starts  seq_ends  label               text
0    64100           1         5      0               нема
1    64100           1         8      0            нема пр
2    64100           1        11      0         нема пр що
3    64100         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/108 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


        id  seq_starts  seq_ends  label               text
0    64100           1         5      1               нема
1    64100           1         8      1            нема пр
2    64100           1        11      1         нема пр що
3    64100           1        16      1    нема пр що дума
4    64100           1        18      1  нема пр що думати
..     ...         ...       ...    ...                ...
852  64100         125       128      1              ##іль
853  64100         125       132      1          ##ільства
854  64100         125       133      0        ##ільства .
855  64100         128       132      1             ##ства
856  64100         128       133      0           ##ства .

[857 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     645654           0         1      0               с
1     645654           0         4      0            скіл
2     645654           0         7      0         скільки
3     645654           0        10  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     645654           0         1      0               с
1     645654           0         4      1            скіл
2     645654           0         7      1         скільки
3     645654           0        10      1      скільки за
4     645654           0        14      1  скільки зароби
...      ...         ...       ...    ...             ...
7612  645654         376       385      1     ##лати нови
7613  645654         376       387      1   ##лати новину
7614  645654         381       385      0            нови
7615  645654         381       387      0          новину
7616  645654         385       387      1            ##ну

[7617 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645756           0         1      0              п
1     645756           0         3      0            пив
2     645756           0         4      0           пиво
3     645756           0        11      0    пиво з

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645756           0         1      0              п
1     645756           0         3      1            пив
2     645756           0         4      1           пиво
3     645756           0        11      1    пиво значно
4     645756           0        13      1  пиво значно з
...      ...         ...       ...    ...            ...
7011  645756         317       326      1    ##лати нови
7012  645756         317       328      1  ##лати новину
7013  645756         322       326      0           нови
7014  645756         322       328      0         новину
7015  645756         326       328      1           ##ну

[7016 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645805           0         2      0             же
1     645805           0         4      0           жест
2     645805           0         6      0         жестяк
3     645805           0         9      0      жестякове
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645805           0         2      1             же
1     645805           0         4      1           жест
2     645805           0         6      1         жестяк
3     645805           0         9      1      жестякове
4     645805           0        11      1    жестякове д
...      ...         ...       ...    ...            ...
7004  645805         292       301      1    ##лати нови
7005  645805         292       303      1  ##лати новину
7006  645805         297       301      0           нови
7007  645805         297       303      0         новину
7008  645805         301       303      1           ##ну

[7009 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645977           0         3      0            під
1     645977           0         5      0          підви
2     645977           0         7      0        підвищи
3     645977           0         9      0      підвищити
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/511 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645977           0         3      0            під
1     645977           0         5      1          підви
2     645977           0         7      1        підвищи
3     645977           0         9      1      підвищити
4     645977           0        12      1   підвищити ці
...      ...         ...       ...    ...            ...
4080  645977         221       230      1    ##лати нови
4081  645977         221       232      1  ##лати новину
4082  645977         226       230      0           нови
4083  645977         226       232      0         новину
4084  645977         230       232      1           ##ну

[4085 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     646006           0         1      0                  м
1     646006           0         1      0                міи
2     646006           0        11      0        міи чоловік
3     646006           0        13      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     646006           0         1      0                  м
1     646006           0         1      1                міи
2     646006           0        11      1        міи чоловік
3     646006           0        13      1      міи чоловік з
4     646006           0        17      1  міи чоловік злама
...      ...         ...       ...    ...                ...
2406  646006         193       202      1        ##лати нови
2407  646006         193       204      1      ##лати новину
2408  646006         198       202      0               нови
2409  646006         198       204      0             новину
2410  646006         202       204      1               ##ну

[2411 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646255           0         1      0              т
1     646255           0         3      0            тре
2     646255           0         4      0           треш
3     646255   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/631 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646255           0         1      0              т
1     646255           0         3      1            тре
2     646255           0         4      1           треш
3     646255           0         5      1         треш !
4     646255           0         7      1       треш ! ф
...      ...         ...       ...    ...            ...
5039  646255         287       296      1    ##лати нови
5040  646255         287       298      1  ##лати новину
5041  646255         292       296      0           нови
5042  646255         292       298      0         новину
5043  646255         296       298      1           ##ну

[5044 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     646264           0         3      0              сад
1     646264           0         3      0          садовии
2     646264           0        10      0       садовии по
3     646264           0        12      0     садовии п

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     646264           0         3      0              сад
1     646264           0         3      1          садовии
2     646264           0        10      1       садовии по
3     646264           0        12      1     садовии пояс
4     646264           0        15      1  садовии пояснив
...      ...         ...       ...    ...              ...
4741  646264         302       311      1      ##лати нови
4742  646264         302       313      1    ##лати новину
4743  646264         307       311      0             нови
4744  646264         307       313      0           новину
4745  646264         311       313      1             ##ну

[4746 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646444           0         2      0             жа
1     646444           0         4      0           жахл
2     646444           0         6      0         жахлив
3     646444           0         7     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/468 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646444           0         2      1             жа
1     646444           0         4      1           жахл
2     646444           0         6      1         жахлив
3     646444           0         7      1        жахливе
4     646444           0         9      1      жахливе д
...      ...         ...       ...    ...            ...
3732  646444         226       235      1    ##лати нови
3733  646444         226       237      1  ##лати новину
3734  646444         231       235      0           нови
3735  646444         231       237      0         новину
3736  646444         235       237      1           ##ну

[3737 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     646485          -1         6      0               украіна
1     646485          -1        10      0            украіна го
2     646485          -1        12      0          украіна готу
3     646485          -1        17 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/467 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     646485          -1         6      1               украіна
1     646485          -1        10      1            украіна го
2     646485          -1        12      1          украіна готу
3     646485          -1        17      1     украіна готується
4     646485          -1        20      1  украіна готується до
...      ...         ...       ...    ...                   ...
3731  646485         239       248      1           ##лати нови
3732  646485         239       250      1         ##лати новину
3733  646485         244       248      0                  нови
3734  646485         244       250      0                новину
3735  646485         248       250      1                  ##ну

[3736 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     646703           0         6      0             зробив
1     646703           0         9      0          зробив др
2     646703           0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     646703           0         6      0             зробив
1     646703           0         9      1          зробив др
2     646703           0        10      1         зробив дру
3     646703           0        14      1     зробив дружину
4     646703           0        17      1  зробив дружину ін
...      ...         ...       ...    ...                ...
3648  646703         248       257      1        ##лати нови
3649  646703         248       259      1      ##лати новину
3650  646703         253       257      0               нови
3651  646703         253       259      0             новину
3652  646703         257       259      1               ##ну

[3653 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     646828           0         1      0               с
1     646828           0         4      0            скан
2     646828           0         7      0         скандал
3     64682

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/535 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     646828           0         1      0               с
1     646828           0         4      1            скан
2     646828           0         7      1         скандал
3     646828           0        10      1      скандальна
4     646828           0        14      1  скандальна сто
...      ...         ...       ...    ...             ...
4268  646828         261       270      1     ##лати нови
4269  646828         261       272      1   ##лати новину
4270  646828         266       270      0            нови
4271  646828         266       272      0          новину
4272  646828         270       272      1            ##ну

[4273 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     646888           0         7      0         замість
1     646888           0        10      0      замість бо
2     646888           0        11      0     замість бом
3     646888           0        13      0   зам

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1015 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     646888           0         7      0         замість
1     646888           0        10      1      замість бо
2     646888           0        11      1     замість бом
3     646888           0        13      1   замість бомбо
4     646888           0        14      1  замість бомбос
...      ...         ...       ...    ...             ...
8112  646888         360       369      1     ##лати нови
8113  646888         360       371      1   ##лати новину
8114  646888         365       369      0            нови
8115  646888         365       371      0          новину
8116  646888         369       371      1            ##ну

[8117 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     646907           0         1      0                  в
1     646907           0         3      0                взи
2     646907           0         6      0             взимку
3     646907           0         9 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/467 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     646907           0         1      0                  в
1     646907           0         3      1                взи
2     646907           0         6      1             взимку
3     646907           0         9      1          взимку по
4     646907           0         6      1  взимку по украіні
...      ...         ...       ...    ...                ...
3730  646907         258       267      1        ##лати нови
3731  646907         258       269      1      ##лати новину
3732  646907         263       267      0               нови
3733  646907         263       269      0             новину
3734  646907         267       269      1               ##ну

[3735 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     647048           0         4      0           виду
1     647048           0         7      0        видурив
2     647048           0        10      0     видурив гр
3     647048   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     647048           0         4      0           виду
1     647048           0         7      1        видурив
2     647048           0        10      1     видурив гр
3     647048           0        12      1   видурив грош
4     647048           0        13      1  видурив гроші
...      ...         ...       ...    ...            ...
3816  647048         242       251      1    ##лати нови
3817  647048         242       253      1  ##лати новину
3818  647048         247       251      0           нови
3819  647048         247       253      0         новину
3820  647048         251       253      1           ##ну

[3821 rows x 5 columns]
          id  seq_starts  seq_ends  label                       text
0     647149          -1         8      0                  росіиська
1     647149          -1        16      0           росіиська ракета
2     647149          -1        20      0       росіиська ракета зал
3     647149   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                       text
0     647149          -1         8      0                  росіиська
1     647149          -1        16      1           росіиська ракета
2     647149          -1        20      1       росіиська ракета зал
3     647149          -1        23      1    росіиська ракета залеті
4     647149          -1        25      1  росіиська ракета залетіла
...      ...         ...       ...    ...                        ...
5552  647149         302       311      1                ##лати нови
5553  647149         302       313      1              ##лати новину
5554  647149         307       311      0                       нови
5555  647149         307       313      0                     новину
5556  647149         311       313      1                       ##ну

[5557 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     647164           0         1      0               с
1     647164           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     647164           0         1      0               с
1     647164           0         4      1            сказ
2     647164           0         8      1        сказ під
3     647164           0        11      1     сказ підтве
4     647164           0        14      1  сказ підтверди
...      ...         ...       ...    ...             ...
2764  647164         209       212      1           ##хід
2765  647164         209       214      1         ##хідно
2766  647164         209       215      0       ##хідно .
2767  647164         212       214      1            ##но
2768  647164         212       215      0          ##но .

[2769 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     647199           0         1      0              2
1     647199           0         4      0           2 не
2     647199           0         6      0         2 неле
3     647199           0         9      0      2 не

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/489 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     647199           0         1      0              2
1     647199           0         4      1           2 не
2     647199           0         6      1         2 неле
3     647199           0         9      1      2 нелегал
4     647199           0        13      1  2 нелегальних
...      ...         ...       ...    ...            ...
3905  647199         235       244      1    ##лати нови
3906  647199         235       246      1  ##лати новину
3907  647199         240       244      0           нови
3908  647199         240       246      0         новину
3909  647199         244       246      1           ##ну

[3910 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     714532           0         2      0             жа
1     714532           0         4      0           жахл
2     714532           0         7      0        жахлива
3     714532           0         9      0      жахлива д
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/311 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     714532           0         2      1             жа
1     714532           0         4      1           жахл
2     714532           0         7      1        жахлива
3     714532           0         9      1      жахлива д
4     714532           0        10      1     жахлива дт
...      ...         ...       ...    ...            ...
2477  714532         203       212      1    ##лати нови
2478  714532         203       214      1  ##лати новини
2479  714532         208       212      0           нови
2480  714532         208       214      1         новини
2481  714532         212       214      1           ##ни

[2482 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     714557           0         5      0               понад
1     714557           0         9      0           понад 500
2     714557           0        13      0       понад 500 укр
3     714557           0        15      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/535 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     714557           0         5      0               понад
1     714557           0         9      1           понад 500
2     714557           0        13      1       понад 500 укр
3     714557           0        15      1     понад 500 укрит
4     714557           0        18      1  понад 500 укриттів
...      ...         ...       ...    ...                 ...
4268  714557         274       283      1         ##лати нови
4269  714557         274       285      1       ##лати новини
4270  714557         279       283      0                нови
4271  714557         279       285      1              новини
4272  714557         283       285      1                ##ни

[4273 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     714938           0         3      0            він
1     714938           0         5      0          вінни
2     714938           0         6      0         віннич
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/619 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     714938           0         3      0            він
1     714938           0         5      1          вінни
2     714938           0         6      1         віннич
3     714938           0         9      1      вінниччан
4     714938           0        11      1    вінниччанин
...      ...         ...       ...    ...            ...
4940  714938         272       281      1    ##лати нови
4941  714938         272       283      1  ##лати новини
4942  714938         277       281      0           нови
4943  714938         277       283      1         новини
4944  714938         281       283      1           ##ни

[4945 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     714943           0         1      0              з
1     714943           0         4      0           згор
2     714943           0         6      0         згорів
3     714943           0         9      0      згорів за
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label           text
0     714943           0         1      0              з
1     714943           0         4      1           згор
2     714943           0         6      1         згорів
3     714943           0         9      1      згорів за
4     714943           0        12      1   згорів зажив
...      ...         ...       ...    ...            ...
3392  714943         235       244      1    ##лати нови
3393  714943         235       246      1  ##лати новини
3394  714943         240       244      0           нови
3395  714943         240       246      1         новини
3396  714943         244       246      1           ##ни

[3397 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      714962           1         2      0                в
1      714962           1         4      0              вно
2      714962           1         6      0            вночі
3      714962           1         9      0         вночі 18
4      714962           1        16      0  вночі 18 грудня
...       ...         ...       ...    ...              ...
31104  714962         714       717      0            ##вар
31105  714962         714         1      0          ##варіі
31106  714962         714        24      0        ##варіі .
31107  714962          -1         1      0             ##іі
31108  714962          -1        24      0           ##іі .

[31109 rows x 5 columns]
(31109, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/3889 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      714962           1         2      0                в
1      714962           1         4      1              вно
2      714962           1         6      1            вночі
3      714962           1         9      1         вночі 18
4      714962           1        16      1  вночі 18 грудня
...       ...         ...       ...    ...              ...
31104  714962         714       717      1            ##вар
31105  714962         714         1      1          ##варіі
31106  714962         714        24      0        ##варіі .
31107  714962          -1         1      1             ##іі
31108  714962          -1        24      0           ##іі .

[31109 rows x 5 columns]
           id  seq_starts  seq_ends  label                text
0      716084           0         5      0               понад
1      716084           0         8      0            понад 20
2      716084           0        13      0       понад 20 тонн
3 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1340 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      716084           0         5      0               понад
1      716084           0         8      1            понад 20
2      716084           0        13      1       понад 20 тонн
3      716084           0        16      1    понад 20 тонн бу
4      716084           0        18      1  понад 20 тонн бухл
...       ...         ...       ...    ...                 ...
10714  716084         416       425      1         ##лати нови
10715  716084         416       427      1       ##лати новини
10716  716084         421       425      0                нови
10717  716084         421       427      1              новини
10718  716084         425       427      1                ##ни

[10719 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     716099           0         3      0             доп
1     716099           0         6      0          допома
2     716099           0         9      0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/582 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     716099           0         3      0             доп
1     716099           0         6      1          допома
2     716099           0         9      1       допомагав
3     716099           0        12      1    допомагав го
4     716099           0        14      1  допомагав готу
...      ...         ...       ...    ...             ...
4644  716099         283       292      1     ##лати нови
4645  716099         283       294      1   ##лати новини
4646  716099         288       292      0            нови
4647  716099         288       294      1          новини
4648  716099         292       294      1            ##ни

[4649 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     716228           1         4      0              што
1     716228           1         6      0            шторм
2     716228           1         9      0         штормове
3     716228           1        13      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     716228           1         4      0              што
1     716228           1         6      1            шторм
2     716228           1         9      1         штормове
3     716228           1        13      1     штормове поп
4     716228           1        16      1  штормове попере
...      ...         ...       ...    ...              ...
3308  716228         205       214      1      ##лати нови
3309  716228         205       216      1    ##лати новини
3310  716228         210       214      0             нови
3311  716228         210       216      1           новини
3312  716228         214       216      1             ##ни

[3313 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     716277           1         3      0             см
1     716277           1         5      0           смер
2     716277           1         9      0       смертель
3     716277           1        11     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/907 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     716277           1         3      1             см
1     716277           1         5      1           смер
2     716277           1         9      1       смертель
3     716277           1        11      1     смертельна
4     716277           1        13      1   смертельна д
...      ...         ...       ...    ...            ...
7246  716277         330       339      1    ##лати нови
7247  716277         330       341      1  ##лати новини
7248  716277         335       339      0           нови
7249  716277         335       341      1         новини
7250  716277         339       341      1           ##ни

[7251 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     716349           0         2      0             жа
1     716349           0         4      0           жахл
2     716349           0         6      0         жахлив
3     716349           0         7      0        жахливі
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1015 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     716349           0         2      1             жа
1     716349           0         4      1           жахл
2     716349           0         6      1         жахлив
3     716349           0         7      1        жахливі
4     716349           0        11      1    жахливі кад
...      ...         ...       ...    ...            ...
8115  716349         350       359      1    ##лати нови
8116  716349         350       361      1  ##лати новини
8117  716349         355       359      0           нови
8118  716349         355       361      1         новини
8119  716349         359       361      1           ##ни

[8120 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     716390           0         1      0              б
1     716390           0         3      0            бла
2     716390           0         5      0          блаки
3     716390           0         8      0       блакитно
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/804 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     716390           0         1      1              б
1     716390           0         3      1            бла
2     716390           0         5      1          блаки
3     716390           0         8      1       блакитно
4     716390           0        10      1     блакитноок
...      ...         ...       ...    ...            ...
6427  716390         322       331      1    ##лати нови
6428  716390         322       333      1  ##лати новини
6429  716390         327       331      0           нови
6430  716390         327       333      1         новини
6431  716390         331       333      1           ##ни

[6432 rows x 5 columns]
          id  seq_starts  seq_ends  label                     text
0     716512          -1         6      0                  украіна
1     716512          -1        11      0              украіна має
2     716512          -1        16      0         украіна має приз
3     716512          -

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/643 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     716512          -1         6      1                  украіна
1     716512          -1        11      1              украіна має
2     716512          -1        16      1         украіна має приз
3     716512          -1        20      1     украіна має призвати
4     716512          -1        23      1  украіна має призвати до
...      ...         ...       ...    ...                      ...
5139  716512         301       308      1                ##ть ново
5140  716512         301       311      0             ##ть новость
5141  716512         304       308      0                     ново
5142  716512         304       311      1                  новость
5143  716512         308       311      1                    ##сть

[5144 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     716723           0         3      0             під
1     716723           0         5      0           під

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/937 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label            text
0     716723           0         3      0             під
1     716723           0         5      1           підір
2     716723           0        10      1      підірвався
3     716723           0        13      1   підірвався ва
4     716723           0        14      1  підірвався ваз
...      ...         ...       ...    ...             ...
7490  716723         369       376      1       ##ть ново
7491  716723         369       379      0    ##ть новость
7492  716723         372       376      0            ново
7493  716723         372       379      1         новость
7494  716723         376       379      1           ##сть

[7495 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      717056           0         2      0             по
1      717056           0         6      0         посили
2      717056           0         8      0       посилимо
3      717056           0        11      0    посилимо мо
4      717056           0        13      0  посилимо мобі
...       ...         ...       ...    ...            ...
14178  717056         510       517      0      ##ть ново
14179  717056         510       520      0   ##ть новость
14180  717056         513       517      0           ново
14181  717056         513       520      0        новость
14182  717056         517       520      0          ##сть

[14183 rows x 5 columns]
(14183, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1773 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      717056           0         2      0             по
1      717056           0         6      1         посили
2      717056           0         8      1       посилимо
3      717056           0        11      1    посилимо мо
4      717056           0        13      1  посилимо мобі
...       ...         ...       ...    ...            ...
14178  717056         510       517      1      ##ть ново
14179  717056         510       520      0   ##ть новость
14180  717056         513       517      0           ново
14181  717056         513       520      1        новость
14182  717056         517       520      1          ##сть

[14183 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     717315           0         4      0            може
1     717315           0         7      0         може по
2     717315           0         9      0       може погі
3     717315           0        10      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     717315           0         4      1            може
1     717315           0         7      1         може по
2     717315           0         9      1       може погі
3     717315           0        10      1      може погір
4     717315           0        14      1  може погіршити
...      ...         ...       ...    ...             ...
4452  717315         255       262      1       ##ть ново
4453  717315         255       265      0    ##ть новость
4454  717315         258       262      0            ново
4455  717315         258       265      1         новость
4456  717315         262       265      1           ##сть

[4457 rows x 5 columns]
           id  seq_starts  seq_ends  label              text
0      717428           0         2      0                об
1      717428           0         6      0            обвали
2      717428           0        10      0        обвалилася
3      717428           0        13

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1359 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label              text
0      717428           0         2      0                об
1      717428           0         6      1            обвали
2      717428           0        10      1        обвалилася
3      717428           0        13      1     обвалилася ст
4      717428           0        16      1  обвалилася стеля
...       ...         ...       ...    ...               ...
10861  717428         407       414      1         ##ть ново
10862  717428         407       417      0      ##ть новость
10863  717428         410       414      0              ново
10864  717428         410       417      1           новость
10865  717428         414       417      1             ##сть

[10866 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     717872           0         5      0             жінка
1     717872           0         7      0           жінка в
2     717872           0         8      0          жінка вк
3 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     717872           0         5      0             жінка
1     717872           0         7      1           жінка в
2     717872           0         8      1          жінка вк
3     717872           0        12      1      жінка вкрала
4     717872           0        16      1  жінка вкрала 350
...      ...         ...       ...    ...               ...
4360  717872         268       275      1         ##ть ново
4361  717872         268       278      0      ##ть новость
4362  717872         271       275      0              ново
4363  717872         271       278      1           новость
4364  717872         275       278      1             ##сть

[4365 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     717994           0         2      0                    ша
1     717994           0         4      0               шалении
2     717994           0        14      0        шалении дерево

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/534 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     717994           0         2      0                    ша
1     717994           0         4      1               шалении
2     717994           0        14      1        шалении дерево
3     717994           0        17      1     шалении деревопад
4     717994           0        20      1  шалении деревопад сп
...      ...         ...       ...    ...                   ...
4265  717994         269       276      1             ##ть ново
4266  717994         269       279      0          ##ть новость
4267  717994         272       276      0                  ново
4268  717994         272       279      1               новость
4269  717994         276       279      1                 ##сть

[4270 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     718012           0         2      0            10
1     718012           0         4      0          10 л
2     718012           0         6     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/435 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     718012           0         2      0            10
1     718012           0         4      1          10 л
2     718012           0         6      1        10 лям
3     718012           0         8      1      10 лямів
4     718012           0        11      1   10 лямів ви
...      ...         ...       ...    ...           ...
3473  718012         241       248      1     ##ть ново
3474  718012         241       251      0  ##ть новость
3475  718012         244       248      0          ново
3476  718012         244       251      1       новость
3477  718012         248       251      1         ##сть

[3478 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     718142           0         1      0             т
1     718142           0         3      0           тро
2     718142           0         5      0         трощи
3     718142           0         6      0        трощив
4     718142           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     718142           0         1      0             т
1     718142           0         3      1           тро
2     718142           0         5      1         трощи
3     718142           0         6      1        трощив
4     718142           0        10      1    трощив мог
...      ...         ...       ...    ...           ...
7006  718142         331       338      1     ##ть ново
7007  718142         331       341      0  ##ть новость
7008  718142         334       338      0          ново
7009  718142         334       341      1       новость
7010  718142         338       341      1         ##сть

[7011 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     745876           0         2      0              зв
1     745876           0         4      0            звер
2     745876           0         9      0       звернення
3     745876           0        11      0     звернення х
4     745876 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/523 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     745876           0         2      0              зв
1     745876           0         4      1            звер
2     745876           0         9      1       звернення
3     745876           0        11      1     звернення х
4     745876           0        14      1  звернення хаті
...      ...         ...       ...    ...             ...
4173  745876         257       263      1          контен
4174  745876         257       264      1         контент
4175  745876         260       263      1           ##тен
4176  745876         260       264      1          ##тент
4177  745876         263       264      1             ##т

[4178 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     746033           0         1      0             п
1     746033           0         2      0            пз
2     746033           0         3      0           пзд
3     746033           0         4      0          пздц

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     746033           0         1      0             п
1     746033           0         2      1            пз
2     746033           0         3      1           пзд
3     746033           0         4      1          пздц
4     746033           0         5      1        пздц .
...      ...         ...       ...    ...           ...
3991  746033         221       228      1     ##ть ново
3992  746033         221       231      0  ##ть новость
3993  746033         224       228      0          ново
3994  746033         224       231      1       новость
3995  746033         228       231      1         ##сть

[3996 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     746768           0         3      0             від
1     746768           0         5      0           відір
2     746768           0         9      0       відірвало
3     746768           0        12      0    відірвало па
4     746768 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/395 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     746768           0         3      1             від
1     746768           0         5      1           відір
2     746768           0         9      1       відірвало
3     746768           0        12      1    відірвало па
4     746768           0        14      1  відірвало паль
...      ...         ...       ...    ...             ...
3151  746768         215       222      1       ##ть ново
3152  746768         215       225      0    ##ть новость
3153  746768         218       222      0            ново
3154  746768         218       225      1         новость
3155  746768         222       225      1           ##сть

[3156 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     747283           0         2      0             ви
1     747283           0         4      0       ви [UNK]
2     747283           0         6      0     ви [UNK] у
3     747283           0        11      0    ви [UN

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/748 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     747283           0         2      0             ви
1     747283           0         4      1       ви [UNK]
2     747283           0         6      1     ви [UNK] у
3     747283           0        11      1    ви [UNK] уи
4     747283           0       216      1  ви [UNK] уи *
...      ...         ...       ...    ...            ...
5979  747283         253       260      1      ##ть ново
5980  747283         253       263      0   ##ть новость
5981  747283         256       260      0           ново
5982  747283         256       263      1        новость
5983  747283         260       263      1          ##сть

[5984 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     747502           0         3      0               дні
1     747502           0         5      0             дніпр
2     747502           0         8      0          дніпрята
3     747502           0         9      0        дн

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1164 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     747502           0         3      0               дні
1     747502           0         5      1             дніпр
2     747502           0         8      1          дніпрята
3     747502           0         9      1        дніпрята ,
4     747502           0        15      1  дніпрята , влада
...      ...         ...       ...    ...               ...
9302  747502         375       382      1         ##ть ново
9303  747502         375       385      0      ##ть новость
9304  747502         378       382      0              ново
9305  747502         378       385      1           новость
9306  747502         382       385      1             ##сть

[9307 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     747615          -1         4      0                   віина
1     747615          -1        10      0              віина може
2     747615          -1        16      0        віина мо

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                    text
0     747615          -1         4      0                   віина
1     747615          -1        10      1              віина може
2     747615          -1        16      1        віина може знову
3     747615          -1        19      1     віина може знову ви
4     747615          -1         2      1  віина може знову виити
...      ...         ...       ...    ...                     ...
3476  747615         258       265      1               ##ть ново
3477  747615         258       268      0            ##ть новость
3478  747615         261       265      0                    ново
3479  747615         261       268      1                 новость
3480  747615         265       268      1                   ##сть

[3481 rows x 5 columns]
          id  seq_starts  seq_ends  label         text
0     792284           0         2      0           за
1     792284           0         4      0         заги
2     792284      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/593 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label         text
0     792284           0         2      0           за
1     792284           0         4      1         заги
2     792284           0         6      1       загибл
3     792284           0         8      1     загиблих
4     792284           0        11      1  загиблих за
...      ...         ...       ...    ...          ...
4737  792284         332       337      0        героя
4738  792284         332       338      1       героям
4739  792284         332       339      1     героям !
4740  792284         337       338      1          ##м
4741  792284         337       339      1        ##м !

[4742 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     801953           0         3      0                  905
1     801953           0         7      0              905 пор
2     801953           0         9      0            905 поруш
3     801953           0        14      0       905 порушників


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/366 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     801953           0         3      0                  905
1     801953           0         7      1              905 пор
2     801953           0         9      1            905 поруш
3     801953           0        14      1       905 порушників
4     801953           0        19      1  905 порушників пока
...      ...         ...       ...    ...                  ...
2916  801953         219       228      1          ##лати нови
2917  801953         219       230      1        ##лати новину
2918  801953         224       228      0                 нови
2919  801953         224       230      0               новину
2920  801953         228       230      1                 ##ну

[2921 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     802316           0         2      0            по
1     802316           0         4      0          поту
2     802316           0         3      0      поту

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     802316           0         2      0            по
1     802316           0         4      1          поту
2     802316           0         3      1      потужнии
3     802316           0        11      1   потужнии ма
4     802316           0        12      1  потужнии маг
...      ...         ...       ...    ...           ...
3814  802316         240       243      1         ##вра
3815  802316         240         2      1      ##вразіі
3816  802316         240        69      0    ##вразіі .
3817  802316          -1         2      1         ##зіі
3818  802316          -1        69      0       ##зіі .

[3819 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802511           0         2      0             жа
1     802511           0         4      0           жахл
2     802511           0         7      0        жахлива
3     802511           0        10      0     жахлива си
4     802511      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/319 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802511           0         2      1             жа
1     802511           0         4      1           жахл
2     802511           0         7      1        жахлива
3     802511           0        10      1     жахлива си
4     802511           0        12      1   жахлива ситу
...      ...         ...       ...    ...            ...
2545  802511         192       201      1    ##лати нови
2546  802511         192       203      1  ##лати новину
2547  802511         197       201      0           нови
2548  802511         197       203      0         новину
2549  802511         201       203      1           ##ну

[2550 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     802717           0         2      0            ка
1     802717           0         4      0          каца
2     802717           0         6      0        кацапи
3     802717           0         9      0     кацапи те
4     80271

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     802717           0         2      0            ка
1     802717           0         4      1          каца
2     802717           0         6      1        кацапи
3     802717           0         9      1     кацапи те
4     802717           0        12      1  кацапи тесту
...      ...         ...       ...    ...           ...
3560  802717         256       258      1          ##пе
3561  802717         256       260      1        ##пека
3562  802717         256       261      0      ##пека .
3563  802717         258       260      1          ##ка
3564  802717         258       261      0        ##ка .

[3565 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802841           0         3      0            час
1     802841           0         6      0         час мо
2     802841           0         8      0       час мобі
3     802841           0        10      0     час мобілі
4     802841      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/951 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802841           0         3      0            час
1     802841           0         6      1         час мо
2     802841           0         8      1       час мобі
3     802841           0        10      1     час мобілі
4     802841           0        12      1   час мобілізу
...      ...         ...       ...    ...            ...
7602  802841         357       366      1    ##лати нови
7603  802841         357       368      1  ##лати новину
7604  802841         362       366      0           нови
7605  802841         362       368      0         новину
7606  802841         366       368      1           ##ну

[7607 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     802873           0         3      0                  мал
1     802873           0         5      0            малецькии
2     802873           0        15      0      малецькии назва
3     802873           0        16     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/708 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     802873           0         3      0                  мал
1     802873           0         5      1            малецькии
2     802873           0        15      1      малецькии назва
3     802873           0        16      1     малецькии назвав
4     802873           0        19      1  малецькии назвав пр
...      ...         ...       ...    ...                  ...
5657  802873         284       293      1          ##лати нови
5658  802873         284       295      1        ##лати новину
5659  802873         289       293      0                 нови
5660  802873         289       295      0               новину
5661  802873         293       295      1                 ##ну

[5662 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802910           0         4      0           дете
1     802910           0         6      0         детект
2     802910           0         8      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802910           0         4      0           дете
1     802910           0         6      1         детект
2     802910           0         8      1       детектор
3     802910           0        11      1    детектор ме
4     802910           0        13      1  детектор меді
...      ...         ...       ...    ...            ...
4742  802910         302       311      1    ##лати нови
4743  802910         302       313      1  ##лати новину
4744  802910         307       311      0           нови
4745  802910         307       313      0         новину
4746  802910         311       313      1           ##ну

[4747 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802979           0         2      0             по
1     802979           0         4      0           поту
2     802979           0         7      0        потужна
3     802979           0        10      0     потужна ма
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802979           0         2      0             по
1     802979           0         4      1           поту
2     802979           0         7      1        потужна
3     802979           0        10      1     потужна ма
4     802979           0        11      1    потужна маг
...      ...         ...       ...    ...            ...
3559  802979         228       237      1    ##лати нови
3560  802979         228       239      1  ##лати новину
3561  802979         233       237      0           нови
3562  802979         233       239      0         новину
3563  802979         237       239      1           ##ну

[3564 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802981           0         1      0              1
1     802981           0         2      0            1 ,
2     802981           0         3      0          1 , 3
3     802981           0         7      0      1 , 3 млн
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1016 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802981           0         1      0              1
1     802981           0         2      1            1 ,
2     802981           0         3      1          1 , 3
3     802981           0         7      1      1 , 3 млн
4     802981           0        10      1   1 , 3 млн гр
...      ...         ...       ...    ...            ...
8116  802981         332       341      1    ##лати нови
8117  802981         332       343      1  ##лати новину
8118  802981         337       341      0           нови
8119  802981         337       343      0         новину
8120  802981         341       343      1           ##ну

[8121 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     803167           0         2      0                 ви
1     803167           0         4      0               вилу
2     803167           0         8      0           вилучили
3     803167           0        14      0     в

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     803167           0         2      0                 ви
1     803167           0         4      1               вилу
2     803167           0         8      1           вилучили
3     803167           0        14      1     вилучили понад
4     803167           0        17      1  вилучили понад 80
...      ...         ...       ...    ...                ...
3311  803167         227       236      1        ##лати нови
3312  803167         227       238      1      ##лати новину
3313  803167         232       236      0               нови
3314  803167         232       238      0             новину
3315  803167         236       238      1               ##ну

[3316 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     876107           0         1      0             к
1     876107           0         4      0          крив
2     876107           0         6      0        кривор
3     876107       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/722 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label          text
0     876107           0         1      0             к
1     876107           0         4      1          крив
2     876107           0         6      1        кривор
3     876107           0         8      1      криворіз
4     876107           0        11      1   криворізькі
...      ...         ...       ...    ...           ...
5767  876107         275       282      1     ##ть ново
5768  876107         275       285      0  ##ть новость
5769  876107         278       282      0          ново
5770  876107         278       285      1       новость
5771  876107         282       285      1         ##сть

[5772 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      876253           0         3      0              від
1      876253           0         6      0           від мо
2      876253           0         8      0         від мобі
3      876253           0        10      0       від мобілі
4      876253           0         4      0  від мобілізаціі
...       ...         ...       ...    ...              ...
17743  876253         539       546      0        ##ть ново
17744  876253         539       549      0     ##ть новость
17745  876253         542       546      0             ново
17746  876253         542       549      0          новость
17747  876253         546       549      0            ##сть

[17748 rows x 5 columns]
(17748, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2219 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      876253           0         3      1              від
1      876253           0         6      1           від мо
2      876253           0         8      1         від мобі
3      876253           0        10      1       від мобілі
4      876253           0         4      1  від мобілізаціі
...       ...         ...       ...    ...              ...
17743  876253         539       546      1        ##ть ново
17744  876253         539       549      0     ##ть новость
17745  876253         542       546      0             ново
17746  876253         542       549      1          новость
17747  876253         546       549      1            ##сть

[17748 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     876442           0         2      0            не
1     876442           0         5      0         неаде
2     876442           0         8      0      неадеква
3     876442           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/862 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     876442           0         2      1            не
1     876442           0         5      1         неаде
2     876442           0         8      1      неадеква
3     876442           0         9      1     неадекват
4     876442           0        12      1  неадекват на
...      ...         ...       ...    ...           ...
6889  876442         308       315      1     ##ть ново
6890  876442         308       318      0  ##ть новость
6891  876442         311       315      0          ново
6892  876442         311       318      1       новость
6893  876442         315       318      1         ##сть

[6894 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     877142           0         2      0              то
1     877142           0         5      0           торка
2     877142           0         9      0       торкалась
3     877142           0        12      0    торкалась ст
4     877142 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/984 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     877142           0         2      0              то
1     877142           0         5      1           торка
2     877142           0         9      1       торкалась
3     877142           0        12      1    торкалась ст
4     877142           0        14      1  торкалась стат
...      ...         ...       ...    ...             ...
7860  877142         358       365      1       ##ть ново
7861  877142         358       368      0    ##ть новость
7862  877142         361       365      0            ново
7863  877142         361       368      1         новость
7864  877142         365       368      1           ##сть

[7865 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     877513           0         2      0            фр
1     877513           0         4      0          фрук
2     877513           0         6      0        фрукто
3     877513           0         8      0      фруктоза

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     877513           0         2      0            фр
1     877513           0         4      1          фрук
2     877513           0         6      1        фрукто
3     877513           0         8      1      фруктоза
4     877513           0        11      1   фруктоза ви
...      ...         ...       ...    ...           ...
3388  877513         225       232      1     ##ть ново
3389  877513         225       235      0  ##ть новость
3390  877513         228       232      0          ново
3391  877513         228       235      1       новость
3392  877513         232       235      1         ##сть

[3393 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     891388           0         3      0             при
1     891388           0         5      0           приму
2     891388           0         9      0       примусова
3     891388           0        12      0    примусова мо
4     891388 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1180 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     891388           0         3      0             при
1     891388           0         5      1           приму
2     891388           0         9      1       примусова
3     891388           0        12      1    примусова мо
4     891388           0        14      1  примусова мобі
...      ...         ...       ...    ...             ...
9435  891388         379       388      1     ##лати нови
9436  891388         379       390      1   ##лати новину
9437  891388         384       388      0            нови
9438  891388         384       390      0          новину
9439  891388         388       390      1            ##ну

[9440 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891635           0         2      0             не
1     891635           0         4      0           небе
2     891635           0         5      0          небез
3     891635           0         7      0        не

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/833 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891635           0         2      1             не
1     891635           0         4      1           небе
2     891635           0         5      1          небез
3     891635           0         7      1        небезпе
4     891635           0        10      1     небезпечно
...      ...         ...       ...    ...            ...
6658  891635         319       328      1    ##лати нови
6659  891635         319       330      1  ##лати новину
6660  891635         324       328      0           нови
6661  891635         324       330      0         новину
6662  891635         328       330      1           ##ну

[6663 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891871           0         2      0             на
1     891871           0         4      0           напа
2     891871           0         5      0          напав
3     891871           0         8      0       напав на
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/570 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891871           0         2      0             на
1     891871           0         4      1           напа
2     891871           0         5      1          напав
3     891871           0         8      1       напав на
4     891871           0        13      1  напав на школ
...      ...         ...       ...    ...            ...
4548  891871         249       258      1    ##лати нови
4549  891871         249       260      1  ##лати новину
4550  891871         254       258      0           нови
4551  891871         254       260      0         новину
4552  891871         258       260      1           ##ну

[4553 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     892050           0         2      0              із
1     892050           0         4      0            ізра
2     892050           0         2      0         ізраіль
3     892050           0        11      0     ізраіль під
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/618 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     892050           0         2      0              із
1     892050           0         4      1            ізра
2     892050           0         2      1         ізраіль
3     892050           0        11      1     ізраіль під
4     892050           0        14      1  ізраіль під ма
...      ...         ...       ...    ...             ...
4939  892050         306       315      1     ##лати нови
4940  892050         306       317      1   ##лати новину
4941  892050         311       315      0            нови
4942  892050         311       317      0          новину
4943  892050         315       317      1            ##ну

[4944 rows x 5 columns]
           id  seq_starts  seq_ends  label                text
0      892319           0         5      0               росія
1      892319           0         9      0           росія про
2      892319           0        12      0        росія продов
3      892319           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1395 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      892319           0         5      0               росія
1      892319           0         9      1           росія про
2      892319           0        12      1        росія продов
3      892319           0        15      1     росія продовжує
4      892319           0        18      1  росія продовжує те
...       ...         ...       ...    ...                 ...
11154  892319         475       477      1                ##во
11155  892319         475       479      1              ##воги
11156  892319         475       480      0            ##воги .
11157  892319         477       479      1                ##ги
11158  892319         477       480      0              ##ги .

[11159 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     892321          -1         2      0            наи
1     892321          -1         5      0          наиці
2     892321          -1         7      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/511 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     892321          -1         2      1            наи
1     892321          -1         5      1          наиці
2     892321          -1         7      1        наиціка
3     892321          -1         9      1      наицікаві
4     892321          -1        11      1    наицікавіше
...      ...         ...       ...    ...            ...
4083  892321         232       241      1    ##лати нови
4084  892321         232       243      1  ##лати новину
4085  892321         237       241      0           нови
4086  892321         237       243      0         новину
4087  892321         241       243      1           ##ну

[4088 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     892535           0         1      0                   н
1     892535           0         2      0                  ну
2     892535           0         9      0           ну просто
3     892535           0        15      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/456 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     892535           0         1      0                   н
1     892535           0         2      1                  ну
2     892535           0         9      1           ну просто
3     892535           0        15      1     ну просто немає
4     892535           0        18      1  ну просто немає сл
...      ...         ...       ...    ...                 ...
3643  892535         238       247      1         ##лати нови
3644  892535         238       249      1       ##лати новину
3645  892535         243       247      0                нови
3646  892535         243       249      0              новину
3647  892535         247       249      1                ##ну

[3648 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     976215           0         3      0              укр
1     976215           0         5      0            укрит
2     976215           0         7      0          укр

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     976215           0         3      1              укр
1     976215           0         5      1            укрит
2     976215           0         7      1          укриття
3     976215           0        13      1    укриття стали
4     976215           0        15      1  укриття стали с
...      ...         ...       ...    ...              ...
3477  976215         233       242      1      ##лати нови
3478  976215         233       244      1    ##лати новину
3479  976215         238       242      0             нови
3480  976215         238       244      0           новину
3481  976215         242       244      1             ##ну

[3482 rows x 5 columns]
          id  seq_starts  seq_ends  label         text
0     976495           0         2      0           мо
1     976495           0         4      0         моро
2     976495           0         6      0       морози
3     976495           0         9      0    мо

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label         text
0     976495           0         2      0           мо
1     976495           0         4      1         моро
2     976495           0         6      1       морози
3     976495           0         9      1    морози до
4     976495           0        11      1  морози до -
...      ...         ...       ...    ...          ...
2134  976495         202       206      1         одяг
2135  976495         202       207      1        одягу
2136  976495         204       206      1         ##яг
2137  976495         204       207      1        ##ягу
2138  976495         206       207      1          ##у

[2139 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976765           0         1      0              5
1     976765           0         3      0            5 л
2     976765           0         5      0          5 лям
3     976765           0         7      0        5 лямів
4     976765           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/643 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976765           0         1      0              5
1     976765           0         3      1            5 л
2     976765           0         5      1          5 лям
3     976765           0         7      1        5 лямів
4     976765           0        10      1     5 лямів ви
...      ...         ...       ...    ...            ...
5138  976765         263       272      1    ##лати нови
5139  976765         263       274      1  ##лати новину
5140  976765         268       272      0           нови
5141  976765         268       274      0         новину
5142  976765         272       274      1           ##ну

[5143 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     976785           0         2      0               чу
1     976785           0         4      0             чума
2     976785           0         8      0         чума сви
3     976785           0         2      0      чума сви

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/366 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     976785           0         2      1               чу
1     976785           0         4      1             чума
2     976785           0         8      1         чума сви
3     976785           0         2      1      чума свинеи
4     976785           0        15      1  чума свинеи вже
...      ...         ...       ...    ...              ...
2918  976785         221       230      1      ##лати нови
2919  976785         221       232      1    ##лати новину
2920  976785         226       230      0             нови
2921  976785         226       232      0           новину
2922  976785         230       232      1             ##ну

[2923 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     977229           0         3      0            тіл
1     977229           0         4      0           тіло
2     977229           0         8      0       тіло пен
3     977229           0        10     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     977229           0         3      0            тіл
1     977229           0         4      1           тіло
2     977229           0         8      1       тіло пен
3     977229           0        10      1     тіло пенсі
4     977229           0        13      1  тіло пенсіоне
...      ...         ...       ...    ...            ...
2270  977229         207         1      1          водои
2271  977229         207        54      1        водоимі
2272  977229          -1         1      1           ##ои
2273  977229          -1        54      1         ##оимі
2274  977229          52        54      1           ##мі

[2275 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     977633           0         3      0             под
1     977633           0         7      0         подроби
2     977633           0         9      0       подробиці
3     977633           0        12      0    подробиці по
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     977633           0         3      0             под
1     977633           0         7      1         подроби
2     977633           0         9      1       подробиці
3     977633           0        12      1    подробиці по
4     977633           0        14      1  подробиці потр
...      ...         ...       ...    ...             ...
4839  977633         273       282      1     ##лати нови
4840  977633         273       284      1   ##лати новину
4841  977633         278       282      0            нови
4842  977633         278       284      0          новину
4843  977633         282       284      1            ##ну

[4844 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     977839           0         1      0              в
1     977839           0         3      0            віт
2     977839           0         5      0          вітер
3     977839           0         8      0       віт

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     977839           0         1      0              в
1     977839           0         3      1            віт
2     977839           0         5      1          вітер
3     977839           0         8      1       вітер до
4     977839           0        11      1    вітер до 30
...      ...         ...       ...    ...            ...
4742  977839         276       285      1    ##лати нови
4743  977839         276       287      1  ##лати новину
4744  977839         281       285      0           нови
4745  977839         281       287      0         новину
4746  977839         285       287      1           ##ну

[4747 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     977906           0         2      0                    10
1     977906           0         6      0                10 тис
2     977906           0         7      0              10 тис .
3     977906           0        15 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/682 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     977906           0         2      0                    10
1     977906           0         6      1                10 тис
2     977906           0         7      0              10 тис .
3     977906           0        15      0      10 тис . доларів
4     977906           0        19      0  10 тис . доларів суд
...      ...         ...       ...    ...                   ...
5444  977906         332       341      1           ##лати нови
5445  977906         332       343      1         ##лати новину
5446  977906         337       341      0                  нови
5447  977906         337       343      0                новину
5448  977906         341       343      1                  ##ну

[5449 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     994944           0         2      0               бр
1     994944           0         5      0            брита
2     994944           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1015 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     994944           0         2      0               бр
1     994944           0         5      1            брита
2     994944           0        10      1       британська
3     994944           0        13      1    британська ро
4     994944           0        15      1  британська розв
...      ...         ...       ...    ...              ...
8113  994944         405       411      1         ##писати
8114  994944         405       413      1       ##писатись
8115  994944         408       411      1            ##ати
8116  994944         408       413      1          ##атись
8117  994944         411       413      1             ##сь

[8118 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     994945           0         1      0                 з
1     994945           0         3      0               зсу
2     994945           0        12      0      зсу отримали
3     994945           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/876 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     994945           0         1      0                 з
1     994945           0         3      1               зсу
2     994945           0        12      1      зсу отримали
3     994945           0        14      1    зсу отримали в
4     994945           0        16      1  зсу отримали вер
...      ...         ...       ...    ...               ...
7003  994945         334       340      1          ##писати
7004  994945         334       342      1        ##писатись
7005  994945         337       340      1             ##ати
7006  994945         337       342      1           ##атись
7007  994945         340       342      1              ##сь

[7008 rows x 5 columns]
          id  seq_starts  seq_ends  label        text
0     994950           0         1      0           г
1     994950           0         2      0         г *
2     994950           0         4      0      г * мн
3     994950           0         5     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/708 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label        text
0     994950           0         1      1           г
1     994950           0         2      1         г *
2     994950           0         4      1      г * мн
3     994950           0         5      1     г * мно
4     994950           0         8      1  г * мно ви
...      ...         ...       ...    ...         ...
5657  994950         355       361      1    ##писати
5658  994950         355       363      1  ##писатись
5659  994950         358       361      1       ##ати
5660  994950         358       363      1     ##атись
5661  994950         361       363      1        ##сь

[5662 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     995016           0         4      0                    вели
1     995016           0         6      0                  величе
2     995016           0         9      0               величезна
3     995016           0        19      0     величезна кількіс

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/228 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label                    text
0     995016           0         4      0                    вели
1     995016           0         6      1                  величе
2     995016           0         9      1               величезна
3     995016           0        19      1     величезна кількість
4     995016           0        22      1  величезна кількість мо
...      ...         ...       ...    ...                     ...
1819  995016         179       184      1                   не сп
1820  995016         179       185      1                  не спи
1821  995016         182       184      1                      сп
1822  995016         182       185      1                     спи
1823  995016         184       185      1                     ##и

[1824 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      995089           0         2      0                   го
1      995089           0         4      0                 готу
2      995089           0        10      0           готуватися
3      995089           0        13      0        готуватися до
4      995089           0         4      0  готуватися до віини
...       ...         ...       ...    ...                  ...
19474  995089         631       637      0             ##писати
19475  995089         631       639      0           ##писатись
19476  995089         634       637      0                ##ати
19477  995089         634       639      0              ##атись
19478  995089         637       639      0                 ##сь

[19479 rows x 5 columns]
(19479, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2435 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      995089           0         2      0                   го
1      995089           0         4      1                 готу
2      995089           0        10      1           готуватися
3      995089           0        13      1        готуватися до
4      995089           0         4      1  готуватися до віини
...       ...         ...       ...    ...                  ...
19474  995089         631       637      1             ##писати
19475  995089         631       639      1           ##писатись
19476  995089         634       637      1                ##ати
19477  995089         634       639      1              ##атись
19478  995089         637       639      1                 ##сь

[19479 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     995165          -1         6      0            украіна
1     995165          -1        11      0        украіна пер
2     995165          -

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/681 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     995165          -1         6      1            украіна
1     995165          -1        11      1        украіна пер
2     995165          -1        13      1      украіна переб
3     995165          -1        16      1   украіна перебува
4     995165          -1        17      1  украіна перебуває
...      ...         ...       ...    ...                ...
5438  995165         297       303      1           ##писати
5439  995165         297       305      1         ##писатись
5440  995165         300       303      1              ##ати
5441  995165         300       305      1            ##атись
5442  995165         303       305      1               ##сь

[5443 rows x 5 columns]
           id  seq_starts  seq_ends  label                 text
0      995481           1         2      0                    в
1      995481           1         6      0            в украіні
2      995481           1        16      0      в у

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1396 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      995481           1         2      0                    в
1      995481           1         6      1            в украіні
2      995481           1        16      1      в украіні почав
3      995481           1        18      1    в украіні почався
4      995481           1        20      1  в украіні почався е
...       ...         ...       ...    ...                  ...
11157  995481         431       437      1             ##писати
11158  995481         431       439      1           ##писатись
11159  995481         434       437      1                ##ати
11160  995481         434       439      1              ##атись
11161  995481         437       439      1                 ##сь

[11162 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     995502           0         4      0              лука
1     995502           0         7      0           лукашен
2     995502           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/319 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     995502           0         4      0              лука
1     995502           0         7      1           лукашен
2     995502           0         9      1         лукашенко
3     995502           0        13      1     лукашенко при
4     995502           0        16      1  лукашенко прилет
...      ...         ...       ...    ...               ...
2543  995502         217       223      1          ##писати
2544  995502         217       225      1        ##писатись
2545  995502         220       223      1             ##ати
2546  995502         220       225      1           ##атись
2547  995502         223       225      1              ##сь

[2548 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     995781          -1         4      0                   віина
1     995781          -1        10      0              віина може
2     995781          -1        16      0        віина мо

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1063 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                    text
0     995781          -1         4      0                   віина
1     995781          -1        10      1              віина може
2     995781          -1        16      1        віина може знову
3     995781          -1        19      1     віина може знову ви
4     995781          -1         2      1  віина може знову виити
...      ...         ...       ...    ...                     ...
8499  995781         429       435      1                ##писати
8500  995781         429       437      1              ##писатись
8501  995781         432       435      1                   ##ати
8502  995781         432       437      1                 ##атись
8503  995781         435       437      1                    ##сь

[8504 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     996072           0         1      0                  у
1     996072           0         4      0               угор


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/804 [00:00<?, ?it/s]

          id  seq_starts  seq_ends  label               text
0     996072           0         1      0                  у
1     996072           0         4      1               угор
2     996072           0         8      1           угорщина
3     996072           0        11      1        угорщина та
4     996072           0        17      1  угорщина та слова
...      ...         ...       ...    ...                ...
6425  996072         351       357      1           ##писати
6426  996072         351       359      1         ##писатись
6427  996072         354       357      1              ##ати
6428  996072         354       359      1            ##атись
6429  996072         357       359      1               ##сь

[6430 rows x 5 columns]


In [36]:
#Write in one file

f_total = open("C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/SI.labels_pred.txt", 'w')
writer = csv.writer(f_total, delimiter='\t')
labels_filenames = sorted(glob.glob(os.path.join(labels_dir, "*.labels.txt")))
for i in range(len(labels_filenames)):
  f = open(labels_filenames[i], 'r')
  reader = csv.reader(f, delimiter='\t')
  for row in reader:
    writer.writerow(row)
  f.close()
f_total.close()

In [5]:
# Open the output file in write mode
#!!!!!!!!!!!!!!!!!!!
labels_dir = 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling'
with open("C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/SI.labels_pred.txt", 'w', newline='') as f_total:
    writer = csv.writer(f_total, delimiter='\t')
    print(f_total)
    # Get a sorted list of .txt files in the specified directory
    labels_filenames = sorted(glob.glob(os.path.join(labels_dir, "*.labels.tsv")))
    print(labels_filenames)
    # Iterate through each file and write its content to the output file
    for filename in labels_filenames:
        with open(filename, 'r') as f:
            reader = csv.reader(f, delimiter='\t')
            for row in reader:
                writer.writerow(row)

<_io.TextIOWrapper name='C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/SI.labels_pred.txt' mode='w' encoding='cp1251'>
['C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1062476.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1062542.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1062916.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1063082.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1063158.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/pred_SI_labels_upsampling\\article1063177.labels.tsv', 'C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_

## Calculate accuracy

In [6]:
# Read contents of template.labels_pred.txt
pred_file = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/SI.labels_pred.txt"
true_file = "C:/N/st/UCU/5sem2024_DIPLOMA/Manipulation/code/my_master/datasets/upsampling/SI.labels_true.txt"

In [8]:
# Initialize dictionaries to store IDs and techniques
pred_dict = {}
true_dict = {}

# Read contents of TC.labels_pred.txt
with open(pred_file, "r") as pred_f:
    pred_reader = csv.reader(pred_f, delimiter="\t")
    for row in pred_reader:
      if len(row)>=3:
        id_ = row[0]
        start = int(row[1])
        end = int(row[2])
        if id_ not in pred_dict:
            pred_dict[id_] = [(start, end)]
        else:
            pred_dict[id_].append((start, end))
      # else:
      # # Handle cases where the row doesn't have enough elements
      #   print("Row does not have enough elements:", row)
print (len(pred_dict)) 

#Read contents of TC.labels_true.txt
with open(true_file, "r") as true_f:
    true_reader = csv.reader(true_f, delimiter="\t")
    for row in true_reader:
        id_ = row[0]
        start = int(row[1])
        end = int(row[2])
        if id_ not in true_dict:
            true_dict[id_] = [(start, end)]
        else:
            true_dict[id_].append((start, end))
print (len(true_dict)) 

595
595


In [12]:
# Convert -1 to 0
for key, value in pred_dict.items():
    # Iterate through each tuple in the list
    for i, (start, end) in enumerate(value):
        # Check if the start value is -1
        if start == -1:
            # Replace -1 with 0
            pred_dict[key][i] = (0, end)

print(pred_dict)

{'1062476': [(0, 290)], '1062542': [(1, 39), (41, 53), (54, 62), (63, 85), (86, 100), (101, 109), (110, 134), (135, 149), (150, 158), (159, 182), (183, 251), (254, 283)], '1062916': [(0, 582)], '1063082': [(0, 105), (107, 204), (206, 248)], '1063158': [(0, 419)], '1063177': [(0, 249)], '1063217': [(0, 338)], '1063308': [(0, 391)], '1063340': [(0, 599)], '1063449': [(0, 259)], '1063475': [(0, 336)], '1064347': [(0, 204)], '1064382': [(0, 324)], '1064725': [(0, 102), (103, 184), (186, 211), (213, 227), (229, 287)], '1064779': [(0, 244)], '1065168': [(0, 308)], '1065870': [(0, 328), (330, 351), (354, 384)], '1066039': [(0, 342)], '1066310': [(0, 314)], '1066612': [(0, 345)], '1066986': [(0, 268), (271, 299)], '1067012': [(0, 340)], '1067320': [(0, 215), (217, 251)], '1067379': [(0, 286)], '1067429': [(0, 235), (237, 265)], '1067452': [(0, 155), (157, 215), (217, 242), (245, 273)], '1067800': [(0, 598)], '1068004': [(0, 344)], '1068121': [(0, 252), (255, 283)], '1068417': [(0, 220), (222, 

In [13]:
pred_dict

{'1062476': [(0, 290)],
 '1062542': [(1, 39),
  (41, 53),
  (54, 62),
  (63, 85),
  (86, 100),
  (101, 109),
  (110, 134),
  (135, 149),
  (150, 158),
  (159, 182),
  (183, 251),
  (254, 283)],
 '1062916': [(0, 582)],
 '1063082': [(0, 105), (107, 204), (206, 248)],
 '1063158': [(0, 419)],
 '1063177': [(0, 249)],
 '1063217': [(0, 338)],
 '1063308': [(0, 391)],
 '1063340': [(0, 599)],
 '1063449': [(0, 259)],
 '1063475': [(0, 336)],
 '1064347': [(0, 204)],
 '1064382': [(0, 324)],
 '1064725': [(0, 102), (103, 184), (186, 211), (213, 227), (229, 287)],
 '1064779': [(0, 244)],
 '1065168': [(0, 308)],
 '1065870': [(0, 328), (330, 351), (354, 384)],
 '1066039': [(0, 342)],
 '1066310': [(0, 314)],
 '1066612': [(0, 345)],
 '1066986': [(0, 268), (271, 299)],
 '1067012': [(0, 340)],
 '1067320': [(0, 215), (217, 251)],
 '1067379': [(0, 286)],
 '1067429': [(0, 235), (237, 265)],
 '1067452': [(0, 155), (157, 215), (217, 242), (245, 273)],
 '1067800': [(0, 598)],
 '1068004': [(0, 344)],
 '1068121': [(

In [14]:
# Calculate the total number of spans in predicted dictionary
total_spans = sum(len(spans) for spans in pred_dict.values())
# Calculate the average number of spans per key
average_spans_per_key = total_spans / len(pred_dict)
print(f"Average number of spans per key: {average_spans_per_key:.2f}")

Average number of spans per key: 1.27


In [15]:
# Calculate the total length between end and start for all spans
total_length = sum(end - start for spans in pred_dict.values() for start, end in spans)
# Calculate the total number of spans
total_spans = sum(len(spans) for spans in pred_dict.values())
# Calculate the average length
average_length = total_length / total_spans
print(f"Average length of the span: {average_length:.2f}")

Average length of the span: 198.39


In [11]:
true_dict

{'20120': [(84, 226)],
 '20220': [(0, 197)],
 '20290': [(0, 203)],
 '20330': [(0, 205)],
 '20360': [(0, 241)],
 '20420': [(0, 269)],
 '20460': [(0, 218)],
 '20470': [(0, 229)],
 '20500': [(0, 227)],
 '20520': [(0, 233)],
 '20600': [(0, 200)],
 '20650': [(0, 222)],
 '20710': [(0, 182)],
 '20770': [(0, 189)],
 '20810': [(0, 232)],
 '20880': [(0, 228)],
 '20990': [(0, 261)],
 '21060': [(0, 87)],
 '21100': [(0, 86)],
 '21140': [(0, 85)],
 '21220': [(0, 66)],
 '21250': [(0, 86)],
 '21260': [(0, 54)],
 '21290': [(0, 97)],
 '21360': [(0, 70)],
 '21520': [(0, 79)],
 '21610': [(0, 77)],
 '21640': [(0, 92)],
 '21660': [(0, 86)],
 '21760': [(0, 265)],
 '21770': [(0, 135)],
 '21840': [(0, 198)],
 '21870': [(0, 138)],
 '21900': [(0, 113)],
 '21930': [(0, 116)],
 '22040': [(0, 85)],
 '22140': [(0, 134)],
 '22230': [(0, 108)],
 '22370': [(0, 73)],
 '22410': [(0, 82)],
 '22430': [(0, 100)],
 '22690': [(0, 134)],
 '22700': [(0, 105)],
 '22710': [(0, 142)],
 '22750': [(0, 153)],
 '22920': [(0, 150)],
 '

In [16]:
# Calculate the total number of spans in true dictionary
total_spans = sum(len(spans) for spans in true_dict.values())
# Calculate the average number of spans per key
average_spans_per_key = total_spans / len(true_dict)
print(f"Average number of spans per key: {average_spans_per_key:.2f}")

Average number of spans per key: 1.42


In [17]:
# Calculate the total length between end and start for all spans
total_length = sum(end - start for spans in true_dict.values() for start, end in spans)
# Calculate the total number of spans
total_spans = sum(len(spans) for spans in true_dict.values())
# Calculate the average length
average_length = total_length / total_spans
print(f"Average length of the span: {average_length:.2f}")

Average length of the span: 61.29


In [18]:
# Standart overlap
overlaps = []

# Iterate through each ID in the true dictionary
for id, true_spans in true_dict.items():
    
    # Check if the ID is present in the predicted dictionary
    if id in pred_dict:
        
        # Get the predicted spans for the current ID
        pred_spans = pred_dict[id]
        #print(pred_spans)
        
        true_length = 0
        pred_length = 0
    
#         # Iterate through each true span
        for true_span in true_spans:
            max_overlap = 0
#             
#             # Extract start and end positions of the true span
            true_start, true_end = true_span

            
#             # Iterate through each predicted span
            for pred_span in pred_spans:
                # Extract start and end positions of the predicted span
                pred_start, pred_end = pred_span
                  
#                 # Calculate the overlap between the true and predicted spans
                overlap = max(0, min(true_end, pred_end) - max(true_start, pred_start))
                #print(pred_span)
                #print(true_span)
                #print(overlap)
#                 # Update the maximum overlap if necessary
                #max_overlap = max(max_overlap, overlap)

#             # Append the maximum overlap for the current true span to the list
            overlaps.append(overlap)


#print(overlaps)        
# print(sum(overlaps))
# # Calculate the accuracy
average_overlap = sum(overlaps) / len(overlaps) if overlaps else 0
# precision = 
# 
print(f"Accuracy on character level: {average_overlap:.2f}")

Accuracy on character level: 56.66


#### Analyze syntatic dataset vs initial

In [40]:
# Analyze syntatic dataset vs initial 
syntatic_data = pd.read_csv("C:/N\st/UCU/5sem2024_DIPLOMA/Manipulation/code/labels/generated_texts/generated_texts.csv")
syntatic_ids = syntatic_data[["message_id"]]
syntatic_ids = syntatic_ids["message_id"].tolist()
syntatic_ids = [str(key) for key in syntatic_ids]
syntatic_ids

['60010',
 '60020',
 '60030',
 '60040',
 '60050',
 '60060',
 '60070',
 '60080',
 '60090',
 '60100',
 '60110',
 '60120',
 '60130',
 '60140',
 '60150',
 '60160',
 '60170',
 '60180',
 '60190',
 '60200',
 '60210',
 '60220',
 '60230',
 '60240',
 '60250',
 '60260',
 '60270',
 '60280',
 '60290',
 '60300',
 '60310',
 '60320',
 '60330',
 '60340',
 '60350',
 '60360',
 '60370',
 '60380',
 '60390',
 '60400',
 '60410',
 '60420',
 '60430',
 '60440',
 '60450',
 '60460',
 '60470',
 '60480',
 '60490',
 '60500',
 '60510',
 '60520',
 '60530',
 '60540',
 '60550',
 '60560',
 '60570',
 '60580',
 '60590',
 '60600',
 '60610',
 '60620',
 '60630',
 '60640',
 '60650',
 '60660',
 '60670',
 '60680',
 '60690',
 '60700',
 '60710',
 '60720',
 '60730',
 '60740',
 '60750',
 '60760',
 '60770',
 '60780',
 '60790',
 '60800',
 '60810',
 '60820',
 '60830',
 '60840',
 '60850',
 '60860',
 '60870',
 '60880',
 '60890',
 '60900',
 '60910',
 '60920',
 '60930',
 '60940',
 '60950',
 '60960',
 '60970',
 '60980',
 '60990',
 '61000',


In [43]:
test = {'21670': [(0, 77)],
 '21680': [(0, 92)],
 '21690': [(0, 86)],
 '21760': [(0, 265)],
 '21770': [(0, 135)],
 '21840': [(0, 198)],
 '21870': [(0, 138)],
 '21900': [(0, 113)],
 '21930': [(0, 116)],
 '22040': [(0, 85)]
    
}


In [47]:
# Create a pred dictionary with only the keys that are in the list with synthetic data
pred_dict_syn = {k: v for k, v in pred_dict.items() if k in syntatic_ids}
# filtered_dict = {}
# for ids,k in test.items():
#     # if not isinstance(ids, str):
#     #     ids = str(ids)
#     if ids in syntatic_ids:
#         filtered_dict[ids] = k
# print(filtered_dict)
len(pred_dict_syn)

317

In [53]:
# Standart overlap only with syntatic data
overlaps = []

# Iterate through each ID in the true dictionary
for id, true_spans in true_dict.items():
    
    # Check if the ID is present in the predicted dictionary
    if id in pred_dict_syn:
        
        # Get the predicted spans for the current ID
        pred_spans = pred_dict_syn[id]
        #print(pred_spans)
        
        true_length = 0
        pred_length = 0
    
#         # Iterate through each true span
        for true_span in true_spans:
            max_overlap = 0
#             
#             # Extract start and end positions of the true span
            true_start, true_end = true_span
            true_span_length = true_end - true_start
            
#             # Iterate through each predicted span
            for pred_span in pred_spans:
                # Extract start and end positions of the predicted span
                pred_start, pred_end = pred_span
                  
#                 # Calculate the overlap between the true and predicted spans
                overlap = max(0, min(true_end, pred_end) - max(true_start, pred_start))
                #print(pred_span)
                #print(true_span)
                #print(overlap)
#                 # Update the maximum overlap if necessary
                max_overlap = max(max_overlap, overlap)

#             # Append the maximum overlap for the current true span to the list
            #overlaps.append(overlap)
            if true_span_length > 0:
                normalized_overlap = (max_overlap / true_span_length) * 100
                overlaps.append(normalized_overlap)


#print(overlaps)        
# print(sum(overlaps))
# # Calculate the accuracy
average_overlap = sum(overlaps) / len(overlaps) if overlaps else 0

print(f"Accuracy on character level: {average_overlap:.2f}")
print(sum(overlaps))
print(len(overlaps))

Accuracy on character level: 99.65
31590.081135808952
317


In [54]:
# Create a pred dictionary with only the keys that are in the list with synthetic data
pred_dict_not_syn = {k: v for k, v in pred_dict.items() if k not in syntatic_ids}
len(pred_dict_not_syn)

278

In [55]:
# Standart overlap only with syntatic data
overlaps = []

# Iterate through each ID in the true dictionary
for id, true_spans in true_dict.items():
    
    # Check if the ID is present in the predicted dictionary
    if id in pred_dict_not_syn:
        
        # Get the predicted spans for the current ID
        pred_spans = pred_dict_not_syn[id]
        #print(pred_spans)
        
        true_length = 0
        pred_length = 0
    
#         # Iterate through each true span
        for true_span in true_spans:
            max_overlap = 0
#             
#             # Extract start and end positions of the true span
            true_start, true_end = true_span
            true_span_length = true_end - true_start
            
#             # Iterate through each predicted span
            for pred_span in pred_spans:
                # Extract start and end positions of the predicted span
                pred_start, pred_end = pred_span
                  
#                 # Calculate the overlap between the true and predicted spans
                overlap = max(0, min(true_end, pred_end) - max(true_start, pred_start))
                #print(pred_span)
                #print(true_span)
                #print(overlap)
#                 # Update the maximum overlap if necessary
                max_overlap = max(max_overlap, overlap)

#             # Append the maximum overlap for the current true span to the list
            #overlaps.append(overlap)
            if true_span_length > 0:
                normalized_overlap = (max_overlap / true_span_length) * 100
                overlaps.append(normalized_overlap)


#print(overlaps)        
# print(sum(overlaps))
# # Calculate the accuracy
average_overlap = sum(overlaps) / len(overlaps) if overlaps else 0

print(f"Accuracy on character level: {average_overlap:.2f}")
print(sum(overlaps))
print(len(overlaps))

Accuracy on character level: 99.31
52136.5527055113
525


Ref: https://medium.com/@jihwangk/fine-grained-propaganda-detection-and-classification-with-bert-dfad4acaa321
- https://github.com/ThilinaRajapakse/pytorch-transformers-classification/blob/master/colab_quickstart.ipynb