## Span Identification
"model_name": "google-bert/bert-base-multilingual-uncased",
"max_seq_length": 128,
"train_batch_size": 8,
"eval_batch_size": 8,
"num_train_epochs": 1

In [77]:
import os
import glob
import codecs
import csv
import pandas as pd
import math
import numpy as np
from tqdm import tqdm, tqdm_notebook, trange
import torch
from torch.utils.data import (DataLoader, RandomSampler, SequentialSampler, TensorDataset)
from transformers import (BertConfig, BertTokenizer, BertForSequenceClassification, AdamW, get_linear_schedule_with_warmup)

### Config

In [ ]:
train_articles = "datasets/train"
dev_articles = "datasets/dev"
train_SI_labels = "datasets/train_SI_labels"
dev_SI_labels = "datasets/dev_SI_labels"

In [ ]:
device = torch.device("cuda")
n_gpu = torch.cuda.device_count()

In [2]:
MODEL_CLASSES = {"bert": (BertConfig, BertForSequenceClassification, BertTokenizer)}
args = {"data_dir": "bert/",
        "model_type": "bert",
        "model_name": "google-bert/bert-base-multilingual-uncased",
        "output_dir": "output_dir/output_model_SI",
        "max_seq_length": 128,
        "train_batch_size": 8,
        "eval_batch_size": 8,
        "num_train_epochs": 1,
        "weight_decay": 0,
        "learning_rate": 4e-5,
        "adam_epsilon": 1e-8,
        "warmup_ratio": 0.06,
        "warmup_steps": 0,
        "max_grad_norm": 1.0,
        "gradient_accumulation_steps": 1,
        "save_steps": 2000}

#### Data pre-processing

In [3]:
def merge_overlapping(indices_list):
  """
  Merges overlapping indices and sorts indices from list of tuples
  """
  # If no propaganda, return empty list
  if indices_list == []:
    return []

  # Sort the list
  indices_list = sorted(indices_list)
  i = 0

  # Going through tuples from the beginning, see if it overlaps with the nex one 
  # and merge it if so
  while True:
    if i == len(indices_list) - 1:
      break
    
    # If the next one is within the range of current, just delete next one. If
    # overlapping, then merge the range
    elif indices_list[i][1] >= indices_list[i + 1][0]:
      if indices_list[i][1] >= indices_list[i + 1][1]:
        pass
      else:
        indices_list[i] = (indices_list[i][0], indices_list[i+1][1])
      indices_list.pop(i+1)

    # Go to next element if not overlapping
    else:
      i += 1

  return indices_list

In [4]:
def article_to_sequences(article_id, article, tokenizer):
  """
  Divides article into sequences, dividing first by sentences then to powersets
  of the sentences
  """
  # Split the lines by sentences
  curr = 0
  lines = article.split("\n")
  sequences = []
  seq_starts = []
  seq_ends = []

  # For each lines, do:
  for line in lines:
    # If an empty line, just continue
    if line == "":
      curr += 1
      continue

    # Tokenize the line
    tokenized = tokenizer.tokenize(line)

    # For each token, do:
    seq_start = 0
    for ind, token in enumerate(tokenized):
      # Get the token without ## sign
      mod_start_token = token.replace("##", "")

      # Find the start of the sequence in line
      seq_start = line.lower().find(mod_start_token, seq_start)

      # Update the end of the sequence
      seq_end = seq_start

      # For each following tokens in the line, do
      for iter in range(1, len(tokenized) + 1 - ind):
        # Also modify this token
        mod_end_token = tokenized[ind + iter - 1].replace("##", "")
        # Find the end of the token
        seq_end = line.lower().find(mod_end_token, seq_end) + len(mod_end_token)

        sequences.append(tokenizer.convert_tokens_to_string(tokenized[ind: ind + iter]))
        seq_starts.append(curr + seq_start)
        seq_ends.append(curr + seq_end)

      # Update the start of the sequence
      seq_start += len(mod_start_token)

    # Update the current whereabouts
    curr += len(line) + 1

  dataframe = pd.DataFrame(None, range(len(sequences)), ["id", "seq_starts", "seq_ends", "label", "text"])
  dataframe["id"] = [article_id] * len(sequences)
  dataframe["seq_starts"] = seq_starts
  dataframe["seq_ends"] = seq_ends
  dataframe["label"] = [0] * len(sequences)
  dataframe["text"] = sequences
  return dataframe


In [5]:
def article_labels_to_sequences(article, indices_list):
  """
  Divides article into sequences, where each are tagged to be propaganda or not
  """
  # Start at 0 indices, and split the article into lines
  curr = 0
  lines = article.split("\n")
  sequences = {}

  # For each lines, do:
  for line in lines:
    # If an empty line, just continue after adding \n character
    if line == "":
      curr += 1
      continue

    # If nothing in indices_list or current line is not part of propaganda, 
    # just mark it to be none 
    elif indices_list == [] or curr + len(line) <= indices_list[0][0]:
      sequences[line] = 0

    # If current line is part of propaganda, do:
    else:
      # If the propaganda is contained within the line, add it accordingly
      # and pop that indices range
      if curr + len(line) >= indices_list[0][1]:
        sequences[line[:indices_list[0][0] - curr]] = 0
        sequences[line[indices_list[0][0] - curr:indices_list[0][1] - curr]] = 1
        sequences[line[indices_list[0][1] - curr:]] = 0
        indices_list.pop(0)
      # If the propaganda goes over to the next line, add accordingly and 
      # modify that indices range
      else:
        sequences[line[:indices_list[0][0] - curr]] = 0
        sequences[line[indices_list[0][0] - curr:]] = 1
        indices_list[0] = (curr + len(line) + 2, indices_list[0][1])  
        indices_list[0] = tuple(indices_list[0])                       
    # Add the current line length plus \n character
    curr += len(line) + 1

  dataframe = pd.DataFrame(None, range(len(sequences)), ["label", "text"])
  dataframe["label"] = sequences.values()  
  dataframe["text"] = sequences.keys()
  return dataframe

In [6]:
def articles_to_dataframe(article_folder, label_folder):
  """
  Preprocesses the articles into dataframes with sequences with binary tags
  """
  # First sort the filenames and make sure we have label file for each articles
  article_filenames = sorted(glob.glob(os.path.join(article_folder, "*.txt")))
  label_filenames = sorted(glob.glob(os.path.join(label_folder, "*.labels.tsv"))) 
  assert len(article_filenames) == len(label_filenames)

  # Initialize sequences
  sequences = []

  # For each article, do:
  for i in range(len(article_filenames)):
    # Read in the article
    with codecs.open(article_filenames[i], "r", encoding="utf8") as f:
      article = f.read()

    with open(label_filenames[i], "r") as f:
      reader = csv.reader(f, delimiter="\t")
      indices_list = []
      for row in reader:
        indices_list.append([int(row[1]), int(row[2])])

      # Merge the indices if overlapping
      indices_list = merge_overlapping(indices_list)

    # Add to the sequences
    sequences.append(article_labels_to_sequences(article, indices_list))

  # Concatenate all dataframes
  dataframe = pd.concat(sequences, ignore_index=True)

  return dataframe

In [7]:
def convert_dataframe_to_features(dataframe, max_seq_length, tokenizer):
  """
  Converts dataframe into features dataframe, where each feature will
  take form of [CLS] + A + [SEP]
  """
  # Create features
  features = pd.DataFrame(None, range(dataframe.shape[0]), 
                              ["input_ids", "input_mask", "segment_ids", "label_ids"])

  # For each sequence, do:
  for i in range(len(dataframe)):
    # Set first and second part of the sequences
    tokens = tokenizer.tokenize(dataframe["text"][i])

    # If length of the sequence is greater than max sequence length, truncate it
    if len(tokens) > max_seq_length - 2:
        tokens = tokens[:(max_seq_length - 2)]

    # Concatenate the tokens
    tokens = [tokenizer.cls_token] + tokens + [tokenizer.sep_token]

    # Compute the ids
    segment_ids = [0] * len(tokens)
    input_ids = tokenizer.convert_tokens_to_ids(tokens)
    input_mask = [1] * len(input_ids)

    # Zero-pad up to the sequence length.
    padding_length = max_seq_length - len(input_ids)
    pad_token = tokenizer.convert_tokens_to_ids([tokenizer.pad_token])[0]
    input_ids = input_ids + [pad_token] * padding_length
    input_mask = input_mask + [0] * padding_length
    segment_ids = segment_ids + [0] * padding_length
    label_id = dataframe["label"][i]

    # Assert to make sure we have same length
    assert len(input_ids) == max_seq_length
    assert len(input_mask) == max_seq_length
    assert len(segment_ids) == max_seq_length

    # Put the data into features dataframe
    features["input_ids"][i] = input_ids
    features["input_mask"][i] = input_mask
    features["segment_ids"][i] = segment_ids
    features["label_ids"][i] = label_id   

  return features

In [8]:
def generate_training_dataset_from_articles(articles_folders, labels_folders, tokenizer):
  """
  Generates dataset to go into BERT from articles and labels
  """
  
  # For each articles and labels folder set, turn them into dataframes
  dataframe_list = []
  for i in range(len(articles_folders)):
    dataframe_list.append(articles_to_dataframe(articles_folders[i], labels_folders[i]))

  # Concatenate the dataframes to make a total dataframe
  dataframe = pd.concat(dataframe_list, ignore_index=True)
  # Process into features dataframe
  features = convert_dataframe_to_features(dataframe, args['max_seq_length'], tokenizer)
      
  # Creating TensorDataset from features
  all_input_ids = torch.tensor(features["input_ids"], dtype=torch.long)
  all_input_mask = torch.tensor(features["input_mask"], dtype=torch.long)
  all_segment_ids = torch.tensor(features["segment_ids"], dtype=torch.long)
  all_label_ids = torch.tensor(features["label_ids"], dtype=torch.long)

  dataset = TensorDataset(all_input_ids, all_input_mask, all_segment_ids, all_label_ids)
  return dataset

#### Train

In [9]:
def train(train_dataset, model):
  """
  Trains the model with training dataset
  """
  # Initialize various necessary objects
  train_sampler = RandomSampler(train_dataset)
  train_dataloader = DataLoader(train_dataset, sampler=train_sampler, batch_size=args['train_batch_size'])
    
  # Compute the total time
  t_total = len(train_dataloader) // args['gradient_accumulation_steps'] * args['num_train_epochs']
  
  # Set the grouped parameters for optimizer
  no_decay = ['bias', 'LayerNorm.weight']
  optimizer_grouped_parameters = [
    {'params': [p for n, p in model.named_parameters() if not any(nd in n for nd in no_decay)], 'weight_decay': args['weight_decay']},
    {'params': [p for n, p in model.named_parameters() if any(nd in n for nd in no_decay)], 'weight_decay': 0.0}
    ]
  
  # Compute warmup steps
  warmup_steps = math.ceil(t_total * args['warmup_ratio'])
  args['warmup_steps'] = warmup_steps if args['warmup_steps'] == 0 else args['warmup_steps']
  
  # Initialize optimizer as Adam with constant weight decay and a linear scheduler with warmup
  optimizer = AdamW(optimizer_grouped_parameters, lr=args['learning_rate'], eps=args['adam_epsilon'])
  scheduler = get_linear_schedule_with_warmup(optimizer, num_warmup_steps=args['warmup_steps'], num_training_steps=t_total)

  # Initialize variables for training
  global_step = 0
  tr_loss = 0.0
  model.zero_grad()
  train_iterator = trange(int(args['num_train_epochs']), desc="Epoch")
  
  # Start training!
  for _ in train_iterator:
    epoch_iterator = tqdm_notebook(train_dataloader, desc="Iteration")
    for step, batch in enumerate(epoch_iterator):
      model.train()
      batch = tuple(t.to(device) for t in batch)
      inputs = {'input_ids':      batch[0],
                'attention_mask': batch[1],
                'token_type_ids': batch[2], 
                'labels':         batch[3]}
      outputs = model(**inputs)
      loss = outputs[0]

      if args['gradient_accumulation_steps'] > 1:
        loss = loss / args['gradient_accumulation_steps']
          
      loss.backward()
      torch.nn.utils.clip_grad_norm_(model.parameters(), args['max_grad_norm'])

      tr_loss += loss.item()
      if (step + 1) % args['gradient_accumulation_steps'] == 0:
        optimizer.step()
        scheduler.step() 
        model.zero_grad()
        global_step += 1

        if args['save_steps'] > 0 and global_step % args['save_steps'] == 0:
          output_dir = os.path.join(args['output_dir'], 'checkpoint-{}'.format(global_step))
          if not os.path.exists(output_dir):
            os.makedirs(output_dir)
          model_to_save = model.module if hasattr(model, 'module') else model
          model_to_save.save_pretrained(output_dir)
          logger.info("Saving model checkpoint to %s", output_dir)

  return global_step, tr_loss / global_step

In [10]:
config_class, model_class, tokenizer_class = MODEL_CLASSES[args["model_type"]]
config = config_class.from_pretrained(args["model_name"], num_labels=2, finetuning_task="binary")
tokenizer = tokenizer_class.from_pretrained(args["model_name"])
model = model_class(config)
model.to(device)

train_dataset = generate_training_dataset_from_articles([train_articles], [train_SI_labels], tokenizer)
global_step, tr_loss = train(train_dataset, model)

model_to_save = model.module if hasattr(model, 'module') else model
model_to_save.save_pretrained(args['output_dir'])
tokenizer.save_pretrained(args['output_dir'])
torch.save(args, os.path.join(args['output_dir'], 'training_args.bin'))

INFO:LOG:Generating training dataset...
INFO:LOG:Generating dataframe for folder datasets/train
INFO:LOG:Creating features from dataframe


      label                                               text
0         0  буковинця засудили до довічного ув'язнення за ...
1         1  чоловік побив її, потім наніс ножові поранення...
2         0                                                 о.
3         0                                     друзі, у мене 
4         1                                              шален
...     ...                                                ...
3994      1  нехай краще 10 років ведуть переговори про мир...
3995      0  ", – сказав він. також у виступі на комітеті в...
3996      0                                                   
3997      1                повальна мобілізація теж не допомож
3998      0  е. навіть якщо призвемо зараз 4 млн українців ...

[3999 rows x 2 columns]
(3999, 2)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  epoch_iterator = tqdm_notebook(train_dataloader, desc="Iteration")


Iteration:   0%|          | 0/500 [00:00<?, ?it/s]

Epoch: 100%|██████████| 1/1 [03:34<00:00, 214.60s/it]
INFO:LOG: global_step = 500, average loss = 0.31195589937455953
INFO:LOG:Saving model checkpoint to output_model_SI


#### Evaluation

In [11]:
def generate_SI_eval_dataset_from_article(article_file, tokenizer):
  """
  Generates SI dataset to go into BERT from articles and labels
  """
  # Get the id name
  article_id = os.path.basename(article_file).split(".")[0][7:]

  # Read in the article
  with codecs.open(article_file, "r", encoding="utf8") as f:
    article = f.read()

  # For evaluating, do:
  dataframe = article_to_sequences(article_id, article, tokenizer)

  # Only include sequences that has alphanumeric characters in them
  bool_indices = [False] * len(dataframe)
  for i in range(len(dataframe)):
    if any(c.isalnum() for c in dataframe["text"][i]):
      bool_indices[i] = True
  dataframe = dataframe.loc[bool_indices].reset_index(drop=True)


  # Process into features dataframe
  features = convert_dataframe_to_features(dataframe, args['max_seq_length'], tokenizer)
      
  # Creating TensorDataset from features
  all_input_ids = torch.tensor(features["input_ids"], dtype=torch.long)
  all_input_mask = torch.tensor(features["input_mask"], dtype=torch.long)
  all_segment_ids = torch.tensor(features["segment_ids"], dtype=torch.long)
  all_label_ids = torch.tensor(features["label_ids"], dtype=torch.long)

  dataset = TensorDataset(all_input_ids, all_input_mask, all_segment_ids, all_label_ids)
  return dataset, dataframe


In [12]:
def classify_per_article(eval_dataframe, eval_dataset, model):
  """
  Classifies a single article dataset and returns article id with indices list
  """
  # Load the eval data and initialize sampler
  eval_sampler = SequentialSampler(eval_dataset)
  eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args['eval_batch_size'])

  # Start Classification
  preds = np.empty((0, 2)) 

  # For each batch, evaluate
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):
    model.eval()
    batch = tuple(t.to(device) for t in batch)

    with torch.no_grad():
      inputs = {'input_ids':      batch[0],
                'attention_mask': batch[1],
                'token_type_ids': batch[2],
                'labels':         batch[3]}
      outputs = model(**inputs)
      logits = outputs[1]

      preds = np.append(preds, logits.detach().cpu().numpy(), axis=0)

  # Get the most probable prediction
  preds = np.argmax(preds, axis=1)
  eval_dataframe["label"] = preds

  # Get the propaganda indices and return them
  eval_dataframe = eval_dataframe.loc[eval_dataframe["label"] ==1].reset_index(drop=True)
  indices_list = []
  for i in range(len(eval_dataframe)):
    indices_list.append(tuple([eval_dataframe["seq_starts"][i], eval_dataframe["seq_ends"][i]]))
  indices_list = merge_overlapping(indices_list)

  return eval_dataframe["id"][0], indices_list

In [13]:
article_filenames = sorted(glob.glob(os.path.join(dev_articles, "*.txt")))   

labels_dir = 'datasets/pred_SI_labels'
if not os.path.exists(labels_dir):
  os.makedirs(labels_dir)

for i in range(len(article_filenames)):
  eval_dataset, eval_dataframe = generate_SI_eval_dataset_from_article(article_filenames[i], tokenizer)
  article_id, indices_list = classify_per_article(eval_dataframe, eval_dataset, model, tokenizer)
  
  f = open(labels_dir + '/article{}.labels.tsv'.format(article_id), 'w')
  writer = csv.writer(f, delimiter='\t')
  for indices in indices_list:
    writer.writerow([article_id, indices[0], indices[1]])
  f.close()
  


INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     477814           0         2      0             за
1     477814           0         4      0           запр
2     477814           0         6      0         запрош
3     477814           0        11      0    запрошувати
4     477814           0        13      0  запрошувати у
...      ...         ...       ...    ...            ...
5872  477814         328       335      0      ##ть ново
5873  477814         328       338      0   ##ть новость
5874  477814         331       335      0           ново
5875  477814         331       338      0        новость
5876  477814         335       338      0          ##сть

[5877 rows x 5 columns]
(5877, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/735 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     477814           0         2      1             за
1     477814           0         4      1           запр
2     477814           0         6      1         запрош
3     477814           0        11      1    запрошувати
4     477814           0        13      1  запрошувати у
...      ...         ...       ...    ...            ...
5872  477814         328       335      1      ##ть ново
5873  477814         328       338      1   ##ть новость
5874  477814         331       335      0           ново
5875  477814         331       338      1        новость
5876  477814         335       338      1          ##сть

[5877 rows x 5 columns]
           id  seq_starts  seq_ends  label           text
0      477842           0         2      0             по
1      477842           0         6      0         посили
2      477842           0         8      0       посилимо
3      477842           0        11      0    посилимо мо
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1837 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      477842           0         2      1             по
1      477842           0         6      1         посили
2      477842           0         8      1       посилимо
3      477842           0        11      1    посилимо мо
4      477842           0        13      1  посилимо мобі
...       ...         ...       ...    ...            ...
14688  477842         511       518      1      ##ть ново
14689  477842         511       521      1   ##ть новость
14690  477842         514       518      0           ново
14691  477842         514       521      1        новость
14692  477842         518       521      1          ##сть

[14693 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     477920           0         3      0            125
1     477920           0         7      0        125 млн
2     477920           0        10      0     125 млн гр
3     477920           0        11      0    125 м

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/582 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     477920           0         3      0            125
1     477920           0         7      1        125 млн
2     477920           0        10      1     125 млн гр
3     477920           0        11      1    125 млн грн
4     477920           0        12      0  125 млн грн .
...      ...         ...       ...    ...            ...
4647  477920         270       277      1      ##ть ново
4648  477920         270       280      1   ##ть новость
4649  477920         273       277      0           ново
4650  477920         273       280      1        новость
4651  477920         277       280      1          ##сть

[4652 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     477934           0         2      0                 ні
1     477934           0         6      0             нічого
2     477934           0         9      0          нічого не
3     477934           0        11      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     477934           0         2      0                 ні
1     477934           0         6      1             нічого
2     477934           0         9      1          нічого не
3     477934           0        11      1        нічого незв
4     477934           0         5      1  нічого незвичаино
...      ...         ...       ...    ...                ...
3228  477934         230       232      1               ##те
3229  477934         230       236      1           ##те тут
3230  477934         230       237      1         ##те тут :
3231  477934         233       236      0                тут
3232  477934         233       237      1              тут :

[3233 rows x 5 columns]
          id  seq_starts  seq_ends  label                            text
0     478085           0         7      0                         близько
1     478085           0         9      0                       близько 6
2     478085         

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                            text
0     478085           0         7      0                         близько
1     478085           0         9      1                       близько 6
2     478085           0        15      1                 близько 6 тисяч
3     478085           0        25      1       близько 6 тисяч чоловіків
4     478085           0        30      1  близько 6 тисяч чоловіків приз
...      ...         ...       ...    ...                             ...
4838  478085         290       297      1                       ##ть ново
4839  478085         290       300      1                    ##ть новость
4840  478085         293       297      0                            ново
4841  478085         293       300      1                         новость
4842  478085         297       300      1                           ##сть

[4843 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     478237           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     478237           0         1      0             т
1     478237           0         3      0           тру
2     478237           0         6      1        труять
3     478237           0        10      1    труять гри
4     478237           0        12      1  труять гризу
...      ...         ...       ...    ...           ...
3230  478237         214       221      1     ##ть ново
3231  478237         214       224      1  ##ть новость
3232  478237         217       221      0          ново
3233  478237         217       224      1       новость
3234  478237         221       224      1         ##сть

[3235 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     478610           0         1      0             п
1     478610           0         2      0            пз
2     478610           0         3      0           пзд
3     478610           0         4      0          пздц
4     478610           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/819 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     478610           0         1      0             п
1     478610           0         2      1            пз
2     478610           0         3      1           пзд
3     478610           0         4      1          пздц
4     478610           0         5      1        пздц !
...      ...         ...       ...    ...           ...
6541  478610         310       317      1     ##ть ново
6542  478610         310       320      1  ##ть новость
6543  478610         313       317      0          ново
6544  478610         313       320      1       новость
6545  478610         317       320      1         ##сть

[6546 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     478644           0         2      0              че
1     478644           0         5      0           черга
2     478644           0         8      0        черга за
3     478644           0        12      0    черга за сім
4     478644 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     478644           0         2      0              че
1     478644           0         5      1           черга
2     478644           0         8      1        черга за
3     478644           0        12      1    черга за сім
4     478644           0        13      1  черга за сім -
...      ...         ...       ...    ...             ...
2765  478644         220       227      1       ##ть ново
2766  478644         220       230      1    ##ть новость
2767  478644         223       227      0            ново
2768  478644         223       230      1         новость
2769  478644         227       230      1           ##сть

[2770 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     478691           0         2      0             ун
1     478691           0         5      0          уніка
2     478691           0         9      0      унікальну
3     478691           0        11      0    унікал

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/777 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     478691           0         2      0             ун
1     478691           0         5      1          уніка
2     478691           0         9      1      унікальну
3     478691           0        11      1    унікальну а
4     478691           0        13      1  унікальну аві
...      ...         ...       ...    ...            ...
6206  478691         305       312      1      ##ть ново
6207  478691         305       315      1   ##ть новость
6208  478691         308       312      0           ново
6209  478691         308       315      1        новость
6210  478691         312       315      1          ##сть

[6211 rows x 5 columns]
           id  seq_starts  seq_ends  label             text
0      478705           1         3      0               до
1      478705           1         7      0           до над
2      478705           1         9      0         до надзв
3      478705           1         5      0   до над

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1340 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      478705           1         3      0               до
1      478705           1         7      1           до над
2      478705           1         9      1         до надзв
3      478705           1         5      1   до надзвичаино
4      478705           1        24      1  до надзвичаиноі
...       ...         ...       ...    ...              ...
10715  478705         471       478      1        ##ть ново
10716  478705         471       481      1     ##ть новость
10717  478705         474       478      0             ново
10718  478705         474       481      1          новость
10719  478705         478       481      1            ##сть

[10720 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     478749           0         2      0                ім
1     478749           0         8      0          імовірно
2     478749           0         9      0        імовірно ,
3     478749  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     478749           0         2      0                ім
1     478749           0         8      1          імовірно
2     478749           0         9      1        імовірно ,
3     478749           0        12      1     імовірно , рф
4     478749           0        15      1  імовірно , рф на
...      ...         ...       ...    ...               ...
4453  478749         256       263      1         ##ть ново
4454  478749         256       266      1      ##ть новость
4455  478749         259       263      0              ново
4456  478749         259       266      1           новость
4457  478749         263       266      1             ##сть

[4458 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     478916           0         4      0          реке
1     478916           0         5      0         рекет
2     478916           0         8      0      рекет та
3     478916           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1097 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     478916           0         4      0          реке
1     478916           0         5      1         рекет
2     478916           0         8      1      рекет та
3     478916           0        10      1    рекет та р
4     478916           0         1      1  рекет та реи
...      ...         ...       ...    ...           ...
8766  478916         371       375      1        ##уков
8767  478916         371       378      1     ##уковича
8768  478916         371       379      0   ##уковича .
8769  478916         375       378      1         ##ича
8770  478916         375       379      0       ##ича .

[8771 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     478923           0         2      0                29
1     478923           0         6      0            29 тис
2     478923           0         7      0          29 тис .
3     478923           0        12      0     29 тис . один
4  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/656 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     478923           0         2      0                29
1     478923           0         6      1            29 тис
2     478923           0         7      0          29 тис .
3     478923           0        12      0     29 тис . один
4     478923           0        15      0  29 тис . одиниць
...      ...         ...       ...    ...               ...
5240  478923         291       298      1         ##ть ново
5241  478923         291       301      1      ##ть новость
5242  478923         294       298      0              ново
5243  478923         294       301      1           новость
5244  478923         298       301      1             ##сть

[5245 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     479109           0         5      0                 помер
1     479109           0         7      0               померли
2     479109           0        10      0            померли 13

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     479109           0         5      0                 помер
1     479109           0         7      1               померли
2     479109           0        10      1            померли 13
3     479109           0         4      1      померли 13 людеи
4     479109           0        20      1  померли 13 людеи від
...      ...         ...       ...    ...                   ...
5554  479109         308       315      1             ##ть ново
5555  479109         308       318      1          ##ть новость
5556  479109         311       315      0                  ново
5557  479109         311       318      1               новость
5558  479109         315       318      1                 ##сть

[5559 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     479331           0         1      0              в
1     479331           0         4      0           вдар
2     479331           0         7  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/534 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     479331           0         1      0              в
1     479331           0         4      1           вдар
2     479331           0         7      1        вдарила
3     479331           0        10      1     вдарила но
4     479331           0        13      1  вдарила ножем
...      ...         ...       ...    ...            ...
4266  479331         246       253      1      ##ть ново
4267  479331         246       256      1   ##ть новость
4268  479331         249       253      0           ново
4269  479331         249       256      1        новость
4270  479331         253       256      1          ##сть

[4271 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     479338           0         2      0            ен
1     479338           0         4      0          енер
2     479338           0         8      0      енергода
3     479338           0         9      0     енергодар
4     47933

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/876 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     479338           0         2      0            ен
1     479338           0         4      1          енер
2     479338           0         8      1      енергода
3     479338           0         9      1     енергодар
4     479338           0        12      1  енергодар за
...      ...         ...       ...    ...           ...
7001  479338         359       366      1     ##ть ново
7002  479338         359       369      1  ##ть новость
7003  479338         362       366      0          ново
7004  479338         362       369      1       новость
7005  479338         366       369      1         ##сть

[7006 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     543165           0         1      0             с
1     543165           0         3      0           ска
2     543165           0         4      0          скаб
3     543165           0         5      0         скабє
4     543165           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/922 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     543165           0         1      0             с
1     543165           0         3      1           ска
2     543165           0         4      1          скаб
3     543165           0         5      1         скабє
4     543165           0         7      1       скабєєв
...      ...         ...       ...    ...           ...
7369  543165         360       367      1     ##ть ново
7370  543165         360       370      1  ##ть новость
7371  543165         363       367      0          ново
7372  543165         363       370      1       новость
7373  543165         367       370      1         ##сть

[7374 rows x 5 columns]
          id  seq_starts  seq_ends  label    text
0     543177           0         1      0       п
1     543177           0         2      0      пз
2     543177           0         3      0     пзд
3     543177           0         4      0    пздц
4     543177           0         5      0  пздц :
...

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label    text
0     543177           0         1      0       п
1     543177           0         2      1      пз
2     543177           0         3      1     пзд
3     543177           0         4      1    пздц
4     543177           0         5      1  пздц :
...      ...         ...       ...    ...     ...
4455  543177         254       258      1    на з
4456  543177         254       260      1  на зсу
4457  543177         257       258      0       з
4458  543177         257       260      1     зсу
4459  543177         258       260      1    ##су

[4460 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     543315          -1         6      0           украіні
1     543315          -1        10      0        украіні за
2     543315          -1        12      0      украіні загр
3     543315          -1        13      0     украіні загро
4     543315          -1        16      0  украіні загрожує
...      ...   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1216 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     543315          -1         6      0           украіні
1     543315          -1        10      1        украіні за
2     543315          -1        12      1      украіні загр
3     543315          -1        13      1     украіні загро
4     543315          -1        16      1  украіні загрожує
...      ...         ...       ...    ...               ...
9718  543315         423       426      0               кор
9719  543315         423       433      1        корецького
9720  543315         423       434      0      корецького .
9721  543315         426       433      1         ##ецького
9722  543315         426       434      0       ##ецького .

[9723 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     543353           0         2      0              ла
1     543353           0         5      0           лазер
2     543353           0         7      0         лазерна
3     543353           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     543353           0         2      0              ла
1     543353           0         5      1           лазер
2     543353           0         7      1         лазерна
3     543353           0         9      1       лазерна з
4     543353           0        11      1     лазерна збр
...      ...         ...       ...    ...             ...
4838  543353         282       286      1          ##руха
4839  543353         282       294      1  ##руха израиль
4840  543353         284       286      1            ##ха
4841  543353         284       294      1    ##ха израиль
4842  543353         287       294      0         израиль

[4843 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     543458           0         5      0                немає
1     543458           0         8      0             немає по
2     543458           0        13      0        немає поняття
3     543458           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label                 text
0     543458           0         5      0                немає
1     543458           0         8      1             немає по
2     543458           0        13      1        немає поняття
3     543458           0        17      1    немає поняття рос
4     543458           0         1      1  немає поняття росіи
...      ...         ...       ...    ...                  ...
3228  543458         240       245      1                запит
3229  543458         240       248      1             запитань
3230  543458         242       245      1                ##пит
3231  543458         242       248      1             ##питань
3232  543458         245       248      1                ##ань

[3233 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                        text
0      543646           0         3      0                         нам
1      543646           0         6      0                      нам по
2      543646           0        12      0                нам потрібно
3      543646           0        19      0         нам потрібно більше
4      543646           0        26      0  нам потрібно більше солдат
...       ...         ...       ...    ...                         ...
16632  543646         631       633      0                        ##уп
16633  543646         631       637      0                    ##упація
16634  543646         631       638      0                  ##упація .
16635  543646         633       637      0                      ##ація
16636  543646         633       638      0                    ##ація .

[16637 rows x 5 columns]
(16637, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2080 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


           id  seq_starts  seq_ends  label                        text
0      543646           0         3      0                         нам
1      543646           0         6      1                      нам по
2      543646           0        12      1                нам потрібно
3      543646           0        19      1         нам потрібно більше
4      543646           0        26      1  нам потрібно більше солдат
...       ...         ...       ...    ...                         ...
16632  543646         631       633      1                        ##уп
16633  543646         631       637      1                    ##упація
16634  543646         631       638      0                  ##упація .
16635  543646         633       637      1                      ##ація
16636  543646         633       638      0                    ##ація .

[16637 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      543688           0         2      0             ел
1      543688           0         4      0           елек
2      543688           0         7      0        електри
3      543688           0         9      0      електрика
4      543688           0        13      0  електрика под
...       ...         ...       ...    ...            ...
21510  543688         568       572      0           прем
21511  543688         568         1      0         преміи
21512  543688         568       226      0       преміи .
21513  543688          -1         1      0           ##іи
21514  543688          -1       226      0         ##іи .

[21515 rows x 5 columns]
(21515, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2690 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      543688           0         2      0             ел
1      543688           0         4      1           елек
2      543688           0         7      1        електри
3      543688           0         9      1      електрика
4      543688           0        13      1  електрика под
...       ...         ...       ...    ...            ...
21510  543688         568       572      0           прем
21511  543688         568         1      1         преміи
21512  543688         568       226      0       преміи .
21513  543688          -1         1      1           ##іи
21514  543688          -1       226      0         ##іи .

[21515 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     543780          -1         4      0               віина
1     543780          -1         8      0            віина не
2     543780          -1        11      0         віина не за
3     543780          -1      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/384 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     543780          -1         4      0               віина
1     543780          -1         8      1            віина не
2     543780          -1        11      1         віина не за
3     543780          -1        14      1      віина не завер
4     543780          -1        18      1  віина не завершить
...      ...         ...       ...    ...                 ...
3066  543780         239       242      1               ##бен
3067  543780         239       246      1           ##бен час
3068  543780         239       247      0         ##бен час .
3069  543780         243       246      0                 час
3070  543780         243       247      0               час .

[3071 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     544007           0         5      0              серія
1     544007           0         9      0          серія під
2     544007           0        11      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     544007           0         5      0              серія
1     544007           0         9      1          серія під
2     544007           0        11      1        серія підлі
3     544007           0        15      1    серія підлітков
4     544007           0        17      1  серія підліткових
...      ...         ...       ...    ...                ...
3559  544007         221       228      1          ##ть ново
3560  544007         221       231      1       ##ть новость
3561  544007         224       228      0               ново
3562  544007         224       231      1            новость
3563  544007         228       231      1              ##сть

[3564 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     544053           0         3      0             мал
1     544053           0         5      0           малюк
2     544053           0         9      0       малюк пер
3     54405

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     544053           0         3      0             мал
1     544053           0         5      1           малюк
2     544053           0         9      1       малюк пер
3     544053           0        11      1     малюк перет
4     544053           0        14      1  малюк перетвор
...      ...         ...       ...    ...             ...
7007  544053         343       350      1       ##ть ново
7008  544053         343       353      1    ##ть новость
7009  544053         346       350      0            ново
7010  544053         346       353      1         новость
7011  544053         350       353      1           ##сть

[7012 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     544105           0         3      0             бел
1     544105           0         4      0            бель
2     544105           0         7      0         бельгія
3     544105           0        11      0     б

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/301 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     544105           0         3      0             бел
1     544105           0         4      1            бель
2     544105           0         7      1         бельгія
3     544105           0        11      1     бельгія від
4     544105           0        14      1  бельгія відпра
...      ...         ...       ...    ...             ...
2402  544105         216       223      1       ##ть ново
2403  544105         216       226      1    ##ть новость
2404  544105         219       223      0            ново
2405  544105         219       226      1         новость
2406  544105         223       226      1           ##сть

[2407 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     544274           0         6      0               голова
1     544274           0         8      0             голова н
2     544274           0        10      0           голова нбу
3     544274           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/749 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     544274           0         6      0               голова
1     544274           0         8      1             голова н
2     544274           0        10      1           голова нбу
3     544274           0         5      1    голова нбу андріи
4     544274           0        19      1  голова нбу андріи п
...      ...         ...       ...    ...                  ...
5983  544274         334       341      1            ##ть ново
5984  544274         334       344      1         ##ть новость
5985  544274         337       341      0                 ново
5986  544274         337       344      1              новость
5987  544274         341       344      1                ##сть

[5988 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     544511           0         7      0               загинув
1     544511           0        11      0           загинув пом
2     544511           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     544511           0         7      0               загинув
1     544511           0        11      1           загинув пом
2     544511           0        13      1         загинув поміч
3     544511           0        16      1      загинув помічник
4     544511           0        20      1  загинув помічник зал
...      ...         ...       ...    ...                   ...
3559  544511         262       269      1             ##ть ново
3560  544511         262       272      1          ##ть новость
3561  544511         265       269      0                  ново
3562  544511         265       272      1               новость
3563  544511         269       272      1                 ##сть

[3564 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     544701           0         3      0            сам
1     544701           0         5      0          сам о
2     544701           0         6  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/268 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     544701           0         3      0            сам
1     544701           0         5      1          сам о
2     544701           0         6      1         сам ор
3     544701           0         9      1      сам орбан
4     544701           0        13      1  сам орбан про
...      ...         ...       ...    ...            ...
2135  544701         205       209      1           мраз
2136  544701         205       210      1          мразь
2137  544701         206       209      1          ##раз
2138  544701         206       210      1         ##разь
2139  544701         209       210      1            ##ь

[2140 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     545090           0         6      0              рекорд
1     545090           0         7      0             рекорді
2     545090           0        11      0         рекорді 100
3     545090           0        16      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/467 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     545090           0         6      0              рекорд
1     545090           0         7      1             рекорді
2     545090           0        11      1         рекорді 100
3     545090           0        16      1    рекорді 100 млрд
4     545090           0        17      1  рекорді 100 млрд :
...      ...         ...       ...    ...                 ...
3729  545090         315       317      1                ##нц
3730  545090         315       320      1             ##нцями
3731  545090         315       321      0           ##нцями .
3732  545090         317       320      1               ##ями
3733  545090         317       321      0             ##ями .

[3734 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     545232           0         1      0                  в
1     545232           0         3      0                взи
2     545232           0         6      0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/467 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label               text
0     545232           0         1      0                  в
1     545232           0         3      1                взи
2     545232           0         6      1             взимку
3     545232           0         9      1          взимку по
4     545232           0         6      1  взимку по украіні
...      ...         ...       ...    ...                ...
3731  545232         260       267      1          ##ть ново
3732  545232         260       270      1       ##ть новость
3733  545232         263       267      0               ново
3734  545232         263       270      1            новость
3735  545232         267       270      1              ##сть

[3736 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      545315          -1         6      0             украіна
1      545315          -1        10      0          украіна зі
2      545315          -1        14      0      украіна зі сша
3      545315          -1        17      0   украіна зі сша ро
4      545315          -1        18      0  украіна зі сша роз
...       ...         ...       ...    ...                 ...
16814  545315         583       584      0                   я
16815  545315         583       591      0            я раніше
16816  545315         583       592      0          я раніше .
16817  545315         585       591      0              раніше
16818  545315         585       592      0            раніше .

[16819 rows x 5 columns]
(16819, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2103 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      545315          -1         6      0             украіна
1      545315          -1        10      1          украіна зі
2      545315          -1        14      1      украіна зі сша
3      545315          -1        17      1   украіна зі сша ро
4      545315          -1        18      1  украіна зі сша роз
...       ...         ...       ...    ...                 ...
16814  545315         583       584      0                   я
16815  545315         583       591      1            я раніше
16816  545315         583       592      0          я раніше .
16817  545315         585       591      0              раніше
16818  545315         585       592      0            раніше .

[16819 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     545668           0         3      0              про
1     545668           0         6      0           продов
2     545668           0         9      0

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     545668           0         3      0              про
1     545668           0         6      1           продов
2     545668           0         9      1        продовжує
3     545668           0        14      1   продовжує зато
4     545668           0        15      1  продовжує затоп
...      ...         ...       ...    ...              ...
3817  545668         240       249      1        цього при
3818  545668         240       253      1    цього приводу
3819  545668         246       249      0              при
3820  545668         246       253      1          приводу
3821  545668         249       253      1           ##воду

[3822 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     545752           0         2      0            як
1     545752           0         4      0          як в
2     545752           0         5      0         як вп
3     545752           0         7      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/696 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     545752           0         2      0            як
1     545752           0         4      1          як в
2     545752           0         5      1         як вп
3     545752           0         7      1       як впіз
4     545752           0        11      1   як впізнати
...      ...         ...       ...    ...           ...
5556  545752         300       307      1     ##ть ново
5557  545752         300       310      1  ##ть новость
5558  545752         303       307      0          ново
5559  545752         303       310      1       новость
5560  545752         307       310      1         ##сть

[5561 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     545767           0         1      0             ж
1     545767           0         3      0           жор
2     545767           0         7      0       жорсток
3     545767           0         8      0      жорстоко
4     545767           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/594 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     545767           0         1      0             ж
1     545767           0         3      1           жор
2     545767           0         7      1       жорсток
3     545767           0         8      1      жорстоко
4     545767           0        11      1   жорстоко по
...      ...         ...       ...    ...           ...
4741  545767         279       286      1     ##ть ново
4742  545767         279       289      1  ##ть новость
4743  545767         282       286      0          ново
4744  545767         282       289      1       новость
4745  545767         286       289      1         ##сть

[4746 rows x 5 columns]
           id  seq_starts  seq_ends  label           text
0      545832           0         2      0             др
1      545832           0         5      0          дрони
2      545832           0         9      0      дрони від
3      545832           0        12      0   дрони від сб
4      545832

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1269 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      545832           0         2      0             др
1      545832           0         5      1          дрони
2      545832           0         9      1      дрони від
3      545832           0        12      1   дрони від сб
4      545832           0        13      1  дрони від сбу
...       ...         ...       ...    ...            ...
10141  545832         443       450      1      ##ть ново
10142  545832         443       453      1   ##ть новость
10143  545832         446       450      0           ново
10144  545832         446       453      1        новость
10145  545832         450       453      1          ##сть

[10146 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     645654           0         1      0               с
1     645654           0         4      0            скіл
2     645654           0         7      0         скільки
3     645654           0        10      0     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     645654           0         1      0               с
1     645654           0         4      1            скіл
2     645654           0         7      1         скільки
3     645654           0        10      1      скільки за
4     645654           0        14      1  скільки зароби
...      ...         ...       ...    ...             ...
7612  645654         376       385      1     ##лати нови
7613  645654         376       387      1   ##лати новину
7614  645654         381       385      0            нови
7615  645654         381       387      0          новину
7616  645654         385       387      1            ##ну

[7617 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645756           0         1      0              п
1     645756           0         3      0            пив
2     645756           0         4      0           пиво
3     645756           0        11      0    пиво з

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645756           0         1      0              п
1     645756           0         3      1            пив
2     645756           0         4      1           пиво
3     645756           0        11      1    пиво значно
4     645756           0        13      1  пиво значно з
...      ...         ...       ...    ...            ...
7011  645756         317       326      1    ##лати нови
7012  645756         317       328      1  ##лати новину
7013  645756         322       326      0           нови
7014  645756         322       328      0         новину
7015  645756         326       328      1           ##ну

[7016 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645811           0         2      0             че
1     645811           0         4      0           черг
2     645811           0         3      0       черговии
3     645811           0        10      0     черговии с
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/277 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645811           0         2      0             че
1     645811           0         4      1           черг
2     645811           0         3      1       черговии
3     645811           0        10      1     черговии с
4     645811           0        13      1  черговии скан
...      ...         ...       ...    ...            ...
2204  645811         183       192      1    ##лати нови
2205  645811         183       194      1  ##лати новину
2206  645811         188       192      0           нови
2207  645811         188       194      0         новину
2208  645811         192       194      1           ##ну

[2209 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     645844           0         3      0               від
1     645844           0         7      0           відмова
2     645844           0        11      0       відмова від
3     645844           0        14      0    відмов

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/682 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     645844           0         3      0               від
1     645844           0         7      1           відмова
2     645844           0        11      1       відмова від
3     645844           0        14      1    відмова від се
4     645844           0        16      1  відмова від секс
...      ...         ...       ...    ...               ...
5448  645844         320       329      1       ##лати нови
5449  645844         320       331      1     ##лати новину
5450  645844         325       329      0              нови
5451  645844         325       331      0            новину
5452  645844         329       331      1              ##ну

[5453 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     645977           0         3      0            під
1     645977           0         5      0          підви
2     645977           0         7      0        підвищи
3     645977           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/511 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     645977           0         3      0            під
1     645977           0         5      1          підви
2     645977           0         7      1        підвищи
3     645977           0         9      1      підвищити
4     645977           0        12      1   підвищити ці
...      ...         ...       ...    ...            ...
4080  645977         221       230      1    ##лати нови
4081  645977         221       232      1  ##лати новину
4082  645977         226       230      0           нови
4083  645977         226       232      0         новину
4084  645977         230       232      1           ##ну

[4085 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     646035           0         2      0              ко
1     646035           0         4      0            кому
2     646035           0         4      0      кому віина
3     646035           0        11      0    кому віина ,
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     646035           0         2      1              ко
1     646035           0         4      1            кому
2     646035           0         4      1      кому віина
3     646035           0        11      1    кому віина ,
4     646035           0        13      1  кому віина , а
...      ...         ...       ...    ...             ...
2993  646035         196       205      1     ##лати нови
2994  646035         196       207      1   ##лати новину
2995  646035         201       205      0            нови
2996  646035         201       207      0          новину
2997  646035         205       207      1            ##ну

[2998 rows x 5 columns]
          id  seq_starts  seq_ends  label         text
0     646053           0         2      0           не
1     646053           0         3      0          нео
2     646053           0         5      0        неочі
3     646053           0         7      0      неочіку
4   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/804 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label         text
0     646053           0         2      1           не
1     646053           0         3      1          нео
2     646053           0         5      1        неочі
3     646053           0         7      1      неочіку
4     646053           0        11      1  неочікуване
...      ...         ...       ...    ...          ...
6425  646053         314       318      1       ##lviv
6426  646053         314       321      1    ##lvivbot
6427  646053         316       318      1         ##iv
6428  646053         316       321      1      ##ivbot
6429  646053         318       321      1        ##bot

[6430 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646255           0         1      0              т
1     646255           0         3      0            тре
2     646255           0         4      0           треш
3     646255           0         5      0         треш !
4     646255           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/631 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646255           0         1      0              т
1     646255           0         3      1            тре
2     646255           0         4      1           треш
3     646255           0         5      1         треш !
4     646255           0         7      1       треш ! ф
...      ...         ...       ...    ...            ...
5039  646255         287       296      1    ##лати нови
5040  646255         287       298      1  ##лати новину
5041  646255         292       296      0           нови
5042  646255         292       298      0         новину
5043  646255         296       298      1           ##ну

[5044 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646434           0         2      0             31
1     646434           0         6      0         31 млн
2     646434           0         9      0      31 млн гр
3     646434           0        10      0     31 млн грн
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/656 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646434           0         2      0             31
1     646434           0         6      1         31 млн
2     646434           0         9      1      31 млн гр
3     646434           0        10      1     31 млн грн
4     646434           0        13      1  31 млн грн на
...      ...         ...       ...    ...            ...
5239  646434         289       298      1    ##лати нови
5240  646434         289       300      1  ##лати новину
5241  646434         294       298      0           нови
5242  646434         294       300      0         новину
5243  646434         298       300      1           ##ну

[5244 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646460           0         2      0             ви
1     646460           0         4      0           вибу
2     646460           0         5      0          вибух
3     646460           0        10      0     вибух став
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/512 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646460           0         2      0             ви
1     646460           0         4      1           вибу
2     646460           0         5      1          вибух
3     646460           0        10      1     вибух став
4     646460           0        12      1   вибух стався
...      ...         ...       ...    ...            ...
4086  646460         257       266      1    ##лати нови
4087  646460         257       268      1  ##лати новину
4088  646460         262       266      0           нови
4089  646460         262       268      0         новину
4090  646460         266       268      1           ##ну

[4091 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646557           0         2      0             жа
1     646557           0         3      0            жах
2     646557           0         4      0          жах !
3     646557           0         8      0      жах ! нам
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646557           0         2      1             жа
1     646557           0         3      1            жах
2     646557           0         4      1          жах !
3     646557           0         8      1      жах ! нам
4     646557           0        11      1   жах ! намага
...      ...         ...       ...    ...            ...
3231  646557         227       236      1    ##лати нови
3232  646557         227       238      1  ##лати новину
3233  646557         232       236      0           нови
3234  646557         232       238      0         новину
3235  646557         236       238      1           ##ну

[3236 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     646593           0         2      0                на
1     646593           0         9      0         на смерть
2     646593           0        11      0       на смерть з
3     646593           0        14      0    на сме

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/435 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     646593           0         2      0                на
1     646593           0         9      1         на смерть
2     646593           0        11      1       на смерть з
3     646593           0        14      1    на смерть збив
4     646593           0        16      1  на смерть збив п
...      ...         ...       ...    ...               ...
3475  646593         222       231      1       ##лати нови
3476  646593         222       233      1     ##лати новину
3477  646593         227       231      0              нови
3478  646593         227       233      0            новину
3479  646593         231       233      1              ##ну

[3480 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     646653           0         3      0             все
1     646653           0         5      0           все ж
2     646653           0        10      0      все ж таки
3     646653           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/848 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     646653           0         3      0             все
1     646653           0         5      1           все ж
2     646653           0        10      1      все ж таки
3     646653           0        12      1    все ж таки у
4     646653           0        14      1  все ж таки уск
...      ...         ...       ...    ...             ...
6774  646653         359       368      1     ##лати нови
6775  646653         359       370      1   ##лати новину
6776  646653         364       368      0            нови
6777  646653         364       370      0          новину
6778  646653         368       370      1            ##ну

[6779 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646761           0         1      0              1
1     646761           0         4      0           1 ла
2     646761           0         5      0          1 лак
3     646761           0         8      0       1 л

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/805 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646761           0         1      0              1
1     646761           0         4      1           1 ла
2     646761           0         5      1          1 лак
3     646761           0         8      1       1 лакшер
4     646761           0         9      1      1 лакшері
...      ...         ...       ...    ...            ...
6429  646761         326       335      1    ##лати нови
6430  646761         326       337      1  ##лати новину
6431  646761         331       335      0           нови
6432  646761         331       337      0         новину
6433  646761         335       337      1           ##ну

[6434 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     646866           0         2      0             зі
1     646866           0         4      0           зі с
2     646866           0         6      0         зі ске
3     646866           0         8      0       зі скелі
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/405 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     646866           0         2      0             зі
1     646866           0         4      1           зі с
2     646866           0         6      1         зі ске
3     646866           0         8      1       зі скелі
4     646866           0        10      1     зі скелі в
...      ...         ...       ...    ...            ...
3232  646866         218       227      1    ##лати нови
3233  646866         218       229      1  ##лати новину
3234  646866         223       227      0           нови
3235  646866         223       229      0         новину
3236  646866         227       229      1           ##ну

[3237 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     647048           0         4      0           виду
1     647048           0         7      0        видурив
2     647048           0        10      0     видурив гр
3     647048           0        12      0   видурив грош
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     647048           0         4      0           виду
1     647048           0         7      1        видурив
2     647048           0        10      1     видурив гр
3     647048           0        12      1   видурив грош
4     647048           0        13      1  видурив гроші
...      ...         ...       ...    ...            ...
3816  647048         242       251      1    ##лати нови
3817  647048         242       253      1  ##лати новину
3818  647048         247       251      0           нови
3819  647048         247       253      0         новину
3820  647048         251       253      1           ##ну

[3821 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     647161           0         5      0              львів
1     647161           0         4      0        львів [UNK]
2     647161           0         9      0      львів [UNK] л
3     647161           0        11      0    ль

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/557 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     647161           0         5      0              львів
1     647161           0         4      1        львів [UNK]
2     647161           0         9      1      львів [UNK] л
3     647161           0        11      1    львів [UNK] лід
4     647161           0        13      1  львів [UNK] лідер
...      ...         ...       ...    ...                ...
4451  647161         269       270      1                ##ж
4452  647161         269       272      1              ##жче
4453  647161         269       273      0            ##жче .
4454  647161         270       272      1               ##че
4455  647161         270       273      0             ##че .

[4456 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     647164           0         1      0               с
1     647164           0         4      0            сказ
2     647164           0         8      0        сказ під
3     64716

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     647164           0         1      0               с
1     647164           0         4      1            сказ
2     647164           0         8      1        сказ під
3     647164           0        11      1     сказ підтве
4     647164           0        14      1  сказ підтверди
...      ...         ...       ...    ...             ...
2764  647164         209       212      1           ##хід
2765  647164         209       214      1         ##хідно
2766  647164         209       215      0       ##хідно .
2767  647164         212       214      1            ##но
2768  647164         212       215      0          ##но .

[2769 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     647174           0         1      0              с
1     647174           0         3      0            ска
2     647174           0         6      0         скажен
3     647174           0         7      0        ск

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/892 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     647174           0         1      0              с
1     647174           0         3      1            ска
2     647174           0         6      1         скажен
3     647174           0         7      1        скажену
4     647174           0        10      1     скажену ли
...      ...         ...       ...    ...            ...
7126  647174         335       344      1    ##лати нови
7127  647174         335       346      1  ##лати новину
7128  647174         340       344      0           нови
7129  647174         340       346      0         новину
7130  647174         344       346      1           ##ну

[7131 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     647187           0         5      0            росія
1     647187           0         8      0         росіянка
2     647187           0        10      0       росіянка х
3     647187           0        12      0     росіянка 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     647187           0         5      0            росія
1     647187           0         8      1         росіянка
2     647187           0        10      1       росіянка х
3     647187           0        12      1     росіянка хот
4     647187           0        15      1  росіянка хотіла
...      ...         ...       ...    ...              ...
7009  647187         347       356      1      ##лати нови
7010  647187         347       358      1    ##лати новину
7011  647187         352       356      0             нови
7012  647187         352       358      0           новину
7013  647187         356       358      1             ##ну

[7014 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     647199           0         1      0              2
1     647199           0         4      0           2 не
2     647199           0         6      0         2 неле
3     647199           0         9     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/489 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     647199           0         1      0              2
1     647199           0         4      1           2 не
2     647199           0         6      1         2 неле
3     647199           0         9      1      2 нелегал
4     647199           0        13      1  2 нелегальних
...      ...         ...       ...    ...            ...
3905  647199         235       244      1    ##лати нови
3906  647199         235       246      1  ##лати новину
3907  647199         240       244      0           нови
3908  647199         240       246      0         новину
3909  647199         244       246      1           ##ну

[3910 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     647279           0         3      0               сад
1     647279           0         3      0           садовии
2     647279           0        11      0       садовии під
3     647279           0        14      0    садови

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/385 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     647279           0         3      0               сад
1     647279           0         3      1           садовии
2     647279           0        11      1       садовии під
3     647279           0        14      1    садовии підтри
4     647279           0        16      1  садовии підтрима
...      ...         ...       ...    ...               ...
3070  647279         209       218      1       ##лати нови
3071  647279         209       220      1     ##лати новину
3072  647279         214       218      0              нови
3073  647279         214       220      0            новину
3074  647279         218       220      1              ##ну

[3075 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     647335           0         5      0             львів
1     647335           0         8      0          львівяни
2     647335           0         9      0        львівяни ,
3     647335   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/347 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     647335           0         5      0             львів
1     647335           0         8      1          львівяни
2     647335           0         9      1        львівяни ,
3     647335           0        12      1     львівяни , за
4     647335           0        15      1  львівяни , запас
...      ...         ...       ...    ...               ...
2764  647335         233       242      1       ##лати нови
2765  647335         233       244      1     ##лати новину
2766  647335         238       242      0              нови
2767  647335         238       244      0            новину
2768  647335         242       244      1              ##ну

[2769 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     647376           0         2      0               14
1     647376           0         8      0         14 тисяч
2     647376           0        10      0       14 тисяч а
3     647376       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     647376           0         2      0               14
1     647376           0         8      1         14 тисяч
2     647376           0        10      1       14 тисяч а
3     647376           0        13      1    14 тисяч авар
4     647376           0         1      1  14 тисяч аваріи
...      ...         ...       ...    ...              ...
2994  647376         243       252      1      ##лати нови
2995  647376         243       254      1    ##лати новину
2996  647376         248       252      0             нови
2997  647376         248       254      0           новину
2998  647376         252       254      1             ##ну

[2999 rows x 5 columns]
          id  seq_starts  seq_ends  label                  text
0     714627           0         4      0                  полі
1     714627           0         7      0               поліція
2     714627           0        14      0        поліція польщі
3     71462

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/804 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                  text
0     714627           0         4      0                  полі
1     714627           0         7      1               поліція
2     714627           0        14      1        поліція польщі
3     714627           0        16      1      поліція польщі в
4     714627           0        20      1  поліція польщі вбила
...      ...         ...       ...    ...                   ...
6426  714627         352       361      1           ##лати нови
6427  714627         352       363      1         ##лати новини
6428  714627         357       361      0                  нови
6429  714627         357       363      1                новини
6430  714627         361       363      1                  ##ни

[6431 rows x 5 columns]
          id  seq_starts  seq_ends  label         text
0     714669           0         1      0            х
1     714669           0         4      0         хвор
2     714669           0         6      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/937 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label         text
0     714669           0         1      0            х
1     714669           0         4      1         хвор
2     714669           0         6      1       хворих
3     714669           0         9      1    хворих на
4     714669           0        11      1  хворих на с
...      ...         ...       ...    ...          ...
7491  714669         373       374      0            с
7492  714669         373       377      1         сказ
7493  714669         373       378      0       сказ .
7494  714669         374       377      1        ##каз
7495  714669         374       378      0      ##каз .

[7496 rows x 5 columns]
          id  seq_starts  seq_ends  label                     text
0     714721           0         6      0                   рекорд
1     714721           0         8      0                 рекордну
2     714721           0        18      0       рекордну кількість
3     714721           0        22      0   рек

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/338 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     714721           0         6      0                   рекорд
1     714721           0         8      1                 рекордну
2     714721           0        18      1       рекордну кількість
3     714721           0        22      1   рекордну кількість без
4     714721           0        23      1  рекордну кількість безп
...      ...         ...       ...    ...                      ...
2692  714721         235       244      1              ##лати нови
2693  714721         235       246      1            ##лати новини
2694  714721         240       244      0                     нови
2695  714721         240       246      1                   новини
2696  714721         244       246      1                     ##ни

[2697 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     714729           0         2      0             та
1     714729           0         7      0        та сама


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     714729           0         2      0             та
1     714729           0         7      1        та сама
2     714729           0         9      1      та сама з
3     714729           0        11      1    та сама зуп
4     714729           0        13      1  та сама зупин
...      ...         ...       ...    ...            ...
3647  714729         240       249      1    ##лати нови
3648  714729         240       251      1  ##лати новину
3649  714729         245       249      0           нови
3650  714729         245       251      0         новину
3651  714729         249       251      1           ##ну

[3652 rows x 5 columns]
           id  seq_starts  seq_ends  label           text
0      714759           0         1      0              п
1      714759           0         2      0             пз
2      714759           0         3      0            пзд
3      714759           0         4      0           пздц
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1433 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


           id  seq_starts  seq_ends  label           text
0      714759           0         1      0              п
1      714759           0         2      1             пз
2      714759           0         3      1            пзд
3      714759           0         4      1           пздц
4      714759           0         5      1         пздц !
...       ...         ...       ...    ...            ...
11457  714759         414       423      1    ##лати нови
11458  714759         414       425      1  ##лати новини
11459  714759         419       423      0           нови
11460  714759         419       425      1         новини
11461  714759         423       425      1           ##ни

[11462 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                               text
0      714918           0         8      0                           директор
1      714918           0        12      0                       директор він
2      714918           0        20      0               директор вінницького
3      714918           0        26      0         директор вінницького ринку
4      714918           0        33      0  директор вінницького ринку центра
...       ...         ...       ...    ...                                ...
71596  714918        1164      1167      0                              ##дал
71597  714918        1164      1169      0                            ##далів
71598  714918        1164      1170      0                          ##далів .
71599  714918        1167      1169      0                               ##ів
71600  714918        1167      1170      0                             ##ів .

[71601 rows x 5 columns]
(71601, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/8951 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                               text
0      714918           0         8      0                           директор
1      714918           0        12      1                       директор він
2      714918           0        20      1               директор вінницького
3      714918           0        26      1         директор вінницького ринку
4      714918           0        33      1  директор вінницького ринку центра
...       ...         ...       ...    ...                                ...
71596  714918        1164      1167      1                              ##дал
71597  714918        1164      1169      1                            ##далів
71598  714918        1164      1170      0                          ##далів .
71599  714918        1167      1169      1                               ##ів
71600  714918        1167      1170      0                             ##ів .

[71601 rows x 5 columns]
          id  seq_starts  seq_ends  la

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     714943           0         1      0              з
1     714943           0         4      1           згор
2     714943           0         6      1         згорів
3     714943           0         9      1      згорів за
4     714943           0        12      1   згорів зажив
...      ...         ...       ...    ...            ...
3392  714943         235       244      1    ##лати нови
3393  714943         235       246      1  ##лати новини
3394  714943         240       244      0           нови
3395  714943         240       246      1         новини
3396  714943         244       246      1           ##ни

[3397 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     714982           0         6      0            батько
1     714982           0         8      0          батько г
2     714982           0        11      0       батько гвал
3     714982           0        13      0     батьк

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/735 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     714982           0         6      0            батько
1     714982           0         8      1          батько г
2     714982           0        11      1       батько гвал
3     714982           0        13      1     батько гвалту
4     714982           0        16      1  батько гвалтував
...      ...         ...       ...    ...               ...
5873  714982         305       314      1       ##лати нови
5874  714982         305       316      1     ##лати новини
5875  714982         310       314      0              нови
5876  714982         310       316      1            новини
5877  714982         314       316      1              ##ни

[5878 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     715048         102       104      0              із
1     715048         102         2      0           іздив
2     715048         102         9      0       іздив під
3     715048         10

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/385 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     715048         102       104      0              із
1     715048         102         2      1           іздив
2     715048         102         9      1       іздив під
3     715048         102        12      1    іздив під ді
4     715048         102        14      1  іздив під дією
...      ...         ...       ...    ...             ...
3071  715048         210       219      1     ##лати нови
3072  715048         210       221      1   ##лати новини
3073  715048         215       219      0            нови
3074  715048         215       221      1          новини
3075  715048         219       221      1            ##ни

[3076 rows x 5 columns]
          id  seq_starts  seq_ends  label                      text
0     715117           1         8      0                   переход
1     715117           1         9      0                  переходь
2     715117           1        12      0               переходь на
3     7

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                      text
0     715117           1         8      0                   переход
1     715117           1         9      1                  переходь
2     715117           1        12      1               переходь на
3     715117           1         4      1         переходь на новии
4     715117           1        25      1  переходь на новии рівень
...      ...         ...       ...    ...                       ...
5551  715117         313       315      1                      ##сь
5552  715117         313       321      1                ##сь зараз
5553  715117         313       322      1              ##сь зараз !
5554  715117         316       321      0                     зараз
5555  715117         316       322      1                   зараз !

[5556 rows x 5 columns]
          id  seq_starts  seq_ends  label                             text
0     715171           0         9      0                        більшість
1     715

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1080 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                             text
0     715171           0         9      0                        більшість
1     715171           0         8      1              більшість украінців
2     715171           0        22      1           більшість украінців не
3     715171           0        28      1     більшість украінців не мають
4     715171           0        31      1  більшість украінців не мають ім
...      ...         ...       ...    ...                              ...
8629  715171         395       404      1                      ##лати нови
8630  715171         395       406      1                    ##лати новини
8631  715171         400       404      0                             нови
8632  715171         400       406      1                           новини
8633  715171         404       406      1                             ##ни

[8634 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     715592      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/790 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     715592           0         2      0             во
1     715592           0         4      1           воро
2     715592           0         5      1          ворог
3     715592           0         9      1      ворог нам
4     715592           0        12      1   ворог намага
...      ...         ...       ...    ...            ...
6311  715592         331       340      1    ##лати нови
6312  715592         331       342      1  ##лати новини
6313  715592         336       340      0           нови
6314  715592         336       342      1         новини
6315  715592         340       342      1           ##ни

[6316 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     715770           0         1      0               п
1     715770           0         2      0             п *
2     715770           0         5      0         п * дар
3     715770           0         8      0      п * дариси
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     715770           0         1      0               п
1     715770           0         2      1             п *
2     715770           0         5      1         п * дар
3     715770           0         8      1      п * дариси
4     715770           0        12      1  п * дариси укр
...      ...         ...       ...    ...             ...
3476  715770         210       219      1     ##лати нови
3477  715770         210       221      1   ##лати новини
3478  715770         215       219      0            нови
3479  715770         215       221      1          новини
3480  715770         219       221      1            ##ни

[3481 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     715806           1         4      0                 без
1     715806           1         9      0            без води
2     715806           1        12      0         без води на
3     715806           1       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/748 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     715806           1         4      0                 без
1     715806           1         9      1            без води
2     715806           1        12      1         без води на
3     715806           1        15      1      без води на 36
4     715806           1        19      1  без води на 36 год
...      ...         ...       ...    ...                 ...
5977  715806         321       328      1           ##чень на
5978  715806         321       333      1      ##чень на фото
5979  715806         326       328      0                  на
5980  715806         326       333      1             на фото
5981  715806         329       333      0                фото

[5982 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     716099           0         3      0             доп
1     716099           0         6      0          допома
2     716099           0         9      0       допомагав

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/582 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     716099           0         3      0             доп
1     716099           0         6      1          допома
2     716099           0         9      1       допомагав
3     716099           0        12      1    допомагав го
4     716099           0        14      1  допомагав готу
...      ...         ...       ...    ...             ...
4644  716099         283       292      1     ##лати нови
4645  716099         283       294      1   ##лати новини
4646  716099         288       292      0            нови
4647  716099         288       294      1          новини
4648  716099         292       294      1            ##ни

[4649 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     716138           0         3      0               над
1     716138           0         1      0             надіи
2     716138           0         8      0          надіишло
3     716138           0        12     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     716138           0         3      0               над
1     716138           0         1      1             надіи
2     716138           0         8      1          надіишло
3     716138           0        12      1      надіишло 311
4     716138           0        16      1  надіишло 311 пов
...      ...         ...       ...    ...               ...
3477  716138         237       246      1       ##лати нови
3478  716138         237       248      1     ##лати новини
3479  716138         242       246      0              нови
3480  716138         242       248      1            новини
3481  716138         246       248      1              ##ни

[3482 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     716140           0         1      0              п
1     716140           0         2      0             пз
2     716140           0         3      0            пзд
3     716140           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     716140           0         1      0              п
1     716140           0         2      1             пз
2     716140           0         3      1            пзд
3     716140           0         4      1           пздц
4     716140           0         5      1         пздц !
...      ...         ...       ...    ...            ...
2993  716140         219       228      1    ##лати нови
2994  716140         219       230      1  ##лати новини
2995  716140         224       228      0           нови
2996  716140         224       230      1         новини
2997  716140         228       230      1           ##ни

[2998 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     716163           0         4      0             нова
1     716163           0         7      0          нова па
2     716163           0        10      0       нова панде
3     716163           0        13      0    нова панде

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/735 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     716163           0         4      0             нова
1     716163           0         7      1          нова па
2     716163           0        10      1       нова панде
3     716163           0        13      1    нова пандемія
4     716163           0        14      1  нова пандемія ?
...      ...         ...       ...    ...              ...
5873  716163         307       316      1      ##лати нови
5874  716163         307       318      1    ##лати новини
5875  716163         312       316      0             нови
5876  716163         312       318      1           новини
5877  716163         316       318      1             ##ни

[5878 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     716214           0         2      0               на
1     716214           0         9      0        на службу
2     716214           0        11      0      на службу з
3     716214           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/804 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     716214           0         2      0               на
1     716214           0         9      1        на службу
2     716214           0        11      1      на службу з
3     716214           0        13      1    на службу змо
4     716214           0        15      1  на службу зможу
...      ...         ...       ...    ...              ...
6427  716214         339       348      1      ##лати нови
6428  716214         339       350      1    ##лати новини
6429  716214         344       348      0             нови
6430  716214         344       350      1           новини
6431  716214         348       350      1             ##ни

[6432 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     716277           1         3      0             см
1     716277           1         5      0           смер
2     716277           1         9      0       смертель
3     716277           1        11     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/907 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     716277           1         3      0             см
1     716277           1         5      1           смер
2     716277           1         9      1       смертель
3     716277           1        11      1     смертельна
4     716277           1        13      1   смертельна д
...      ...         ...       ...    ...            ...
7246  716277         330       339      1    ##лати нови
7247  716277         330       341      1  ##лати новини
7248  716277         335       339      0           нови
7249  716277         335       341      1         новини
7250  716277         339       341      1           ##ни

[7251 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     716353           0         3      0             куп
1     716353           0         7      0         купував
2     716353           0        10      0      купував кв
3     716353           0        12      0    купував квит
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/643 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     716353           0         3      0             куп
1     716353           0         7      1         купував
2     716353           0        10      1      купував кв
3     716353           0        12      1    купував квит
4     716353           0        14      1  купував квитки
...      ...         ...       ...    ...             ...
5139  716353         286       288      1            ##яз
5140  716353         286       292      1        ##язниці
5141  716353         286       293      0      ##язниці .
5142  716353         288       292      1          ##ниці
5143  716353         288       293      0        ##ниці .

[5144 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     716354           0         2      0                  по
1     716354           0         4      0                поту
2     716354           0         3      0            потужнии
3     716354           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/722 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     716354           0         2      1                  по
1     716354           0         4      1                поту
2     716354           0         3      1            потужнии
3     716354           0        15      1     потужнии дерево
4     716354           0        18      1  потужнии деревопад
...      ...         ...       ...    ...                 ...
5765  716354         308       309      1                 ##є
5766  716354         308       312      1              ##єчку
5767  716354         308       313      0            ##єчку .
5768  716354         309       312      1               ##чку
5769  716354         309       313      0             ##чку .

[5770 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     716540           0         5      0             залив
1     716540           0         9      0         залив пер
2     716540           0        12      0      зали

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/338 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     716540           0         5      0             залив
1     716540           0         9      1         залив пер
2     716540           0        12      1      залив перцем
3     716540           0        15      1   залив перцем ді
4     716540           0        16      1  залив перцем дів
...      ...         ...       ...    ...               ...
2693  716540         212       219      1         ##ть ново
2694  716540         212       222      1      ##ть новость
2695  716540         215       219      0              ново
2696  716540         215       222      1           новость
2697  716540         219       222      1             ##сть

[2698 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     716636           0         2      0            от
1     716636           0         4      0          отру
2     716636           0       196      0       отруина
3     716636           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/631 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label          text
0     716636           0         2      1            от
1     716636           0         4      1          отру
2     716636           0       196      1       отруина
3     716636           0       204      1    отруина ка
4     716636           0         1      1  отруина кава
...      ...         ...       ...    ...           ...
5036  716636         300       307      1     ##ть ново
5037  716636         300       310      1  ##ть новость
5038  716636         303       307      0          ново
5039  716636         303       310      1       новость
5040  716636         307       310      1         ##сть

[5041 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      717056           0         2      0             по
1      717056           0         6      0         посили
2      717056           0         8      0       посилимо
3      717056           0        11      0    посилимо мо
4      717056           0        13      0  посилимо мобі
...       ...         ...       ...    ...            ...
14178  717056         510       517      0      ##ть ново
14179  717056         510       520      0   ##ть новость
14180  717056         513       517      0           ново
14181  717056         513       520      0        новость
14182  717056         517       520      0          ##сть

[14183 rows x 5 columns]
(14183, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1773 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      717056           0         2      1             по
1      717056           0         6      1         посили
2      717056           0         8      1       посилимо
3      717056           0        11      1    посилимо мо
4      717056           0        13      1  посилимо мобі
...       ...         ...       ...    ...            ...
14178  717056         510       517      1      ##ть ново
14179  717056         510       520      1   ##ть новость
14180  717056         513       517      0           ново
14181  717056         513       520      1        новость
14182  717056         517       520      1          ##сть

[14183 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     717062           0         1      0             з
1     717062           0         4      0          зрос
2     717062           0         8      0      зростати
3     717062           0        10      0    зростатим

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/708 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     717062           0         1      0             з
1     717062           0         4      1          зрос
2     717062           0         8      1      зростати
3     717062           0        10      1    зростатиму
4     717062           0        12      1  зростатимуть
...      ...         ...       ...    ...           ...
5655  717062         297       304      1     ##ть ново
5656  717062         297       307      1  ##ть новость
5657  717062         300       304      0          ново
5658  717062         300       307      1       новость
5659  717062         304       307      1         ##сть

[5660 rows x 5 columns]
           id  seq_starts  seq_ends  label                      text
0      717181           0         6      0                    микола
1      717181           0         6      0             миколаівськии
2      717181           0        19      0       миколаівськии судно
3      717181           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1530 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                      text
0      717181           0         6      0                    микола
1      717181           0         6      1             миколаівськии
2      717181           0        19      1       миколаівськии судно
3      717181           0        21      1     миколаівськии суднобу
4      717181           0        24      1  миколаівськии суднобудів
...       ...         ...       ...    ...                       ...
12228  717181         509       516      1                 ##ть ново
12229  717181         509       519      1              ##ть новость
12230  717181         512       516      0                      ново
12231  717181         512       519      1                   новость
12232  717181         516       519      1                     ##сть

[12233 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     717315           0         4      0            може
1     717315           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     717315           0         4      0            може
1     717315           0         7      1         може по
2     717315           0         9      1       може погі
3     717315           0        10      1      може погір
4     717315           0        14      1  може погіршити
...      ...         ...       ...    ...             ...
4452  717315         255       262      1       ##ть ново
4453  717315         255       265      1    ##ть новость
4454  717315         258       262      0            ново
4455  717315         258       265      1         новость
4456  717315         262       265      1           ##сть

[4457 rows x 5 columns]
           id  seq_starts  seq_ends  label              text
0      717428           0         2      0                об
1      717428           0         6      0            обвали
2      717428           0        10      0        обвалилася
3      717428           0        13

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1359 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label              text
0      717428           0         2      0                об
1      717428           0         6      1            обвали
2      717428           0        10      1        обвалилася
3      717428           0        13      1     обвалилася ст
4      717428           0        16      1  обвалилася стеля
...       ...         ...       ...    ...               ...
10861  717428         407       414      1         ##ть ново
10862  717428         407       417      1      ##ть новость
10863  717428         410       414      0              ново
10864  717428         410       417      1           новость
10865  717428         414       417      1             ##сть

[10866 rows x 5 columns]
          id  seq_starts  seq_ends  label       text
0     717523           0         2      0         бу
1     717523           0         2      0      бухии
2     717523           0         7      0    бухии ч
3     717523           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/395 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label       text
0     717523           0         2      0         бу
1     717523           0         2      1      бухии
2     717523           0         7      1    бухии ч
3     717523           0         8      1   бухии чє
4     717523           0         9      1  бухии чєл
...      ...         ...       ...    ...        ...
3151  717523         264       266      1       ##ар
3152  717523         264       268      1     ##арні
3153  717523         264       269      1   ##арні .
3154  717523         266       268      1       ##ні
3155  717523         266       269      0     ##ні .

[3156 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     717533           0         6      0         зробив
1     717533           0         8      0       зробив д
2     717533           0         9      0      зробив дт
3     717533           0        10      0     зробив дтп
4     717533           0        13      0  зробив дтп 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1216 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     717533           0         6      0         зробив
1     717533           0         8      1       зробив д
2     717533           0         9      1      зробив дт
3     717533           0        10      1     зробив дтп
4     717533           0        13      1  зробив дтп із
...      ...         ...       ...    ...            ...
9716  717533         382       388      1       ##тельно
9717  717533         382       389      1      ##тельною
9718  717533         382       390      0    ##тельною .
9719  717533         388       389      1            ##ю
9720  717533         388       390      0          ##ю .

[9721 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     717610           0         4      0             буде
1     717610           0         6      0           будемо
2     717610           0         9      0        будемо ло
3     717610           0        13      0    будемо лов

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/533 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label             text
0     717610           0         4      0             буде
1     717610           0         6      1           будемо
2     717610           0         9      1        будемо ло
3     717610           0        13      1    будемо ловити
4     717610           0        15      1  будемо ловити у
...      ...         ...       ...    ...              ...
4254  717610         277        94      1        більшии "
4255  717610         277       134      0      більшии " .
4256  717610          -1         1      1             ##ии
4257  717610          -1        94      1           ##ии "
4258  717610          -1       134      0         ##ии " .

[4259 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      717690           0         2      0                   сп
1      717690           0         5      0                спала
2      717690           0         6      0               спалах
3      717690           0        13      0        спалах африка
4      717690           0         5      0  спалах африканськоі
...       ...         ...       ...    ...                  ...
12543  717690         494       501      0            ##ть ново
12544  717690         494       504      0         ##ть новость
12545  717690         497       501      0                 ново
12546  717690         497       504      0              новость
12547  717690         501       504      0                ##сть

[12548 rows x 5 columns]
(12548, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1569 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      717690           0         2      0                   сп
1      717690           0         5      1                спала
2      717690           0         6      1               спалах
3      717690           0        13      1        спалах африка
4      717690           0         5      1  спалах африканськоі
...       ...         ...       ...    ...                  ...
12543  717690         494       501      1            ##ть ново
12544  717690         494       504      1         ##ть новость
12545  717690         497       501      0                 ново
12546  717690         497       504      1              новость
12547  717690         501       504      1                ##сть

[12548 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     717871           0         3      0             366
1     717871           0         6      0          366 ви
2     717871           0        

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     717871           0         3      0             366
1     717871           0         6      1          366 ви
2     717871           0         9      1       366 випад
3     717871           0        12      1    366 випадків
4     717871           0        14      1  366 випадків с
...      ...         ...       ...    ...             ...
3994  717871         279       286      1       ##ть ново
3995  717871         279       289      1    ##ть новость
3996  717871         282       286      0            ново
3997  717871         282       289      1         новость
3998  717871         286       289      1           ##сть

[3999 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     718060           0         1      0             п
1     718060           0         2      0            пз
2     718060           0         3      0           пзд
3     718060           0         4      0          пздц

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1198 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     718060           0         1      0             п
1     718060           0         2      1            пз
2     718060           0         3      1           пзд
3     718060           0         4      1          пздц
4     718060           0         5      1        пздц !
...      ...         ...       ...    ...           ...
9574  718060         377       384      1     ##ть ново
9575  718060         377       387      1  ##ть новость
9576  718060         380       384      0          ново
9577  718060         380       387      1       новость
9578  718060         384       387      1         ##сть

[9579 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     718132           0         5      0            агент
1     718132           0         6      0           агента
2     718132           0         9      0        агента рф
3     718132           0        12      0     агента рф за
4     71

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/468 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     718132           0         5      0            агент
1     718132           0         6      1           агента
2     718132           0         9      1        агента рф
3     718132           0        12      1     агента рф за
4     718132           0        15      1  агента рф затри
...      ...         ...       ...    ...              ...
3732  718132         242       249      1        ##ть ново
3733  718132         242       252      1     ##ть новость
3734  718132         245       249      0             ново
3735  718132         245       252      1          новость
3736  718132         249       252      1            ##сть

[3737 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     718142           0         1      0             т
1     718142           0         3      0           тро
2     718142           0         5      0         трощи
3     718142           0         6      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label          text
0     718142           0         1      0             т
1     718142           0         3      1           тро
2     718142           0         5      1         трощи
3     718142           0         6      1        трощив
4     718142           0        10      1    трощив мог
...      ...         ...       ...    ...           ...
7006  718142         331       338      1     ##ть ново
7007  718142         331       341      1  ##ть новость
7008  718142         334       338      0          ново
7009  718142         334       341      1       новость
7010  718142         338       341      1         ##сть

[7011 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                   text
0      718354           0         8      0               компанія
1      718354           0        10      0             компанія з
2      718354           0        14      0         компанія з рос
3      718354           0         1      0       компанія з росіи
4      718354           0        21      0  компанія з росіиським
...       ...         ...       ...    ...                    ...
89225  718354        1318      1321      0                  ##бак
89226  718354        1318      1323      0                ##баков
89227  718354        1318      1324      0              ##баков .
89228  718354        1321      1323      0                   ##ов
89229  718354        1321      1324      0                 ##ов .

[89230 rows x 5 columns]
(89230, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/11154 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


           id  seq_starts  seq_ends  label                   text
0      718354           0         8      0               компанія
1      718354           0        10      1             компанія з
2      718354           0        14      1         компанія з рос
3      718354           0         1      1       компанія з росіи
4      718354           0        21      1  компанія з росіиським
...       ...         ...       ...    ...                    ...
89225  718354        1318      1321      1                  ##бак
89226  718354        1318      1323      1                ##баков
89227  718354        1318      1324      0              ##баков .
89228  718354        1321      1323      1                   ##ов
89229  718354        1321      1324      0                 ##ов .

[89230 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      742432           0         2      0               ок
1      742432           0         4      0             окру
2      742432           0         9      0        окружение
3      742432           0        11      0      окружение з
4      742432           0        15      0  окружение зелен
...       ...         ...       ...    ...              ...
95656  742432        1448      1453      0          ##бинск
95657  742432        1448         1      0        ##бинскии
95658  742432        1448       204      0      ##бинскии .
95659  742432          -1         1      0             ##ии
95660  742432          -1       204      0           ##ии .

[95661 rows x 5 columns]
(95661, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/11958 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      742432           0         2      0               ок
1      742432           0         4      1             окру
2      742432           0         9      1        окружение
3      742432           0        11      1      окружение з
4      742432           0        15      1  окружение зелен
...       ...         ...       ...    ...              ...
95656  742432        1448      1453      1          ##бинск
95657  742432        1448         1      1        ##бинскии
95658  742432        1448       204      0      ##бинскии .
95659  742432          -1         1      1             ##ии
95660  742432          -1       204      0           ##ии .

[95661 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     745402           0         1      0               з
1     745402           0         4      0            збив
2     745402           0         9      0       збив люди
3     745402          

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/337 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     745402           0         1      0               з
1     745402           0         4      1            збив
2     745402           0         9      1       збив люди
3     745402           0        11      1     збив людину
4     745402           0        14      1  збив людину та
...      ...         ...       ...    ...             ...
2691  745402         212       219      1       ##ть ново
2692  745402         212       222      1    ##ть новость
2693  745402         215       219      0            ново
2694  745402         215       222      1         новость
2695  745402         219       222      1           ##сть

[2696 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     745876           0         2      0              зв
1     745876           0         4      0            звер
2     745876           0         9      0       звернення
3     745876           0        11      0     з

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/523 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     745876           0         2      0              зв
1     745876           0         4      1            звер
2     745876           0         9      1       звернення
3     745876           0        11      1     звернення х
4     745876           0        14      1  звернення хаті
...      ...         ...       ...    ...             ...
4173  745876         257       263      1          контен
4174  745876         257       264      1         контент
4175  745876         260       263      1           ##тен
4176  745876         260       264      1          ##тент
4177  745876         263       264      1             ##т

[4178 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     745974           0         1      0               з
1     745974           0         4      0            зрад
2     745974           0         7      0         зрадник
3     745974           0        10      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/819 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     745974           0         1      0               з
1     745974           0         4      1            зрад
2     745974           0         7      1         зрадник
3     745974           0        10      1      зрадник із
4     745974           0        14      1  зрадник із дні
...      ...         ...       ...    ...             ...
6545  745974         344       351      1       ##ть ново
6546  745974         344       354      1    ##ть новость
6547  745974         347       351      0            ново
6548  745974         347       354      1         новость
6549  745974         351       354      1           ##сть

[6550 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     746033           0         1      0             п
1     746033           0         2      0            пз
2     746033           0         3      0           пзд
3     746033           0         4      0          пздц

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     746033           0         1      0             п
1     746033           0         2      1            пз
2     746033           0         3      1           пзд
3     746033           0         4      1          пздц
4     746033           0         5      1        пздц .
...      ...         ...       ...    ...           ...
3991  746033         221       228      1     ##ть ново
3992  746033         221       231      1  ##ть новость
3993  746033         224       228      0          ново
3994  746033         224       231      1       новость
3995  746033         228       231      1         ##сть

[3996 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     746058           0         1      0              т
1     746058           0         3      0            тро
2     746058           0         4      0           троє
3     746058           0         4      0     троє людеи
4     746058      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/293 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     746058           0         1      0              т
1     746058           0         3      1            тро
2     746058           0         4      1           троє
3     746058           0         4      1     троє людеи
4     746058           0        13      1  троє людеи по
...      ...         ...       ...    ...            ...
2337  746058         193       200      1      ##ть ново
2338  746058         193       203      1   ##ть новость
2339  746058         196       200      0           ново
2340  746058         196       203      1        новость
2341  746058         200       203      1          ##сть

[2342 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     746139           0         3      0              від
1     746139           0         8      0         від удар
2     746139           0         9      0        від удару
3     746139           0        13      0    від удару 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     746139           0         3      0              від
1     746139           0         8      1         від удар
2     746139           0         9      1        від удару
3     746139           0        13      1    від удару стр
4     746139           0        15      1  від удару струм
...      ...         ...       ...    ...              ...
3994  746139         268       275      1        ##ть ново
3995  746139         268       278      1     ##ть новость
3996  746139         271       275      0             ново
3997  746139         271       278      1          новость
3998  746139         275       278      1            ##сть

[3999 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     746169           0         1      0                в
1     746169           0         5      0            вбили
2     746169           0         8      0         вбили та
3     746169           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     746169           0         1      0                в
1     746169           0         5      1            вбили
2     746169           0         8      1         вбили та
3     746169           0        12      1     вбили та зал
4     746169           0        15      1  вбили та залили
...      ...         ...       ...    ...              ...
3818  746169         231       238      1        ##ть ново
3819  746169         231       241      1     ##ть новость
3820  746169         234       238      0             ново
3821  746169         234       241      1          новость
3822  746169         238       241      1            ##сть

[3823 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     746699           0         3      0           час
1     746699           0         6      0        час мо
2     746699           0         8      0      час мобі
3     746699           0        10      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/921 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     746699           0         3      0           час
1     746699           0         6      1        час мо
2     746699           0         8      1      час мобі
3     746699           0        10      1    час мобілі
4     746699           0        12      1  час мобілізу
...      ...         ...       ...    ...           ...
7357  746699         354       361      1     ##ть ново
7358  746699         354       364      1  ##ть новость
7359  746699         357       361      0          ново
7360  746699         357       364      1       новость
7361  746699         361       364      1         ##сть

[7362 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     747170           0         2      0              ро
1     747170           0         3      0             роз
2     747170           0         7      0         розклад
3     747170           0        10      0      розкладала
4     747170 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/922 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     747170           0         2      0              ро
1     747170           0         3      1             роз
2     747170           0         7      1         розклад
3     747170           0        10      1      розкладала
4     747170           0        14      1  розкладала сол
...      ...         ...       ...    ...             ...
7368  747170         322       329      1       ##ть ново
7369  747170         322       332      1    ##ть новость
7370  747170         325       329      0            ново
7371  747170         325       332      1         новость
7372  747170         329       332      1           ##сть

[7373 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     747198          -1         7      0               наибільш
1     747198          -1        11      0            наибільш ма
2     747198          -1        15      0        наибільш масова
3     747198       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/862 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     747198          -1         7      0               наибільш
1     747198          -1        11      1            наибільш ма
2     747198          -1        15      1        наибільш масова
3     747198          -1        17      1      наибільш масована
4     747198          -1        21      1  наибільш масована ата
...      ...         ...       ...    ...                    ...
6887  747198         362       369      1              ##ть ново
6888  747198         362       372      1           ##ть новость
6889  747198         365       369      0                   ново
6890  747198         365       372      1                новость
6891  747198         369       372      1                  ##сть

[6892 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     747214           0         5      0             забив
1     747214           0         8      0          забив со
2     747214   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/467 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     747214           0         5      0             забив
1     747214           0         8      1          забив со
2     747214           0        10      1        забив соки
3     747214           0        13      1     забив сокирою
4     747214           0        16      1  забив сокирою до
...      ...         ...       ...    ...               ...
3730  747214         254       261      1         ##ть ново
3731  747214         254       264      1      ##ть новость
3732  747214         257       261      0              ново
3733  747214         257       264      1           новость
3734  747214         261       264      1             ##сть

[3735 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     747259           0         2      0              че
1     747259           0         4      0            черг
2     747259           0         3      0        черговии
3     747259           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/721 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     747259           0         2      0              че
1     747259           0         4      1            черг
2     747259           0         3      1        черговии
3     747259           0        11      1     черговии те
4     747259           0        14      1  черговии терак
...      ...         ...       ...    ...             ...
5763  747259         319       322      1           ##нюю
5764  747259         319       326      1       ##нюються
5765  747259         319       327      0     ##нюються .
5766  747259         322       326      1          ##ться
5767  747259         322       327      0        ##ться .

[5768 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     747283           0         2      0             ви
1     747283           0         4      0       ви [UNK]
2     747283           0         6      0     ви [UNK] у
3     747283           0        11      0    ви [UN

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/748 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     747283           0         2      0             ви
1     747283           0         4      1       ви [UNK]
2     747283           0         6      1     ви [UNK] у
3     747283           0        11      1    ви [UNK] уи
4     747283           0       216      1  ви [UNK] уи *
...      ...         ...       ...    ...            ...
5979  747283         253       260      1      ##ть ново
5980  747283         253       263      1   ##ть новость
5981  747283         256       260      0           ново
5982  747283         256       263      1        новость
5983  747283         260       263      1          ##сть

[5984 rows x 5 columns]
           id  seq_starts  seq_ends  label                 text
0      747301           0         7      0              чоловік
1      747301           0         9      0            чоловікам
2      747301           0        15      0      чоловікам треба
3      747301           0        18

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1287 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      747301           0         7      0              чоловік
1      747301           0         9      1            чоловікам
2      747301           0        15      1      чоловікам треба
3      747301           0        18      1   чоловікам треба за
4      747301           0        19      1  чоловікам треба зап
...       ...         ...       ...    ...                  ...
10284  747301         471       478      1            ##ть ново
10285  747301         471       481      1         ##ть новость
10286  747301         474       478      0                 ново
10287  747301         474       481      1              новость
10288  747301         478       481      1                ##сть

[10289 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     747346           0         8      0             працював
1     747346           0        11      0          працював на
2     747346     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/819 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label                 text
0     747346           0         8      0             працював
1     747346           0        11      1          працював на
2     747346           0        13      1        працював на к
3     747346           0        16      1     працював на крем
4     747346           0        19      1  працював на кремлів
...      ...         ...       ...    ...                  ...
6544  747346         327       334      1            ##ть ново
6545  747346         327       337      1         ##ть новость
6546  747346         330       334      0                 ново
6547  747346         330       337      1              новость
6548  747346         334       337      1                ##сть

[6549 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      747353           0         2      0            на
1      747353           0         6      0        на дні
2      747353           0         8      0      на дніпр
3      747353           0        10      0    на дніпроп
4      747353           0        12      0  на дніпропет
...       ...         ...       ...    ...           ...
15731  747353         534       537      0         ##ілі
15732  747353         534       538      0        ##ілів
15733  747353         534       539      0      ##ілів .
15734  747353         537       538      0           ##в
15735  747353         537       539      0         ##в .

[15736 rows x 5 columns]
(15736, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1967 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      747353           0         2      0            на
1      747353           0         6      1        на дні
2      747353           0         8      1      на дніпр
3      747353           0        10      1    на дніпроп
4      747353           0        12      1  на дніпропет
...       ...         ...       ...    ...           ...
15731  747353         534       537      1         ##ілі
15732  747353         534       538      1        ##ілів
15733  747353         534       539      0      ##ілів .
15734  747353         537       538      1           ##в
15735  747353         537       539      0         ##в .

[15736 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     747417           0         1      0                      з
1     747417           0         6      0                 зросла
2     747417           0        16      0       зросла кількість
3     747417           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/338 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     747417           0         1      0                      з
1     747417           0         6      1                 зросла
2     747417           0        16      1       зросла кількість
3     747417           0        18      1     зросла кількість х
4     747417           0        21      1  зросла кількість хвор
...      ...         ...       ...    ...                    ...
2693  747417         199       206      1              ##ть ново
2694  747417         199       209      1           ##ть новость
2695  747417         202       206      0                   ново
2696  747417         202       209      1                новость
2697  747417         206       209      1                  ##сть

[2698 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     747481           0         3      0           дні
1     747481           0         5      0         дніпр
2     747481           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     747481           0         3      0           дні
1     747481           0         5      1         дніпр
2     747481           0         7      1       дніпроп
3     747481           0         9      1     дніпропет
4     747481           0        12      1  дніпропетров
...      ...         ...       ...    ...           ...
4839  747481         286       293      1     ##ть ново
4840  747481         286       296      1  ##ть новость
4841  747481         289       293      0          ново
4842  747481         289       296      1       новость
4843  747481         293       296      1         ##сть

[4844 rows x 5 columns]
           id  seq_starts  seq_ends  label          text
0      747489           0         3      0           без
1      747489           0         6      0        без те
2      747489           0         7      0       без теп
3      747489           0         9      0     без тепло
4      747489     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      747489           0         3      0           без
1      747489           0         6      1        без те
2      747489           0         7      1       без теп
3      747489           0         9      1     без тепло
4      747489           0        10      1   без тепло -
...       ...         ...       ...    ...           ...
10993  747489         402       409      1     ##ть ново
10994  747489         402       412      1  ##ть новость
10995  747489         405       409      0          ново
10996  747489         405       412      1       новость
10997  747489         409       412      1         ##сть

[10998 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     747502           0         3      0               дні
1     747502           0         5      0             дніпр
2     747502           0         8      0          дніпрята
3     747502           0         9      0        д

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1164 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     747502           0         3      0               дні
1     747502           0         5      1             дніпр
2     747502           0         8      1          дніпрята
3     747502           0         9      1        дніпрята ,
4     747502           0        15      1  дніпрята , влада
...      ...         ...       ...    ...               ...
9302  747502         375       382      1         ##ть ново
9303  747502         375       385      1      ##ть новость
9304  747502         378       382      0              ново
9305  747502         378       385      1           новость
9306  747502         382       385      1             ##сть

[9307 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     772625           0         9      0               володимир
1     772625           0        11      0             володимир з
2     772625           0        15      0         володим

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/523 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                    text
0     772625           0         9      0               володимир
1     772625           0        11      1             володимир з
2     772625           0        15      1         володимир зелен
3     772625           0         4      1    володимир зеленськии
4     772625           0        21      1  володимир зеленськии :
...      ...         ...       ...    ...                     ...
4175  772625         302       311      1             ##вати інші
4176  772625         302         5      1      ##вати інші краіни
4177  772625         307       311      0                    інші
4178  772625         307         5      1             інші краіни
4179  772625          -1         5      0                  краіни

[4180 rows x 5 columns]
          id  seq_starts  seq_ends  label         text
0     792284           0         2      0           за
1     792284           0         4      0         заги
2     792284      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/593 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label         text
0     792284           0         2      1           за
1     792284           0         4      1         заги
2     792284           0         6      1       загибл
3     792284           0         8      1     загиблих
4     792284           0        11      1  загиблих за
...      ...         ...       ...    ...          ...
4737  792284         332       337      0        героя
4738  792284         332       338      1       героям
4739  792284         332       339      1     героям !
4740  792284         337       338      1          ##м
4741  792284         337       339      1        ##м !

[4742 rows x 5 columns]
           id  seq_starts  seq_ends  label             text
0      801846           0         2      0               чи
1      801846           0         7      0          читання
2      801846           0        12      0     читання нови
3      801846           0        13      0    читання новин
4      801846  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1396 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      801846           0         2      0               чи
1      801846           0         7      1          читання
2      801846           0        12      1     читання нови
3      801846           0        13      1    читання новин
4      801846           0        15      1  читання новин в
...       ...         ...       ...    ...              ...
11157  801846         407       416      1      ##лати нови
11158  801846         407       418      1    ##лати новину
11159  801846         412       416      0             нови
11160  801846         412       418      0           новину
11161  801846         416       418      1             ##ну

[11162 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     801849           0         5      0            орден
1     801849           0         8      0         орден по
2     801849           0        11      0      орден пошан
3     801849      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1048 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     801849           0         5      0            орден
1     801849           0         8      1         орден по
2     801849           0        11      1      орден пошан
3     801849           0        12      1     орден пошани
4     801849           0        15      1  орден пошани за
...      ...         ...       ...    ...              ...
8372  801849         369       378      1      ##лати нови
8373  801849         369       380      1    ##лати новину
8374  801849         374       378      0             нови
8375  801849         374       380      0           новину
8376  801849         378       380      1             ##ну

[8377 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     801904           0         3      0            нар
1     801904           0         5      0          нареш
2     801904           0         7      0        нарешті
3     801904           0        11     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/328 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     801904           0         3      0            нар
1     801904           0         5      1          нареш
2     801904           0         7      1        нарешті
3     801904           0        11      1    нарешті обл
4     801904           0        13      1  нарешті облаш
...      ...         ...       ...    ...            ...
2619  801904         213       215      1           ##ит
2620  801904         213       218      1        ##иттів
2621  801904         213       219      0      ##иттів .
2622  801904         215       218      1          ##тів
2623  801904         215       219      0        ##тів .

[2624 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     802130           0         2      0                ар
1     802130           0         6      0            арсена
2     802130           0         7      0           арсенал
3     802130           0         4      0     арсен

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     802130           0         2      0                ар
1     802130           0         6      1            арсена
2     802130           0         7      1           арсенал
3     802130           0         4      1     арсенал зброі
4     802130           0        16      1  арсенал зброі ви
...      ...         ...       ...    ...               ...
2993  802130         218       227      1       ##лати нови
2994  802130         218       229      1     ##лати новину
2995  802130         223       227      0              нови
2996  802130         223       229      0            новину
2997  802130         227       229      1              ##ну

[2998 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802152           0         1      0              ж
1     802152           0         3      0            жін
2     802152           0         5      0          жінці
3     802152           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1215 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802152           0         1      0              ж
1     802152           0         3      1            жін
2     802152           0         5      1          жінці
3     802152           0         7      1        жінці в
4     802152           0        12      1   жінці в кафе
...      ...         ...       ...    ...            ...
9714  802152         408       417      1    ##лати нови
9715  802152         408       419      1  ##лати новину
9716  802152         413       417      0           нови
9717  802152         413       419      0         новину
9718  802152         417       419      1           ##ну

[9719 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802156           0         2      0             на
1     802156           0         6      0         на кор
2     802156           0         9      0      на кордон
3     802156           0        10      0     на кордоні
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802156           0         2      0             на
1     802156           0         6      1         на кор
2     802156           0         9      1      на кордон
3     802156           0        10      1     на кордоні
4     802156           0        12      1   на кордоні з
...      ...         ...       ...    ...            ...
7612  802156         374       383      1    ##лати нови
7613  802156         374       385      1  ##лати новину
7614  802156         379       383      0           нови
7615  802156         379       385      0         новину
7616  802156         383       385      1           ##ну

[7617 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     802416           0         3      0               мал
1     802416           0         5      0         малецькии
2     802416           0        12      0      малецькии за
3     802416           0        14      0    малець

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/302 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     802416           0         3      0               мал
1     802416           0         5      1         малецькии
2     802416           0        12      1      малецькии за
3     802416           0        14      1    малецькии загу
4     802416           0        16      1  малецькии загуля
...      ...         ...       ...    ...               ...
2406  802416         206       215      1       ##лати нови
2407  802416         206       217      1     ##лати новину
2408  802416         211       215      0              нови
2409  802416         211       217      0            новину
2410  802416         215       217      1              ##ну

[2411 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     802534           0         5      0              добро
1     802534           0         7      0            доброго
2     802534           0        12      0       доброго рано
3     80253

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/618 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label               text
0     802534           0         5      0              добро
1     802534           0         7      1            доброго
2     802534           0        12      1       доброго рано
3     802534           0        15      1    доброго раночку
4     802534           0        16      1  доброго раночку ,
...      ...         ...       ...    ...                ...
4936  802534         286       295      1        ##лати нови
4937  802534         286       297      1      ##лати новину
4938  802534         291       295      0               нови
4939  802534         291       297      0             новину
4940  802534         295       297      1               ##ну

[4941 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      802635           0         2      0               ша
1      802635           0         5      0            шапов
2      802635           0         8      0         шаповало
3      802635           0         9      0        шаповалов
4      802635           0        15      0  шаповалов почав
...       ...         ...       ...    ...              ...
17001  802635         534       537      0            ##лат
17002  802635         534       539      0          ##латню
17003  802635         534       540      0        ##латню ?
17004  802635         537       539      0             ##ню
17005  802635         537       540      0           ##ню ?

[17006 rows x 5 columns]
(17006, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2126 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      802635           0         2      0               ша
1      802635           0         5      1            шапов
2      802635           0         8      1         шаповало
3      802635           0         9      1        шаповалов
4      802635           0        15      1  шаповалов почав
...       ...         ...       ...    ...              ...
17001  802635         534       537      1            ##лат
17002  802635         534       539      1          ##латню
17003  802635         534       540      1        ##латню ?
17004  802635         537       539      1             ##ню
17005  802635         537       540      1           ##ню ?

[17006 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     802717           0         2      0            ка
1     802717           0         4      0          каца
2     802717           0         6      0        кацапи
3     802717           0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     802717           0         2      0            ка
1     802717           0         4      1          каца
2     802717           0         6      1        кацапи
3     802717           0         9      1     кацапи те
4     802717           0        12      1  кацапи тесту
...      ...         ...       ...    ...           ...
3560  802717         256       258      1          ##пе
3561  802717         256       260      1        ##пека
3562  802717         256       261      0      ##пека .
3563  802717         258       260      1          ##ка
3564  802717         258       261      0        ##ка .

[3565 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     802824           0         3      0            нар
1     802824           0         7      0        наркото
2     802824           0         9      0      наркоторг
3     802824           0        11      0    наркоторгів
4     802824      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     802824           0         3      0            нар
1     802824           0         7      1        наркото
2     802824           0         9      1      наркоторг
3     802824           0        11      1    наркоторгів
4     802824           0        13      1  наркоторгівця
...      ...         ...       ...    ...            ...
4362  802824         252       261      1    ##лати нови
4363  802824         252       263      1  ##лати новину
4364  802824         257       261      0           нови
4365  802824         257       263      0         новину
4366  802824         261       263      1           ##ну

[4367 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     802873           0         3      0                  мал
1     802873           0         5      0            малецькии
2     802873           0        15      0      малецькии назва
3     802873           0        16     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/708 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     802873           0         3      0                  мал
1     802873           0         5      1            малецькии
2     802873           0        15      1      малецькии назва
3     802873           0        16      1     малецькии назвав
4     802873           0        19      1  малецькии назвав пр
...      ...         ...       ...    ...                  ...
5657  802873         284       293      1          ##лати нови
5658  802873         284       295      1        ##лати новину
5659  802873         289       293      0                 нови
5660  802873         289       295      0               новину
5661  802873         293       295      1                 ##ну

[5662 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     803167           0         2      0                 ви
1     803167           0         4      0               вилу
2     803167           0         8  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     803167           0         2      0                 ви
1     803167           0         4      1               вилу
2     803167           0         8      1           вилучили
3     803167           0        14      1     вилучили понад
4     803167           0        17      1  вилучили понад 80
...      ...         ...       ...    ...                ...
3311  803167         227       236      1        ##лати нови
3312  803167         227       238      1      ##лати новину
3313  803167         232       236      0               нови
3314  803167         232       238      0             новину
3315  803167         236       238      1               ##ну

[3316 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     803349           0         3      0             пол
1     803349           0         4      0            поль
2     803349           0         8      0        польські
3     80334

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     803349           0         3      0             пол
1     803349           0         4      1            поль
2     803349           0         8      1        польські
3     803349           0        12      1    польські пер
4     803349           0        14      1  польські перев
...      ...         ...       ...    ...             ...
4362  803349         293       302      1     ##лати нови
4363  803349         293       304      1   ##лати новину
4364  803349         298       302      0            нови
4365  803349         298       304      0          новину
4366  803349         302       304      1            ##ну

[4367 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     876018           0         3      0            дні
1     876018           0         5      0          дніпр
2     876018           0         6      0         дніпро
3     876018           0         9      0      дніп

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/922 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label           text
0     876018           0         3      0            дні
1     876018           0         5      1          дніпр
2     876018           0         6      1         дніпро
3     876018           0         9      1      дніпро не
4     876018           0        13      1  дніпро не пер
...      ...         ...       ...    ...            ...
7364  876018         328       335      1      ##ть ново
7365  876018         328       338      1   ##ть новость
7366  876018         331       335      0           ново
7367  876018         331       338      1        новость
7368  876018         335       338      1          ##сть

[7369 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      876042           0         2      0                   на
1      876042           0         4      0                 наяв
2      876042           0         9      0            наявність
3      876042           0        14      0       наявність дома
4      876042           0         4      0  наявність домашньоі
...       ...         ...       ...    ...                  ...
12231  876042         441       448      0            ##ть ново
12232  876042         441       451      0         ##ть новость
12233  876042         444       448      0                 ново
12234  876042         444       451      0              новость
12235  876042         448       451      0                ##сть

[12236 rows x 5 columns]
(12236, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1530 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      876042           0         2      0                   на
1      876042           0         4      1                 наяв
2      876042           0         9      1            наявність
3      876042           0        14      1       наявність дома
4      876042           0         4      1  наявність домашньоі
...       ...         ...       ...    ...                  ...
12231  876042         441       448      1            ##ть ново
12232  876042         441       451      1         ##ть новость
12233  876042         444       448      0                 ново
12234  876042         444       451      1              новость
12235  876042         448       451      1                ##сть

[12236 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     876107           0         1      0             к
1     876107           0         4      0          крив
2     876107           0         6    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/722 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     876107           0         1      0             к
1     876107           0         4      1          крив
2     876107           0         6      1        кривор
3     876107           0         8      1      криворіз
4     876107           0        11      1   криворізькі
...      ...         ...       ...    ...           ...
5767  876107         275       282      1     ##ть ново
5768  876107         275       285      1  ##ть новость
5769  876107         278       282      0          ново
5770  876107         278       285      1       новость
5771  876107         282       285      1         ##сть

[5772 rows x 5 columns]
           id  seq_starts  seq_ends  label                text
0      876114           0         3      0                 акт
1      876114           0         5      0               актив
2      876114           0         7      0             активіз
3      876114           0        14      0      акт

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1286 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      876114           0         3      0                 акт
1      876114           0         5      1               актив
2      876114           0         7      1             активіз
3      876114           0        14      1      активізувалися
4      876114           0        18      1  активізувалися шах
...       ...         ...       ...    ...                 ...
10277  876114         408       410      1                ##ні
10278  876114         408       417      1         ##ні органи
10279  876114         408       418      0       ##ні органи .
10280  876114         411       417      0              органи
10281  876114         411       418      0            органи .

[10282 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     876373           0         2      0             ун
1     876373           0         4      0           уник
2     876373           0         8      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/833 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     876373           0         2      0             ун
1     876373           0         4      1           уник
2     876373           0         8      1       уникнути
3     876373           0        11      1    уникнути мо
4     876373           0        13      1  уникнути мобі
...      ...         ...       ...    ...            ...
6656  876373         315       322      1      ##ть ново
6657  876373         315       325      1   ##ть новость
6658  876373         318       322      0           ново
6659  876373         318       325      1        новость
6660  876373         322       325      1          ##сть

[6661 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     876423           0         3      0              під
1     876423           0         6      0           підпис
2     876423           0        10      0       підписники
3     876423           0        13      0    підписники

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/415 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     876423           0         3      0              під
1     876423           0         6      1           підпис
2     876423           0        10      1       підписники
3     876423           0        13      1    підписники жа
4     876423           0        15      1  підписники жалі
...      ...         ...       ...    ...              ...
3311  876423         231       238      1        ##ть ново
3312  876423         231       241      1     ##ть новость
3313  876423         234       238      0             ново
3314  876423         234       241      1          новость
3315  876423         238       241      1            ##сть

[3316 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     876440           0         2      0                ця
1     876440           0         4      0          ця віина
2     876440           0        12      0      ця віина над
3     876440           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/511 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label              text
0     876440           0         2      0                ця
1     876440           0         4      1          ця віина
2     876440           0        12      1      ця віина над
3     876440           0        14      1    ця віина надов
4     876440           0        16      1  ця віина надовго
...      ...         ...       ...    ...               ...
4081  876440         270       277      1         ##ть ново
4082  876440         270       280      1      ##ть новость
4083  876440         273       277      0              ново
4084  876440         273       280      1           новость
4085  876440         277       280      1             ##сть

[4086 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                  text
0      876460           0         4      0                  якщо
1      876460           0         7      0               якщо не
2      876460           0        13      0         якщо не можна
3      876460           0        17      0     якщо не можна куп
4      876460           0        20      0  якщо не можна купити
...       ...         ...       ...    ...                   ...
25627  876460         652       656      0                  полі
25628  876460         652       660      0              політику
25629  876460         652       661      0            політику .
25630  876460         656       660      0                ##тику
25631  876460         656       661      0              ##тику .

[25632 rows x 5 columns]
(25632, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/3204 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


           id  seq_starts  seq_ends  label                  text
0      876460           0         4      0                  якщо
1      876460           0         7      1               якщо не
2      876460           0        13      1         якщо не можна
3      876460           0        17      1     якщо не можна куп
4      876460           0        20      1  якщо не можна купити
...       ...         ...       ...    ...                   ...
25627  876460         652       656      0                  полі
25628  876460         652       660      1              політику
25629  876460         652       661      0            політику .
25630  876460         656       660      1                ##тику
25631  876460         656       661      0              ##тику .

[25632 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                  text
0      876756           0         3      0                   хто
1      876756           0         5      0                 хтось
2      876756           0         9      0             хтось або
3      876756           0        15      0       хтось або група
4      876756           0        20      0  хтось або група осіб
...       ...         ...       ...    ...                   ...
23197  876756         610       617      0             ##ть ново
23198  876756         610       620      0          ##ть новость
23199  876756         613       617      0                  ново
23200  876756         613       620      0               новость
23201  876756         617       620      0                 ##сть

[23202 rows x 5 columns]
(23202, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/2901 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                  text
0      876756           0         3      0                   хто
1      876756           0         5      1                 хтось
2      876756           0         9      1             хтось або
3      876756           0        15      1       хтось або група
4      876756           0        20      1  хтось або група осіб
...       ...         ...       ...    ...                   ...
23197  876756         610       617      1             ##ть ново
23198  876756         610       620      1          ##ть новость
23199  876756         613       617      0                  ново
23200  876756         613       620      1               новость
23201  876756         617       620      1                 ##сть

[23202 rows x 5 columns]
          id  seq_starts  seq_ends  label                    text
0     876788           0         9      0               відкриття
1     876788           0        16      0        відкриття нов

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                    text
0     876788           0         9      0               відкриття
1     876788           0        16      1        відкриття нового
2     876788           0        19      1     відкриття нового ат
3     876788           0        20      1    відкриття нового атб
4     876788           0        22      1  відкриття нового атб у
...      ...         ...       ...    ...                     ...
3478  876788         242       249      1               ##ть ново
3479  876788         242       252      1            ##ть новость
3480  876788         245       249      0                    ново
3481  876788         245       252      1                 новость
3482  876788         249       252      1                   ##сть

[3483 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     876856           0         2      0             ви
1     876856           0         1      0           вииш
2     876856

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/523 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     876856           0         2      0             ви
1     876856           0         1      1           вииш
2     876856           0         6      1         виишло
3     876856           0        10      1     виишло топ
4     876856           0        13      1  виишло топове
...      ...         ...       ...    ...            ...
4175  876856         241       248      1      ##ть ново
4176  876856         241       251      1   ##ть новость
4177  876856         244       248      0           ново
4178  876856         244       251      1        новость
4179  876856         248       251      1          ##сть

[4180 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     877009           0         5      0          росія
1     877009           0         7      0        росіяни
2     877009           0        10      0     росіяни за
3     877009           0        11      0    росіяни зав
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/776 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     877009           0         5      0          росія
1     877009           0         7      1        росіяни
2     877009           0        10      1     росіяни за
3     877009           0        11      1    росіяни зав
4     877009           0        13      1  росіяни завда
...      ...         ...       ...    ...            ...
6201  877009         281       288      1      ##ть ново
6202  877009         281       291      1   ##ть новость
6203  877009         284       288      0           ново
6204  877009         284       291      1        новость
6205  877009         288       291      1          ##сть

[6206 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     877225           0         3      0              ана
1     877225           0         7      0          анально
2     877225           0        10      0       анально та
3     877225           0        12      0     анально т

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1080 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     877225           0         3      0              ана
1     877225           0         7      1          анально
2     877225           0        10      1       анально та
3     877225           0        12      1     анально та о
4     877225           0        15      1  анально та орал
...      ...         ...       ...    ...              ...
8628  877225         361       368      1        ##ть ново
8629  877225         361       371      1     ##ть новость
8630  877225         364       368      0             ново
8631  877225         364       371      1          новость
8632  877225         368       371      1            ##сть

[8633 rows x 5 columns]
          id  seq_starts  seq_ends  label               text
0     877270           0         3      0                обе
1     877270           0         5      0              обере
2     877270           0         8      0           обережно
3     877270           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label               text
0     877270           0         3      0                обе
1     877270           0         5      1              обере
2     877270           0         8      1           обережно
3     877270           0         9      0         обережно .
4     877270           0        16      1  обережно . дерево
...      ...         ...       ...    ...                ...
3994  877270         251       258      1          ##ть ново
3995  877270         251       261      1       ##ть новость
3996  877270         254       258      0               ново
3997  877270         254       261      1            новость
3998  877270         258       261      1              ##сть

[3999 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     877285           0         3      0             під
1     877285           0         5      0           підлі
2     877285           0         8      0        підліток
3     87728

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     877285           0         3      0             під
1     877285           0         5      1           підлі
2     877285           0         8      1        підліток
3     877285           0        11      1     підліток ви
4     877285           0        14      1  підліток випив
...      ...         ...       ...    ...             ...
3394  877285         217       224      1       ##ть ново
3395  877285         217       227      1    ##ть новость
3396  877285         220       224      0            ново
3397  877285         220       227      1         новость
3398  877285         224       227      1           ##сть

[3399 rows x 5 columns]
           id  seq_starts  seq_ends  label            text
0      877549           0         3      0             муж
1      877549           0         5      0           мужик
2      877549           0         9      0       мужик ран
3      877549           0        11      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1378 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label            text
0      877549           0         3      0             муж
1      877549           0         5      1           мужик
2      877549           0         9      1       мужик ран
3      877549           0        11      1     мужик ранив
4      877549           0        14      1  мужик ранив ко
...       ...         ...       ...    ...             ...
11013  877549         407       414      1       ##ть ново
11014  877549         407       417      1    ##ть новость
11015  877549         410       414      0            ново
11016  877549         410       417      1         новость
11017  877549         414       417      1           ##сть

[11018 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     877550           0         1      0             п
1     877550           0         2      0            пз
2     877550           0         3      0           пзд
3     877550           0         4      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/365 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label          text
0     877550           0         1      0             п
1     877550           0         2      1            пз
2     877550           0         3      1           пзд
3     877550           0         4      1          пздц
4     877550           0         5      1        пздц .
...      ...         ...       ...    ...           ...
2914  877550         214       221      1     ##ть ново
2915  877550         214       224      1  ##ть новость
2916  877550         217       221      0          ново
2917  877550         217       224      1       новость
2918  877550         221       224      1         ##сть

[2919 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     877553           0         1      0                      з
1     877553           0         6      0                 зросла
2     877553           0        16      0       зросла кількість
3     877553           0        18      0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                   text
0     877553           0         1      0                      з
1     877553           0         6      1                 зросла
2     877553           0        16      1       зросла кількість
3     877553           0        18      1     зросла кількість х
4     877553           0        21      1  зросла кількість хвор
...      ...         ...       ...    ...                    ...
3645  877553         224       231      1              ##ть ново
3646  877553         224       234      1           ##ть новость
3647  877553         227       231      0                   ново
3648  877553         227       234      1                новость
3649  877553         231       234      1                  ##сть

[3650 rows x 5 columns]
          id  seq_starts  seq_ends  label          text
0     877660           0         1      0             п
1     877660           0         2      0            пз
2     877660           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/570 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label          text
0     877660           0         1      0             п
1     877660           0         2      1            пз
2     877660           0         3      1           пзд
3     877660           0         4      1          пздц
4     877660           0         5      1        пздц :
...      ...         ...       ...    ...           ...
4549  877660         272       279      1     ##ть ново
4550  877660         272       282      1  ##ть новость
4551  877660         275       279      0          ново
4552  877660         275       282      1       новость
4553  877660         279       282      1         ##сть

[4554 rows x 5 columns]


INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     877715           0         5      0                    через
1     877715           0        10      0               через нові
2     877715           0        14      0           через нові рос
3     877715           0         5      0     через нові росіиські
4     877715           0        23      0  через нові росіиські др
...      ...         ...       ...    ...                      ...
6315  877715         348       355      0                ##ть ново
6316  877715         348       358      0             ##ть новость
6317  877715         351       355      0                     ново
6318  877715         351       358      0                  новость
6319  877715         355       358      0                    ##сть

[6320 rows x 5 columns]
(6320, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/790 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     877715           0         5      0                    через
1     877715           0        10      1               через нові
2     877715           0        14      1           через нові рос
3     877715           0         5      1     через нові росіиські
4     877715           0        23      1  через нові росіиські др
...      ...         ...       ...    ...                      ...
6315  877715         348       355      1                ##ть ново
6316  877715         348       358      1             ##ть новость
6317  877715         351       355      0                     ново
6318  877715         351       358      1                  новость
6319  877715         355       358      1                    ##сть

[6320 rows x 5 columns]
          id  seq_starts  seq_ends  label                text
0     891096           0         1      0                   з
1     891096           0         4      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/490 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                text
0     891096           0         1      0                   з
1     891096           0         4      1                зрад
2     891096           0         8      1            зрадниця
3     891096           0        13      1       зрадниця anna
4     891096           0        18      1  зрадниця anna asti
...      ...         ...       ...    ...                 ...
3908  891096         253       262      1         ##лати нови
3909  891096         253       264      1       ##лати новину
3910  891096         258       262      0                нови
3911  891096         258       264      0              новину
3912  891096         262       264      1                ##ну

[3913 rows x 5 columns]
           id  seq_starts  seq_ends  label           text
0      891286           0         2      0             ба
1      891286           0         4      0           банд
2      891286           0         5      0          банду

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1396 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      891286           0         2      0             ба
1      891286           0         4      1           банд
2      891286           0         5      1          банду
3      891286           0         9      1      банду нар
4      891286           0        12      1   банду наркос
...       ...         ...       ...    ...            ...
11163  891286         402       411      1    ##лати нови
11164  891286         402       413      1  ##лати новину
11165  891286         407       411      0           нови
11166  891286         407       413      0         новину
11167  891286         411       413      1           ##ну

[11168 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891298           0         1      0              б
1     891298           0         3      0            бля
2     891298           0         5      0          блядь
3     891298           0         6      0        б

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/456 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891298           0         1      0              б
1     891298           0         3      1            бля
2     891298           0         5      1          блядь
3     891298           0         6      1        блядь ,
4     891298           0        11      1      блядь , и
...      ...         ...       ...    ...            ...
3640  891298         216       225      1    ##лати нови
3641  891298         216       227      1  ##лати новину
3642  891298         221       225      0           нови
3643  891298         221       227      0         новину
3644  891298         225       227      1           ##ну

[3645 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891573           1         3      0             за
1     891573           1         5      0           зарі
2     891573           1         7      0         заріза
3     891573           1         8      0        зарізав
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/631 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891573           1         3      1             за
1     891573           1         5      1           зарі
2     891573           1         7      1         заріза
3     891573           1         8      1        зарізав
4     891573           1        10      1      зарізав і
...      ...         ...       ...    ...            ...
5037  891573         268       277      1    ##лати нови
5038  891573         268       279      1  ##лати новину
5039  891573         273       277      0           нови
5040  891573         273       279      0         новину
5041  891573         277       279      1           ##ну

[5042 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891635           0         2      0             не
1     891635           0         4      0           небе
2     891635           0         5      0          небез
3     891635           0         7      0        небезпе
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/833 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891635           0         2      1             не
1     891635           0         4      1           небе
2     891635           0         5      1          небез
3     891635           0         7      1        небезпе
4     891635           0        10      1     небезпечно
...      ...         ...       ...    ...            ...
6658  891635         319       328      1    ##лати нови
6659  891635         319       330      1  ##лати новину
6660  891635         324       328      0           нови
6661  891635         324       330      0         новину
6662  891635         328       330      1           ##ну

[6663 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     891698           0         3      0             нар
1     891698           0         6      0          наркол
2     891698           0         8      0        нарколаб
3     891698           0        11      0     нарколабора
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     891698           0         3      0             нар
1     891698           0         6      1          наркол
2     891698           0         8      1        нарколаб
3     891698           0        11      1     нарколабора
4     891698           0        14      1  нарколаборатор
...      ...         ...       ...    ...             ...
3393  891698         243       252      1     ##лати нови
3394  891698         243       254      1   ##лати новину
3395  891698         248       252      0            нови
3396  891698         248       254      0          новину
3397  891698         252       254      1            ##ну

[3398 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     891774           0         3      0            стр
1     891774           0         5      0          страш
2     891774           0         7      0        страшна
3     891774           0         9      0      стра

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1113 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     891774           0         3      0            стр
1     891774           0         5      1          страш
2     891774           0         7      1        страшна
3     891774           0         9      1      страшна д
4     891774           0        10      1     страшна дт
...      ...         ...       ...    ...            ...
8897  891774         376       385      1    ##лати нови
8898  891774         376       387      1  ##лати новину
8899  891774         381       385      0           нови
8900  891774         381       387      0         новину
8901  891774         385       387      1           ##ну

[8902 rows x 5 columns]
          id  seq_starts  seq_ends  label                     text
0     891809           0         2      0                       не
1     891809           0         7      0                  не буде
2     891809           0        12      0             не буде води
3     891809           

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/592 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                     text
0     891809           0         2      1                       не
1     891809           0         7      1                  не буде
2     891809           0        12      1             не буде води
3     891809           0        14      1           не буде води в
4     891809           0        23      1  не буде води в південно
...      ...         ...       ...    ...                      ...
4727  891809         244       253      1              ##лати нови
4728  891809         244       255      1            ##лати новину
4729  891809         249       253      0                     нови
4730  891809         249       255      0                   новину
4731  891809         253       255      1                     ##ну

[4732 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     891820           0         3      0             500
1     891820           0         7      0         500 м

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/276 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     891820           0         3      0             500
1     891820           0         7      1         500 млн
2     891820           0        10      1      500 млн гр
3     891820           0        11      1     500 млн грн
4     891820           0        14      1  500 млн грн на
...      ...         ...       ...    ...             ...
2202  891820         200       203      1           ##чул
2203  891820         200       204      1          ##чули
2204  891820         200       205      1        ##чули !
2205  891820         203       204      1             ##и
2206  891820         203       205      1           ##и !

[2207 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     892222           0         2      0             сб
1     892222           0         3      0            сбу
2     892222           0         7      0        сбу пов
3     892222           0         9      0      сбу 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/877 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     892222           0         2      0             сб
1     892222           0         3      1            сбу
2     892222           0         7      1        сбу пов
3     892222           0         9      1      сбу повід
4     892222           0        12      1   сбу повідоми
...      ...         ...       ...    ...            ...
7007  892222         343       352      1    ##лати нови
7008  892222         343       354      1  ##лати новину
7009  892222         348       352      0           нови
7010  892222         348       354      0         новину
7011  892222         352       354      1           ##ну

[7012 rows x 5 columns]
           id  seq_starts  seq_ends  label                text
0      892319           0         5      0               росія
1      892319           0         9      0           росія про
2      892319           0        12      0        росія продов
3      892319           0        15    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1395 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                text
0      892319           0         5      0               росія
1      892319           0         9      1           росія про
2      892319           0        12      1        росія продов
3      892319           0        15      1     росія продовжує
4      892319           0        18      1  росія продовжує те
...       ...         ...       ...    ...                 ...
11154  892319         475       477      1                ##во
11155  892319         475       479      1              ##воги
11156  892319         475       480      0            ##воги .
11157  892319         477       479      1                ##ги
11158  892319         477       480      0              ##ги .

[11159 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     892328           0         1      0              п
1     892328           0         2      0             пз
2     892328           0         3      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/695 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     892328           0         1      0              п
1     892328           0         2      1             пз
2     892328           0         3      1            пзд
3     892328           0         4      1           пздц
4     892328           0         5      1         пздц .
...      ...         ...       ...    ...            ...
5555  892328         300       309      1    ##лати нови
5556  892328         300       311      1  ##лати новину
5557  892328         305       309      0           нови
5558  892328         305       311      0         новину
5559  892328         309       311      1           ##ну

[5560 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     892422           0         5      0             знову
1     892422           0         8      0          знову па
2     892422           0        11      0       знову панде
3     892422           0        14      0    знову 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/593 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     892422           0         5      0             знову
1     892422           0         8      1          знову па
2     892422           0        11      1       знову панде
3     892422           0        14      1    знову пандемія
4     892422           0        15      1  знову пандемія ?
...      ...         ...       ...    ...               ...
4739  892422         286       295      1       ##лати нови
4740  892422         286       297      1     ##лати новину
4741  892422         291       295      0              нови
4742  892422         291       297      0            новину
4743  892422         295       297      1              ##ну

[4744 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     892462           0         2      0                   на
1     892462           0         8      0             на фронт
2     892462           0         9      0            на фронті
3  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/375 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                 text
0     892462           0         2      0                   на
1     892462           0         8      1             на фронт
2     892462           0         9      1            на фронті
3     892462           0        15      1      на фронті зараз
4     892462           0        19      1  на фронті зараз наш
...      ...         ...       ...    ...                  ...
2991  892462         224       233      1          ##лати нови
2992  892462         224       235      1        ##лати новину
2993  892462         229       233      0                 нови
2994  892462         229       235      0               новину
2995  892462         233       235      1                 ##ну

[2996 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     892611           0         3      0             усе
1     892611           0         6      0          усе ще
2     892611           0         8      0    

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/618 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     892611           0         3      0             усе
1     892611           0         6      1          усе ще
2     892611           0         8      1        усе ще з
3     892611           0        11      1     усе ще зрос
4     892611           0        14      1  усе ще зростає
...      ...         ...       ...    ...             ...
4939  892611         297       306      1     ##лати нови
4940  892611         297       308      1   ##лати новину
4941  892611         302       306      0            нови
4942  892611         302       308      0          новину
4943  892611         306       308      1            ##ну

[4944 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     892635           0         5      0             немає
1     892635           0         7      0           немає о
2     892635           0        10      0        немає опал
3     892635           0        14     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     892635           0         5      0             немає
1     892635           0         7      1           немає о
2     892635           0        10      1        немає опал
3     892635           0        14      1    немає опалення
4     892635           0        16      1  немає опалення в
...      ...         ...       ...    ...               ...
4359  892635         257       266      1       ##лати нови
4360  892635         257       268      1     ##лати новину
4361  892635         262       266      0              нови
4362  892635         262       268      0            новину
4363  892635         266       268      1              ##ну

[4364 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     976074           0         1      0                у
1     976074           0         5      0            у сша
2     976074           0        10      0       у сша школ
3     976074       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/805 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     976074           0         1      0                у
1     976074           0         5      1            у сша
2     976074           0        10      1       у сша школ
3     976074           0        12      1     у сша школяр
4     976074           0        15      1  у сша школяр зі
...      ...         ...       ...    ...              ...
6431  976074         345       354      1      ##лати нови
6432  976074         345       356      1    ##лати новину
6433  976074         350       354      0             нови
6434  976074         350       356      0           новину
6435  976074         354       356      1             ##ну

[6436 rows x 5 columns]
           id  seq_starts  seq_ends  label             text
0      976130           0         2      0               чи
1      976130           0         7      0          читання
2      976130           0        12      0     читання нови
3      976130           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1414 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label             text
0      976130           0         2      0               чи
1      976130           0         7      1          читання
2      976130           0        12      1     читання нови
3      976130           0        13      1    читання новин
4      976130           0        15      1  читання новин в
...       ...         ...       ...    ...              ...
11307  976130         411       420      1      ##лати нови
11308  976130         411       422      1    ##лати новину
11309  976130         416       420      0             нови
11310  976130         416       422      0           новину
11311  976130         420       422      1             ##ну

[11312 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976175           0         2      0             не
1     976175           0         4      0           небе
2     976175           0         5      0          небез
3     976175           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976175           0         2      1             не
1     976175           0         4      1           небе
2     976175           0         5      1          небез
3     976175           0         7      1        небезпе
4     976175           0         3      1    небезпечнии
...      ...         ...       ...    ...            ...
4453  976175         251       260      1    ##лати нови
4454  976175         251       262      1  ##лати новину
4455  976175         256       260      0           нови
4456  976175         256       262      0         новину
4457  976175         260       262      1           ##ну

[4458 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976196           0         1      0              я
1     976196           0         3      0            ябл
2     976196           0         7      0        яблучни
3     976196           0        11      0       яблучнии
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/848 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976196           0         1      0              я
1     976196           0         3      1            ябл
2     976196           0         7      1        яблучни
3     976196           0        11      1       яблучнии
4     976196           0        90      1    яблучнии си
...      ...         ...       ...    ...            ...
6775  976196         335       344      1    ##лати нови
6776  976196         335       346      1  ##лати новину
6777  976196         340       344      0           нови
6778  976196         340       346      0         новину
6779  976196         344       346      1           ##ну

[6780 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976271           0         2      0             жа
1     976271           0         4      0           жахл
2     976271           0         7      0        жахлива
3     976271           0         9      0      жахлива д
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/478 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976271           0         2      1             жа
1     976271           0         4      1           жахл
2     976271           0         7      1        жахлива
3     976271           0         9      1      жахлива д
4     976271           0        10      1     жахлива дт
...      ...         ...       ...    ...            ...
3819  976271         236       245      1    ##лати нови
3820  976271         236       247      1  ##лати новину
3821  976271         241       245      0           нови
3822  976271         241       247      0         новину
3823  976271         245       247      1           ##ну

[3824 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976277           0         2      0             не
1     976277           0         4      0           небе
2     976277           0         5      0          небез
3     976277           0         7      0        небезпе
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/546 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976277           0         2      1             не
1     976277           0         4      1           небе
2     976277           0         5      1          небез
3     976277           0         7      1        небезпе
4     976277           0        10      1     небезпечні
...      ...         ...       ...    ...            ...
4363  976277         228       237      1    ##лати нови
4364  976277         228       239      1  ##лати новину
4365  976277         233       237      0           нови
4366  976277         233       239      0         новину
4367  976277         237       239      1           ##ну

[4368 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976282           0         2      0             по
1     976282           0         5      0          потон
2     976282           0         8      0       потонула
3     976282           0        10      0     потонула а
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/356 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976282           0         2      1             по
1     976282           0         5      1          потон
2     976282           0         8      1       потонула
3     976282           0        10      1     потонула а
4     976282           0        12      1   потонула авт
...      ...         ...       ...    ...            ...
2839  976282         227       236      1    ##лати нови
2840  976282         227       238      1  ##лати новину
2841  976282         232       236      0           нови
2842  976282         232       238      0         новину
2843  976282         236       238      1           ##ну

[2844 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976418           0         2      0             98
1     976418           0         6      0         98 про
2     976418           0         8      0       98 прова
3     976418           0        10      0     98 провадж
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/669 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976418           0         2      0             98
1     976418           0         6      1         98 про
2     976418           0         8      1       98 прова
3     976418           0        10      1     98 провадж
4     976418           0        13      1  98 проваджень
...      ...         ...       ...    ...            ...
5344  976418         292       301      1    ##лати нови
5345  976418         292       303      1  ##лати новину
5346  976418         297       301      0           нови
5347  976418         297       303      0         новину
5348  976418         301       303      1           ##ну

[5349 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976469           0         1      0              в
1     976469           0         3      0            вчо
2     976469           0         5      0          вчора
3     976469           0         3      0      вчорашніи
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/749 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976469           0         1      0              в
1     976469           0         3      1            вчо
2     976469           0         5      1          вчора
3     976469           0         3      1      вчорашніи
4     976469           0         5      1   вчорашніи ра
...      ...         ...       ...    ...            ...
5984  976469         312       321      1    ##лати нови
5985  976469         312       323      1  ##лати новину
5986  976469         317       321      0           нови
5987  976469         317       323      0         новину
5988  976469         321       323      1           ##ну

[5989 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976483           0         3      0            від
1     976483           0         6      0         відвер
2     976483           0         8      0       відверте
3     976483           0        11      0    відверте зв
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1047 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976483           0         3      0            від
1     976483           0         6      1         відвер
2     976483           0         8      1       відверте
3     976483           0        11      1    відверте зв
4     976483           0        13      1  відверте звер
...      ...         ...       ...    ...            ...
8370  976483         341       347      1       ##asendb
8371  976483         341       349      1     ##asendbot
8372  976483         345       347      1           ##db
8373  976483         345       349      1         ##dbot
8374  976483         347       349      1           ##ot

[8375 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976655           0         1      0              з
1     976655           0         3      0            зло
2     976655           0         6      0         злочин
3     976655           0         8      0       злочинне
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/425 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976655           0         1      0              з
1     976655           0         3      1            зло
2     976655           0         6      1         злочин
3     976655           0         8      1       злочинне
4     976655           0        10      1     злочинне у
...      ...         ...       ...    ...            ...
3394  976655         233       242      1    ##лати нови
3395  976655         233       244      1  ##лати новину
3396  976655         238       242      0           нови
3397  976655         238       244      0         новину
3398  976655         242       244      1           ##ну

[3399 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     976743           0         1      0              с
1     976743           0         3      0            ска
2     976743           0         5      0          скасу
3     976743           0         8      0       скасують
4     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/457 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     976743           0         1      0              с
1     976743           0         3      1            ска
2     976743           0         5      1          скасу
3     976743           0         8      1       скасують
4     976743           0        11      1    скасують ст
...      ...         ...       ...    ...            ...
3644  976743         247       256      1    ##лати нови
3645  976743         247       258      1  ##лати новину
3646  976743         252       256      0           нови
3647  976743         252       258      0         новину
3648  976743         256       258      1           ##ну

[3649 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     977061           0         7      0          депутат
1     977061           0         8      0         депутати
2     977061           0        12      0     депутати від
3     977061           0        14      0   депутати ві

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/468 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     977061           0         7      0          депутат
1     977061           0         8      1         депутати
2     977061           0        12      1     депутати від
3     977061           0        14      1   депутати від о
4     977061           0        15      1  депутати від оп
...      ...         ...       ...    ...              ...
3733  977061         230       239      1      ##лати нови
3734  977061         230       241      1    ##лати новину
3735  977061         235       239      0             нови
3736  977061         235       241      0           новину
3737  977061         239       241      1             ##ну

[3738 rows x 5 columns]
          id  seq_starts  seq_ends  label             text
0     977111           0         3      0              174
1     977111           0         6      0           174 кг
2     977111           0        10      0       174 кг нар
3     977111           0       

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/446 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label             text
0     977111           0         3      0              174
1     977111           0         6      1           174 кг
2     977111           0        10      1       174 кг нар
3     977111           0        13      1    174 кг наркот
4     977111           0        15      1  174 кг наркотик
...      ...         ...       ...    ...              ...
3558  977111         225       234      1      ##лати нови
3559  977111         225       236      1    ##лати новину
3560  977111         230       234      0             нови
3561  977111         230       236      0           новину
3562  977111         234       236      1             ##ну

[3563 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     977176           0         2      0              ці
1     977176           0         4      0            ціни
2     977176           0         7      0         ціни на
3     977176           0        10 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/818 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     977176           0         2      0              ці
1     977176           0         4      1            ціни
2     977176           0         7      1         ціни на
3     977176           0        10      1      ціни на ди
4     977176           0        14      1  ціни на дизель
...      ...         ...       ...    ...             ...
6539  977176         322       331      1     ##лати нови
6540  977176         322       333      1   ##лати новину
6541  977176         327       331      0            нови
6542  977176         327       333      0          новину
6543  977176         331       333      1            ##ну

[6544 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     977216           0         1      0               к
1     977216           0         3      0             кір
2     977216           0         6      0          кірово
3     977216           0        10      0      

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/619 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     977216           0         1      0               к
1     977216           0         3      1             кір
2     977216           0         6      1          кірово
3     977216           0        10      1      кіровоград
4     977216           0        14      1  кіровоградщина
...      ...         ...       ...    ...             ...
4941  977216         270       279      1     ##лати нови
4942  977216         270       281      1   ##лати новину
4943  977216         275       279      0            нови
4944  977216         275       281      0          новину
4945  977216         279       281      1            ##ну

[4946 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     977229           0         3      0            тіл
1     977229           0         4      0           тіло
2     977229           0         8      0       тіло пен
3     977229           0        10      0     тіло 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/285 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     977229           0         3      0            тіл
1     977229           0         4      1           тіло
2     977229           0         8      1       тіло пен
3     977229           0        10      1     тіло пенсі
4     977229           0        13      1  тіло пенсіоне
...      ...         ...       ...    ...            ...
2270  977229         207         1      1          водои
2271  977229         207        54      1        водоимі
2272  977229          -1         1      1           ##ои
2273  977229          -1        54      1         ##оимі
2274  977229          52        54      1           ##мі

[2275 rows x 5 columns]
           id  seq_starts  seq_ends  label                 text
0      977272           0         3      0                  184
1      977272           0         7      0              184 нас
2      977272           0        12      0         184 населени
3      977272           0        13

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1322 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                 text
0      977272           0         3      0                  184
1      977272           0         7      1              184 нас
2      977272           0        12      1         184 населени
3      977272           0        13      1        184 населених
4      977272           0        19      1  184 населених пункт
...       ...         ...       ...    ...                  ...
10565  977272         424       425      1                  ##о
10566  977272         424       427      1                ##оже
10567  977272         424       428      1              ##оже !
10568  977272         425       427      1                 ##же
10569  977272         425       428      1               ##же !

[10570 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     977341           0         2      0                сп
1     977341           0         3      0              сп *
2     977341           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/500 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     977341           0         2      0                сп
1     977341           0         3      1              сп *
2     977341           0         4      1            сп * з
3     977341           0         8      1        сп * здили
4     977341           0        14      1  сп * здили парка
...      ...         ...       ...    ...               ...
3992  977341         244       253      1       ##лати нови
3993  977341         244       255      1     ##лати новину
3994  977341         249       253      0              нови
3995  977341         249       255      0            новину
3996  977341         253       255      1              ##ну

[3997 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     977536           0         2      0             на
1     977536           0         4      0           на к
2     977536           0         6      0         на кір
3     977536           0   

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/466 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label           text
0     977536           0         2      0             на
1     977536           0         4      1           на к
2     977536           0         6      1         на кір
3     977536           0         9      1      на кірово
4     977536           0        13      1  на кіровоград
...      ...         ...       ...    ...            ...
3722  977536         213         3      1         раиков
3723  977536         213        39      1       раикович
3724  977536          -1         3      1         ##иков
3725  977536          -1        39      1       ##икович
3726  977536          37        39      1           ##ич

[3727 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     977633           0         3      0             под
1     977633           0         7      0         подроби
2     977633           0         9      0       подробиці
3     977633           0        12      0    подробиці по
4

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/606 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     977633           0         3      0             под
1     977633           0         7      1         подроби
2     977633           0         9      1       подробиці
3     977633           0        12      1    подробиці по
4     977633           0        14      1  подробиці потр
...      ...         ...       ...    ...             ...
4839  977633         273       282      1     ##лати нови
4840  977633         273       284      1   ##лати новину
4841  977633         278       282      0            нови
4842  977633         278       284      0          новину
4843  977633         282       284      1            ##ну

[4844 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     977771           0         3      0               від
1     977771           0         5      0             відкл
2     977771           0         6      0            відклю
3     977771           0        11     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/436 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     977771           0         3      0               від
1     977771           0         5      1             відкл
2     977771           0         6      1            відклю
3     977771           0        11      1       відключення
4     977771           0        16      1  відключення світ
...      ...         ...       ...    ...               ...
3477  977771         254       263      1       ##лати нови
3478  977771         254       265      1     ##лати новину
3479  977771         259       263      0              нови
3480  977771         259       265      0            новину
3481  977771         263       265      1              ##ну

[3482 rows x 5 columns]
           id  seq_starts  seq_ends  label           text
0      977821           0         1      0              к
1      977821           0         3      0            кро
2      977821           0         6      0         кропив
3      977821          

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1269 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label           text
0      977821           0         1      0              к
1      977821           0         3      1            кро
2      977821           0         6      1         кропив
3      977821           0         8      1       кропивни
4      977821           0        11      1    кропивничан
...       ...         ...       ...    ...            ...
10140  977821         377       386      1    ##лати нови
10141  977821         377       388      1  ##лати новину
10142  977821         382       386      0           нови
10143  977821         382       388      0         новину
10144  977821         386       388      1           ##ну

[10145 rows x 5 columns]
          id  seq_starts  seq_ends  label                 text
0     995043           0         5      0                росія
1     995043           0         9      0            росія про
2     995043           0        12      0         росія продов
3     995043           0  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/489 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label                 text
0     995043           0         5      0                росія
1     995043           0         9      1            росія про
2     995043           0        12      1         росія продов
3     995043           0        16      1     росія продовжува
4     995043           0        19      1  росія продовжуватим
...      ...         ...       ...    ...                  ...
3905  995043         313       319      1             ##писати
3906  995043         313       321      1           ##писатись
3907  995043         316       319      1                ##ати
3908  995043         316       321      1              ##атись
3909  995043         319       321      1                 ##сь

[3910 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label                     text
0      995233           0         2      0                       на
1      995233           0         6      0                   на куп
2      995233           0         8      0                 на купян
3      995233           0        14      0           на купянському
4      995233           0        23      0  на купянському напрямку
...       ...         ...       ...    ...                      ...
32878  995233         764       770      0                 ##писати
32879  995233         764       772      0               ##писатись
32880  995233         767       770      0                    ##ати
32881  995233         767       772      0                  ##атись
32882  995233         770       772      0                     ##сь

[32883 rows x 5 columns]
(32883, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/4111 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


           id  seq_starts  seq_ends  label                     text
0      995233           0         2      0                       на
1      995233           0         6      1                   на куп
2      995233           0         8      1                 на купян
3      995233           0        14      1           на купянському
4      995233           0        23      1  на купянському напрямку
...       ...         ...       ...    ...                      ...
32878  995233         764       770      1                 ##писати
32879  995233         764       772      1               ##писатись
32880  995233         767       770      1                    ##ати
32881  995233         767       772      1                  ##атись
32882  995233         770       772      1                     ##сь

[32883 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label               text
0      995279           0         5      0              росія
1      995279           0        10      0         росія може
2      995279           0        12      0       росія може в
3      995279           0        14      0     росія може взи
4      995279           0        17      0  росія може взимку
...       ...         ...       ...    ...                ...
13019  995279         527       533      0           ##писати
13020  995279         527       535      0         ##писатись
13021  995279         530       533      0              ##ати
13022  995279         530       535      0            ##атись
13023  995279         533       535      0               ##сь

[13024 rows x 5 columns]
(13024, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1628 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label               text
0      995279           0         5      0              росія
1      995279           0        10      1         росія може
2      995279           0        12      1       росія може в
3      995279           0        14      1     росія може взи
4      995279           0        17      1  росія може взимку
...       ...         ...       ...    ...                ...
13019  995279         527       533      1           ##писати
13020  995279         527       535      1         ##писатись
13021  995279         530       533      1              ##ати
13022  995279         530       535      1            ##атись
13023  995279         533       535      1               ##сь

[13024 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     995304           0         4      0            граф
1     995304           0         7      0         графіки
2     995304           0        11      0     графіки ві

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/952 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label            text
0     995304           0         4      0            граф
1     995304           0         7      1         графіки
2     995304           0        11      1     графіки від
3     995304           0        13      1   графіки відкл
4     995304           0        14      1  графіки відклю
...      ...         ...       ...    ...             ...
7609  995304         392       398      1        ##писати
7610  995304         392       400      1      ##писатись
7611  995304         395       398      1           ##ати
7612  995304         395       400      1         ##атись
7613  995304         398       400      1            ##сь

[7614 rows x 5 columns]
          id  seq_starts  seq_ends  label                         text
0     995414           0         1      0                            у
1     995414           0         4      0                      у росіі
2     995414           0        12      0                 у росіі 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/953 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label                         text
0     995414           0         1      0                            у
1     995414           0         4      1                      у росіі
2     995414           0        12      1                 у росіі була
3     995414           0        23      1      у росіі була інформація
4     995414           0        27      1  у росіі була інформація про
...      ...         ...       ...    ...                          ...
7613  995414         387       393      1                     ##писати
7614  995414         387       395      1                   ##писатись
7615  995414         390       393      1                        ##ати
7616  995414         390       395      1                      ##атись
7617  995414         393       395      1                         ##сь

[7618 rows x 5 columns]
          id  seq_starts  seq_ends  label              text
0     995502           0         4      0              лука
1  

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/319 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label              text
0     995502           0         4      0              лука
1     995502           0         7      1           лукашен
2     995502           0         9      1         лукашенко
3     995502           0        13      1     лукашенко при
4     995502           0        16      1  лукашенко прилет
...      ...         ...       ...    ...               ...
2543  995502         217       223      1          ##писати
2544  995502         217       225      1        ##писатись
2545  995502         220       223      1             ##ати
2546  995502         220       225      1           ##атись
2547  995502         223       225      1              ##сь

[2548 rows x 5 columns]
          id  seq_starts  seq_ends  label        text
0     995547           0         3      0         укр
1     995547           0         4      0        укра
2     995547           0         1      0      украін
3     995547           0         8     

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/558 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


          id  seq_starts  seq_ends  label        text
0     995547           0         3      0         укр
1     995547           0         4      1        укра
2     995547           0         1      1      украін
3     995547           0         8      1    украінці
4     995547           0        10      1  украінці в
...      ...         ...       ...    ...         ...
4455  995547         296       302      1    ##писати
4456  995547         296       304      1  ##писатись
4457  995547         299       302      1       ##ати
4458  995547         299       304      1     ##атись
4459  995547         302       304      1        ##сь

[4460 rows x 5 columns]
          id  seq_starts  seq_ends  label           text
0     995599           0         3      0            740
1     995599           0         4      0           7400
2     995599           0         7      0        7400 ра
3     995599           0        10      0     7400 ракет
4     995599           0        13      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/533 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label           text
0     995599           0         3      0            740
1     995599           0         4      1           7400
2     995599           0         7      1        7400 ра
3     995599           0        10      1     7400 ракет
4     995599           0        13      1  7400 ракет ви
...      ...         ...       ...    ...            ...
4257  995599         256       262      1       ##писати
4258  995599         256       264      1     ##писатись
4259  995599         259       262      1          ##ати
4260  995599         259       264      1        ##атись
4261  995599         262       264      1           ##сь

[4262 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      996020           0         1      0             м
1      996020           0         4      0          міну
2      996020           0         5      0         мінус
3      996020           0        10      0    мінус 1380
4      996020           0        12      0  мінус 1380 п
...       ...         ...       ...    ...           ...
13514  996020         438       444      0      ##писати
13515  996020         438       446      0    ##писатись
13516  996020         441       444      0         ##ати
13517  996020         441       446      0       ##атись
13518  996020         444       446      0          ##сь

[13519 rows x 5 columns]
(13519, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1690 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label          text
0      996020           0         1      0             м
1      996020           0         4      1          міну
2      996020           0         5      1         мінус
3      996020           0        10      1    мінус 1380
4      996020           0        12      1  мінус 1380 п
...       ...         ...       ...    ...           ...
13514  996020         438       444      1      ##писати
13515  996020         438       446      1    ##писатись
13516  996020         441       444      1         ##ати
13517  996020         441       446      1       ##атись
13518  996020         444       446      1          ##сь

[13519 rows x 5 columns]
          id  seq_starts  seq_ends  label            text
0     996063           0         3      0             рус
1     996063           0         5      0           русня
2     996063           0         8      0        русня че
3     996063           0        11      0     русня четве


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/776 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...


          id  seq_starts  seq_ends  label            text
0     996063           0         3      0             рус
1     996063           0         5      1           русня
2     996063           0         8      1        русня че
3     996063           0        11      1     русня четве
4     996063           0        14      1  русня четверту
...      ...         ...       ...    ...             ...
6199  996063         315       321      1        ##писати
6200  996063         315       323      1      ##писатись
6201  996063         318       321      1           ##ати
6202  996063         318       323      1         ##атись
6203  996063         321       323      1            ##сь

[6204 rows x 5 columns]


INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label         text
0      996076           0         2      0           не
1      996076           0         5      0        не ви
2      996076           0         7      0      не викл
3      996076           0         8      0     не виклю
4      996076           0        11      0  не виключає
...       ...         ...       ...    ...          ...
13495  996076         464       470      0     ##писати
13496  996076         464       472      0   ##писатись
13497  996076         467       470      0        ##ати
13498  996076         467       472      0      ##атись
13499  996076         470       472      0         ##сь

[13500 rows x 5 columns]
(13500, 5)


INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/1688 [00:00<?, ?it/s]

INFO:LOG:Generating evaluation dataset...
INFO:LOG:Creating features from dataframe


           id  seq_starts  seq_ends  label         text
0      996076           0         2      1           не
1      996076           0         5      1        не ви
2      996076           0         7      1      не викл
3      996076           0         8      1     не виклю
4      996076           0        11      1  не виключає
...       ...         ...       ...    ...          ...
13495  996076         464       470      1     ##писати
13496  996076         464       472      1   ##писатись
13497  996076         467       470      1        ##ати
13498  996076         467       472      1      ##атись
13499  996076         470       472      1         ##сь

[13500 rows x 5 columns]
          id  seq_starts  seq_ends  label                   text
0     996249           0         9      0              швидкість
1     996249           0        11      0            швидкість в
2     996249           0        13      0          швидкість віт
3     996249           0        15      0 

INFO:LOG:Creating TensorDataset from features dataframe
Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  for batch in tqdm_notebook(eval_dataloader, desc="Evaluating"):


Evaluating:   0%|          | 0/833 [00:00<?, ?it/s]

          id  seq_starts  seq_ends  label                   text
0     996249           0         9      0              швидкість
1     996249           0        11      1            швидкість в
2     996249           0        13      1          швидкість віт
3     996249           0        15      1        швидкість вітру
4     996249           0        21      1  швидкість вітру понад
...      ...         ...       ...    ...                    ...
6654  996249         355       361      1               ##писати
6655  996249         355       363      1             ##писатись
6656  996249         358       361      1                  ##ати
6657  996249         358       363      1                ##атись
6658  996249         361       363      1                   ##сь

[6659 rows x 5 columns]


In [5]:
# Open the output file in write mode
labels_dir = 'datasets/pred_SI_labels'
with open("datasets/SI.labels_pred.txt", 'w', newline='') as f_total:
    writer = csv.writer(f_total, delimiter='\t')
    print(f_total)
    # Get a sorted list of .txt files in the specified directory
    labels_filenames = sorted(glob.glob(os.path.join(labels_dir, "*.labels.tsv")))
    print(labels_filenames)
    # Iterate through each file and write its content to the output file
    for filename in labels_filenames:
        with open(filename, 'r') as f:
            reader = csv.reader(f, delimiter='\t')
            for row in reader:
                writer.writerow(row)

<_io.TextIOWrapper name='datasets/SI.labels_pred.txt' mode='w' encoding='cp1251'>
['datasets/pred_SI_labels\\article1062476.labels.tsv', 'datasets/pred_SI_labels\\article1062480.labels.tsv', 'datasets/pred_SI_labels\\article1062575.labels.tsv', 'datasets/pred_SI_labels\\article1062722.labels.tsv', 'datasets/pred_SI_labels\\article1062744.labels.tsv', 'datasets/pred_SI_labels\\article1062751.labels.tsv', 'datasets/pred_SI_labels\\article1063058.labels.tsv', 'datasets/pred_SI_labels\\article1063082.labels.tsv', 'datasets/pred_SI_labels\\article1063177.labels.tsv', 'datasets/pred_SI_labels\\article1063217.labels.tsv', 'datasets/pred_SI_labels\\article1063289.labels.tsv', 'datasets/pred_SI_labels\\article1063460.labels.tsv', 'datasets/pred_SI_labels\\article1063475.labels.tsv', 'datasets/pred_SI_labels\\article1063526.labels.tsv', 'datasets/pred_SI_labels\\article1063603.labels.tsv', 'datasets/pred_SI_labels\\article1063878.labels.tsv', 'datasets/pred_SI_labels\\article1063931.labels.tsv',

#### References:
The structure of data preporation is the modification of Henry Kim's [implementation](https://medium.com/@jihwangk/fine-grained-propaganda-detection-and-classification-with-bert-dfad4acaa321).

The structure of train() function is a modification of Thilina Rajapakse’s [implementation](https://github.com/ThilinaRajapakse/pytorch-transformers-classification).