In [1]:
import torch
if torch.cuda.is_available():
  device = torch.device("cuda")
  print('There are %d GPU(s) available.' % torch.cuda.device_count())
  print('We will use the GPU:', torch.cuda.get_device_name(0))
else:
  print('No GPU availvable, using CPU instead.')
  device = torch.device("cpu")

There are 2 GPU(s) available.
We will use the GPU: Tesla T4


In [2]:
!pwd

/kaggle/working


In [3]:
!ls /kaggle/input

paraphrases  ruwikiruscorpora-upos-cbow


In [4]:
!tree /kaggle/input

[01;34m/kaggle/input[0m
├── [01;34mparaphrases[0m
│   ├── [00mcheckpoint_epoch3_step120.pt[0m
│   ├── [00mdata.json[0m
│   ├── [00mpairs.tsv[0m
│   └── [00mpairs_reduced.tsv[0m
└── [01;34mruwikiruscorpora-upos-cbow[0m
    └── [00mruwikiruscorpora_upos_cbow_300_10_2021.bin[0m

2 directories, 5 files


In [5]:
%%capture
! pip install sentencepiece
! pip install transformers
! pip install "treesimi>=0.1.5" datasketch
! pip install -U pip setuptools wheel
! pip install -U spacy
! python -m spacy download ru_core_news_sm
! pip install accelerate -U
! pip install optuna

In [6]:
import json

with open('/kaggle/input/paraphrases/data.json', 'r') as f:
    data = json.load(f)

In [7]:
# Use train_test_split to split our data into train and validation sets for
# training
from sklearn.model_selection import train_test_split

# Use 90% for training and 10% for validation.
train_dataset, validation_dataset = train_test_split(data, random_state=2018, test_size=0.1)



In [8]:
len(train_dataset)

3615

In [9]:
# Print the first few elements of train_dataset and validation_dataset
print("Train Dataset Sample:")
print(train_dataset[:2])  # Print the first 2 elements

print("\nValidation Dataset Sample:")
print(validation_dataset[:2])  # Print the first 2 elements

Train Dataset Sample:
[{'input': 'Вы что то плохо выглядите что у вас что-нибудь болит', 'target': 'У вас голос странный что у вас что-нибудь болит', 'input_tree': [570272283, 353300086, 122879569, 999870266, 157978476, 1902875321, 729333537, 444010880, 1087209578, 116765198, 248846295, 219859497, 394809467, 2034940150, 84077671, 160454645, 380451629, 943823497, 1099385344, 279935846, 316940651, 1257837434, 63178866, 159543812, 485744649, 60959675, 91280724, 383174313, 85663715, 813665748, 423576522, 306727142, 293869808, 30364140, 112312715, 551342760, 461167410, 396389078, 150082588, 658737846, 14637594, 191833, 986910865, 425065566, 20059047, 120551759, 519959666, 242155070, 820925023, 83736172, 184450484, 1709726678, 1224230697, 312347740, 3210310, 500055946, 136922280, 363677623, 90468210, 843661850, 44997228, 609310021, 672674213, 35531536, 735606613, 188509787, 256816523, 146092238, 1045013226, 1105791047, 488705254, 245785279, 923583071, 176964394, 80252480, 143403444, 40216943

In [10]:
import os
import json
import subprocess
import datasketch
import numpy as np
from transformers import T5ForConditionalGeneration, T5Tokenizer, TrainingArguments, EarlyStoppingCallback
from transformers import MT5ForConditionalGeneration, AutoTokenizer
from sklearn.metrics.pairwise import cosine_similarity
from gensim.models import KeyedVectors
from torch.utils.data import DataLoader, Dataset
import random
from sklearn.model_selection import train_test_split
from scipy.spatial.distance import jaccard
from tqdm import tqdm
import torch
import torch.nn as nn
import torch.nn.functional as F
from nltk.translate.bleu_score import corpus_bleu, SmoothingFunction

In [11]:
# Define a custom dataset
class CustomDataset(Dataset):
    def __init__(self, examples, tokenizer, max_length):
        self.examples = examples
        self.tokenizer = tokenizer
        self.max_length = max_length

    def __len__(self):
        return len(self.examples)

    def __getitem__(self, idx):
        example = self.examples[idx]
        input_tree = example["input_tree"]
        target_tree = example["target_tree"]
        input_text = "paraphrase: " + example["input"]
        target_text = example["target"]

        # Calculate syntactic similarity
        syntactic_similarity = calculate_syntactic_similarity(input_tree, target_tree)

        # Calculate semantic similarity
        semantic_similarity = calculate_semantic_similarity(input_text, target_text)

        # Tokenize input and target texts
        inputs = self.tokenizer.batch_encode_plus([input_text], return_tensors="pt", max_length=self.max_length, padding="max_length", truncation=True)
        targets = self.tokenizer.batch_encode_plus([target_text], return_tensors="pt", max_length=self.max_length, padding="max_length", truncation=True)

        return {
            "input_texts": input_text,
            "input_ids": inputs["input_ids"].squeeze(),
            "attention_mask": inputs["attention_mask"].squeeze(),
            "decoder_input_ids": targets["input_ids"].squeeze(),
            "labels": targets["input_ids"].squeeze(),
            "decoder_attention_mask": targets["attention_mask"].squeeze(),
            "target_syntactic_similarities": syntactic_similarity,
            "target_semantic_similarities": semantic_similarity,
        }

# Split our data into train and validation sets
train_data, validation_data = train_test_split(data, random_state=2018, test_size=0.1)

# Define the function to calculate syntactic similarity
def calculate_syntactic_similarity(tree1, tree2):
    tree_set1 = set(tree1)
    tree_set2 = set(tree2)
    intersection = len(tree_set1.intersection(tree_set2))
    union = len(tree_set1.union(tree_set2))
    jaccard_similarity = intersection / union
    return jaccard_similarity

# Load the pre-trained Word2Vec model
word2vec_model_path = '/kaggle/input/ruwikiruscorpora-upos-cbow/ruwikiruscorpora_upos_cbow_300_10_2021.bin'
word2vec_model = KeyedVectors.load_word2vec_format(word2vec_model_path, binary=True)

# Define the function to calculate the vector representation of a sentence using Word2Vec
def calculate_word2vec_embedding(text):
    words = text.split()
    vectors = [word2vec_model.get_vector(word) for word in words if word in word2vec_model.key_to_index]
    if vectors:
        return np.mean(vectors, axis=0)
    else:
        return np.zeros(word2vec_model.vector_size)

# Define the function to calculate BERT embeddings for semantic similarity
def calculate_semantic_embeddings(texts):
    return np.array([calculate_word2vec_embedding(text) for text in texts])

# Define the function to calculate semantic similarity
def calculate_semantic_similarity(input, paraphrase):
    input_embedding = calculate_semantic_embeddings([input])
    paraphrase_embedding = calculate_semantic_embeddings([paraphrase])
    semantic_similarity = cosine_similarity(input_embedding, paraphrase_embedding).squeeze()
    normalized_semantic_similarity = (semantic_similarity + 1) / 2
    return normalized_semantic_similarity

# Load the pre-trained model and tokenizer
MODEL_NAME = 'cointegrated/rut5-base-paraphraser'
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
model.to(device)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)

# Create custom datasets
max_length = 128  # Adjust as needed
train_dataset = CustomDataset(train_data, tokenizer, max_length)
validation_dataset = CustomDataset(validation_data, tokenizer, max_length)

# Define data loaders
train_batch_size = 16  # Adjust as needed (8 initially)
validation_batch_size = 16  # Adjust as needed (16 initially)

train_dataloader = DataLoader(
    train_dataset,
    batch_size=train_batch_size,
    shuffle=True,  # Shuffle the data at the beginning of each epoch
    num_workers=4,  # Adjust the number of workers based on your system's capabilities
)

validation_dataloader = DataLoader(
    validation_dataset,
    batch_size=validation_batch_size,
    shuffle=False,  # No need to shuffle validation data
    num_workers=4,  # Adjust the number of workers based on your system's capabilities
)


def custom_loss(syntactic_similarities, target_syntactic_similarities,
                semantic_similarities, target_semantic_similarities,
                model_outputs, alpha=0.8, beta=0.5, gamma=0.3, device=device):
    # Calculate the syntactic similarity loss
    syntactic_loss = nn.MSELoss()(syntactic_similarities, target_syntactic_similarities.detach()).to(device)

    # Calculate the semantic similarity loss
    semantic_loss = nn.MSELoss()(semantic_similarities, target_semantic_similarities.detach()).to(device)

    # Extract the model's loss from the outputs
    model_loss = model_outputs.loss

    # Combine the losses using weights
    total_loss = alpha * syntactic_loss + beta * semantic_loss + gamma * model_loss

    return total_loss
    
def generate_paraphrases(input_ids, model, tokenizer, max_length=128, device="cuda", training=True):
    # Generate paraphrase
    if training:
        output_sequences = model.generate(input_ids=input_ids, max_length=max_length, num_return_sequences=1).to(device)
    else:
        with torch.no_grad():  # If validation or testing, gradients are not calculated
            output_sequences = model.generate(input_ids=input_ids, max_length=max_length, num_return_sequences=1).to(device)
    
    # Decode the generated paraphrase
    paraphrases = tokenizer.batch_decode(output_sequences, skip_special_tokens=True)

    return paraphrases


# Define fine-tuning arguments
training_args = TrainingArguments(
    output_dir="./output",
    num_train_epochs=5,
    per_device_train_batch_size=16,
    per_device_eval_batch_size=16,
    learning_rate=3e-5,
    weight_decay=1e-2, 
    evaluation_strategy="steps",
    save_steps=1000,
    eval_steps=1000,
    save_total_limit=3,
    remove_unused_columns=False,
)

# Initialize the optimizer and the scheduler
optimizer = torch.optim.AdamW(model.parameters(), lr=training_args.learning_rate, weight_decay=training_args.weight_decay)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=1, gamma=0.95)

# Define the checkpoint directory
checkpoint_dir = training_args.output_dir

# Create the directory if it doesn't exist
if not os.path.exists(checkpoint_dir):
    os.makedirs(checkpoint_dir)

# Check if a checkpoint exists
checkpoint_file = "/kaggle/input/paraphrases/checkpoint_epoch3_step320.pt"  # Change this to the path of your checkpoint file
if os.path.exists(checkpoint_file):
    checkpoint = torch.load(checkpoint_file)
    model.load_state_dict(checkpoint['model_state_dict'])
    optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
    start_epoch = checkpoint['epoch']  # Use the epoch from the checkpoint
    total_loss = checkpoint['loss']
    num_batches = checkpoint['num_batches']  # Start from the next batch

    # Increment the epoch if all batches were processed
    if num_batches == len(train_dataloader):
        start_epoch += 1
        num_batches = 0
else:
    start_epoch = 0  # Start training from the beginning
    num_batches = 0

Downloading (…)lve/main/config.json:   0%|          | 0.00/724 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/977M [00:00<?, ?B/s]

Downloading spiece.model:   0%|          | 0.00/828k [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/315 [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. If you see this, DO NOT PANIC! This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thouroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


In [12]:
# Initialize an empty list to store the validation results
validation_results = []

# Start fine-tuning from the specified epoch or 0 if no checkpoint was loaded
for epoch in range(start_epoch, training_args.num_train_epochs):
    print()
    print('Training...')

    model.train()
    if num_batches == 0:
        total_loss = 0.0

    # Create a tqdm progress bar for the training loop
    pbar = tqdm(train_dataloader, desc=f"Epoch {epoch + 1}/{training_args.num_train_epochs}")

    save_interval = 40
    checkpoint_dir_name = 'output'

    # Change the range to start from the next batch
    for batch_idx, batch in enumerate(pbar):
        if batch_idx < num_batches:
            continue  # Skip batches that were processed in the previous epoch
        
        # Checkpoint model and optimizer every 'save_interval' steps
        if (num_batches % save_interval) == 0:
            print()
            print("Checkpoint...")
            
            # Save the current checkpoint
            checkpoint_path = f"{checkpoint_dir_name}/checkpoint_epoch{epoch + 1}_step{num_batches}.pt"
            torch.save({
                'epoch': epoch,
                'model_state_dict': model.state_dict(),
                'optimizer_state_dict': optimizer.state_dict(),
                'loss': total_loss,
                'num_batches': batch_idx,  # Save the current batch index
            }, checkpoint_path)
            
            # Delete the previous checkpoint file if it exists
            if os.path.exists(checkpoint_file) and not checkpoint_file.startswith('/kaggle/input'):
                os.remove(checkpoint_file)
            
            # Update the checkpoint_file variable to the new checkpoint
            checkpoint_file = checkpoint_path
        
        input_texts = batch["input_texts"]
        input_ids = batch["input_ids"].to(device)
        attention_mask = batch["attention_mask"].to(device)
        decoder_input_ids = batch["decoder_input_ids"].to(device)
        labels = batch["labels"].to(device)
        decoder_attention_mask = batch["decoder_attention_mask"].to(device)
        syntactic_similarities_original = batch["target_syntactic_similarities"].to(device, dtype=torch.float64)
        semantic_similarities_original = batch["target_semantic_similarities"].to(device, dtype=torch.float64)
        
        # Do not force the model to predict pad tokens
        labels[labels == 0] = -100
        
        # Forward pass
        outputs = model(input_ids=input_ids, attention_mask=attention_mask, decoder_input_ids=decoder_input_ids,
                        decoder_attention_mask=decoder_attention_mask, labels=labels)

        # Generate paraphrases
        generated_texts = generate_paraphrases(input_ids, model, tokenizer, max_length=128, device=device)

        # Calculate syntactic similarities
        syntactic_similarities_generated = [calculate_syntactic_similarity(generated_text, input_text) for generated_text, input_text in zip(generated_texts, input_texts)]
        # Calculate semantic similarities
        semantic_similarities_generated = [calculate_semantic_similarity(generated_text, input_text) for generated_text, input_text in zip(generated_texts, input_texts)]

        # Convert similarities to tensors
        syntactic_similarities_generated = torch.tensor(syntactic_similarities_generated, requires_grad=True).to(device, dtype=torch.float64)
        semantic_similarities_generated = torch.tensor(semantic_similarities_generated, requires_grad=True).to(device, dtype=torch.float64)
        
        # Calculate loss manually
        loss = custom_loss(syntactic_similarities_generated, syntactic_similarities_original,
                           semantic_similarities_generated, semantic_similarities_original,
                           outputs)

        total_loss += loss.item()
        
        # Backpropagation
        loss.backward()
        
        optimizer.step()
        scheduler.step()
        optimizer.zero_grad()  # Clear gradients for the next batch
        num_batches += 1

        # Update tqdm progress bar description with batch loss
        pbar.set_postfix({"Batch Loss": loss.item(), "Avg Loss": total_loss / num_batches})

    avg_loss = total_loss / num_batches
    print(f"Epoch {epoch + 1}/{training_args.num_train_epochs}, Avg Loss: {avg_loss}")

    # Evaluate on validation set

    print()
    print("Running Validation...")

    model.eval()
    num_batches = 0
    bleu_scores = []
    results = []

    for batch in tqdm(validation_dataloader, desc="Validation"):
        input_texts = batch["input_texts"]
        input_ids = batch["input_ids"].to(device)
        attention_mask = batch["attention_mask"].to(device)

        # Telling the model not to compute or store gradients, saving memory and
        # speeding up validation
        generated_paraphrases = generate_paraphrases(input_ids, model, tokenizer, max_length, device=device, training=False)
        start = num_batches * validation_batch_size
        end = (num_batches + 1) * validation_batch_size
        reference_paraphrases = [example['target'] for example in validation_data[start:end]]

        print()
        print('inputs', input_texts)
        print('generated_paraphrases', generated_paraphrases)
        print('targets', reference_paraphrases)
        
        # Store the reference paraphrases and generated paraphrases in the dictionary
        for reference_text, generated_text in zip(reference_paraphrases, generated_paraphrases):
            results.append({
                "reference_paraphrase": reference_text,
                "generated_paraphrase": generated_text
            })

        # Define a SmoothingFunction
        smoother = SmoothingFunction()

        # Calculate BLEU score
        batch_bleu_score = corpus_bleu(reference_paraphrases, generated_paraphrases, smoothing_function=smoother.method1)
        bleu_scores.append(batch_bleu_score)

        num_batches += 1

    # Calculate average validation loss
    avg_bleu_score = sum(bleu_scores) / len(bleu_scores)
    print(f"Validation Avg BLEU Score for Epoch {epoch + 1}: {avg_bleu_score}")
    num_batches = 0

    # Create a dictionary to store the validation results for this epoch
    epoch_result = {
        "epoch": epoch + 1,
        "avg_bleu_score": avg_bleu_score,
        "results": results
    }

    # Append the epoch results to the list
    validation_results.append(epoch_result)

    # Save the validation results as a JSON file
    with open('/kaggle/working/output/validation_results.json', 'w', encoding='utf-8') as json_file:
        json.dump(validation_results, json_file, ensure_ascii=False, indent=4)

# Save the final model
final_model_path = f'{checkpoint_dir}/fine_tuned_model'
model.save_pretrained(final_model_path)

print()
print("Training complete!")


Training...


Epoch 1/5:   0%|          | 0/226 [00:00<?, ?it/s]


Checkpoint...


Epoch 1/5:  18%|█▊        | 40/226 [01:17<06:29,  2.09s/it, Batch Loss=2.35, Avg Loss=2.52]


Checkpoint...


Epoch 1/5:  35%|███▌      | 80/226 [02:50<04:44,  1.95s/it, Batch Loss=2.17, Avg Loss=2.4]


Checkpoint...


Epoch 1/5:  53%|█████▎    | 120/226 [04:18<03:12,  1.82s/it, Batch Loss=2.3, Avg Loss=2.34]


Checkpoint...


Epoch 1/5:  71%|███████   | 160/226 [05:54<01:58,  1.79s/it, Batch Loss=2.11, Avg Loss=2.31]


Checkpoint...


Epoch 1/5:  88%|████████▊ | 200/226 [07:38<01:02,  2.39s/it, Batch Loss=2.26, Avg Loss=2.29]


Checkpoint...


Epoch 1/5: 100%|██████████| 226/226 [08:47<00:00,  2.33s/it, Batch Loss=2.33, Avg Loss=2.29]


Epoch 1/5, Avg Loss: 2.285285658322194

Running Validation...


Validation:   4%|▍         | 1/26 [00:01<00:25,  1.01s/it]


inputs ['paraphrase: Полиция США арестовала узбека по подозрению в терроризме.', 'paraphrase: У тебя есть любимый человек?', 'paraphrase: В роддоме какой страны ты родилась?', 'paraphrase: ЧТО ТЫ ЛЮБИШЬ ПИТЬ НАПИТКИ', 'paraphrase: Здравствуйте можно узнать как у вас прошли выходные', 'paraphrase: Российские хакеры получили доступ к электронной переписке Обамы', 'paraphrase: Закон о "резиновых квартирах" принят депутатами в первом чтении.', 'paraphrase: что ты делала пока меня не было', 'paraphrase: Отметим твой день рождения', 'paraphrase: купи пожалуйста абонемент в бассейн', 'paraphrase: Националисты предупредили мэрию о "Русском марше" в Люблино.', 'paraphrase: а научился ли ты в институте например', 'paraphrase: В Туве автомобиль насмерть сбил четырех человек на остановке.', 'paraphrase: а как ты ко мне относишься', 'paraphrase: Пожар в офисном здании в центре Москвы потушен', 'paraphrase: Какое твое любимое приложение в телефоне']
generated_paraphrases ['- Полиция США арестовала 

Validation:   8%|▊         | 2/26 [00:01<00:19,  1.26it/s]


inputs ['paraphrase: Нидерландского дипломата осудили на 12 лет за шпионаж в пользу России.', 'paraphrase: Грузинский фильм о чеченской войне получил награду в Локарно.', 'paraphrase: скажи какой цвет тебе больше всего нравится', 'paraphrase: Прокуроры представили доказательства вины "узников Болотной".', 'paraphrase: Четверо альпинистов погибли в Шотландии из-за схода лавины.', 'paraphrase: В Москве арестован таджикский бандит Сталин.', 'paraphrase: Собянин: С выборов мэра Москвы никого снимать не нужно.', 'paraphrase: Концерн "Алмаз-Антей" обжаловал санкции, введенные против компании ЕС', 'paraphrase: Я люблю играть симфонии на фортепиано', 'paraphrase: В Лондоне вертолет столкнулся со строительным краном и разбился.', 'paraphrase: Хотелось бы знать в чем смысл жизни', 'paraphrase: Сотрудники карельского музея "Кижи" выступили против нового руководства.', 'paraphrase: СКР просит о заочном аресте "белгородского стрелка".', 'paraphrase: Бетин назначен замминистра строительства и ЖКХ Р

Validation:  12%|█▏        | 3/26 [00:02<00:18,  1.24it/s]


inputs ['paraphrase: соскучилась ли ты по моему голосу', 'paraphrase: какое у тебя любимое мобильное приложение для рисования', 'paraphrase: Гус Хиддинк ушел с поста главного тренера ФК "Анжи".', 'paraphrase: А ен мог ли бы ты подбросить монетку', 'paraphrase: Костюм Скарлетт из "Унесенных ветром" продан за 137 тысяч долларов', 'paraphrase: Есть ли у тебя образование?', 'paraphrase: Как тебя можно величать?', 'paraphrase: мне совершенно не хочется идти на работу в субботу', 'paraphrase: Какие планы на новый год?', 'paraphrase: Число жертв землетрясения в Непале достигло 3218', 'paraphrase: любимое приложение какое', 'paraphrase: В США скончался основатель группы Slayer Джефф Ханнеман.', 'paraphrase: какая будет твоя реакция если я приглашу тебя сегодня на свидание', 'paraphrase: Генпрокуратура сочла Мадонну и Леди Гагу нелегальными гастарбайтерами.', 'paraphrase: Что ты понимаешь под словом любовь', 'paraphrase: Маркин: Васильева сможет реализовать свой потенциал в жанре "шансон"']
ge

Validation:  15%|█▌        | 4/26 [00:03<00:17,  1.29it/s]


inputs ['paraphrase: какой подарок ты хочешь купить?', 'paraphrase: какие у тебя планы на завтра на работе', 'paraphrase: Путин изменил закон о митингах, шествиях и пикетах', 'paraphrase: почему ты такая грустная?', 'paraphrase: У тебя есть вторая половина', 'paraphrase: Такая плохая погода и мне так не хочется идти на работу', 'paraphrase: Определена дата референдума о независимости Шотландии.', 'paraphrase: Вода из прорванного трубопровода затопила Дмитровское шоссе.', 'paraphrase: Расскажи мне пожалуйста в чём у тебя смысл жизни', 'paraphrase: Мост между Канадой и США назовут в честь хоккеиста Горди Хоу', 'paraphrase: Осужденному за взрыв на Манежной площади отменили приговор.', 'paraphrase: А у тебя хорошее чувство юмора?', 'paraphrase: Литва заморозила счета российских чиновников из "списка Магнитского".', 'paraphrase: приглашаю тебя на свидание в театр', 'paraphrase: в какой стране тебя изобрели', 'paraphrase: Убийство солдата в Лондоне: задержан девятый подозреваемый.']
generat

Validation:  19%|█▉        | 5/26 [00:03<00:15,  1.40it/s]


inputs ['paraphrase: мечтаешь о чем то братуха', 'paraphrase: Премьер Таиланда объявила о роспуске парламента.', 'paraphrase: Дука: Косово примут в ФИФА и УЕФА в 2016 году', 'paraphrase: На саратовского дебошира с борта самолета Москва - Хургада заведено дело.', 'paraphrase: что такое любовь ответь?', 'paraphrase: есть ли у тебя собака', 'paraphrase: Депутат: взрыв у офиса партии "Свобода" произошел в Одессе', 'paraphrase: Я вообще не хочу идти ни на какую работу', 'paraphrase: Ты шутишь или правду говоришь?', 'paraphrase: Вице-президент Еврокомиссии бойкотирует Олимпиаду в Сочи.', 'paraphrase: Что интересного делала сегодня пока меня не было?', 'paraphrase: что бы ты хотел получить', 'paraphrase: У тебя есть чувство юмора?', 'paraphrase: На Камчатке заключенного освободили в обмен на 200 шапок.', 'paraphrase: Полиция: дело Бойцова закроют после разговора следователей с боксером', 'paraphrase: какая марка машины твоя любимая?']
generated_paraphrases ['Для краткого: ты о чем-то мечтаеш

Validation:  23%|██▎       | 6/26 [00:04<00:15,  1.25it/s]


inputs ['paraphrase: Добыча сланцевой нефти принесла Shell убытки в 2,1 млрд долл.', 'paraphrase: Что из музыки тебе нравится больше всего?', 'paraphrase: я люблю тебя больше всего на свете', 'paraphrase: о чем ты сейчас думаешь', 'paraphrase: мне скучно скажи чем заняться', 'paraphrase: Россия построит для Ирана новые С-300, а не возьмет из наличия', 'paraphrase: У тебя есть любимый?', 'paraphrase: "Болотное дело": в СКР на допрос ждут блогера Митю Алешковского.', 'paraphrase: В московском отделе полиции повесился задержанный.', 'paraphrase: ТЫ МАЛЬЧИК ИЛИ ДЕВОЧКА', 'paraphrase: ты можешь предсказать что со мной случится в будущем', 'paraphrase: пропавший самолет-заправщик ВВС США нашелся в Британии', 'paraphrase: Колонна МЧС с гумпомощью и подарками для ветеранов выехала в Донбасс', 'paraphrase: Какую музыку ты предпочитаешь?', 'paraphrase: Что любишь выпить братан?', 'paraphrase: При пожаре в Рижском замке пострадали реликвии.']
generated_paraphrases ['Тема: Нефтяная добыча принесл

Validation:  27%|██▋       | 7/26 [00:05<00:16,  1.17it/s]


inputs ['paraphrase: МЧС Тувы: Найдено тело последнего из 6 подростков, погибших под лавиной.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: какой твой любимый цвет', 'paraphrase: США получат $1,4 млрд за аварию на нефтяной платформе в Мексиканском заливе.', 'paraphrase: Спокойной ночи тебе и хороших снов', 'paraphrase: Госдума окончательно запретила чиновникам иметь зарубежные счета.', 'paraphrase: Как ты будешь встречать Новый Год?', 'paraphrase: Премию Политковской получила девочка, раненная талибами.', 'paraphrase: у тебя есть друзья дома в городе и каком', 'paraphrase: Адвокат: Арест зарубежных счетов Е.Васильевой – абсурд.', 'paraphrase: как ты думаешь в чем смысл жизни', 'paraphrase: Из чего ты состоишь', 'paraphrase: Репетиция парада Победы началась в Донецке', 'paraphrase: Россия экспортирует программное обеспечение на 5 млрд долл.', 'paraphrase: Олег Тиньков приобрел датскую велокоманду.', 'paraphrase: Сильный взрыв в Праге: 55 пострада

Validation:  31%|███       | 8/26 [00:06<00:14,  1.26it/s]


inputs ['paraphrase: В Мали режим чрезвычайного положения продлили на 3 месяца.', 'paraphrase: Какое мобильное приложение тебе нравится?', 'paraphrase: Какая погода тебе нравиться мой друг', 'paraphrase: BMW отложила решение о строительстве завода в России', 'paraphrase: В горах Пакистана пропала группа российских туристов.', 'paraphrase: Скончался маршал Советского Союза Виктор Куликов.', 'paraphrase: Ты что-то испытываешь ко мне?', 'paraphrase: а у меня собака есть', 'paraphrase: Оппозиция уведомила мэрию Москвы о проведении "Марша против палачей".', 'paraphrase: Франция получила доказательства применения химоружия в Сирии.', 'paraphrase: В конгрессе США пришли к соглашению по бюджету.', 'paraphrase: В Чили эксгумировали останки поэта Пабло Неруды.', 'paraphrase: Адвокат опроверг информацию о попытке суицида продюсера Витаса.', 'paraphrase: Двух американских адмиралов отстранили из-за подозрений в коррупции.', 'paraphrase: дорогая ты скучала по мне', 'paraphrase: А почему ты грустиш

Validation:  35%|███▍      | 9/26 [00:07<00:12,  1.31it/s]


inputs ['paraphrase: Нобелевская премия по физике досталась первооткрывателям бозона Хиггса.', 'paraphrase: Я так на работу идти не хочу', 'paraphrase: Выпьем чашечку кофе?', 'paraphrase: За приз Венецианского кинофестиваля поборется "Мой друг Иван Лапшин".', 'paraphrase: Вы согласитесь стать моей женой?', 'paraphrase: Главным редактором "Коммерсантъ FM" назначен Константин Эггерт.', 'paraphrase: любишь ли ты животных', 'paraphrase: ты сейчас о чём-то думаешь', 'paraphrase: Какое мобильное приложение ты предпочитаешь?', 'paraphrase: По факту ДТП под Псковом возбуждено уголовное дело.', 'paraphrase: Куда ты хотел бы поехать?', 'paraphrase: Что для тебя счастье', 'paraphrase: В Москве 2 упавших столба перекрыли движение по Профсоюзной улице.', 'paraphrase: Главным кремлевским борцом с коррупцией назначен Олег Плохой.', 'paraphrase: я в ссоре с очень близким человеком', 'paraphrase: как планируешь отметить Новый год?']
generated_paraphrases ['Для примера: Нобелевская премия по физике пол

Validation:  38%|███▊      | 10/26 [00:07<00:11,  1.39it/s]


inputs ['paraphrase: Свободен ли ты в выходные дни', 'paraphrase: Подкинь монетку в воздух', 'paraphrase: Куда хотелось ты тебе отправится?', 'paraphrase: По факту крушения поезда на Кубани возбуждено дело.', 'paraphrase: "Бой идет не ради славы": В Москве открыли памятник А.Твардовскому.', 'paraphrase: Скончалась балерина Майя Плисецкая', 'paraphrase: соскучилась ли ты по отношениям', 'paraphrase: В аэропорту Киева задержан бывший премьер Таджикистана.', 'paraphrase: Тина Тернер отказалась от американского гражданства.', 'paraphrase: я тебе нравлюсь или нет?', 'paraphrase: Командующий войсками ЗВО: Против России начата гибридная война', 'paraphrase: какой у тебя любимый цвет моего автомобиля', 'paraphrase: У Деми Мур похитили одежду на 200 тысяч долларов', 'paraphrase: Тебе знакомо откуда берутся дети?', 'paraphrase: Когда день рождения у тебя', 'paraphrase: "Атака века", предпринятая хакерами, затормозила Интернет.']
generated_paraphrases ['Вопрос: Вы свободны в выходные дни?', 'Тем

Validation:  42%|████▏     | 11/26 [00:08<00:10,  1.40it/s]


inputs ['paraphrase: Французские и малийские военнослужащие выбили исламистов из Тимбукту.', 'paraphrase: Ты что учишься искать фильмы?', 'paraphrase: Что ты сказала? я не расслышала', 'paraphrase: Роберт Мугабе переизбран президентом Зимбабве.', 'paraphrase: Расскажи ка где ты живешь', 'paraphrase: Брось монетку чтобы решить вопрос', 'paraphrase: Интересно соскучилась ли ты по мне', 'paraphrase: СМИ сообщили о новом деле по факту хищений в Мособлбанке на 70 млрд руб.', 'paraphrase: Президент РФ предложил трудоустраивать мигрантов по патентам.', 'paraphrase: В Германии проходят парламентские выборы.', 'paraphrase: Чем любишь заниматься в выходные', 'paraphrase: Умер режиссер Алексей Балабанов.', 'paraphrase: А какое у вас хобби', 'paraphrase: Что составило твои дела в моё отсутствие?', 'paraphrase: у тебя есть какой нибудь любимый цвет', 'paraphrase: Попробуешь угадать что меня ждет в будущем?']
generated_paraphrases ['- Французские и малийские военные выбили исламистов из Тимбукту.',

Validation:  46%|████▌     | 12/26 [00:09<00:09,  1.46it/s]


inputs ['paraphrase: Какой цвет ты любишь?', 'paraphrase: Как у тебя дела на личном пространстве?', 'paraphrase: Путин ратифицировал соглашение о поставках газа в Китай', 'paraphrase: Чем ты занимался на выходных', 'paraphrase: Что ты делаешь в выходные до обеда?', 'paraphrase: Что у тебя спрашивали пока меня не было?', 'paraphrase: ты относишься ко мне хорошо?', 'paraphrase: Будем вместе навсегда!', 'paraphrase: США просят РФ немедленно отменить запрет на ввоз мяса.', 'paraphrase: В КНДР казнили дядю национального лидера.', 'paraphrase: В Японии успешно прошли испытания обновленного "Лайнера мечты".', 'paraphrase: о да у меня есть кошка и я ее люблю', 'paraphrase: Великобритания инвестирует в экономику Кубы 400 миллионов долларов', 'paraphrase: У вас есть постоянный партнер', 'paraphrase: твой смысл жизни в чем заключается', 'paraphrase: Есть планы на новый год']
generated_paraphrases ['Тема: Какой цвет ты любишь?', 'Вопрос: Как у вас дела в личном пространстве?', 'Путин ратифицирова

Validation:  50%|█████     | 13/26 [00:09<00:08,  1.49it/s]


inputs ['paraphrase: СКР: Бастующие офицеры ФСБ - вымышленные персонажи.', 'paraphrase: Что ты пьёшь из любимых напитков?', 'paraphrase: Есть ли у тебя среднее образование?', 'paraphrase: какое у вас образование', 'paraphrase: куда бы ты хотел съездить в путешествие', 'paraphrase: какой цвет ты любишь оттенок', 'paraphrase: Президент присвоил главе ФМС ранг министра.', 'paraphrase: могу я узнать ваше имя', 'paraphrase: ООН: крушение судна в Средиземном море унесло жизни 800 мигрантов', 'paraphrase: Экс-глава Тамбовской области Бетин назначен замминистра ЖКХ России', 'paraphrase: Глава Крыма облетел сельхозугодья республики на воздушном шаре', 'paraphrase: Танк "Армата" прошел по Красной площади', 'paraphrase: Президент Кипра лишил себя четвертой части зарплаты.', 'paraphrase: Какой жанр музыки ты любишь слушать?', 'paraphrase: Скончался легенда блюза Би Би Кинг', 'paraphrase: НАТО более чем вдвое увеличит численность сил реагирования']
generated_paraphrases ['Тема: СКР: Бастующие офиц

Validation:  54%|█████▍    | 14/26 [00:10<00:08,  1.41it/s]


inputs ['paraphrase: Авиакомпания Red Wings продана за 1 рубль.', 'paraphrase: Ушел из жизни британский скульптор Энтони Каро.', 'paraphrase: В Минобороны Грузии обнаружили финансовые нарушения.', 'paraphrase: Можно поинтересоваться как у вас прошли выходные', 'paraphrase: Подмосковный чиновник оштрафован почти на 1 млрд руб. за взяточничество.', 'paraphrase: догадайся сколько мне лет?', 'paraphrase: Расскажи мне пожалуйста о себе', 'paraphrase: Число жертв теракта в Волгограде выросло до семи человек.', 'paraphrase: СК выяснит, был ли подкуп свидетеля по делу Ю.Буданова.', 'paraphrase: Минобразования сократит количество специальностей в вузах в 5 раз.', 'paraphrase: Протестующие в Таиланде прорвались в штаб-квартиру армии.', 'paraphrase: По жалобе пенсионерки из прямой линии Путина возбуждено дело.', 'paraphrase: Россия и Иран могут реализовать бартерную сделку', 'paraphrase: Президент Сербии извинился за бойню в Сребренице.', 'paraphrase: В Санкт-Петербурге произошла массовая драка:

Validation:  58%|█████▊    | 15/26 [00:11<00:07,  1.39it/s]


inputs ['paraphrase: Нападающий ХК "Салават Юлаев" Сергей Зиновьев дисквалифицирован на четыре матча.', 'paraphrase: состоишь ли ты в отношениях', 'paraphrase: Медведев подписал соглашение о ЗСТ между ЕАЭС и Вьетнамом', 'paraphrase: Премьер Японии получил приглашение РФ на празднование 70-летия Победы', 'paraphrase: Опубликовано видео захвата судна Arctic Sunrise сотрудниками ФСБ.', 'paraphrase: Нарышкин: уроки Первой и Второй мировых войн плохо усвоены политиками', 'paraphrase: Расскажи мне где ты живешь?', 'paraphrase: В Петербурге скончался кинорежиссер Алексей Герман - старший.', 'paraphrase: Президент Украины подписал закон о моратории на выплату внешних долгов', 'paraphrase: ИГ казнило в Пальмире 20 человек на руинах древнеримского театра', 'paraphrase: Представители ЕС подтвердили выделение Кипру 10 млрд евро.', 'paraphrase: Ты любишь путешествовать?', 'paraphrase: Какие сладости тебе не нравятся?', 'paraphrase: По меньшей мере четыре человека стали жертвами землетрясений в Неп

Validation:  62%|██████▏   | 16/26 [00:11<00:07,  1.42it/s]


inputs ['paraphrase: Россия облегчила условия погашения кредита для Кипра.', 'paraphrase: Правозащитники из Чувашии попросили Генпрокуратуру проверить Минюст.', 'paraphrase: Сенаторы разрешили США поставлять оружие сирийским повстанцам.', 'paraphrase: угадай сколько мне лет', 'paraphrase: Коалиция арабских стран завершила военную операцию в Йемене', 'paraphrase: Минтруд обсудит идею внесения личного взноса на накопительную пенсию', 'paraphrase: на новый год ты уже что-то запланировал', 'paraphrase: На что ты мне намекаешь?', 'paraphrase: Как ты считаешь что такое счастье', 'paraphrase: любишь ли ты путешествовать', 'paraphrase: Варшава отказалась платить за разгром российского посольства.', 'paraphrase: я поссорилась с любимым что делать', 'paraphrase: А ты любишь животных или нет?', 'paraphrase: Сенат Франции разрешил однополые браки.', 'paraphrase: Число пострадавших при аварии парома в Нью-Йорке выросло до 74.', 'paraphrase: какое у тебя образование?']
generated_paraphrases ['Для к

Validation:  65%|██████▌   | 17/26 [00:12<00:06,  1.44it/s]


inputs ['paraphrase: Подскажи мне откуда дети берутся?', 'paraphrase: Как много ты получаешь в месяц', 'paraphrase: Считаешь ли ты себя красивым?', 'paraphrase: На выборах в Армении с большим отрывом побеждает действующий президент.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: Ты принадлежишь к какому полу?', 'paraphrase: В какой стране ты был создан?', 'paraphrase: Более 20 мирных жителей погибли при авиаударах коалиции в Йемене', 'paraphrase: Полиция вновь начала задерживать митингующих в Балтиморе', 'paraphrase: Я хочу знать какой твой самый любимый цвет', 'paraphrase: у тебя есть женщина?', 'paraphrase: Взрыв газа в Красноярске: семеро пострадавших.', 'paraphrase: Самой влиятельной женщиной России признали В.Матвиенко.', 'paraphrase: Полина Гагарина выступила в финале "Евровидения-2015"', 'paraphrase: В Йемене взорван главный нефтепровод страны.', 'paraphrase: Итальянская Generali удвоит долю в "Ингосстрахе".']
generated_paraphrases ['Вопро

Validation:  69%|██████▉   | 18/26 [00:13<00:05,  1.43it/s]


inputs ['paraphrase: Подкинь монетку чтобы выпал орел', 'paraphrase: не люблю свою работу и не хочу туда идти', 'paraphrase: Алексей Навальный стал председателем "Народного альянса".', 'paraphrase: Самолет Lufthansa вернулся в аэропорт Стамбула из-за угрозы взрыва', 'paraphrase: думаешь ли ты что являешься личностью', 'paraphrase: скажи в каком месяце твой день рождение', 'paraphrase: расскажи о моем дальнейшем будущем', 'paraphrase: Глав Газпрома и "Роснефти" обяжут отказаться от счетов за границей.', 'paraphrase: Куда бы ты хотел уехать завтра?', 'paraphrase: Ты знаешь откуда берутся дети?', 'paraphrase: «Газпрому» посоветовали изучить «50 оттенков серого» для переговоров с ЕС', 'paraphrase: Ты считаешь себя достаточно знающим в этом вопросе?', 'paraphrase: Посвящен ли ты в тайну- откуда берутся дети?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: Занимался ли ты сексом?', 'paraphrase: ты вообще любишь музыку']
generated_paraphras

Validation:  73%|███████▎  | 19/26 [00:13<00:04,  1.48it/s]


inputs ['paraphrase: В Москве можно будет забронировать место на кладбище через интернет.', 'paraphrase: Дочь Шарля де Голля скончалась во Франции.', 'paraphrase: Операция в ТЦ в Найроби завершена.', 'paraphrase: Куда бы ты отправился летом?', 'paraphrase: ты можешь угадать мой точный возраст', 'paraphrase: ОТР сняло с эфира программу после шутки про развод В.Путина.', 'paraphrase: Какую погоду ты больше всего ненавидишь?', 'paraphrase: У тебя очень приятный голос', 'paraphrase: Ты считаешь себя сообразительным?', 'paraphrase: какой у тебя любимый цвет моих волос', 'paraphrase: Жорес Алферов выдвинут кандидатом на пост президента РАН.', 'paraphrase: Порошенко: в Донбассе введут военное положение при атаке на силовиков', 'paraphrase: Прокуратура: Поджоги церквей в Татарстане - это теракты.', 'paraphrase: расскажи мне где ты живешь или где бы ты хотел', 'paraphrase: Какая твоя самая главная мечта?', 'paraphrase: о чем ты сейчас думаешь?']
generated_paraphrases ['Тема: В Москве можно буд

Validation:  77%|███████▋  | 20/26 [00:14<00:04,  1.46it/s]


inputs ['paraphrase: Россияне все чаще "забывают" оплачивать кредиты.', 'paraphrase: Михаэль Шумахер попал в больницу с травмой черепа.', 'paraphrase: Какие у тебя есть хобби?', 'paraphrase: Скончался ведущий артист Малого театра Ярослав Барышев.', 'paraphrase: У певицы Шакиры и футболиста Жерара Пике родился сын.', 'paraphrase: Какие головоломки любишь?', 'paraphrase: На комплексе Байконур вскрыли хищение 15 млн руб.', 'paraphrase: расскажи мне все о себе немедленно!', 'paraphrase: Ты считаешь себя профессионалом в этом деле?', 'paraphrase: В Петербурге задержали похитителей часов на 21 миллион', 'paraphrase: СКР завел дело о торговле в США усыновленными российскими детьми.', 'paraphrase: А где вы появились на свет?', 'paraphrase: "Указующий человек" Джакометти стал самой дорогой скульптурой в мире', 'paraphrase: Китай вошел в топ-5 продавцов оружия.', 'paraphrase: Пушков: России и ЕС нельзя сводить отношения к украинскому кризису', 'paraphrase: Суд приговорил экс-президента Египта Х

Validation:  81%|████████  | 21/26 [00:15<00:03,  1.44it/s]


inputs ['paraphrase: Что ты собираешься делать в канун Нового года?', 'paraphrase: Жан-Мари Ле Пен отказывается уходить на политическую пенсию', 'paraphrase: Сотни инструкторов Пентагона отправились тренировать сирийскую оппозицию', 'paraphrase: Консультации по Сирии начинаются в Женеве под эгидой ООН', 'paraphrase: Землетрясение в Таджикистане разрушило сотни домов.', 'paraphrase: есть ли у тебя брат или сестра настоящие', 'paraphrase: Минобрнауки утвердило новую форму студенческого билета и зачетной книжки.', 'paraphrase: Я не сделала задание преподавателя и не хочу из-за этого идти в институт', 'paraphrase: МВД ДНР: праздничные мероприятия в Донецке проходят без происшествий', 'paraphrase: Я поссорилась с близким человеком', 'paraphrase: Закон о реформе РАН принят во втором чтении.', 'paraphrase: Как думаешь в чем смысл жизни?', 'paraphrase: СК завершил расследование дела о крушении "Булгарии".', 'paraphrase: почему ты такой грустный?', 'paraphrase: Я умею хорошо играть на гитаре',

Validation:  85%|████████▍ | 22/26 [00:16<00:02,  1.38it/s]


inputs ['paraphrase: О чем ты сейчас задумался?', 'paraphrase: умеешь ли ты разговаривать как человек?', 'paraphrase: Всегда интересовало какого ты пола', 'paraphrase: Чемпионка России по пауэрлифтингу получила 7 лет за убийство.', 'paraphrase: В Риме скончался режиссер культового сериала "Спрут" Д.Дамиани.', 'paraphrase: Расскажи о себе немного информации', 'paraphrase: можно с тобой поговорить сейчас', 'paraphrase: Конституционный суд разрешил россиянам обжаловать итоги выборов.', 'paraphrase: В Самарской области на военных складах прогремели взрывы.', 'paraphrase: В Японии произошел пожар в больнице: 10 погибших.', 'paraphrase: Посольство РФ: Украина препятствует встрече с задержанными россиянами', 'paraphrase: Китай на 5 лет запретил строительство новых административных зданий.', 'paraphrase: Из чего ты состоишь расскажи?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: В ЦАР лидер повстанцев объявил себя президентом.', 'paraphras

Validation:  88%|████████▊ | 23/26 [00:16<00:02,  1.42it/s]


inputs ['paraphrase: какое мероприятие ты хотел бы посетить?', 'paraphrase: Что ты делал на выходных?', 'paraphrase: Власти Китая приговорили тибетского монаха к смертной казни.', 'paraphrase: скажи а ты веришь в бога', 'paraphrase: Эквадор провел международный день против загрязнения компанией Chevron', 'paraphrase: В какой стране ты родился?', 'paraphrase: "Протон-М" с европейским спутником связи стартовал с "Байконура"', 'paraphrase: ЮНИСЕФ: Непалу угрожает холера из-за антисанитарии после землетрясения', 'paraphrase: Украинские силовики сообщили о гибели трех военных за сутки в Донбассе', 'paraphrase: ты знаешь кто тебя создал', 'paraphrase: Причиной пожара в аэропорту Рима стало короткое замыкание', 'paraphrase: Где ты живешь в последнее время', 'paraphrase: Какой у тебя любимый напиток', 'paraphrase: Ты очень мне симпатизируешь', 'paraphrase: какие у тебя планы на воскресенье', 'paraphrase: Супруга Михаэля Шумахера продала личный самолет стоимостью 34 млн евро']
generated_paraph

Validation:  92%|█████████▏| 24/26 [00:17<00:01,  1.45it/s]


inputs ['paraphrase: Спи сладко этой ночью', 'paraphrase: какой ваш любимый цвет', 'paraphrase: Что ты сказала повторить не слышно', 'paraphrase: Яценюк недоволен встречей Джона Керри с Путиным в Сочи', 'paraphrase: Пираты освободили корабль, захваченный в Гвинейском заливе.', 'paraphrase: Поездки японцев на Курилы возобновятся с конца мая', 'paraphrase: скажи ты знаешь что у меня есть собака', 'paraphrase: моя жизнь бесцельна и запутана', 'paraphrase: Лавров и Могерини обсудили отношения России и Евросоюза', 'paraphrase: Люблю больше жизни тебя', 'paraphrase: Биржевой курс доллара опустился ниже 53 руб.', 'paraphrase: Делегация палестинских переговорщиков с Израилем ушла в отставку.', 'paraphrase: в чем смысл жизни и как ее прожить', 'paraphrase: А у тебя уже есть детишки?', 'paraphrase: Подбрось монетку в воздух', 'paraphrase: Китайским чиновникам запретили курить в общественных местах.']
generated_paraphrases ['Для того чтобы я сказал: ѕспи сладко этой ночью', 'Для расчета: какой ц

Validation:  96%|█████████▌| 25/26 [00:18<00:00,  1.48it/s]


inputs ['paraphrase: В проекте трехлетнего бюджета обнаружилась "дыра" в 250 млрд руб.', 'paraphrase: Владимир Путин поздравил актера Владимира Этуша с 93-летием', 'paraphrase: Ну ка признавайся как ты ко мне относишься', 'paraphrase: обожаю тебя уже а ты обо мне хоть что нибудь знаешь', 'paraphrase: Полиция задержала водителя микроавтобуса, сгоревшего под Самарой.', 'paraphrase: Полиция провела более 20 обысков в московских банках.', 'paraphrase: Взрыв в иракском кафе унес жизни 38 человек.', 'paraphrase: Есть ли у тебя дети?', 'paraphrase: Тебе нравится человечество?', 'paraphrase: Что ты делала в моё отсутствие?', 'paraphrase: После опрокидывания автобуса в Тюменской области ранены 14 человек', 'paraphrase: Спроси у меня что нибудь!', 'paraphrase: Омские приставы избили полицейского.', 'paraphrase: Тебе нравится читать или ты ненавидишь это делать?', 'paraphrase: США исключили Кубу из списка стран-спонсоров терроризма', 'paraphrase: Депутатам разрешили обходиться без присяги на вер

Validation: 100%|██████████| 26/26 [00:19<00:00,  1.15it/s]


inputs ['paraphrase: у меня есть любимая собака', 'paraphrase: какая у тебя любимая марка машины?']
generated_paraphrases ['Тема: у меня есть любимая собака', 'Вопрос: какая у вас любимая марка машины?']
targets ['у меня есть гавкающее животное', 'Слушай какая у тебя любимая марка машины?']


Validation: 100%|██████████| 26/26 [00:19<00:00,  1.33it/s]


Validation Avg BLEU Score for Epoch 1: 0.0010845472663644565

Training...


Epoch 2/5:   0%|          | 0/226 [00:00<?, ?it/s]


Checkpoint...


Epoch 2/5:  18%|█▊        | 40/226 [01:36<07:24,  2.39s/it, Batch Loss=2.3, Avg Loss=2.22]


Checkpoint...


Epoch 2/5:  35%|███▌      | 80/226 [03:14<04:33,  1.87s/it, Batch Loss=2.37, Avg Loss=2.22]


Checkpoint...


Epoch 2/5:  53%|█████▎    | 120/226 [04:53<04:19,  2.45s/it, Batch Loss=2.32, Avg Loss=2.23]


Checkpoint...


Epoch 2/5:  71%|███████   | 160/226 [06:41<03:18,  3.00s/it, Batch Loss=2.28, Avg Loss=2.23]


Checkpoint...


Epoch 2/5:  88%|████████▊ | 200/226 [08:18<01:06,  2.55s/it, Batch Loss=2.22, Avg Loss=2.23]


Checkpoint...


Epoch 2/5: 100%|██████████| 226/226 [09:29<00:00,  2.52s/it, Batch Loss=2.27, Avg Loss=2.22]


Epoch 2/5, Avg Loss: 2.2248322799303635

Running Validation...


Validation:   4%|▍         | 1/26 [00:01<00:29,  1.16s/it]


inputs ['paraphrase: Полиция США арестовала узбека по подозрению в терроризме.', 'paraphrase: У тебя есть любимый человек?', 'paraphrase: В роддоме какой страны ты родилась?', 'paraphrase: ЧТО ТЫ ЛЮБИШЬ ПИТЬ НАПИТКИ', 'paraphrase: Здравствуйте можно узнать как у вас прошли выходные', 'paraphrase: Российские хакеры получили доступ к электронной переписке Обамы', 'paraphrase: Закон о "резиновых квартирах" принят депутатами в первом чтении.', 'paraphrase: что ты делала пока меня не было', 'paraphrase: Отметим твой день рождения', 'paraphrase: купи пожалуйста абонемент в бассейн', 'paraphrase: Националисты предупредили мэрию о "Русском марше" в Люблино.', 'paraphrase: а научился ли ты в институте например', 'paraphrase: В Туве автомобиль насмерть сбил четырех человек на остановке.', 'paraphrase: а как ты ко мне относишься', 'paraphrase: Пожар в офисном здании в центре Москвы потушен', 'paraphrase: Какое твое любимое приложение в телефоне']
generated_paraphrases ['- Полиция США арестовала 

Validation:   8%|▊         | 2/26 [00:01<00:21,  1.12it/s]


inputs ['paraphrase: Нидерландского дипломата осудили на 12 лет за шпионаж в пользу России.', 'paraphrase: Грузинский фильм о чеченской войне получил награду в Локарно.', 'paraphrase: скажи какой цвет тебе больше всего нравится', 'paraphrase: Прокуроры представили доказательства вины "узников Болотной".', 'paraphrase: Четверо альпинистов погибли в Шотландии из-за схода лавины.', 'paraphrase: В Москве арестован таджикский бандит Сталин.', 'paraphrase: Собянин: С выборов мэра Москвы никого снимать не нужно.', 'paraphrase: Концерн "Алмаз-Антей" обжаловал санкции, введенные против компании ЕС', 'paraphrase: Я люблю играть симфонии на фортепиано', 'paraphrase: В Лондоне вертолет столкнулся со строительным краном и разбился.', 'paraphrase: Хотелось бы знать в чем смысл жизни', 'paraphrase: Сотрудники карельского музея "Кижи" выступили против нового руководства.', 'paraphrase: СКР просит о заочном аресте "белгородского стрелка".', 'paraphrase: Бетин назначен замминистра строительства и ЖКХ Р

Validation:  12%|█▏        | 3/26 [00:02<00:19,  1.20it/s]


inputs ['paraphrase: соскучилась ли ты по моему голосу', 'paraphrase: какое у тебя любимое мобильное приложение для рисования', 'paraphrase: Гус Хиддинк ушел с поста главного тренера ФК "Анжи".', 'paraphrase: А ен мог ли бы ты подбросить монетку', 'paraphrase: Костюм Скарлетт из "Унесенных ветром" продан за 137 тысяч долларов', 'paraphrase: Есть ли у тебя образование?', 'paraphrase: Как тебя можно величать?', 'paraphrase: мне совершенно не хочется идти на работу в субботу', 'paraphrase: Какие планы на новый год?', 'paraphrase: Число жертв землетрясения в Непале достигло 3218', 'paraphrase: любимое приложение какое', 'paraphrase: В США скончался основатель группы Slayer Джефф Ханнеман.', 'paraphrase: какая будет твоя реакция если я приглашу тебя сегодня на свидание', 'paraphrase: Генпрокуратура сочла Мадонну и Леди Гагу нелегальными гастарбайтерами.', 'paraphrase: Что ты понимаешь под словом любовь', 'paraphrase: Маркин: Васильева сможет реализовать свой потенциал в жанре "шансон"']
ge

Validation:  15%|█▌        | 4/26 [00:03<00:19,  1.13it/s]


inputs ['paraphrase: какой подарок ты хочешь купить?', 'paraphrase: какие у тебя планы на завтра на работе', 'paraphrase: Путин изменил закон о митингах, шествиях и пикетах', 'paraphrase: почему ты такая грустная?', 'paraphrase: У тебя есть вторая половина', 'paraphrase: Такая плохая погода и мне так не хочется идти на работу', 'paraphrase: Определена дата референдума о независимости Шотландии.', 'paraphrase: Вода из прорванного трубопровода затопила Дмитровское шоссе.', 'paraphrase: Расскажи мне пожалуйста в чём у тебя смысл жизни', 'paraphrase: Мост между Канадой и США назовут в честь хоккеиста Горди Хоу', 'paraphrase: Осужденному за взрыв на Манежной площади отменили приговор.', 'paraphrase: А у тебя хорошее чувство юмора?', 'paraphrase: Литва заморозила счета российских чиновников из "списка Магнитского".', 'paraphrase: приглашаю тебя на свидание в театр', 'paraphrase: в какой стране тебя изобрели', 'paraphrase: Убийство солдата в Лондоне: задержан девятый подозреваемый.']
generat

Validation:  19%|█▉        | 5/26 [00:04<00:17,  1.23it/s]


inputs ['paraphrase: мечтаешь о чем то братуха', 'paraphrase: Премьер Таиланда объявила о роспуске парламента.', 'paraphrase: Дука: Косово примут в ФИФА и УЕФА в 2016 году', 'paraphrase: На саратовского дебошира с борта самолета Москва - Хургада заведено дело.', 'paraphrase: что такое любовь ответь?', 'paraphrase: есть ли у тебя собака', 'paraphrase: Депутат: взрыв у офиса партии "Свобода" произошел в Одессе', 'paraphrase: Я вообще не хочу идти ни на какую работу', 'paraphrase: Ты шутишь или правду говоришь?', 'paraphrase: Вице-президент Еврокомиссии бойкотирует Олимпиаду в Сочи.', 'paraphrase: Что интересного делала сегодня пока меня не было?', 'paraphrase: что бы ты хотел получить', 'paraphrase: У тебя есть чувство юмора?', 'paraphrase: На Камчатке заключенного освободили в обмен на 200 шапок.', 'paraphrase: Полиция: дело Бойцова закроют после разговора следователей с боксером', 'paraphrase: какая марка машины твоя любимая?']
generated_paraphrases ['Для краткого: ты о чем-то мечтаеш

Validation:  23%|██▎       | 6/26 [00:05<00:15,  1.27it/s]


inputs ['paraphrase: Добыча сланцевой нефти принесла Shell убытки в 2,1 млрд долл.', 'paraphrase: Что из музыки тебе нравится больше всего?', 'paraphrase: я люблю тебя больше всего на свете', 'paraphrase: о чем ты сейчас думаешь', 'paraphrase: мне скучно скажи чем заняться', 'paraphrase: Россия построит для Ирана новые С-300, а не возьмет из наличия', 'paraphrase: У тебя есть любимый?', 'paraphrase: "Болотное дело": в СКР на допрос ждут блогера Митю Алешковского.', 'paraphrase: В московском отделе полиции повесился задержанный.', 'paraphrase: ТЫ МАЛЬЧИК ИЛИ ДЕВОЧКА', 'paraphrase: ты можешь предсказать что со мной случится в будущем', 'paraphrase: пропавший самолет-заправщик ВВС США нашелся в Британии', 'paraphrase: Колонна МЧС с гумпомощью и подарками для ветеранов выехала в Донбасс', 'paraphrase: Какую музыку ты предпочитаешь?', 'paraphrase: Что любишь выпить братан?', 'paraphrase: При пожаре в Рижском замке пострадали реликвии.']
generated_paraphrases ['Тема: Нефтяная добыча принесл

Validation:  27%|██▋       | 7/26 [00:05<00:15,  1.23it/s]


inputs ['paraphrase: МЧС Тувы: Найдено тело последнего из 6 подростков, погибших под лавиной.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: какой твой любимый цвет', 'paraphrase: США получат $1,4 млрд за аварию на нефтяной платформе в Мексиканском заливе.', 'paraphrase: Спокойной ночи тебе и хороших снов', 'paraphrase: Госдума окончательно запретила чиновникам иметь зарубежные счета.', 'paraphrase: Как ты будешь встречать Новый Год?', 'paraphrase: Премию Политковской получила девочка, раненная талибами.', 'paraphrase: у тебя есть друзья дома в городе и каком', 'paraphrase: Адвокат: Арест зарубежных счетов Е.Васильевой – абсурд.', 'paraphrase: как ты думаешь в чем смысл жизни', 'paraphrase: Из чего ты состоишь', 'paraphrase: Репетиция парада Победы началась в Донецке', 'paraphrase: Россия экспортирует программное обеспечение на 5 млрд долл.', 'paraphrase: Олег Тиньков приобрел датскую велокоманду.', 'paraphrase: Сильный взрыв в Праге: 55 пострада

Validation:  31%|███       | 8/26 [00:06<00:14,  1.26it/s]


inputs ['paraphrase: В Мали режим чрезвычайного положения продлили на 3 месяца.', 'paraphrase: Какое мобильное приложение тебе нравится?', 'paraphrase: Какая погода тебе нравиться мой друг', 'paraphrase: BMW отложила решение о строительстве завода в России', 'paraphrase: В горах Пакистана пропала группа российских туристов.', 'paraphrase: Скончался маршал Советского Союза Виктор Куликов.', 'paraphrase: Ты что-то испытываешь ко мне?', 'paraphrase: а у меня собака есть', 'paraphrase: Оппозиция уведомила мэрию Москвы о проведении "Марша против палачей".', 'paraphrase: Франция получила доказательства применения химоружия в Сирии.', 'paraphrase: В конгрессе США пришли к соглашению по бюджету.', 'paraphrase: В Чили эксгумировали останки поэта Пабло Неруды.', 'paraphrase: Адвокат опроверг информацию о попытке суицида продюсера Витаса.', 'paraphrase: Двух американских адмиралов отстранили из-за подозрений в коррупции.', 'paraphrase: дорогая ты скучала по мне', 'paraphrase: А почему ты грустиш

Validation:  35%|███▍      | 9/26 [00:07<00:13,  1.26it/s]


inputs ['paraphrase: Нобелевская премия по физике досталась первооткрывателям бозона Хиггса.', 'paraphrase: Я так на работу идти не хочу', 'paraphrase: Выпьем чашечку кофе?', 'paraphrase: За приз Венецианского кинофестиваля поборется "Мой друг Иван Лапшин".', 'paraphrase: Вы согласитесь стать моей женой?', 'paraphrase: Главным редактором "Коммерсантъ FM" назначен Константин Эггерт.', 'paraphrase: любишь ли ты животных', 'paraphrase: ты сейчас о чём-то думаешь', 'paraphrase: Какое мобильное приложение ты предпочитаешь?', 'paraphrase: По факту ДТП под Псковом возбуждено уголовное дело.', 'paraphrase: Куда ты хотел бы поехать?', 'paraphrase: Что для тебя счастье', 'paraphrase: В Москве 2 упавших столба перекрыли движение по Профсоюзной улице.', 'paraphrase: Главным кремлевским борцом с коррупцией назначен Олег Плохой.', 'paraphrase: я в ссоре с очень близким человеком', 'paraphrase: как планируешь отметить Новый год?']
generated_paraphrases ['Для примера: Нобелевская премия по физике пол

Validation:  38%|███▊      | 10/26 [00:08<00:12,  1.30it/s]


inputs ['paraphrase: Свободен ли ты в выходные дни', 'paraphrase: Подкинь монетку в воздух', 'paraphrase: Куда хотелось ты тебе отправится?', 'paraphrase: По факту крушения поезда на Кубани возбуждено дело.', 'paraphrase: "Бой идет не ради славы": В Москве открыли памятник А.Твардовскому.', 'paraphrase: Скончалась балерина Майя Плисецкая', 'paraphrase: соскучилась ли ты по отношениям', 'paraphrase: В аэропорту Киева задержан бывший премьер Таджикистана.', 'paraphrase: Тина Тернер отказалась от американского гражданства.', 'paraphrase: я тебе нравлюсь или нет?', 'paraphrase: Командующий войсками ЗВО: Против России начата гибридная война', 'paraphrase: какой у тебя любимый цвет моего автомобиля', 'paraphrase: У Деми Мур похитили одежду на 200 тысяч долларов', 'paraphrase: Тебе знакомо откуда берутся дети?', 'paraphrase: Когда день рождения у тебя', 'paraphrase: "Атака века", предпринятая хакерами, затормозила Интернет.']
generated_paraphrases ['Вопрос: Вы свободны в выходные дни?', 'Тем

Validation:  42%|████▏     | 11/26 [00:08<00:11,  1.29it/s]


inputs ['paraphrase: Французские и малийские военнослужащие выбили исламистов из Тимбукту.', 'paraphrase: Ты что учишься искать фильмы?', 'paraphrase: Что ты сказала? я не расслышала', 'paraphrase: Роберт Мугабе переизбран президентом Зимбабве.', 'paraphrase: Расскажи ка где ты живешь', 'paraphrase: Брось монетку чтобы решить вопрос', 'paraphrase: Интересно соскучилась ли ты по мне', 'paraphrase: СМИ сообщили о новом деле по факту хищений в Мособлбанке на 70 млрд руб.', 'paraphrase: Президент РФ предложил трудоустраивать мигрантов по патентам.', 'paraphrase: В Германии проходят парламентские выборы.', 'paraphrase: Чем любишь заниматься в выходные', 'paraphrase: Умер режиссер Алексей Балабанов.', 'paraphrase: А какое у вас хобби', 'paraphrase: Что составило твои дела в моё отсутствие?', 'paraphrase: у тебя есть какой нибудь любимый цвет', 'paraphrase: Попробуешь угадать что меня ждет в будущем?']
generated_paraphrases ['- Французские и малийские военные выбили исламистов из Тимбукту.',

Validation:  46%|████▌     | 12/26 [00:09<00:10,  1.33it/s]


inputs ['paraphrase: Какой цвет ты любишь?', 'paraphrase: Как у тебя дела на личном пространстве?', 'paraphrase: Путин ратифицировал соглашение о поставках газа в Китай', 'paraphrase: Чем ты занимался на выходных', 'paraphrase: Что ты делаешь в выходные до обеда?', 'paraphrase: Что у тебя спрашивали пока меня не было?', 'paraphrase: ты относишься ко мне хорошо?', 'paraphrase: Будем вместе навсегда!', 'paraphrase: США просят РФ немедленно отменить запрет на ввоз мяса.', 'paraphrase: В КНДР казнили дядю национального лидера.', 'paraphrase: В Японии успешно прошли испытания обновленного "Лайнера мечты".', 'paraphrase: о да у меня есть кошка и я ее люблю', 'paraphrase: Великобритания инвестирует в экономику Кубы 400 миллионов долларов', 'paraphrase: У вас есть постоянный партнер', 'paraphrase: твой смысл жизни в чем заключается', 'paraphrase: Есть планы на новый год']
generated_paraphrases ['Тема: Какой цвет ты любишь?', 'Вопрос: Как у вас дела в личном пространстве?', 'Путин ратифицирова

Validation:  50%|█████     | 13/26 [00:10<00:09,  1.35it/s]


inputs ['paraphrase: СКР: Бастующие офицеры ФСБ - вымышленные персонажи.', 'paraphrase: Что ты пьёшь из любимых напитков?', 'paraphrase: Есть ли у тебя среднее образование?', 'paraphrase: какое у вас образование', 'paraphrase: куда бы ты хотел съездить в путешествие', 'paraphrase: какой цвет ты любишь оттенок', 'paraphrase: Президент присвоил главе ФМС ранг министра.', 'paraphrase: могу я узнать ваше имя', 'paraphrase: ООН: крушение судна в Средиземном море унесло жизни 800 мигрантов', 'paraphrase: Экс-глава Тамбовской области Бетин назначен замминистра ЖКХ России', 'paraphrase: Глава Крыма облетел сельхозугодья республики на воздушном шаре', 'paraphrase: Танк "Армата" прошел по Красной площади', 'paraphrase: Президент Кипра лишил себя четвертой части зарплаты.', 'paraphrase: Какой жанр музыки ты любишь слушать?', 'paraphrase: Скончался легенда блюза Би Би Кинг', 'paraphrase: НАТО более чем вдвое увеличит численность сил реагирования']
generated_paraphrases ['Тема: СКР: Бастующие офиц

Validation:  54%|█████▍    | 14/26 [00:11<00:09,  1.26it/s]


inputs ['paraphrase: Авиакомпания Red Wings продана за 1 рубль.', 'paraphrase: Ушел из жизни британский скульптор Энтони Каро.', 'paraphrase: В Минобороны Грузии обнаружили финансовые нарушения.', 'paraphrase: Можно поинтересоваться как у вас прошли выходные', 'paraphrase: Подмосковный чиновник оштрафован почти на 1 млрд руб. за взяточничество.', 'paraphrase: догадайся сколько мне лет?', 'paraphrase: Расскажи мне пожалуйста о себе', 'paraphrase: Число жертв теракта в Волгограде выросло до семи человек.', 'paraphrase: СК выяснит, был ли подкуп свидетеля по делу Ю.Буданова.', 'paraphrase: Минобразования сократит количество специальностей в вузах в 5 раз.', 'paraphrase: Протестующие в Таиланде прорвались в штаб-квартиру армии.', 'paraphrase: По жалобе пенсионерки из прямой линии Путина возбуждено дело.', 'paraphrase: Россия и Иран могут реализовать бартерную сделку', 'paraphrase: Президент Сербии извинился за бойню в Сребренице.', 'paraphrase: В Санкт-Петербурге произошла массовая драка:

Validation:  58%|█████▊    | 15/26 [00:12<00:08,  1.24it/s]


inputs ['paraphrase: Нападающий ХК "Салават Юлаев" Сергей Зиновьев дисквалифицирован на четыре матча.', 'paraphrase: состоишь ли ты в отношениях', 'paraphrase: Медведев подписал соглашение о ЗСТ между ЕАЭС и Вьетнамом', 'paraphrase: Премьер Японии получил приглашение РФ на празднование 70-летия Победы', 'paraphrase: Опубликовано видео захвата судна Arctic Sunrise сотрудниками ФСБ.', 'paraphrase: Нарышкин: уроки Первой и Второй мировых войн плохо усвоены политиками', 'paraphrase: Расскажи мне где ты живешь?', 'paraphrase: В Петербурге скончался кинорежиссер Алексей Герман - старший.', 'paraphrase: Президент Украины подписал закон о моратории на выплату внешних долгов', 'paraphrase: ИГ казнило в Пальмире 20 человек на руинах древнеримского театра', 'paraphrase: Представители ЕС подтвердили выделение Кипру 10 млрд евро.', 'paraphrase: Ты любишь путешествовать?', 'paraphrase: Какие сладости тебе не нравятся?', 'paraphrase: По меньшей мере четыре человека стали жертвами землетрясений в Неп

Validation:  62%|██████▏   | 16/26 [00:12<00:07,  1.27it/s]


inputs ['paraphrase: Россия облегчила условия погашения кредита для Кипра.', 'paraphrase: Правозащитники из Чувашии попросили Генпрокуратуру проверить Минюст.', 'paraphrase: Сенаторы разрешили США поставлять оружие сирийским повстанцам.', 'paraphrase: угадай сколько мне лет', 'paraphrase: Коалиция арабских стран завершила военную операцию в Йемене', 'paraphrase: Минтруд обсудит идею внесения личного взноса на накопительную пенсию', 'paraphrase: на новый год ты уже что-то запланировал', 'paraphrase: На что ты мне намекаешь?', 'paraphrase: Как ты считаешь что такое счастье', 'paraphrase: любишь ли ты путешествовать', 'paraphrase: Варшава отказалась платить за разгром российского посольства.', 'paraphrase: я поссорилась с любимым что делать', 'paraphrase: А ты любишь животных или нет?', 'paraphrase: Сенат Франции разрешил однополые браки.', 'paraphrase: Число пострадавших при аварии парома в Нью-Йорке выросло до 74.', 'paraphrase: какое у тебя образование?']
generated_paraphrases ['Для к

Validation:  65%|██████▌   | 17/26 [00:13<00:06,  1.31it/s]


inputs ['paraphrase: Подскажи мне откуда дети берутся?', 'paraphrase: Как много ты получаешь в месяц', 'paraphrase: Считаешь ли ты себя красивым?', 'paraphrase: На выборах в Армении с большим отрывом побеждает действующий президент.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: Ты принадлежишь к какому полу?', 'paraphrase: В какой стране ты был создан?', 'paraphrase: Более 20 мирных жителей погибли при авиаударах коалиции в Йемене', 'paraphrase: Полиция вновь начала задерживать митингующих в Балтиморе', 'paraphrase: Я хочу знать какой твой самый любимый цвет', 'paraphrase: у тебя есть женщина?', 'paraphrase: Взрыв газа в Красноярске: семеро пострадавших.', 'paraphrase: Самой влиятельной женщиной России признали В.Матвиенко.', 'paraphrase: Полина Гагарина выступила в финале "Евровидения-2015"', 'paraphrase: В Йемене взорван главный нефтепровод страны.', 'paraphrase: Итальянская Generali удвоит долю в "Ингосстрахе".']
generated_paraphrases ['Вопро

Validation:  69%|██████▉   | 18/26 [00:14<00:06,  1.29it/s]


inputs ['paraphrase: Подкинь монетку чтобы выпал орел', 'paraphrase: не люблю свою работу и не хочу туда идти', 'paraphrase: Алексей Навальный стал председателем "Народного альянса".', 'paraphrase: Самолет Lufthansa вернулся в аэропорт Стамбула из-за угрозы взрыва', 'paraphrase: думаешь ли ты что являешься личностью', 'paraphrase: скажи в каком месяце твой день рождение', 'paraphrase: расскажи о моем дальнейшем будущем', 'paraphrase: Глав Газпрома и "Роснефти" обяжут отказаться от счетов за границей.', 'paraphrase: Куда бы ты хотел уехать завтра?', 'paraphrase: Ты знаешь откуда берутся дети?', 'paraphrase: «Газпрому» посоветовали изучить «50 оттенков серого» для переговоров с ЕС', 'paraphrase: Ты считаешь себя достаточно знающим в этом вопросе?', 'paraphrase: Посвящен ли ты в тайну- откуда берутся дети?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: Занимался ли ты сексом?', 'paraphrase: ты вообще любишь музыку']
generated_paraphras

Validation:  73%|███████▎  | 19/26 [00:15<00:05,  1.33it/s]


inputs ['paraphrase: В Москве можно будет забронировать место на кладбище через интернет.', 'paraphrase: Дочь Шарля де Голля скончалась во Франции.', 'paraphrase: Операция в ТЦ в Найроби завершена.', 'paraphrase: Куда бы ты отправился летом?', 'paraphrase: ты можешь угадать мой точный возраст', 'paraphrase: ОТР сняло с эфира программу после шутки про развод В.Путина.', 'paraphrase: Какую погоду ты больше всего ненавидишь?', 'paraphrase: У тебя очень приятный голос', 'paraphrase: Ты считаешь себя сообразительным?', 'paraphrase: какой у тебя любимый цвет моих волос', 'paraphrase: Жорес Алферов выдвинут кандидатом на пост президента РАН.', 'paraphrase: Порошенко: в Донбассе введут военное положение при атаке на силовиков', 'paraphrase: Прокуратура: Поджоги церквей в Татарстане - это теракты.', 'paraphrase: расскажи мне где ты живешь или где бы ты хотел', 'paraphrase: Какая твоя самая главная мечта?', 'paraphrase: о чем ты сейчас думаешь?']
generated_paraphrases ['Тема: В Москве можно буд

Validation:  77%|███████▋  | 20/26 [00:15<00:04,  1.30it/s]


inputs ['paraphrase: Россияне все чаще "забывают" оплачивать кредиты.', 'paraphrase: Михаэль Шумахер попал в больницу с травмой черепа.', 'paraphrase: Какие у тебя есть хобби?', 'paraphrase: Скончался ведущий артист Малого театра Ярослав Барышев.', 'paraphrase: У певицы Шакиры и футболиста Жерара Пике родился сын.', 'paraphrase: Какие головоломки любишь?', 'paraphrase: На комплексе Байконур вскрыли хищение 15 млн руб.', 'paraphrase: расскажи мне все о себе немедленно!', 'paraphrase: Ты считаешь себя профессионалом в этом деле?', 'paraphrase: В Петербурге задержали похитителей часов на 21 миллион', 'paraphrase: СКР завел дело о торговле в США усыновленными российскими детьми.', 'paraphrase: А где вы появились на свет?', 'paraphrase: "Указующий человек" Джакометти стал самой дорогой скульптурой в мире', 'paraphrase: Китай вошел в топ-5 продавцов оружия.', 'paraphrase: Пушков: России и ЕС нельзя сводить отношения к украинскому кризису', 'paraphrase: Суд приговорил экс-президента Египта Х

Validation:  81%|████████  | 21/26 [00:16<00:03,  1.28it/s]


inputs ['paraphrase: Что ты собираешься делать в канун Нового года?', 'paraphrase: Жан-Мари Ле Пен отказывается уходить на политическую пенсию', 'paraphrase: Сотни инструкторов Пентагона отправились тренировать сирийскую оппозицию', 'paraphrase: Консультации по Сирии начинаются в Женеве под эгидой ООН', 'paraphrase: Землетрясение в Таджикистане разрушило сотни домов.', 'paraphrase: есть ли у тебя брат или сестра настоящие', 'paraphrase: Минобрнауки утвердило новую форму студенческого билета и зачетной книжки.', 'paraphrase: Я не сделала задание преподавателя и не хочу из-за этого идти в институт', 'paraphrase: МВД ДНР: праздничные мероприятия в Донецке проходят без происшествий', 'paraphrase: Я поссорилась с близким человеком', 'paraphrase: Закон о реформе РАН принят во втором чтении.', 'paraphrase: Как думаешь в чем смысл жизни?', 'paraphrase: СК завершил расследование дела о крушении "Булгарии".', 'paraphrase: почему ты такой грустный?', 'paraphrase: Я умею хорошо играть на гитаре',

Validation:  85%|████████▍ | 22/26 [00:17<00:03,  1.23it/s]


inputs ['paraphrase: О чем ты сейчас задумался?', 'paraphrase: умеешь ли ты разговаривать как человек?', 'paraphrase: Всегда интересовало какого ты пола', 'paraphrase: Чемпионка России по пауэрлифтингу получила 7 лет за убийство.', 'paraphrase: В Риме скончался режиссер культового сериала "Спрут" Д.Дамиани.', 'paraphrase: Расскажи о себе немного информации', 'paraphrase: можно с тобой поговорить сейчас', 'paraphrase: Конституционный суд разрешил россиянам обжаловать итоги выборов.', 'paraphrase: В Самарской области на военных складах прогремели взрывы.', 'paraphrase: В Японии произошел пожар в больнице: 10 погибших.', 'paraphrase: Посольство РФ: Украина препятствует встрече с задержанными россиянами', 'paraphrase: Китай на 5 лет запретил строительство новых административных зданий.', 'paraphrase: Из чего ты состоишь расскажи?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: В ЦАР лидер повстанцев объявил себя президентом.', 'paraphras

Validation:  88%|████████▊ | 23/26 [00:18<00:02,  1.25it/s]


inputs ['paraphrase: какое мероприятие ты хотел бы посетить?', 'paraphrase: Что ты делал на выходных?', 'paraphrase: Власти Китая приговорили тибетского монаха к смертной казни.', 'paraphrase: скажи а ты веришь в бога', 'paraphrase: Эквадор провел международный день против загрязнения компанией Chevron', 'paraphrase: В какой стране ты родился?', 'paraphrase: "Протон-М" с европейским спутником связи стартовал с "Байконура"', 'paraphrase: ЮНИСЕФ: Непалу угрожает холера из-за антисанитарии после землетрясения', 'paraphrase: Украинские силовики сообщили о гибели трех военных за сутки в Донбассе', 'paraphrase: ты знаешь кто тебя создал', 'paraphrase: Причиной пожара в аэропорту Рима стало короткое замыкание', 'paraphrase: Где ты живешь в последнее время', 'paraphrase: Какой у тебя любимый напиток', 'paraphrase: Ты очень мне симпатизируешь', 'paraphrase: какие у тебя планы на воскресенье', 'paraphrase: Супруга Михаэля Шумахера продала личный самолет стоимостью 34 млн евро']
generated_paraph

Validation:  92%|█████████▏| 24/26 [00:19<00:01,  1.29it/s]


inputs ['paraphrase: Спи сладко этой ночью', 'paraphrase: какой ваш любимый цвет', 'paraphrase: Что ты сказала повторить не слышно', 'paraphrase: Яценюк недоволен встречей Джона Керри с Путиным в Сочи', 'paraphrase: Пираты освободили корабль, захваченный в Гвинейском заливе.', 'paraphrase: Поездки японцев на Курилы возобновятся с конца мая', 'paraphrase: скажи ты знаешь что у меня есть собака', 'paraphrase: моя жизнь бесцельна и запутана', 'paraphrase: Лавров и Могерини обсудили отношения России и Евросоюза', 'paraphrase: Люблю больше жизни тебя', 'paraphrase: Биржевой курс доллара опустился ниже 53 руб.', 'paraphrase: Делегация палестинских переговорщиков с Израилем ушла в отставку.', 'paraphrase: в чем смысл жизни и как ее прожить', 'paraphrase: А у тебя уже есть детишки?', 'paraphrase: Подбрось монетку в воздух', 'paraphrase: Китайским чиновникам запретили курить в общественных местах.']
generated_paraphrases ['Для того чтобы я сказал: ѕспи сладко этой ночью', 'Для расчета: какой ц

Validation:  96%|█████████▌| 25/26 [00:19<00:00,  1.24it/s]


inputs ['paraphrase: В проекте трехлетнего бюджета обнаружилась "дыра" в 250 млрд руб.', 'paraphrase: Владимир Путин поздравил актера Владимира Этуша с 93-летием', 'paraphrase: Ну ка признавайся как ты ко мне относишься', 'paraphrase: обожаю тебя уже а ты обо мне хоть что нибудь знаешь', 'paraphrase: Полиция задержала водителя микроавтобуса, сгоревшего под Самарой.', 'paraphrase: Полиция провела более 20 обысков в московских банках.', 'paraphrase: Взрыв в иракском кафе унес жизни 38 человек.', 'paraphrase: Есть ли у тебя дети?', 'paraphrase: Тебе нравится человечество?', 'paraphrase: Что ты делала в моё отсутствие?', 'paraphrase: После опрокидывания автобуса в Тюменской области ранены 14 человек', 'paraphrase: Спроси у меня что нибудь!', 'paraphrase: Омские приставы избили полицейского.', 'paraphrase: Тебе нравится читать или ты ненавидишь это делать?', 'paraphrase: США исключили Кубу из списка стран-спонсоров терроризма', 'paraphrase: Депутатам разрешили обходиться без присяги на вер

Validation: 100%|██████████| 26/26 [00:20<00:00,  1.41it/s]


inputs ['paraphrase: у меня есть любимая собака', 'paraphrase: какая у тебя любимая марка машины?']
generated_paraphrases ['Тема: у меня есть любимая собака', 'Вопрос: какая у вас любимая марка машины?']
targets ['у меня есть гавкающее животное', 'Слушай какая у тебя любимая марка машины?']


Validation: 100%|██████████| 26/26 [00:20<00:00,  1.25it/s]


Validation Avg BLEU Score for Epoch 2: 0.0010845472663644565

Training...


Epoch 3/5:   0%|          | 0/226 [00:00<?, ?it/s]


Checkpoint...


Epoch 3/5:  18%|█▊        | 40/226 [01:44<07:57,  2.57s/it, Batch Loss=2.18, Avg Loss=2.23]


Checkpoint...


Epoch 3/5:  35%|███▌      | 80/226 [03:25<04:50,  1.99s/it, Batch Loss=2.26, Avg Loss=2.23]


Checkpoint...


Epoch 3/5:  53%|█████▎    | 120/226 [05:13<03:27,  1.96s/it, Batch Loss=2.22, Avg Loss=2.23]


Checkpoint...


Epoch 3/5:  71%|███████   | 160/226 [07:01<02:56,  2.68s/it, Batch Loss=2.32, Avg Loss=2.23]


Checkpoint...


Epoch 3/5:  88%|████████▊ | 200/226 [08:38<00:53,  2.05s/it, Batch Loss=2.23, Avg Loss=2.23]


Checkpoint...


Epoch 3/5: 100%|██████████| 226/226 [09:50<00:00,  2.61s/it, Batch Loss=2.16, Avg Loss=2.22]


Epoch 3/5, Avg Loss: 2.2227488793997474

Running Validation...


Validation:   4%|▍         | 1/26 [00:01<00:30,  1.21s/it]


inputs ['paraphrase: Полиция США арестовала узбека по подозрению в терроризме.', 'paraphrase: У тебя есть любимый человек?', 'paraphrase: В роддоме какой страны ты родилась?', 'paraphrase: ЧТО ТЫ ЛЮБИШЬ ПИТЬ НАПИТКИ', 'paraphrase: Здравствуйте можно узнать как у вас прошли выходные', 'paraphrase: Российские хакеры получили доступ к электронной переписке Обамы', 'paraphrase: Закон о "резиновых квартирах" принят депутатами в первом чтении.', 'paraphrase: что ты делала пока меня не было', 'paraphrase: Отметим твой день рождения', 'paraphrase: купи пожалуйста абонемент в бассейн', 'paraphrase: Националисты предупредили мэрию о "Русском марше" в Люблино.', 'paraphrase: а научился ли ты в институте например', 'paraphrase: В Туве автомобиль насмерть сбил четырех человек на остановке.', 'paraphrase: а как ты ко мне относишься', 'paraphrase: Пожар в офисном здании в центре Москвы потушен', 'paraphrase: Какое твое любимое приложение в телефоне']
generated_paraphrases ['- Полиция США арестовала 

Validation:   8%|▊         | 2/26 [00:02<00:24,  1.02s/it]


inputs ['paraphrase: Нидерландского дипломата осудили на 12 лет за шпионаж в пользу России.', 'paraphrase: Грузинский фильм о чеченской войне получил награду в Локарно.', 'paraphrase: скажи какой цвет тебе больше всего нравится', 'paraphrase: Прокуроры представили доказательства вины "узников Болотной".', 'paraphrase: Четверо альпинистов погибли в Шотландии из-за схода лавины.', 'paraphrase: В Москве арестован таджикский бандит Сталин.', 'paraphrase: Собянин: С выборов мэра Москвы никого снимать не нужно.', 'paraphrase: Концерн "Алмаз-Антей" обжаловал санкции, введенные против компании ЕС', 'paraphrase: Я люблю играть симфонии на фортепиано', 'paraphrase: В Лондоне вертолет столкнулся со строительным краном и разбился.', 'paraphrase: Хотелось бы знать в чем смысл жизни', 'paraphrase: Сотрудники карельского музея "Кижи" выступили против нового руководства.', 'paraphrase: СКР просит о заочном аресте "белгородского стрелка".', 'paraphrase: Бетин назначен замминистра строительства и ЖКХ Р

Validation:  12%|█▏        | 3/26 [00:02<00:21,  1.09it/s]


inputs ['paraphrase: соскучилась ли ты по моему голосу', 'paraphrase: какое у тебя любимое мобильное приложение для рисования', 'paraphrase: Гус Хиддинк ушел с поста главного тренера ФК "Анжи".', 'paraphrase: А ен мог ли бы ты подбросить монетку', 'paraphrase: Костюм Скарлетт из "Унесенных ветром" продан за 137 тысяч долларов', 'paraphrase: Есть ли у тебя образование?', 'paraphrase: Как тебя можно величать?', 'paraphrase: мне совершенно не хочется идти на работу в субботу', 'paraphrase: Какие планы на новый год?', 'paraphrase: Число жертв землетрясения в Непале достигло 3218', 'paraphrase: любимое приложение какое', 'paraphrase: В США скончался основатель группы Slayer Джефф Ханнеман.', 'paraphrase: какая будет твоя реакция если я приглашу тебя сегодня на свидание', 'paraphrase: Генпрокуратура сочла Мадонну и Леди Гагу нелегальными гастарбайтерами.', 'paraphrase: Что ты понимаешь под словом любовь', 'paraphrase: Маркин: Васильева сможет реализовать свой потенциал в жанре "шансон"']
ge

Validation:  15%|█▌        | 4/26 [00:03<00:18,  1.16it/s]


inputs ['paraphrase: какой подарок ты хочешь купить?', 'paraphrase: какие у тебя планы на завтра на работе', 'paraphrase: Путин изменил закон о митингах, шествиях и пикетах', 'paraphrase: почему ты такая грустная?', 'paraphrase: У тебя есть вторая половина', 'paraphrase: Такая плохая погода и мне так не хочется идти на работу', 'paraphrase: Определена дата референдума о независимости Шотландии.', 'paraphrase: Вода из прорванного трубопровода затопила Дмитровское шоссе.', 'paraphrase: Расскажи мне пожалуйста в чём у тебя смысл жизни', 'paraphrase: Мост между Канадой и США назовут в честь хоккеиста Горди Хоу', 'paraphrase: Осужденному за взрыв на Манежной площади отменили приговор.', 'paraphrase: А у тебя хорошее чувство юмора?', 'paraphrase: Литва заморозила счета российских чиновников из "списка Магнитского".', 'paraphrase: приглашаю тебя на свидание в театр', 'paraphrase: в какой стране тебя изобрели', 'paraphrase: Убийство солдата в Лондоне: задержан девятый подозреваемый.']
generat

Validation:  19%|█▉        | 5/26 [00:04<00:16,  1.25it/s]


inputs ['paraphrase: мечтаешь о чем то братуха', 'paraphrase: Премьер Таиланда объявила о роспуске парламента.', 'paraphrase: Дука: Косово примут в ФИФА и УЕФА в 2016 году', 'paraphrase: На саратовского дебошира с борта самолета Москва - Хургада заведено дело.', 'paraphrase: что такое любовь ответь?', 'paraphrase: есть ли у тебя собака', 'paraphrase: Депутат: взрыв у офиса партии "Свобода" произошел в Одессе', 'paraphrase: Я вообще не хочу идти ни на какую работу', 'paraphrase: Ты шутишь или правду говоришь?', 'paraphrase: Вице-президент Еврокомиссии бойкотирует Олимпиаду в Сочи.', 'paraphrase: Что интересного делала сегодня пока меня не было?', 'paraphrase: что бы ты хотел получить', 'paraphrase: У тебя есть чувство юмора?', 'paraphrase: На Камчатке заключенного освободили в обмен на 200 шапок.', 'paraphrase: Полиция: дело Бойцова закроют после разговора следователей с боксером', 'paraphrase: какая марка машины твоя любимая?']
generated_paraphrases ['Для краткого: ты о чем-то мечтаеш

Validation:  23%|██▎       | 6/26 [00:05<00:15,  1.29it/s]


inputs ['paraphrase: Добыча сланцевой нефти принесла Shell убытки в 2,1 млрд долл.', 'paraphrase: Что из музыки тебе нравится больше всего?', 'paraphrase: я люблю тебя больше всего на свете', 'paraphrase: о чем ты сейчас думаешь', 'paraphrase: мне скучно скажи чем заняться', 'paraphrase: Россия построит для Ирана новые С-300, а не возьмет из наличия', 'paraphrase: У тебя есть любимый?', 'paraphrase: "Болотное дело": в СКР на допрос ждут блогера Митю Алешковского.', 'paraphrase: В московском отделе полиции повесился задержанный.', 'paraphrase: ТЫ МАЛЬЧИК ИЛИ ДЕВОЧКА', 'paraphrase: ты можешь предсказать что со мной случится в будущем', 'paraphrase: пропавший самолет-заправщик ВВС США нашелся в Британии', 'paraphrase: Колонна МЧС с гумпомощью и подарками для ветеранов выехала в Донбасс', 'paraphrase: Какую музыку ты предпочитаешь?', 'paraphrase: Что любишь выпить братан?', 'paraphrase: При пожаре в Рижском замке пострадали реликвии.']
generated_paraphrases ['Тема: Нефтяная добыча принесл

Validation:  27%|██▋       | 7/26 [00:05<00:15,  1.23it/s]


inputs ['paraphrase: МЧС Тувы: Найдено тело последнего из 6 подростков, погибших под лавиной.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: какой твой любимый цвет', 'paraphrase: США получат $1,4 млрд за аварию на нефтяной платформе в Мексиканском заливе.', 'paraphrase: Спокойной ночи тебе и хороших снов', 'paraphrase: Госдума окончательно запретила чиновникам иметь зарубежные счета.', 'paraphrase: Как ты будешь встречать Новый Год?', 'paraphrase: Премию Политковской получила девочка, раненная талибами.', 'paraphrase: у тебя есть друзья дома в городе и каком', 'paraphrase: Адвокат: Арест зарубежных счетов Е.Васильевой – абсурд.', 'paraphrase: как ты думаешь в чем смысл жизни', 'paraphrase: Из чего ты состоишь', 'paraphrase: Репетиция парада Победы началась в Донецке', 'paraphrase: Россия экспортирует программное обеспечение на 5 млрд долл.', 'paraphrase: Олег Тиньков приобрел датскую велокоманду.', 'paraphrase: Сильный взрыв в Праге: 55 пострада

Validation:  31%|███       | 8/26 [00:06<00:14,  1.26it/s]


inputs ['paraphrase: В Мали режим чрезвычайного положения продлили на 3 месяца.', 'paraphrase: Какое мобильное приложение тебе нравится?', 'paraphrase: Какая погода тебе нравиться мой друг', 'paraphrase: BMW отложила решение о строительстве завода в России', 'paraphrase: В горах Пакистана пропала группа российских туристов.', 'paraphrase: Скончался маршал Советского Союза Виктор Куликов.', 'paraphrase: Ты что-то испытываешь ко мне?', 'paraphrase: а у меня собака есть', 'paraphrase: Оппозиция уведомила мэрию Москвы о проведении "Марша против палачей".', 'paraphrase: Франция получила доказательства применения химоружия в Сирии.', 'paraphrase: В конгрессе США пришли к соглашению по бюджету.', 'paraphrase: В Чили эксгумировали останки поэта Пабло Неруды.', 'paraphrase: Адвокат опроверг информацию о попытке суицида продюсера Витаса.', 'paraphrase: Двух американских адмиралов отстранили из-за подозрений в коррупции.', 'paraphrase: дорогая ты скучала по мне', 'paraphrase: А почему ты грустиш

Validation:  35%|███▍      | 9/26 [00:07<00:13,  1.26it/s]


inputs ['paraphrase: Нобелевская премия по физике досталась первооткрывателям бозона Хиггса.', 'paraphrase: Я так на работу идти не хочу', 'paraphrase: Выпьем чашечку кофе?', 'paraphrase: За приз Венецианского кинофестиваля поборется "Мой друг Иван Лапшин".', 'paraphrase: Вы согласитесь стать моей женой?', 'paraphrase: Главным редактором "Коммерсантъ FM" назначен Константин Эггерт.', 'paraphrase: любишь ли ты животных', 'paraphrase: ты сейчас о чём-то думаешь', 'paraphrase: Какое мобильное приложение ты предпочитаешь?', 'paraphrase: По факту ДТП под Псковом возбуждено уголовное дело.', 'paraphrase: Куда ты хотел бы поехать?', 'paraphrase: Что для тебя счастье', 'paraphrase: В Москве 2 упавших столба перекрыли движение по Профсоюзной улице.', 'paraphrase: Главным кремлевским борцом с коррупцией назначен Олег Плохой.', 'paraphrase: я в ссоре с очень близким человеком', 'paraphrase: как планируешь отметить Новый год?']
generated_paraphrases ['Для примера: Нобелевская премия по физике пол

Validation:  38%|███▊      | 10/26 [00:08<00:12,  1.30it/s]


inputs ['paraphrase: Свободен ли ты в выходные дни', 'paraphrase: Подкинь монетку в воздух', 'paraphrase: Куда хотелось ты тебе отправится?', 'paraphrase: По факту крушения поезда на Кубани возбуждено дело.', 'paraphrase: "Бой идет не ради славы": В Москве открыли памятник А.Твардовскому.', 'paraphrase: Скончалась балерина Майя Плисецкая', 'paraphrase: соскучилась ли ты по отношениям', 'paraphrase: В аэропорту Киева задержан бывший премьер Таджикистана.', 'paraphrase: Тина Тернер отказалась от американского гражданства.', 'paraphrase: я тебе нравлюсь или нет?', 'paraphrase: Командующий войсками ЗВО: Против России начата гибридная война', 'paraphrase: какой у тебя любимый цвет моего автомобиля', 'paraphrase: У Деми Мур похитили одежду на 200 тысяч долларов', 'paraphrase: Тебе знакомо откуда берутся дети?', 'paraphrase: Когда день рождения у тебя', 'paraphrase: "Атака века", предпринятая хакерами, затормозила Интернет.']
generated_paraphrases ['Вопрос: Вы свободны в выходные дни?', 'Тем

Validation:  42%|████▏     | 11/26 [00:09<00:11,  1.29it/s]


inputs ['paraphrase: Французские и малийские военнослужащие выбили исламистов из Тимбукту.', 'paraphrase: Ты что учишься искать фильмы?', 'paraphrase: Что ты сказала? я не расслышала', 'paraphrase: Роберт Мугабе переизбран президентом Зимбабве.', 'paraphrase: Расскажи ка где ты живешь', 'paraphrase: Брось монетку чтобы решить вопрос', 'paraphrase: Интересно соскучилась ли ты по мне', 'paraphrase: СМИ сообщили о новом деле по факту хищений в Мособлбанке на 70 млрд руб.', 'paraphrase: Президент РФ предложил трудоустраивать мигрантов по патентам.', 'paraphrase: В Германии проходят парламентские выборы.', 'paraphrase: Чем любишь заниматься в выходные', 'paraphrase: Умер режиссер Алексей Балабанов.', 'paraphrase: А какое у вас хобби', 'paraphrase: Что составило твои дела в моё отсутствие?', 'paraphrase: у тебя есть какой нибудь любимый цвет', 'paraphrase: Попробуешь угадать что меня ждет в будущем?']
generated_paraphrases ['- Французские и малийские военные выбили исламистов из Тимбукту.',

Validation:  46%|████▌     | 12/26 [00:09<00:10,  1.33it/s]


inputs ['paraphrase: Какой цвет ты любишь?', 'paraphrase: Как у тебя дела на личном пространстве?', 'paraphrase: Путин ратифицировал соглашение о поставках газа в Китай', 'paraphrase: Чем ты занимался на выходных', 'paraphrase: Что ты делаешь в выходные до обеда?', 'paraphrase: Что у тебя спрашивали пока меня не было?', 'paraphrase: ты относишься ко мне хорошо?', 'paraphrase: Будем вместе навсегда!', 'paraphrase: США просят РФ немедленно отменить запрет на ввоз мяса.', 'paraphrase: В КНДР казнили дядю национального лидера.', 'paraphrase: В Японии успешно прошли испытания обновленного "Лайнера мечты".', 'paraphrase: о да у меня есть кошка и я ее люблю', 'paraphrase: Великобритания инвестирует в экономику Кубы 400 миллионов долларов', 'paraphrase: У вас есть постоянный партнер', 'paraphrase: твой смысл жизни в чем заключается', 'paraphrase: Есть планы на новый год']
generated_paraphrases ['Тема: Какой цвет ты любишь?', 'Вопрос: Как у вас дела в личном пространстве?', 'Путин ратифицирова

Validation:  50%|█████     | 13/26 [00:10<00:09,  1.35it/s]


inputs ['paraphrase: СКР: Бастующие офицеры ФСБ - вымышленные персонажи.', 'paraphrase: Что ты пьёшь из любимых напитков?', 'paraphrase: Есть ли у тебя среднее образование?', 'paraphrase: какое у вас образование', 'paraphrase: куда бы ты хотел съездить в путешествие', 'paraphrase: какой цвет ты любишь оттенок', 'paraphrase: Президент присвоил главе ФМС ранг министра.', 'paraphrase: могу я узнать ваше имя', 'paraphrase: ООН: крушение судна в Средиземном море унесло жизни 800 мигрантов', 'paraphrase: Экс-глава Тамбовской области Бетин назначен замминистра ЖКХ России', 'paraphrase: Глава Крыма облетел сельхозугодья республики на воздушном шаре', 'paraphrase: Танк "Армата" прошел по Красной площади', 'paraphrase: Президент Кипра лишил себя четвертой части зарплаты.', 'paraphrase: Какой жанр музыки ты любишь слушать?', 'paraphrase: Скончался легенда блюза Би Би Кинг', 'paraphrase: НАТО более чем вдвое увеличит численность сил реагирования']
generated_paraphrases ['Тема: СКР: Бастующие офиц

Validation:  54%|█████▍    | 14/26 [00:11<00:09,  1.26it/s]


inputs ['paraphrase: Авиакомпания Red Wings продана за 1 рубль.', 'paraphrase: Ушел из жизни британский скульптор Энтони Каро.', 'paraphrase: В Минобороны Грузии обнаружили финансовые нарушения.', 'paraphrase: Можно поинтересоваться как у вас прошли выходные', 'paraphrase: Подмосковный чиновник оштрафован почти на 1 млрд руб. за взяточничество.', 'paraphrase: догадайся сколько мне лет?', 'paraphrase: Расскажи мне пожалуйста о себе', 'paraphrase: Число жертв теракта в Волгограде выросло до семи человек.', 'paraphrase: СК выяснит, был ли подкуп свидетеля по делу Ю.Буданова.', 'paraphrase: Минобразования сократит количество специальностей в вузах в 5 раз.', 'paraphrase: Протестующие в Таиланде прорвались в штаб-квартиру армии.', 'paraphrase: По жалобе пенсионерки из прямой линии Путина возбуждено дело.', 'paraphrase: Россия и Иран могут реализовать бартерную сделку', 'paraphrase: Президент Сербии извинился за бойню в Сребренице.', 'paraphrase: В Санкт-Петербурге произошла массовая драка:

Validation:  58%|█████▊    | 15/26 [00:12<00:09,  1.20it/s]


inputs ['paraphrase: Нападающий ХК "Салават Юлаев" Сергей Зиновьев дисквалифицирован на четыре матча.', 'paraphrase: состоишь ли ты в отношениях', 'paraphrase: Медведев подписал соглашение о ЗСТ между ЕАЭС и Вьетнамом', 'paraphrase: Премьер Японии получил приглашение РФ на празднование 70-летия Победы', 'paraphrase: Опубликовано видео захвата судна Arctic Sunrise сотрудниками ФСБ.', 'paraphrase: Нарышкин: уроки Первой и Второй мировых войн плохо усвоены политиками', 'paraphrase: Расскажи мне где ты живешь?', 'paraphrase: В Петербурге скончался кинорежиссер Алексей Герман - старший.', 'paraphrase: Президент Украины подписал закон о моратории на выплату внешних долгов', 'paraphrase: ИГ казнило в Пальмире 20 человек на руинах древнеримского театра', 'paraphrase: Представители ЕС подтвердили выделение Кипру 10 млрд евро.', 'paraphrase: Ты любишь путешествовать?', 'paraphrase: Какие сладости тебе не нравятся?', 'paraphrase: По меньшей мере четыре человека стали жертвами землетрясений в Неп

Validation:  62%|██████▏   | 16/26 [00:13<00:08,  1.24it/s]


inputs ['paraphrase: Россия облегчила условия погашения кредита для Кипра.', 'paraphrase: Правозащитники из Чувашии попросили Генпрокуратуру проверить Минюст.', 'paraphrase: Сенаторы разрешили США поставлять оружие сирийским повстанцам.', 'paraphrase: угадай сколько мне лет', 'paraphrase: Коалиция арабских стран завершила военную операцию в Йемене', 'paraphrase: Минтруд обсудит идею внесения личного взноса на накопительную пенсию', 'paraphrase: на новый год ты уже что-то запланировал', 'paraphrase: На что ты мне намекаешь?', 'paraphrase: Как ты считаешь что такое счастье', 'paraphrase: любишь ли ты путешествовать', 'paraphrase: Варшава отказалась платить за разгром российского посольства.', 'paraphrase: я поссорилась с любимым что делать', 'paraphrase: А ты любишь животных или нет?', 'paraphrase: Сенат Франции разрешил однополые браки.', 'paraphrase: Число пострадавших при аварии парома в Нью-Йорке выросло до 74.', 'paraphrase: какое у тебя образование?']
generated_paraphrases ['Для к

Validation:  65%|██████▌   | 17/26 [00:13<00:06,  1.31it/s]


inputs ['paraphrase: Подскажи мне откуда дети берутся?', 'paraphrase: Как много ты получаешь в месяц', 'paraphrase: Считаешь ли ты себя красивым?', 'paraphrase: На выборах в Армении с большим отрывом побеждает действующий президент.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: Ты принадлежишь к какому полу?', 'paraphrase: В какой стране ты был создан?', 'paraphrase: Более 20 мирных жителей погибли при авиаударах коалиции в Йемене', 'paraphrase: Полиция вновь начала задерживать митингующих в Балтиморе', 'paraphrase: Я хочу знать какой твой самый любимый цвет', 'paraphrase: у тебя есть женщина?', 'paraphrase: Взрыв газа в Красноярске: семеро пострадавших.', 'paraphrase: Самой влиятельной женщиной России признали В.Матвиенко.', 'paraphrase: Полина Гагарина выступила в финале "Евровидения-2015"', 'paraphrase: В Йемене взорван главный нефтепровод страны.', 'paraphrase: Итальянская Generali удвоит долю в "Ингосстрахе".']
generated_paraphrases ['Вопро

Validation:  69%|██████▉   | 18/26 [00:14<00:06,  1.29it/s]


inputs ['paraphrase: Подкинь монетку чтобы выпал орел', 'paraphrase: не люблю свою работу и не хочу туда идти', 'paraphrase: Алексей Навальный стал председателем "Народного альянса".', 'paraphrase: Самолет Lufthansa вернулся в аэропорт Стамбула из-за угрозы взрыва', 'paraphrase: думаешь ли ты что являешься личностью', 'paraphrase: скажи в каком месяце твой день рождение', 'paraphrase: расскажи о моем дальнейшем будущем', 'paraphrase: Глав Газпрома и "Роснефти" обяжут отказаться от счетов за границей.', 'paraphrase: Куда бы ты хотел уехать завтра?', 'paraphrase: Ты знаешь откуда берутся дети?', 'paraphrase: «Газпрому» посоветовали изучить «50 оттенков серого» для переговоров с ЕС', 'paraphrase: Ты считаешь себя достаточно знающим в этом вопросе?', 'paraphrase: Посвящен ли ты в тайну- откуда берутся дети?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: Занимался ли ты сексом?', 'paraphrase: ты вообще любишь музыку']
generated_paraphras

Validation:  73%|███████▎  | 19/26 [00:15<00:05,  1.21it/s]


inputs ['paraphrase: В Москве можно будет забронировать место на кладбище через интернет.', 'paraphrase: Дочь Шарля де Голля скончалась во Франции.', 'paraphrase: Операция в ТЦ в Найроби завершена.', 'paraphrase: Куда бы ты отправился летом?', 'paraphrase: ты можешь угадать мой точный возраст', 'paraphrase: ОТР сняло с эфира программу после шутки про развод В.Путина.', 'paraphrase: Какую погоду ты больше всего ненавидишь?', 'paraphrase: У тебя очень приятный голос', 'paraphrase: Ты считаешь себя сообразительным?', 'paraphrase: какой у тебя любимый цвет моих волос', 'paraphrase: Жорес Алферов выдвинут кандидатом на пост президента РАН.', 'paraphrase: Порошенко: в Донбассе введут военное положение при атаке на силовиков', 'paraphrase: Прокуратура: Поджоги церквей в Татарстане - это теракты.', 'paraphrase: расскажи мне где ты живешь или где бы ты хотел', 'paraphrase: Какая твоя самая главная мечта?', 'paraphrase: о чем ты сейчас думаешь?']
generated_paraphrases ['Тема: В Москве можно буд

Validation:  77%|███████▋  | 20/26 [00:16<00:05,  1.12it/s]


inputs ['paraphrase: Россияне все чаще "забывают" оплачивать кредиты.', 'paraphrase: Михаэль Шумахер попал в больницу с травмой черепа.', 'paraphrase: Какие у тебя есть хобби?', 'paraphrase: Скончался ведущий артист Малого театра Ярослав Барышев.', 'paraphrase: У певицы Шакиры и футболиста Жерара Пике родился сын.', 'paraphrase: Какие головоломки любишь?', 'paraphrase: На комплексе Байконур вскрыли хищение 15 млн руб.', 'paraphrase: расскажи мне все о себе немедленно!', 'paraphrase: Ты считаешь себя профессионалом в этом деле?', 'paraphrase: В Петербурге задержали похитителей часов на 21 миллион', 'paraphrase: СКР завел дело о торговле в США усыновленными российскими детьми.', 'paraphrase: А где вы появились на свет?', 'paraphrase: "Указующий человек" Джакометти стал самой дорогой скульптурой в мире', 'paraphrase: Китай вошел в топ-5 продавцов оружия.', 'paraphrase: Пушков: России и ЕС нельзя сводить отношения к украинскому кризису', 'paraphrase: Суд приговорил экс-президента Египта Х

Validation:  81%|████████  | 21/26 [00:17<00:04,  1.15it/s]


inputs ['paraphrase: Что ты собираешься делать в канун Нового года?', 'paraphrase: Жан-Мари Ле Пен отказывается уходить на политическую пенсию', 'paraphrase: Сотни инструкторов Пентагона отправились тренировать сирийскую оппозицию', 'paraphrase: Консультации по Сирии начинаются в Женеве под эгидой ООН', 'paraphrase: Землетрясение в Таджикистане разрушило сотни домов.', 'paraphrase: есть ли у тебя брат или сестра настоящие', 'paraphrase: Минобрнауки утвердило новую форму студенческого билета и зачетной книжки.', 'paraphrase: Я не сделала задание преподавателя и не хочу из-за этого идти в институт', 'paraphrase: МВД ДНР: праздничные мероприятия в Донецке проходят без происшествий', 'paraphrase: Я поссорилась с близким человеком', 'paraphrase: Закон о реформе РАН принят во втором чтении.', 'paraphrase: Как думаешь в чем смысл жизни?', 'paraphrase: СК завершил расследование дела о крушении "Булгарии".', 'paraphrase: почему ты такой грустный?', 'paraphrase: Я умею хорошо играть на гитаре',

Validation:  85%|████████▍ | 22/26 [00:18<00:03,  1.14it/s]


inputs ['paraphrase: О чем ты сейчас задумался?', 'paraphrase: умеешь ли ты разговаривать как человек?', 'paraphrase: Всегда интересовало какого ты пола', 'paraphrase: Чемпионка России по пауэрлифтингу получила 7 лет за убийство.', 'paraphrase: В Риме скончался режиссер культового сериала "Спрут" Д.Дамиани.', 'paraphrase: Расскажи о себе немного информации', 'paraphrase: можно с тобой поговорить сейчас', 'paraphrase: Конституционный суд разрешил россиянам обжаловать итоги выборов.', 'paraphrase: В Самарской области на военных складах прогремели взрывы.', 'paraphrase: В Японии произошел пожар в больнице: 10 погибших.', 'paraphrase: Посольство РФ: Украина препятствует встрече с задержанными россиянами', 'paraphrase: Китай на 5 лет запретил строительство новых административных зданий.', 'paraphrase: Из чего ты состоишь расскажи?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: В ЦАР лидер повстанцев объявил себя президентом.', 'paraphras

Validation:  88%|████████▊ | 23/26 [00:18<00:02,  1.20it/s]


inputs ['paraphrase: какое мероприятие ты хотел бы посетить?', 'paraphrase: Что ты делал на выходных?', 'paraphrase: Власти Китая приговорили тибетского монаха к смертной казни.', 'paraphrase: скажи а ты веришь в бога', 'paraphrase: Эквадор провел международный день против загрязнения компанией Chevron', 'paraphrase: В какой стране ты родился?', 'paraphrase: "Протон-М" с европейским спутником связи стартовал с "Байконура"', 'paraphrase: ЮНИСЕФ: Непалу угрожает холера из-за антисанитарии после землетрясения', 'paraphrase: Украинские силовики сообщили о гибели трех военных за сутки в Донбассе', 'paraphrase: ты знаешь кто тебя создал', 'paraphrase: Причиной пожара в аэропорту Рима стало короткое замыкание', 'paraphrase: Где ты живешь в последнее время', 'paraphrase: Какой у тебя любимый напиток', 'paraphrase: Ты очень мне симпатизируешь', 'paraphrase: какие у тебя планы на воскресенье', 'paraphrase: Супруга Михаэля Шумахера продала личный самолет стоимостью 34 млн евро']
generated_paraph

Validation:  92%|█████████▏| 24/26 [00:19<00:01,  1.24it/s]


inputs ['paraphrase: Спи сладко этой ночью', 'paraphrase: какой ваш любимый цвет', 'paraphrase: Что ты сказала повторить не слышно', 'paraphrase: Яценюк недоволен встречей Джона Керри с Путиным в Сочи', 'paraphrase: Пираты освободили корабль, захваченный в Гвинейском заливе.', 'paraphrase: Поездки японцев на Курилы возобновятся с конца мая', 'paraphrase: скажи ты знаешь что у меня есть собака', 'paraphrase: моя жизнь бесцельна и запутана', 'paraphrase: Лавров и Могерини обсудили отношения России и Евросоюза', 'paraphrase: Люблю больше жизни тебя', 'paraphrase: Биржевой курс доллара опустился ниже 53 руб.', 'paraphrase: Делегация палестинских переговорщиков с Израилем ушла в отставку.', 'paraphrase: в чем смысл жизни и как ее прожить', 'paraphrase: А у тебя уже есть детишки?', 'paraphrase: Подбрось монетку в воздух', 'paraphrase: Китайским чиновникам запретили курить в общественных местах.']
generated_paraphrases ['Для того чтобы я сказал: ѕспи сладко этой ночью', 'Для расчета: какой ц

Validation:  96%|█████████▌| 25/26 [00:20<00:00,  1.29it/s]


inputs ['paraphrase: В проекте трехлетнего бюджета обнаружилась "дыра" в 250 млрд руб.', 'paraphrase: Владимир Путин поздравил актера Владимира Этуша с 93-летием', 'paraphrase: Ну ка признавайся как ты ко мне относишься', 'paraphrase: обожаю тебя уже а ты обо мне хоть что нибудь знаешь', 'paraphrase: Полиция задержала водителя микроавтобуса, сгоревшего под Самарой.', 'paraphrase: Полиция провела более 20 обысков в московских банках.', 'paraphrase: Взрыв в иракском кафе унес жизни 38 человек.', 'paraphrase: Есть ли у тебя дети?', 'paraphrase: Тебе нравится человечество?', 'paraphrase: Что ты делала в моё отсутствие?', 'paraphrase: После опрокидывания автобуса в Тюменской области ранены 14 человек', 'paraphrase: Спроси у меня что нибудь!', 'paraphrase: Омские приставы избили полицейского.', 'paraphrase: Тебе нравится читать или ты ненавидишь это делать?', 'paraphrase: США исключили Кубу из списка стран-спонсоров терроризма', 'paraphrase: Депутатам разрешили обходиться без присяги на вер

Validation: 100%|██████████| 26/26 [00:20<00:00,  1.56it/s]


inputs ['paraphrase: у меня есть любимая собака', 'paraphrase: какая у тебя любимая марка машины?']
generated_paraphrases ['Тема: у меня есть любимая собака', 'Вопрос: какая у вас любимая марка машины?']
targets ['у меня есть гавкающее животное', 'Слушай какая у тебя любимая марка машины?']


Validation: 100%|██████████| 26/26 [00:20<00:00,  1.24it/s]


Validation Avg BLEU Score for Epoch 3: 0.0010845472663644565

Training...


Epoch 4/5:   0%|          | 0/226 [00:00<?, ?it/s]


Checkpoint...


Epoch 4/5:  18%|█▊        | 40/226 [01:49<09:01,  2.91s/it, Batch Loss=2.32, Avg Loss=2.23]


Checkpoint...


Epoch 4/5:  35%|███▌      | 80/226 [03:37<05:25,  2.23s/it, Batch Loss=2.1, Avg Loss=2.23]


Checkpoint...


Epoch 4/5:  53%|█████▎    | 120/226 [05:19<04:10,  2.36s/it, Batch Loss=2.17, Avg Loss=2.23]


Checkpoint...


Epoch 4/5:  71%|███████   | 160/226 [07:01<02:56,  2.68s/it, Batch Loss=2.18, Avg Loss=2.23]


Checkpoint...


Epoch 4/5:  88%|████████▊ | 200/226 [08:42<00:55,  2.14s/it, Batch Loss=2.08, Avg Loss=2.22]


Checkpoint...


Epoch 4/5: 100%|██████████| 226/226 [09:56<00:00,  2.64s/it, Batch Loss=2.25, Avg Loss=2.22]


Epoch 4/5, Avg Loss: 2.223718263860996

Running Validation...


Validation:   4%|▍         | 1/26 [00:01<00:31,  1.28s/it]


inputs ['paraphrase: Полиция США арестовала узбека по подозрению в терроризме.', 'paraphrase: У тебя есть любимый человек?', 'paraphrase: В роддоме какой страны ты родилась?', 'paraphrase: ЧТО ТЫ ЛЮБИШЬ ПИТЬ НАПИТКИ', 'paraphrase: Здравствуйте можно узнать как у вас прошли выходные', 'paraphrase: Российские хакеры получили доступ к электронной переписке Обамы', 'paraphrase: Закон о "резиновых квартирах" принят депутатами в первом чтении.', 'paraphrase: что ты делала пока меня не было', 'paraphrase: Отметим твой день рождения', 'paraphrase: купи пожалуйста абонемент в бассейн', 'paraphrase: Националисты предупредили мэрию о "Русском марше" в Люблино.', 'paraphrase: а научился ли ты в институте например', 'paraphrase: В Туве автомобиль насмерть сбил четырех человек на остановке.', 'paraphrase: а как ты ко мне относишься', 'paraphrase: Пожар в офисном здании в центре Москвы потушен', 'paraphrase: Какое твое любимое приложение в телефоне']
generated_paraphrases ['- Полиция США арестовала 

Validation:   8%|▊         | 2/26 [00:01<00:22,  1.07it/s]


inputs ['paraphrase: Нидерландского дипломата осудили на 12 лет за шпионаж в пользу России.', 'paraphrase: Грузинский фильм о чеченской войне получил награду в Локарно.', 'paraphrase: скажи какой цвет тебе больше всего нравится', 'paraphrase: Прокуроры представили доказательства вины "узников Болотной".', 'paraphrase: Четверо альпинистов погибли в Шотландии из-за схода лавины.', 'paraphrase: В Москве арестован таджикский бандит Сталин.', 'paraphrase: Собянин: С выборов мэра Москвы никого снимать не нужно.', 'paraphrase: Концерн "Алмаз-Антей" обжаловал санкции, введенные против компании ЕС', 'paraphrase: Я люблю играть симфонии на фортепиано', 'paraphrase: В Лондоне вертолет столкнулся со строительным краном и разбился.', 'paraphrase: Хотелось бы знать в чем смысл жизни', 'paraphrase: Сотрудники карельского музея "Кижи" выступили против нового руководства.', 'paraphrase: СКР просит о заочном аресте "белгородского стрелка".', 'paraphrase: Бетин назначен замминистра строительства и ЖКХ Р

Validation:  12%|█▏        | 3/26 [00:02<00:19,  1.19it/s]


inputs ['paraphrase: соскучилась ли ты по моему голосу', 'paraphrase: какое у тебя любимое мобильное приложение для рисования', 'paraphrase: Гус Хиддинк ушел с поста главного тренера ФК "Анжи".', 'paraphrase: А ен мог ли бы ты подбросить монетку', 'paraphrase: Костюм Скарлетт из "Унесенных ветром" продан за 137 тысяч долларов', 'paraphrase: Есть ли у тебя образование?', 'paraphrase: Как тебя можно величать?', 'paraphrase: мне совершенно не хочется идти на работу в субботу', 'paraphrase: Какие планы на новый год?', 'paraphrase: Число жертв землетрясения в Непале достигло 3218', 'paraphrase: любимое приложение какое', 'paraphrase: В США скончался основатель группы Slayer Джефф Ханнеман.', 'paraphrase: какая будет твоя реакция если я приглашу тебя сегодня на свидание', 'paraphrase: Генпрокуратура сочла Мадонну и Леди Гагу нелегальными гастарбайтерами.', 'paraphrase: Что ты понимаешь под словом любовь', 'paraphrase: Маркин: Васильева сможет реализовать свой потенциал в жанре "шансон"']
ge

Validation:  15%|█▌        | 4/26 [00:03<00:17,  1.25it/s]


inputs ['paraphrase: какой подарок ты хочешь купить?', 'paraphrase: какие у тебя планы на завтра на работе', 'paraphrase: Путин изменил закон о митингах, шествиях и пикетах', 'paraphrase: почему ты такая грустная?', 'paraphrase: У тебя есть вторая половина', 'paraphrase: Такая плохая погода и мне так не хочется идти на работу', 'paraphrase: Определена дата референдума о независимости Шотландии.', 'paraphrase: Вода из прорванного трубопровода затопила Дмитровское шоссе.', 'paraphrase: Расскажи мне пожалуйста в чём у тебя смысл жизни', 'paraphrase: Мост между Канадой и США назовут в честь хоккеиста Горди Хоу', 'paraphrase: Осужденному за взрыв на Манежной площади отменили приговор.', 'paraphrase: А у тебя хорошее чувство юмора?', 'paraphrase: Литва заморозила счета российских чиновников из "списка Магнитского".', 'paraphrase: приглашаю тебя на свидание в театр', 'paraphrase: в какой стране тебя изобрели', 'paraphrase: Убийство солдата в Лондоне: задержан девятый подозреваемый.']
generat

Validation:  19%|█▉        | 5/26 [00:04<00:17,  1.20it/s]


inputs ['paraphrase: мечтаешь о чем то братуха', 'paraphrase: Премьер Таиланда объявила о роспуске парламента.', 'paraphrase: Дука: Косово примут в ФИФА и УЕФА в 2016 году', 'paraphrase: На саратовского дебошира с борта самолета Москва - Хургада заведено дело.', 'paraphrase: что такое любовь ответь?', 'paraphrase: есть ли у тебя собака', 'paraphrase: Депутат: взрыв у офиса партии "Свобода" произошел в Одессе', 'paraphrase: Я вообще не хочу идти ни на какую работу', 'paraphrase: Ты шутишь или правду говоришь?', 'paraphrase: Вице-президент Еврокомиссии бойкотирует Олимпиаду в Сочи.', 'paraphrase: Что интересного делала сегодня пока меня не было?', 'paraphrase: что бы ты хотел получить', 'paraphrase: У тебя есть чувство юмора?', 'paraphrase: На Камчатке заключенного освободили в обмен на 200 шапок.', 'paraphrase: Полиция: дело Бойцова закроют после разговора следователей с боксером', 'paraphrase: какая марка машины твоя любимая?']
generated_paraphrases ['Для краткого: ты о чем-то мечтаеш

Validation:  23%|██▎       | 6/26 [00:05<00:19,  1.05it/s]


inputs ['paraphrase: Добыча сланцевой нефти принесла Shell убытки в 2,1 млрд долл.', 'paraphrase: Что из музыки тебе нравится больше всего?', 'paraphrase: я люблю тебя больше всего на свете', 'paraphrase: о чем ты сейчас думаешь', 'paraphrase: мне скучно скажи чем заняться', 'paraphrase: Россия построит для Ирана новые С-300, а не возьмет из наличия', 'paraphrase: У тебя есть любимый?', 'paraphrase: "Болотное дело": в СКР на допрос ждут блогера Митю Алешковского.', 'paraphrase: В московском отделе полиции повесился задержанный.', 'paraphrase: ТЫ МАЛЬЧИК ИЛИ ДЕВОЧКА', 'paraphrase: ты можешь предсказать что со мной случится в будущем', 'paraphrase: пропавший самолет-заправщик ВВС США нашелся в Британии', 'paraphrase: Колонна МЧС с гумпомощью и подарками для ветеранов выехала в Донбасс', 'paraphrase: Какую музыку ты предпочитаешь?', 'paraphrase: Что любишь выпить братан?', 'paraphrase: При пожаре в Рижском замке пострадали реликвии.']
generated_paraphrases ['Тема: Нефтяная добыча принесл

Validation:  27%|██▋       | 7/26 [00:06<00:17,  1.07it/s]


inputs ['paraphrase: МЧС Тувы: Найдено тело последнего из 6 подростков, погибших под лавиной.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: какой твой любимый цвет', 'paraphrase: США получат $1,4 млрд за аварию на нефтяной платформе в Мексиканском заливе.', 'paraphrase: Спокойной ночи тебе и хороших снов', 'paraphrase: Госдума окончательно запретила чиновникам иметь зарубежные счета.', 'paraphrase: Как ты будешь встречать Новый Год?', 'paraphrase: Премию Политковской получила девочка, раненная талибами.', 'paraphrase: у тебя есть друзья дома в городе и каком', 'paraphrase: Адвокат: Арест зарубежных счетов Е.Васильевой – абсурд.', 'paraphrase: как ты думаешь в чем смысл жизни', 'paraphrase: Из чего ты состоишь', 'paraphrase: Репетиция парада Победы началась в Донецке', 'paraphrase: Россия экспортирует программное обеспечение на 5 млрд долл.', 'paraphrase: Олег Тиньков приобрел датскую велокоманду.', 'paraphrase: Сильный взрыв в Праге: 55 пострада

Validation:  31%|███       | 8/26 [00:07<00:15,  1.15it/s]


inputs ['paraphrase: В Мали режим чрезвычайного положения продлили на 3 месяца.', 'paraphrase: Какое мобильное приложение тебе нравится?', 'paraphrase: Какая погода тебе нравиться мой друг', 'paraphrase: BMW отложила решение о строительстве завода в России', 'paraphrase: В горах Пакистана пропала группа российских туристов.', 'paraphrase: Скончался маршал Советского Союза Виктор Куликов.', 'paraphrase: Ты что-то испытываешь ко мне?', 'paraphrase: а у меня собака есть', 'paraphrase: Оппозиция уведомила мэрию Москвы о проведении "Марша против палачей".', 'paraphrase: Франция получила доказательства применения химоружия в Сирии.', 'paraphrase: В конгрессе США пришли к соглашению по бюджету.', 'paraphrase: В Чили эксгумировали останки поэта Пабло Неруды.', 'paraphrase: Адвокат опроверг информацию о попытке суицида продюсера Витаса.', 'paraphrase: Двух американских адмиралов отстранили из-за подозрений в коррупции.', 'paraphrase: дорогая ты скучала по мне', 'paraphrase: А почему ты грустиш

Validation:  35%|███▍      | 9/26 [00:07<00:14,  1.19it/s]


inputs ['paraphrase: Нобелевская премия по физике досталась первооткрывателям бозона Хиггса.', 'paraphrase: Я так на работу идти не хочу', 'paraphrase: Выпьем чашечку кофе?', 'paraphrase: За приз Венецианского кинофестиваля поборется "Мой друг Иван Лапшин".', 'paraphrase: Вы согласитесь стать моей женой?', 'paraphrase: Главным редактором "Коммерсантъ FM" назначен Константин Эггерт.', 'paraphrase: любишь ли ты животных', 'paraphrase: ты сейчас о чём-то думаешь', 'paraphrase: Какое мобильное приложение ты предпочитаешь?', 'paraphrase: По факту ДТП под Псковом возбуждено уголовное дело.', 'paraphrase: Куда ты хотел бы поехать?', 'paraphrase: Что для тебя счастье', 'paraphrase: В Москве 2 упавших столба перекрыли движение по Профсоюзной улице.', 'paraphrase: Главным кремлевским борцом с коррупцией назначен Олег Плохой.', 'paraphrase: я в ссоре с очень близким человеком', 'paraphrase: как планируешь отметить Новый год?']
generated_paraphrases ['Для примера: Нобелевская премия по физике пол

Validation:  38%|███▊      | 10/26 [00:08<00:12,  1.26it/s]


inputs ['paraphrase: Свободен ли ты в выходные дни', 'paraphrase: Подкинь монетку в воздух', 'paraphrase: Куда хотелось ты тебе отправится?', 'paraphrase: По факту крушения поезда на Кубани возбуждено дело.', 'paraphrase: "Бой идет не ради славы": В Москве открыли памятник А.Твардовскому.', 'paraphrase: Скончалась балерина Майя Плисецкая', 'paraphrase: соскучилась ли ты по отношениям', 'paraphrase: В аэропорту Киева задержан бывший премьер Таджикистана.', 'paraphrase: Тина Тернер отказалась от американского гражданства.', 'paraphrase: я тебе нравлюсь или нет?', 'paraphrase: Командующий войсками ЗВО: Против России начата гибридная война', 'paraphrase: какой у тебя любимый цвет моего автомобиля', 'paraphrase: У Деми Мур похитили одежду на 200 тысяч долларов', 'paraphrase: Тебе знакомо откуда берутся дети?', 'paraphrase: Когда день рождения у тебя', 'paraphrase: "Атака века", предпринятая хакерами, затормозила Интернет.']
generated_paraphrases ['Вопрос: Вы свободны в выходные дни?', 'Тем

Validation:  42%|████▏     | 11/26 [00:09<00:11,  1.28it/s]


inputs ['paraphrase: Французские и малийские военнослужащие выбили исламистов из Тимбукту.', 'paraphrase: Ты что учишься искать фильмы?', 'paraphrase: Что ты сказала? я не расслышала', 'paraphrase: Роберт Мугабе переизбран президентом Зимбабве.', 'paraphrase: Расскажи ка где ты живешь', 'paraphrase: Брось монетку чтобы решить вопрос', 'paraphrase: Интересно соскучилась ли ты по мне', 'paraphrase: СМИ сообщили о новом деле по факту хищений в Мособлбанке на 70 млрд руб.', 'paraphrase: Президент РФ предложил трудоустраивать мигрантов по патентам.', 'paraphrase: В Германии проходят парламентские выборы.', 'paraphrase: Чем любишь заниматься в выходные', 'paraphrase: Умер режиссер Алексей Балабанов.', 'paraphrase: А какое у вас хобби', 'paraphrase: Что составило твои дела в моё отсутствие?', 'paraphrase: у тебя есть какой нибудь любимый цвет', 'paraphrase: Попробуешь угадать что меня ждет в будущем?']
generated_paraphrases ['- Французские и малийские военные выбили исламистов из Тимбукту.',

Validation:  46%|████▌     | 12/26 [00:10<00:10,  1.33it/s]


inputs ['paraphrase: Какой цвет ты любишь?', 'paraphrase: Как у тебя дела на личном пространстве?', 'paraphrase: Путин ратифицировал соглашение о поставках газа в Китай', 'paraphrase: Чем ты занимался на выходных', 'paraphrase: Что ты делаешь в выходные до обеда?', 'paraphrase: Что у тебя спрашивали пока меня не было?', 'paraphrase: ты относишься ко мне хорошо?', 'paraphrase: Будем вместе навсегда!', 'paraphrase: США просят РФ немедленно отменить запрет на ввоз мяса.', 'paraphrase: В КНДР казнили дядю национального лидера.', 'paraphrase: В Японии успешно прошли испытания обновленного "Лайнера мечты".', 'paraphrase: о да у меня есть кошка и я ее люблю', 'paraphrase: Великобритания инвестирует в экономику Кубы 400 миллионов долларов', 'paraphrase: У вас есть постоянный партнер', 'paraphrase: твой смысл жизни в чем заключается', 'paraphrase: Есть планы на новый год']
generated_paraphrases ['Тема: Какой цвет ты любишь?', 'Вопрос: Как у вас дела в личном пространстве?', 'Путин ратифицирова

Validation:  50%|█████     | 13/26 [00:10<00:09,  1.36it/s]


inputs ['paraphrase: СКР: Бастующие офицеры ФСБ - вымышленные персонажи.', 'paraphrase: Что ты пьёшь из любимых напитков?', 'paraphrase: Есть ли у тебя среднее образование?', 'paraphrase: какое у вас образование', 'paraphrase: куда бы ты хотел съездить в путешествие', 'paraphrase: какой цвет ты любишь оттенок', 'paraphrase: Президент присвоил главе ФМС ранг министра.', 'paraphrase: могу я узнать ваше имя', 'paraphrase: ООН: крушение судна в Средиземном море унесло жизни 800 мигрантов', 'paraphrase: Экс-глава Тамбовской области Бетин назначен замминистра ЖКХ России', 'paraphrase: Глава Крыма облетел сельхозугодья республики на воздушном шаре', 'paraphrase: Танк "Армата" прошел по Красной площади', 'paraphrase: Президент Кипра лишил себя четвертой части зарплаты.', 'paraphrase: Какой жанр музыки ты любишь слушать?', 'paraphrase: Скончался легенда блюза Би Би Кинг', 'paraphrase: НАТО более чем вдвое увеличит численность сил реагирования']
generated_paraphrases ['Тема: СКР: Бастующие офиц

Validation:  54%|█████▍    | 14/26 [00:11<00:09,  1.28it/s]


inputs ['paraphrase: Авиакомпания Red Wings продана за 1 рубль.', 'paraphrase: Ушел из жизни британский скульптор Энтони Каро.', 'paraphrase: В Минобороны Грузии обнаружили финансовые нарушения.', 'paraphrase: Можно поинтересоваться как у вас прошли выходные', 'paraphrase: Подмосковный чиновник оштрафован почти на 1 млрд руб. за взяточничество.', 'paraphrase: догадайся сколько мне лет?', 'paraphrase: Расскажи мне пожалуйста о себе', 'paraphrase: Число жертв теракта в Волгограде выросло до семи человек.', 'paraphrase: СК выяснит, был ли подкуп свидетеля по делу Ю.Буданова.', 'paraphrase: Минобразования сократит количество специальностей в вузах в 5 раз.', 'paraphrase: Протестующие в Таиланде прорвались в штаб-квартиру армии.', 'paraphrase: По жалобе пенсионерки из прямой линии Путина возбуждено дело.', 'paraphrase: Россия и Иран могут реализовать бартерную сделку', 'paraphrase: Президент Сербии извинился за бойню в Сребренице.', 'paraphrase: В Санкт-Петербурге произошла массовая драка:

Validation:  58%|█████▊    | 15/26 [00:12<00:08,  1.26it/s]


inputs ['paraphrase: Нападающий ХК "Салават Юлаев" Сергей Зиновьев дисквалифицирован на четыре матча.', 'paraphrase: состоишь ли ты в отношениях', 'paraphrase: Медведев подписал соглашение о ЗСТ между ЕАЭС и Вьетнамом', 'paraphrase: Премьер Японии получил приглашение РФ на празднование 70-летия Победы', 'paraphrase: Опубликовано видео захвата судна Arctic Sunrise сотрудниками ФСБ.', 'paraphrase: Нарышкин: уроки Первой и Второй мировых войн плохо усвоены политиками', 'paraphrase: Расскажи мне где ты живешь?', 'paraphrase: В Петербурге скончался кинорежиссер Алексей Герман - старший.', 'paraphrase: Президент Украины подписал закон о моратории на выплату внешних долгов', 'paraphrase: ИГ казнило в Пальмире 20 человек на руинах древнеримского театра', 'paraphrase: Представители ЕС подтвердили выделение Кипру 10 млрд евро.', 'paraphrase: Ты любишь путешествовать?', 'paraphrase: Какие сладости тебе не нравятся?', 'paraphrase: По меньшей мере четыре человека стали жертвами землетрясений в Неп

Validation:  62%|██████▏   | 16/26 [00:13<00:07,  1.29it/s]


inputs ['paraphrase: Россия облегчила условия погашения кредита для Кипра.', 'paraphrase: Правозащитники из Чувашии попросили Генпрокуратуру проверить Минюст.', 'paraphrase: Сенаторы разрешили США поставлять оружие сирийским повстанцам.', 'paraphrase: угадай сколько мне лет', 'paraphrase: Коалиция арабских стран завершила военную операцию в Йемене', 'paraphrase: Минтруд обсудит идею внесения личного взноса на накопительную пенсию', 'paraphrase: на новый год ты уже что-то запланировал', 'paraphrase: На что ты мне намекаешь?', 'paraphrase: Как ты считаешь что такое счастье', 'paraphrase: любишь ли ты путешествовать', 'paraphrase: Варшава отказалась платить за разгром российского посольства.', 'paraphrase: я поссорилась с любимым что делать', 'paraphrase: А ты любишь животных или нет?', 'paraphrase: Сенат Франции разрешил однополые браки.', 'paraphrase: Число пострадавших при аварии парома в Нью-Йорке выросло до 74.', 'paraphrase: какое у тебя образование?']
generated_paraphrases ['Для к

Validation:  65%|██████▌   | 17/26 [00:13<00:06,  1.33it/s]


inputs ['paraphrase: Подскажи мне откуда дети берутся?', 'paraphrase: Как много ты получаешь в месяц', 'paraphrase: Считаешь ли ты себя красивым?', 'paraphrase: На выборах в Армении с большим отрывом побеждает действующий президент.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: Ты принадлежишь к какому полу?', 'paraphrase: В какой стране ты был создан?', 'paraphrase: Более 20 мирных жителей погибли при авиаударах коалиции в Йемене', 'paraphrase: Полиция вновь начала задерживать митингующих в Балтиморе', 'paraphrase: Я хочу знать какой твой самый любимый цвет', 'paraphrase: у тебя есть женщина?', 'paraphrase: Взрыв газа в Красноярске: семеро пострадавших.', 'paraphrase: Самой влиятельной женщиной России признали В.Матвиенко.', 'paraphrase: Полина Гагарина выступила в финале "Евровидения-2015"', 'paraphrase: В Йемене взорван главный нефтепровод страны.', 'paraphrase: Итальянская Generali удвоит долю в "Ингосстрахе".']
generated_paraphrases ['Вопро

Validation:  69%|██████▉   | 18/26 [00:14<00:06,  1.26it/s]


inputs ['paraphrase: Подкинь монетку чтобы выпал орел', 'paraphrase: не люблю свою работу и не хочу туда идти', 'paraphrase: Алексей Навальный стал председателем "Народного альянса".', 'paraphrase: Самолет Lufthansa вернулся в аэропорт Стамбула из-за угрозы взрыва', 'paraphrase: думаешь ли ты что являешься личностью', 'paraphrase: скажи в каком месяце твой день рождение', 'paraphrase: расскажи о моем дальнейшем будущем', 'paraphrase: Глав Газпрома и "Роснефти" обяжут отказаться от счетов за границей.', 'paraphrase: Куда бы ты хотел уехать завтра?', 'paraphrase: Ты знаешь откуда берутся дети?', 'paraphrase: «Газпрому» посоветовали изучить «50 оттенков серого» для переговоров с ЕС', 'paraphrase: Ты считаешь себя достаточно знающим в этом вопросе?', 'paraphrase: Посвящен ли ты в тайну- откуда берутся дети?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: Занимался ли ты сексом?', 'paraphrase: ты вообще любишь музыку']
generated_paraphras

Validation:  73%|███████▎  | 19/26 [00:15<00:05,  1.30it/s]


inputs ['paraphrase: В Москве можно будет забронировать место на кладбище через интернет.', 'paraphrase: Дочь Шарля де Голля скончалась во Франции.', 'paraphrase: Операция в ТЦ в Найроби завершена.', 'paraphrase: Куда бы ты отправился летом?', 'paraphrase: ты можешь угадать мой точный возраст', 'paraphrase: ОТР сняло с эфира программу после шутки про развод В.Путина.', 'paraphrase: Какую погоду ты больше всего ненавидишь?', 'paraphrase: У тебя очень приятный голос', 'paraphrase: Ты считаешь себя сообразительным?', 'paraphrase: какой у тебя любимый цвет моих волос', 'paraphrase: Жорес Алферов выдвинут кандидатом на пост президента РАН.', 'paraphrase: Порошенко: в Донбассе введут военное положение при атаке на силовиков', 'paraphrase: Прокуратура: Поджоги церквей в Татарстане - это теракты.', 'paraphrase: расскажи мне где ты живешь или где бы ты хотел', 'paraphrase: Какая твоя самая главная мечта?', 'paraphrase: о чем ты сейчас думаешь?']
generated_paraphrases ['Тема: В Москве можно буд

Validation:  77%|███████▋  | 20/26 [00:16<00:04,  1.28it/s]


inputs ['paraphrase: Россияне все чаще "забывают" оплачивать кредиты.', 'paraphrase: Михаэль Шумахер попал в больницу с травмой черепа.', 'paraphrase: Какие у тебя есть хобби?', 'paraphrase: Скончался ведущий артист Малого театра Ярослав Барышев.', 'paraphrase: У певицы Шакиры и футболиста Жерара Пике родился сын.', 'paraphrase: Какие головоломки любишь?', 'paraphrase: На комплексе Байконур вскрыли хищение 15 млн руб.', 'paraphrase: расскажи мне все о себе немедленно!', 'paraphrase: Ты считаешь себя профессионалом в этом деле?', 'paraphrase: В Петербурге задержали похитителей часов на 21 миллион', 'paraphrase: СКР завел дело о торговле в США усыновленными российскими детьми.', 'paraphrase: А где вы появились на свет?', 'paraphrase: "Указующий человек" Джакометти стал самой дорогой скульптурой в мире', 'paraphrase: Китай вошел в топ-5 продавцов оружия.', 'paraphrase: Пушков: России и ЕС нельзя сводить отношения к украинскому кризису', 'paraphrase: Суд приговорил экс-президента Египта Х

Validation:  81%|████████  | 21/26 [00:17<00:03,  1.26it/s]


inputs ['paraphrase: Что ты собираешься делать в канун Нового года?', 'paraphrase: Жан-Мари Ле Пен отказывается уходить на политическую пенсию', 'paraphrase: Сотни инструкторов Пентагона отправились тренировать сирийскую оппозицию', 'paraphrase: Консультации по Сирии начинаются в Женеве под эгидой ООН', 'paraphrase: Землетрясение в Таджикистане разрушило сотни домов.', 'paraphrase: есть ли у тебя брат или сестра настоящие', 'paraphrase: Минобрнауки утвердило новую форму студенческого билета и зачетной книжки.', 'paraphrase: Я не сделала задание преподавателя и не хочу из-за этого идти в институт', 'paraphrase: МВД ДНР: праздничные мероприятия в Донецке проходят без происшествий', 'paraphrase: Я поссорилась с близким человеком', 'paraphrase: Закон о реформе РАН принят во втором чтении.', 'paraphrase: Как думаешь в чем смысл жизни?', 'paraphrase: СК завершил расследование дела о крушении "Булгарии".', 'paraphrase: почему ты такой грустный?', 'paraphrase: Я умею хорошо играть на гитаре',

Validation:  85%|████████▍ | 22/26 [00:18<00:03,  1.22it/s]


inputs ['paraphrase: О чем ты сейчас задумался?', 'paraphrase: умеешь ли ты разговаривать как человек?', 'paraphrase: Всегда интересовало какого ты пола', 'paraphrase: Чемпионка России по пауэрлифтингу получила 7 лет за убийство.', 'paraphrase: В Риме скончался режиссер культового сериала "Спрут" Д.Дамиани.', 'paraphrase: Расскажи о себе немного информации', 'paraphrase: можно с тобой поговорить сейчас', 'paraphrase: Конституционный суд разрешил россиянам обжаловать итоги выборов.', 'paraphrase: В Самарской области на военных складах прогремели взрывы.', 'paraphrase: В Японии произошел пожар в больнице: 10 погибших.', 'paraphrase: Посольство РФ: Украина препятствует встрече с задержанными россиянами', 'paraphrase: Китай на 5 лет запретил строительство новых административных зданий.', 'paraphrase: Из чего ты состоишь расскажи?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: В ЦАР лидер повстанцев объявил себя президентом.', 'paraphras

Validation:  88%|████████▊ | 23/26 [00:18<00:02,  1.25it/s]


inputs ['paraphrase: какое мероприятие ты хотел бы посетить?', 'paraphrase: Что ты делал на выходных?', 'paraphrase: Власти Китая приговорили тибетского монаха к смертной казни.', 'paraphrase: скажи а ты веришь в бога', 'paraphrase: Эквадор провел международный день против загрязнения компанией Chevron', 'paraphrase: В какой стране ты родился?', 'paraphrase: "Протон-М" с европейским спутником связи стартовал с "Байконура"', 'paraphrase: ЮНИСЕФ: Непалу угрожает холера из-за антисанитарии после землетрясения', 'paraphrase: Украинские силовики сообщили о гибели трех военных за сутки в Донбассе', 'paraphrase: ты знаешь кто тебя создал', 'paraphrase: Причиной пожара в аэропорту Рима стало короткое замыкание', 'paraphrase: Где ты живешь в последнее время', 'paraphrase: Какой у тебя любимый напиток', 'paraphrase: Ты очень мне симпатизируешь', 'paraphrase: какие у тебя планы на воскресенье', 'paraphrase: Супруга Михаэля Шумахера продала личный самолет стоимостью 34 млн евро']
generated_paraph

Validation:  92%|█████████▏| 24/26 [00:19<00:01,  1.27it/s]


inputs ['paraphrase: Спи сладко этой ночью', 'paraphrase: какой ваш любимый цвет', 'paraphrase: Что ты сказала повторить не слышно', 'paraphrase: Яценюк недоволен встречей Джона Керри с Путиным в Сочи', 'paraphrase: Пираты освободили корабль, захваченный в Гвинейском заливе.', 'paraphrase: Поездки японцев на Курилы возобновятся с конца мая', 'paraphrase: скажи ты знаешь что у меня есть собака', 'paraphrase: моя жизнь бесцельна и запутана', 'paraphrase: Лавров и Могерини обсудили отношения России и Евросоюза', 'paraphrase: Люблю больше жизни тебя', 'paraphrase: Биржевой курс доллара опустился ниже 53 руб.', 'paraphrase: Делегация палестинских переговорщиков с Израилем ушла в отставку.', 'paraphrase: в чем смысл жизни и как ее прожить', 'paraphrase: А у тебя уже есть детишки?', 'paraphrase: Подбрось монетку в воздух', 'paraphrase: Китайским чиновникам запретили курить в общественных местах.']
generated_paraphrases ['Для того чтобы я сказал: ѕспи сладко этой ночью', 'Для расчета: какой ц

Validation:  96%|█████████▌| 25/26 [00:20<00:00,  1.31it/s]


inputs ['paraphrase: В проекте трехлетнего бюджета обнаружилась "дыра" в 250 млрд руб.', 'paraphrase: Владимир Путин поздравил актера Владимира Этуша с 93-летием', 'paraphrase: Ну ка признавайся как ты ко мне относишься', 'paraphrase: обожаю тебя уже а ты обо мне хоть что нибудь знаешь', 'paraphrase: Полиция задержала водителя микроавтобуса, сгоревшего под Самарой.', 'paraphrase: Полиция провела более 20 обысков в московских банках.', 'paraphrase: Взрыв в иракском кафе унес жизни 38 человек.', 'paraphrase: Есть ли у тебя дети?', 'paraphrase: Тебе нравится человечество?', 'paraphrase: Что ты делала в моё отсутствие?', 'paraphrase: После опрокидывания автобуса в Тюменской области ранены 14 человек', 'paraphrase: Спроси у меня что нибудь!', 'paraphrase: Омские приставы избили полицейского.', 'paraphrase: Тебе нравится читать или ты ненавидишь это делать?', 'paraphrase: США исключили Кубу из списка стран-спонсоров терроризма', 'paraphrase: Депутатам разрешили обходиться без присяги на вер

Validation: 100%|██████████| 26/26 [00:20<00:00,  1.58it/s]


inputs ['paraphrase: у меня есть любимая собака', 'paraphrase: какая у тебя любимая марка машины?']
generated_paraphrases ['Тема: у меня есть любимая собака', 'Вопрос: какая у вас любимая марка машины?']
targets ['у меня есть гавкающее животное', 'Слушай какая у тебя любимая марка машины?']


Validation: 100%|██████████| 26/26 [00:20<00:00,  1.25it/s]


Validation Avg BLEU Score for Epoch 4: 0.0010845472663644565

Training...


Epoch 5/5:   0%|          | 0/226 [00:00<?, ?it/s]


Checkpoint...


Epoch 5/5:  18%|█▊        | 40/226 [01:55<08:41,  2.80s/it, Batch Loss=2.24, Avg Loss=2.2]


Checkpoint...


Epoch 5/5:  35%|███▌      | 80/226 [03:38<04:31,  1.86s/it, Batch Loss=2.26, Avg Loss=2.22]


Checkpoint...


Epoch 5/5:  53%|█████▎    | 120/226 [05:27<03:45,  2.13s/it, Batch Loss=2.17, Avg Loss=2.23]


Checkpoint...


Epoch 5/5:  71%|███████   | 160/226 [07:12<02:29,  2.27s/it, Batch Loss=2.19, Avg Loss=2.23]


Checkpoint...


Epoch 5/5:  88%|████████▊ | 200/226 [08:59<01:08,  2.63s/it, Batch Loss=2.18, Avg Loss=2.22]


Checkpoint...


Epoch 5/5: 100%|██████████| 226/226 [10:07<00:00,  2.69s/it, Batch Loss=2.15, Avg Loss=2.22]


Epoch 5/5, Avg Loss: 2.2223639947567295

Running Validation...


Validation:   4%|▍         | 1/26 [00:01<00:29,  1.20s/it]


inputs ['paraphrase: Полиция США арестовала узбека по подозрению в терроризме.', 'paraphrase: У тебя есть любимый человек?', 'paraphrase: В роддоме какой страны ты родилась?', 'paraphrase: ЧТО ТЫ ЛЮБИШЬ ПИТЬ НАПИТКИ', 'paraphrase: Здравствуйте можно узнать как у вас прошли выходные', 'paraphrase: Российские хакеры получили доступ к электронной переписке Обамы', 'paraphrase: Закон о "резиновых квартирах" принят депутатами в первом чтении.', 'paraphrase: что ты делала пока меня не было', 'paraphrase: Отметим твой день рождения', 'paraphrase: купи пожалуйста абонемент в бассейн', 'paraphrase: Националисты предупредили мэрию о "Русском марше" в Люблино.', 'paraphrase: а научился ли ты в институте например', 'paraphrase: В Туве автомобиль насмерть сбил четырех человек на остановке.', 'paraphrase: а как ты ко мне относишься', 'paraphrase: Пожар в офисном здании в центре Москвы потушен', 'paraphrase: Какое твое любимое приложение в телефоне']
generated_paraphrases ['- Полиция США арестовала 

Validation:   8%|▊         | 2/26 [00:01<00:21,  1.13it/s]


inputs ['paraphrase: Нидерландского дипломата осудили на 12 лет за шпионаж в пользу России.', 'paraphrase: Грузинский фильм о чеченской войне получил награду в Локарно.', 'paraphrase: скажи какой цвет тебе больше всего нравится', 'paraphrase: Прокуроры представили доказательства вины "узников Болотной".', 'paraphrase: Четверо альпинистов погибли в Шотландии из-за схода лавины.', 'paraphrase: В Москве арестован таджикский бандит Сталин.', 'paraphrase: Собянин: С выборов мэра Москвы никого снимать не нужно.', 'paraphrase: Концерн "Алмаз-Антей" обжаловал санкции, введенные против компании ЕС', 'paraphrase: Я люблю играть симфонии на фортепиано', 'paraphrase: В Лондоне вертолет столкнулся со строительным краном и разбился.', 'paraphrase: Хотелось бы знать в чем смысл жизни', 'paraphrase: Сотрудники карельского музея "Кижи" выступили против нового руководства.', 'paraphrase: СКР просит о заочном аресте "белгородского стрелка".', 'paraphrase: Бетин назначен замминистра строительства и ЖКХ Р

Validation:  12%|█▏        | 3/26 [00:02<00:18,  1.26it/s]


inputs ['paraphrase: соскучилась ли ты по моему голосу', 'paraphrase: какое у тебя любимое мобильное приложение для рисования', 'paraphrase: Гус Хиддинк ушел с поста главного тренера ФК "Анжи".', 'paraphrase: А ен мог ли бы ты подбросить монетку', 'paraphrase: Костюм Скарлетт из "Унесенных ветром" продан за 137 тысяч долларов', 'paraphrase: Есть ли у тебя образование?', 'paraphrase: Как тебя можно величать?', 'paraphrase: мне совершенно не хочется идти на работу в субботу', 'paraphrase: Какие планы на новый год?', 'paraphrase: Число жертв землетрясения в Непале достигло 3218', 'paraphrase: любимое приложение какое', 'paraphrase: В США скончался основатель группы Slayer Джефф Ханнеман.', 'paraphrase: какая будет твоя реакция если я приглашу тебя сегодня на свидание', 'paraphrase: Генпрокуратура сочла Мадонну и Леди Гагу нелегальными гастарбайтерами.', 'paraphrase: Что ты понимаешь под словом любовь', 'paraphrase: Маркин: Васильева сможет реализовать свой потенциал в жанре "шансон"']
ge

Validation:  15%|█▌        | 4/26 [00:03<00:16,  1.31it/s]


inputs ['paraphrase: какой подарок ты хочешь купить?', 'paraphrase: какие у тебя планы на завтра на работе', 'paraphrase: Путин изменил закон о митингах, шествиях и пикетах', 'paraphrase: почему ты такая грустная?', 'paraphrase: У тебя есть вторая половина', 'paraphrase: Такая плохая погода и мне так не хочется идти на работу', 'paraphrase: Определена дата референдума о независимости Шотландии.', 'paraphrase: Вода из прорванного трубопровода затопила Дмитровское шоссе.', 'paraphrase: Расскажи мне пожалуйста в чём у тебя смысл жизни', 'paraphrase: Мост между Канадой и США назовут в честь хоккеиста Горди Хоу', 'paraphrase: Осужденному за взрыв на Манежной площади отменили приговор.', 'paraphrase: А у тебя хорошее чувство юмора?', 'paraphrase: Литва заморозила счета российских чиновников из "списка Магнитского".', 'paraphrase: приглашаю тебя на свидание в театр', 'paraphrase: в какой стране тебя изобрели', 'paraphrase: Убийство солдата в Лондоне: задержан девятый подозреваемый.']
generat

Validation:  19%|█▉        | 5/26 [00:03<00:15,  1.39it/s]


inputs ['paraphrase: мечтаешь о чем то братуха', 'paraphrase: Премьер Таиланда объявила о роспуске парламента.', 'paraphrase: Дука: Косово примут в ФИФА и УЕФА в 2016 году', 'paraphrase: На саратовского дебошира с борта самолета Москва - Хургада заведено дело.', 'paraphrase: что такое любовь ответь?', 'paraphrase: есть ли у тебя собака', 'paraphrase: Депутат: взрыв у офиса партии "Свобода" произошел в Одессе', 'paraphrase: Я вообще не хочу идти ни на какую работу', 'paraphrase: Ты шутишь или правду говоришь?', 'paraphrase: Вице-президент Еврокомиссии бойкотирует Олимпиаду в Сочи.', 'paraphrase: Что интересного делала сегодня пока меня не было?', 'paraphrase: что бы ты хотел получить', 'paraphrase: У тебя есть чувство юмора?', 'paraphrase: На Камчатке заключенного освободили в обмен на 200 шапок.', 'paraphrase: Полиция: дело Бойцова закроют после разговора следователей с боксером', 'paraphrase: какая марка машины твоя любимая?']
generated_paraphrases ['Для краткого: ты о чем-то мечтаеш

Validation:  23%|██▎       | 6/26 [00:04<00:14,  1.42it/s]


inputs ['paraphrase: Добыча сланцевой нефти принесла Shell убытки в 2,1 млрд долл.', 'paraphrase: Что из музыки тебе нравится больше всего?', 'paraphrase: я люблю тебя больше всего на свете', 'paraphrase: о чем ты сейчас думаешь', 'paraphrase: мне скучно скажи чем заняться', 'paraphrase: Россия построит для Ирана новые С-300, а не возьмет из наличия', 'paraphrase: У тебя есть любимый?', 'paraphrase: "Болотное дело": в СКР на допрос ждут блогера Митю Алешковского.', 'paraphrase: В московском отделе полиции повесился задержанный.', 'paraphrase: ТЫ МАЛЬЧИК ИЛИ ДЕВОЧКА', 'paraphrase: ты можешь предсказать что со мной случится в будущем', 'paraphrase: пропавший самолет-заправщик ВВС США нашелся в Британии', 'paraphrase: Колонна МЧС с гумпомощью и подарками для ветеранов выехала в Донбасс', 'paraphrase: Какую музыку ты предпочитаешь?', 'paraphrase: Что любишь выпить братан?', 'paraphrase: При пожаре в Рижском замке пострадали реликвии.']
generated_paraphrases ['Тема: Нефтяная добыча принесл

Validation:  27%|██▋       | 7/26 [00:05<00:14,  1.34it/s]


inputs ['paraphrase: МЧС Тувы: Найдено тело последнего из 6 подростков, погибших под лавиной.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: какой твой любимый цвет', 'paraphrase: США получат $1,4 млрд за аварию на нефтяной платформе в Мексиканском заливе.', 'paraphrase: Спокойной ночи тебе и хороших снов', 'paraphrase: Госдума окончательно запретила чиновникам иметь зарубежные счета.', 'paraphrase: Как ты будешь встречать Новый Год?', 'paraphrase: Премию Политковской получила девочка, раненная талибами.', 'paraphrase: у тебя есть друзья дома в городе и каком', 'paraphrase: Адвокат: Арест зарубежных счетов Е.Васильевой – абсурд.', 'paraphrase: как ты думаешь в чем смысл жизни', 'paraphrase: Из чего ты состоишь', 'paraphrase: Репетиция парада Победы началась в Донецке', 'paraphrase: Россия экспортирует программное обеспечение на 5 млрд долл.', 'paraphrase: Олег Тиньков приобрел датскую велокоманду.', 'paraphrase: Сильный взрыв в Праге: 55 пострада

Validation:  31%|███       | 8/26 [00:06<00:13,  1.35it/s]


inputs ['paraphrase: В Мали режим чрезвычайного положения продлили на 3 месяца.', 'paraphrase: Какое мобильное приложение тебе нравится?', 'paraphrase: Какая погода тебе нравиться мой друг', 'paraphrase: BMW отложила решение о строительстве завода в России', 'paraphrase: В горах Пакистана пропала группа российских туристов.', 'paraphrase: Скончался маршал Советского Союза Виктор Куликов.', 'paraphrase: Ты что-то испытываешь ко мне?', 'paraphrase: а у меня собака есть', 'paraphrase: Оппозиция уведомила мэрию Москвы о проведении "Марша против палачей".', 'paraphrase: Франция получила доказательства применения химоружия в Сирии.', 'paraphrase: В конгрессе США пришли к соглашению по бюджету.', 'paraphrase: В Чили эксгумировали останки поэта Пабло Неруды.', 'paraphrase: Адвокат опроверг информацию о попытке суицида продюсера Витаса.', 'paraphrase: Двух американских адмиралов отстранили из-за подозрений в коррупции.', 'paraphrase: дорогая ты скучала по мне', 'paraphrase: А почему ты грустиш

Validation:  35%|███▍      | 9/26 [00:07<00:13,  1.24it/s]


inputs ['paraphrase: Нобелевская премия по физике досталась первооткрывателям бозона Хиггса.', 'paraphrase: Я так на работу идти не хочу', 'paraphrase: Выпьем чашечку кофе?', 'paraphrase: За приз Венецианского кинофестиваля поборется "Мой друг Иван Лапшин".', 'paraphrase: Вы согласитесь стать моей женой?', 'paraphrase: Главным редактором "Коммерсантъ FM" назначен Константин Эггерт.', 'paraphrase: любишь ли ты животных', 'paraphrase: ты сейчас о чём-то думаешь', 'paraphrase: Какое мобильное приложение ты предпочитаешь?', 'paraphrase: По факту ДТП под Псковом возбуждено уголовное дело.', 'paraphrase: Куда ты хотел бы поехать?', 'paraphrase: Что для тебя счастье', 'paraphrase: В Москве 2 упавших столба перекрыли движение по Профсоюзной улице.', 'paraphrase: Главным кремлевским борцом с коррупцией назначен Олег Плохой.', 'paraphrase: я в ссоре с очень близким человеком', 'paraphrase: как планируешь отметить Новый год?']
generated_paraphrases ['Для примера: Нобелевская премия по физике пол

Validation:  38%|███▊      | 10/26 [00:07<00:13,  1.23it/s]


inputs ['paraphrase: Свободен ли ты в выходные дни', 'paraphrase: Подкинь монетку в воздух', 'paraphrase: Куда хотелось ты тебе отправится?', 'paraphrase: По факту крушения поезда на Кубани возбуждено дело.', 'paraphrase: "Бой идет не ради славы": В Москве открыли памятник А.Твардовскому.', 'paraphrase: Скончалась балерина Майя Плисецкая', 'paraphrase: соскучилась ли ты по отношениям', 'paraphrase: В аэропорту Киева задержан бывший премьер Таджикистана.', 'paraphrase: Тина Тернер отказалась от американского гражданства.', 'paraphrase: я тебе нравлюсь или нет?', 'paraphrase: Командующий войсками ЗВО: Против России начата гибридная война', 'paraphrase: какой у тебя любимый цвет моего автомобиля', 'paraphrase: У Деми Мур похитили одежду на 200 тысяч долларов', 'paraphrase: Тебе знакомо откуда берутся дети?', 'paraphrase: Когда день рождения у тебя', 'paraphrase: "Атака века", предпринятая хакерами, затормозила Интернет.']
generated_paraphrases ['Вопрос: Вы свободны в выходные дни?', 'Тем

Validation:  42%|████▏     | 11/26 [00:08<00:11,  1.26it/s]


inputs ['paraphrase: Французские и малийские военнослужащие выбили исламистов из Тимбукту.', 'paraphrase: Ты что учишься искать фильмы?', 'paraphrase: Что ты сказала? я не расслышала', 'paraphrase: Роберт Мугабе переизбран президентом Зимбабве.', 'paraphrase: Расскажи ка где ты живешь', 'paraphrase: Брось монетку чтобы решить вопрос', 'paraphrase: Интересно соскучилась ли ты по мне', 'paraphrase: СМИ сообщили о новом деле по факту хищений в Мособлбанке на 70 млрд руб.', 'paraphrase: Президент РФ предложил трудоустраивать мигрантов по патентам.', 'paraphrase: В Германии проходят парламентские выборы.', 'paraphrase: Чем любишь заниматься в выходные', 'paraphrase: Умер режиссер Алексей Балабанов.', 'paraphrase: А какое у вас хобби', 'paraphrase: Что составило твои дела в моё отсутствие?', 'paraphrase: у тебя есть какой нибудь любимый цвет', 'paraphrase: Попробуешь угадать что меня ждет в будущем?']
generated_paraphrases ['- Французские и малийские военные выбили исламистов из Тимбукту.',

Validation:  46%|████▌     | 12/26 [00:09<00:10,  1.31it/s]


inputs ['paraphrase: Какой цвет ты любишь?', 'paraphrase: Как у тебя дела на личном пространстве?', 'paraphrase: Путин ратифицировал соглашение о поставках газа в Китай', 'paraphrase: Чем ты занимался на выходных', 'paraphrase: Что ты делаешь в выходные до обеда?', 'paraphrase: Что у тебя спрашивали пока меня не было?', 'paraphrase: ты относишься ко мне хорошо?', 'paraphrase: Будем вместе навсегда!', 'paraphrase: США просят РФ немедленно отменить запрет на ввоз мяса.', 'paraphrase: В КНДР казнили дядю национального лидера.', 'paraphrase: В Японии успешно прошли испытания обновленного "Лайнера мечты".', 'paraphrase: о да у меня есть кошка и я ее люблю', 'paraphrase: Великобритания инвестирует в экономику Кубы 400 миллионов долларов', 'paraphrase: У вас есть постоянный партнер', 'paraphrase: твой смысл жизни в чем заключается', 'paraphrase: Есть планы на новый год']
generated_paraphrases ['Тема: Какой цвет ты любишь?', 'Вопрос: Как у вас дела в личном пространстве?', 'Путин ратифицирова

Validation:  50%|█████     | 13/26 [00:10<00:09,  1.35it/s]


inputs ['paraphrase: СКР: Бастующие офицеры ФСБ - вымышленные персонажи.', 'paraphrase: Что ты пьёшь из любимых напитков?', 'paraphrase: Есть ли у тебя среднее образование?', 'paraphrase: какое у вас образование', 'paraphrase: куда бы ты хотел съездить в путешествие', 'paraphrase: какой цвет ты любишь оттенок', 'paraphrase: Президент присвоил главе ФМС ранг министра.', 'paraphrase: могу я узнать ваше имя', 'paraphrase: ООН: крушение судна в Средиземном море унесло жизни 800 мигрантов', 'paraphrase: Экс-глава Тамбовской области Бетин назначен замминистра ЖКХ России', 'paraphrase: Глава Крыма облетел сельхозугодья республики на воздушном шаре', 'paraphrase: Танк "Армата" прошел по Красной площади', 'paraphrase: Президент Кипра лишил себя четвертой части зарплаты.', 'paraphrase: Какой жанр музыки ты любишь слушать?', 'paraphrase: Скончался легенда блюза Би Би Кинг', 'paraphrase: НАТО более чем вдвое увеличит численность сил реагирования']
generated_paraphrases ['Тема: СКР: Бастующие офиц

Validation:  54%|█████▍    | 14/26 [00:10<00:09,  1.28it/s]


inputs ['paraphrase: Авиакомпания Red Wings продана за 1 рубль.', 'paraphrase: Ушел из жизни британский скульптор Энтони Каро.', 'paraphrase: В Минобороны Грузии обнаружили финансовые нарушения.', 'paraphrase: Можно поинтересоваться как у вас прошли выходные', 'paraphrase: Подмосковный чиновник оштрафован почти на 1 млрд руб. за взяточничество.', 'paraphrase: догадайся сколько мне лет?', 'paraphrase: Расскажи мне пожалуйста о себе', 'paraphrase: Число жертв теракта в Волгограде выросло до семи человек.', 'paraphrase: СК выяснит, был ли подкуп свидетеля по делу Ю.Буданова.', 'paraphrase: Минобразования сократит количество специальностей в вузах в 5 раз.', 'paraphrase: Протестующие в Таиланде прорвались в штаб-квартиру армии.', 'paraphrase: По жалобе пенсионерки из прямой линии Путина возбуждено дело.', 'paraphrase: Россия и Иран могут реализовать бартерную сделку', 'paraphrase: Президент Сербии извинился за бойню в Сребренице.', 'paraphrase: В Санкт-Петербурге произошла массовая драка:

Validation:  58%|█████▊    | 15/26 [00:11<00:08,  1.27it/s]


inputs ['paraphrase: Нападающий ХК "Салават Юлаев" Сергей Зиновьев дисквалифицирован на четыре матча.', 'paraphrase: состоишь ли ты в отношениях', 'paraphrase: Медведев подписал соглашение о ЗСТ между ЕАЭС и Вьетнамом', 'paraphrase: Премьер Японии получил приглашение РФ на празднование 70-летия Победы', 'paraphrase: Опубликовано видео захвата судна Arctic Sunrise сотрудниками ФСБ.', 'paraphrase: Нарышкин: уроки Первой и Второй мировых войн плохо усвоены политиками', 'paraphrase: Расскажи мне где ты живешь?', 'paraphrase: В Петербурге скончался кинорежиссер Алексей Герман - старший.', 'paraphrase: Президент Украины подписал закон о моратории на выплату внешних долгов', 'paraphrase: ИГ казнило в Пальмире 20 человек на руинах древнеримского театра', 'paraphrase: Представители ЕС подтвердили выделение Кипру 10 млрд евро.', 'paraphrase: Ты любишь путешествовать?', 'paraphrase: Какие сладости тебе не нравятся?', 'paraphrase: По меньшей мере четыре человека стали жертвами землетрясений в Неп

Validation:  62%|██████▏   | 16/26 [00:12<00:07,  1.31it/s]


inputs ['paraphrase: Россия облегчила условия погашения кредита для Кипра.', 'paraphrase: Правозащитники из Чувашии попросили Генпрокуратуру проверить Минюст.', 'paraphrase: Сенаторы разрешили США поставлять оружие сирийским повстанцам.', 'paraphrase: угадай сколько мне лет', 'paraphrase: Коалиция арабских стран завершила военную операцию в Йемене', 'paraphrase: Минтруд обсудит идею внесения личного взноса на накопительную пенсию', 'paraphrase: на новый год ты уже что-то запланировал', 'paraphrase: На что ты мне намекаешь?', 'paraphrase: Как ты считаешь что такое счастье', 'paraphrase: любишь ли ты путешествовать', 'paraphrase: Варшава отказалась платить за разгром российского посольства.', 'paraphrase: я поссорилась с любимым что делать', 'paraphrase: А ты любишь животных или нет?', 'paraphrase: Сенат Франции разрешил однополые браки.', 'paraphrase: Число пострадавших при аварии парома в Нью-Йорке выросло до 74.', 'paraphrase: какое у тебя образование?']
generated_paraphrases ['Для к

Validation:  65%|██████▌   | 17/26 [00:13<00:06,  1.37it/s]


inputs ['paraphrase: Подскажи мне откуда дети берутся?', 'paraphrase: Как много ты получаешь в месяц', 'paraphrase: Считаешь ли ты себя красивым?', 'paraphrase: На выборах в Армении с большим отрывом побеждает действующий президент.', 'paraphrase: МИД Италии: Киев должен предоставить автономию Донбассу', 'paraphrase: Ты принадлежишь к какому полу?', 'paraphrase: В какой стране ты был создан?', 'paraphrase: Более 20 мирных жителей погибли при авиаударах коалиции в Йемене', 'paraphrase: Полиция вновь начала задерживать митингующих в Балтиморе', 'paraphrase: Я хочу знать какой твой самый любимый цвет', 'paraphrase: у тебя есть женщина?', 'paraphrase: Взрыв газа в Красноярске: семеро пострадавших.', 'paraphrase: Самой влиятельной женщиной России признали В.Матвиенко.', 'paraphrase: Полина Гагарина выступила в финале "Евровидения-2015"', 'paraphrase: В Йемене взорван главный нефтепровод страны.', 'paraphrase: Итальянская Generali удвоит долю в "Ингосстрахе".']
generated_paraphrases ['Вопро

Validation:  69%|██████▉   | 18/26 [00:14<00:06,  1.19it/s]


inputs ['paraphrase: Подкинь монетку чтобы выпал орел', 'paraphrase: не люблю свою работу и не хочу туда идти', 'paraphrase: Алексей Навальный стал председателем "Народного альянса".', 'paraphrase: Самолет Lufthansa вернулся в аэропорт Стамбула из-за угрозы взрыва', 'paraphrase: думаешь ли ты что являешься личностью', 'paraphrase: скажи в каком месяце твой день рождение', 'paraphrase: расскажи о моем дальнейшем будущем', 'paraphrase: Глав Газпрома и "Роснефти" обяжут отказаться от счетов за границей.', 'paraphrase: Куда бы ты хотел уехать завтра?', 'paraphrase: Ты знаешь откуда берутся дети?', 'paraphrase: «Газпрому» посоветовали изучить «50 оттенков серого» для переговоров с ЕС', 'paraphrase: Ты считаешь себя достаточно знающим в этом вопросе?', 'paraphrase: Посвящен ли ты в тайну- откуда берутся дети?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: Занимался ли ты сексом?', 'paraphrase: ты вообще любишь музыку']
generated_paraphras

Validation:  73%|███████▎  | 19/26 [00:15<00:05,  1.20it/s]


inputs ['paraphrase: В Москве можно будет забронировать место на кладбище через интернет.', 'paraphrase: Дочь Шарля де Голля скончалась во Франции.', 'paraphrase: Операция в ТЦ в Найроби завершена.', 'paraphrase: Куда бы ты отправился летом?', 'paraphrase: ты можешь угадать мой точный возраст', 'paraphrase: ОТР сняло с эфира программу после шутки про развод В.Путина.', 'paraphrase: Какую погоду ты больше всего ненавидишь?', 'paraphrase: У тебя очень приятный голос', 'paraphrase: Ты считаешь себя сообразительным?', 'paraphrase: какой у тебя любимый цвет моих волос', 'paraphrase: Жорес Алферов выдвинут кандидатом на пост президента РАН.', 'paraphrase: Порошенко: в Донбассе введут военное положение при атаке на силовиков', 'paraphrase: Прокуратура: Поджоги церквей в Татарстане - это теракты.', 'paraphrase: расскажи мне где ты живешь или где бы ты хотел', 'paraphrase: Какая твоя самая главная мечта?', 'paraphrase: о чем ты сейчас думаешь?']
generated_paraphrases ['Тема: В Москве можно буд

Validation:  77%|███████▋  | 20/26 [00:15<00:04,  1.24it/s]


inputs ['paraphrase: Россияне все чаще "забывают" оплачивать кредиты.', 'paraphrase: Михаэль Шумахер попал в больницу с травмой черепа.', 'paraphrase: Какие у тебя есть хобби?', 'paraphrase: Скончался ведущий артист Малого театра Ярослав Барышев.', 'paraphrase: У певицы Шакиры и футболиста Жерара Пике родился сын.', 'paraphrase: Какие головоломки любишь?', 'paraphrase: На комплексе Байконур вскрыли хищение 15 млн руб.', 'paraphrase: расскажи мне все о себе немедленно!', 'paraphrase: Ты считаешь себя профессионалом в этом деле?', 'paraphrase: В Петербурге задержали похитителей часов на 21 миллион', 'paraphrase: СКР завел дело о торговле в США усыновленными российскими детьми.', 'paraphrase: А где вы появились на свет?', 'paraphrase: "Указующий человек" Джакометти стал самой дорогой скульптурой в мире', 'paraphrase: Китай вошел в топ-5 продавцов оружия.', 'paraphrase: Пушков: России и ЕС нельзя сводить отношения к украинскому кризису', 'paraphrase: Суд приговорил экс-президента Египта Х

Validation:  81%|████████  | 21/26 [00:16<00:03,  1.26it/s]


inputs ['paraphrase: Что ты собираешься делать в канун Нового года?', 'paraphrase: Жан-Мари Ле Пен отказывается уходить на политическую пенсию', 'paraphrase: Сотни инструкторов Пентагона отправились тренировать сирийскую оппозицию', 'paraphrase: Консультации по Сирии начинаются в Женеве под эгидой ООН', 'paraphrase: Землетрясение в Таджикистане разрушило сотни домов.', 'paraphrase: есть ли у тебя брат или сестра настоящие', 'paraphrase: Минобрнауки утвердило новую форму студенческого билета и зачетной книжки.', 'paraphrase: Я не сделала задание преподавателя и не хочу из-за этого идти в институт', 'paraphrase: МВД ДНР: праздничные мероприятия в Донецке проходят без происшествий', 'paraphrase: Я поссорилась с близким человеком', 'paraphrase: Закон о реформе РАН принят во втором чтении.', 'paraphrase: Как думаешь в чем смысл жизни?', 'paraphrase: СК завершил расследование дела о крушении "Булгарии".', 'paraphrase: почему ты такой грустный?', 'paraphrase: Я умею хорошо играть на гитаре',

Validation:  85%|████████▍ | 22/26 [00:17<00:03,  1.22it/s]


inputs ['paraphrase: О чем ты сейчас задумался?', 'paraphrase: умеешь ли ты разговаривать как человек?', 'paraphrase: Всегда интересовало какого ты пола', 'paraphrase: Чемпионка России по пауэрлифтингу получила 7 лет за убийство.', 'paraphrase: В Риме скончался режиссер культового сериала "Спрут" Д.Дамиани.', 'paraphrase: Расскажи о себе немного информации', 'paraphrase: можно с тобой поговорить сейчас', 'paraphrase: Конституционный суд разрешил россиянам обжаловать итоги выборов.', 'paraphrase: В Самарской области на военных складах прогремели взрывы.', 'paraphrase: В Японии произошел пожар в больнице: 10 погибших.', 'paraphrase: Посольство РФ: Украина препятствует встрече с задержанными россиянами', 'paraphrase: Китай на 5 лет запретил строительство новых административных зданий.', 'paraphrase: Из чего ты состоишь расскажи?', 'paraphrase: Президент Венесуэлы подарил дом женщине, кинувшей в него плодом манго', 'paraphrase: В ЦАР лидер повстанцев объявил себя президентом.', 'paraphras

Validation:  88%|████████▊ | 23/26 [00:18<00:02,  1.28it/s]


inputs ['paraphrase: какое мероприятие ты хотел бы посетить?', 'paraphrase: Что ты делал на выходных?', 'paraphrase: Власти Китая приговорили тибетского монаха к смертной казни.', 'paraphrase: скажи а ты веришь в бога', 'paraphrase: Эквадор провел международный день против загрязнения компанией Chevron', 'paraphrase: В какой стране ты родился?', 'paraphrase: "Протон-М" с европейским спутником связи стартовал с "Байконура"', 'paraphrase: ЮНИСЕФ: Непалу угрожает холера из-за антисанитарии после землетрясения', 'paraphrase: Украинские силовики сообщили о гибели трех военных за сутки в Донбассе', 'paraphrase: ты знаешь кто тебя создал', 'paraphrase: Причиной пожара в аэропорту Рима стало короткое замыкание', 'paraphrase: Где ты живешь в последнее время', 'paraphrase: Какой у тебя любимый напиток', 'paraphrase: Ты очень мне симпатизируешь', 'paraphrase: какие у тебя планы на воскресенье', 'paraphrase: Супруга Михаэля Шумахера продала личный самолет стоимостью 34 млн евро']
generated_paraph

Validation:  92%|█████████▏| 24/26 [00:18<00:01,  1.32it/s]


inputs ['paraphrase: Спи сладко этой ночью', 'paraphrase: какой ваш любимый цвет', 'paraphrase: Что ты сказала повторить не слышно', 'paraphrase: Яценюк недоволен встречей Джона Керри с Путиным в Сочи', 'paraphrase: Пираты освободили корабль, захваченный в Гвинейском заливе.', 'paraphrase: Поездки японцев на Курилы возобновятся с конца мая', 'paraphrase: скажи ты знаешь что у меня есть собака', 'paraphrase: моя жизнь бесцельна и запутана', 'paraphrase: Лавров и Могерини обсудили отношения России и Евросоюза', 'paraphrase: Люблю больше жизни тебя', 'paraphrase: Биржевой курс доллара опустился ниже 53 руб.', 'paraphrase: Делегация палестинских переговорщиков с Израилем ушла в отставку.', 'paraphrase: в чем смысл жизни и как ее прожить', 'paraphrase: А у тебя уже есть детишки?', 'paraphrase: Подбрось монетку в воздух', 'paraphrase: Китайским чиновникам запретили курить в общественных местах.']
generated_paraphrases ['Для того чтобы я сказал: ѕспи сладко этой ночью', 'Для расчета: какой ц

Validation:  96%|█████████▌| 25/26 [00:19<00:00,  1.35it/s]


inputs ['paraphrase: В проекте трехлетнего бюджета обнаружилась "дыра" в 250 млрд руб.', 'paraphrase: Владимир Путин поздравил актера Владимира Этуша с 93-летием', 'paraphrase: Ну ка признавайся как ты ко мне относишься', 'paraphrase: обожаю тебя уже а ты обо мне хоть что нибудь знаешь', 'paraphrase: Полиция задержала водителя микроавтобуса, сгоревшего под Самарой.', 'paraphrase: Полиция провела более 20 обысков в московских банках.', 'paraphrase: Взрыв в иракском кафе унес жизни 38 человек.', 'paraphrase: Есть ли у тебя дети?', 'paraphrase: Тебе нравится человечество?', 'paraphrase: Что ты делала в моё отсутствие?', 'paraphrase: После опрокидывания автобуса в Тюменской области ранены 14 человек', 'paraphrase: Спроси у меня что нибудь!', 'paraphrase: Омские приставы избили полицейского.', 'paraphrase: Тебе нравится читать или ты ненавидишь это делать?', 'paraphrase: США исключили Кубу из списка стран-спонсоров терроризма', 'paraphrase: Депутатам разрешили обходиться без присяги на вер

Validation: 100%|██████████| 26/26 [00:19<00:00,  1.65it/s]


inputs ['paraphrase: у меня есть любимая собака', 'paraphrase: какая у тебя любимая марка машины?']
generated_paraphrases ['Тема: у меня есть любимая собака', 'Вопрос: какая у вас любимая марка машины?']
targets ['у меня есть гавкающее животное', 'Слушай какая у тебя любимая марка машины?']


Validation: 100%|██████████| 26/26 [00:20<00:00,  1.30it/s]


Validation Avg BLEU Score for Epoch 5: 0.0010845472663644565

Training complete!


In [13]:
test_dataset = [{"input": "Каждый охотник желает знать, где сидит фазан.", "target": "Все охотники хотят знать, где фазан сидит."}]

# Load the fine-tuned model
fine_tuned_model = T5ForConditionalGeneration.from_pretrained('./output/fine_tuned_model')

# Testing
for example in test_dataset:
    input_text = example['input']
    target_text = example['target']

    # Tokenize input text
    input_ids = tokenizer.encode(input_text, return_tensors='pt')

    # Generate paraphrased output
    generated_ids = fine_tuned_model.generate(input_ids)

    # Decode generated output
    generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)

    # Print input, target, and generated output
    print(f"Input: {input_text}")
    print(f"Target: {target_text}")
    print(f"Generated: {generated_text}")
    print("=" * 30)



Input: Каждый охотник желает знать, где сидит фазан.
Target: Все охотники хотят знать, где фазан сидит.
Generated: Каждый охотник хочет знать, где сидит фазан.
