In [1]:
!pip install --no-cache-dir -q transformers sentencepiece

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.0/7.0 MB[0m [31m106.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m163.9 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.8/7.8 MB[0m [31m220.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m224.5/224.5 kB[0m [31m207.4 MB/s[0m eta [36m0:00:00[0m
[?25h

In [2]:
!git clone https://github.com/spbu-smart-assistant/support-chatbot.git

Cloning into 'support-chatbot'...
remote: Enumerating objects: 587, done.[K
remote: Counting objects: 100% (243/243), done.[K
remote: Compressing objects: 100% (116/116), done.[K
remote: Total 587 (delta 138), reused 229 (delta 127), pack-reused 344[K
Receiving objects: 100% (587/587), 403.01 MiB | 16.28 MiB/s, done.
Resolving deltas: 100% (210/210), done.
Updating files: 100% (156/156), done.


In [1]:
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
MODEL_NAME = 'cointegrated/rut5-base-absum'
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)
model.cuda() if torch.cuda.is_available() else None
model.eval();

def summarize(
    text, n_words=None, compression=None,
    max_length=1000, num_beams=3, do_sample=False, repetition_penalty=10.0, 
    **kwargs
):
    """
    Summarize the text
    The following parameters are mutually exclusive:
    - n_words (int) is an approximate number of words to generate.
    - compression (float) is an approximate length ratio of summary and original text.
    """
    if n_words:
        text = '[{}] '.format(n_words) + text
    elif compression:
        text = '[{0:.1g}] '.format(compression) + text
    x = tokenizer(text, return_tensors='pt', padding=True).to(model.device)
    with torch.inference_mode():
        out = model.generate(
            **x, 
            max_length=max_length, num_beams=num_beams, 
            do_sample=do_sample, repetition_penalty=repetition_penalty, 
            **kwargs
        )
    return tokenizer.decode(out[0], skip_special_tokens=True)

Downloading (…)lve/main/config.json:   0%|          | 0.00/753 [00:00<?, ?B/s]

Downloading pytorch_model.bin:   0%|          | 0.00/977M [00:00<?, ?B/s]

Downloading spiece.model:   0%|          | 0.00/828k [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/315 [00:00<?, ?B/s]

In [2]:
!pip install datasets

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [3]:
from datasets import load_dataset

In [4]:
our_dataset = load_dataset('json', data_files='support-chatbot/data/raw/summary_data.json')

Downloading and preparing dataset json/default to /root/.cache/huggingface/datasets/json/default-e2acaad298041a60/0.0.0/e347ab1c932092252e717ff3f949105a4dd28b27e842dd53157d2f72e276c2e4...


Downloading data files:   0%|          | 0/1 [00:00<?, ?it/s]

Extracting data files:   0%|          | 0/1 [00:00<?, ?it/s]

Generating train split: 0 examples [00:00, ? examples/s]

Dataset json downloaded and prepared to /root/.cache/huggingface/datasets/json/default-e2acaad298041a60/0.0.0/e347ab1c932092252e717ff3f949105a4dd28b27e842dd53157d2f72e276c2e4. Subsequent calls will reuse this data.


  0%|          | 0/1 [00:00<?, ?it/s]

In [5]:
our_dataset

DatasetDict({
    train: Dataset({
        features: ['text', 'summa'],
        num_rows: 16
    })
})

In [6]:
prefix = "summarize: "


def preprocess_function(examples):
    inputs = [prefix + doc for doc in examples["text"]]
    model_inputs = tokenizer(inputs, max_length=1024, truncation=True)

    labels = tokenizer(text_target=examples["summa"], max_length=128, truncation=True)

    model_inputs["labels"] = labels["input_ids"]
    return model_inputs

In [7]:
tokenized_our_dataset = our_dataset.map(preprocess_function, batched=True)

Map:   0%|          | 0/16 [00:00<?, ? examples/s]

In [8]:
tokenized_our_dataset

DatasetDict({
    train: Dataset({
        features: ['text', 'summa', 'input_ids', 'attention_mask', 'labels'],
        num_rows: 16
    })
})

In [9]:
from transformers import DataCollatorForSeq2Seq

data_collator = DataCollatorForSeq2Seq(tokenizer=tokenizer, model=MODEL_NAME)

In [10]:
!pip install -q rouge_score evaluate

  Preparing metadata (setup.py) ... [?25l[?25hdone
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m81.4/81.4 kB[0m [31m9.7 MB/s[0m eta [36m0:00:00[0m
[?25h  Building wheel for rouge_score (setup.py) ... [?25l[?25hdone


In [11]:
import evaluate

rouge = evaluate.load("rouge")

Downloading builder script:   0%|          | 0.00/6.27k [00:00<?, ?B/s]

In [12]:
import numpy as np


def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
    labels = np.where(labels != -100, labels, tokenizer.pad_token_id)
    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)
    print('True:', decoded_labels)
    print('prediction:', decoded_preds)

    result = rouge.compute(predictions=decoded_preds, references=decoded_labels, use_stemmer=True)

    prediction_lens = [np.count_nonzero(pred != tokenizer.pad_token_id) for pred in predictions]
    result["gen_len"] = np.mean(prediction_lens)

    return {k: round(v, 4) for k, v in result.items()}

In [13]:
from transformers import AutoModelForSeq2SeqLM, Seq2SeqTrainingArguments, Seq2SeqTrainer

In [20]:
#model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)
training_args = Seq2SeqTrainingArguments(
    output_dir="my_awesome_model",
    evaluation_strategy="steps",
    eval_steps=20,
    learning_rate=2e-5,
    per_device_train_batch_size=1, # было 4
    per_device_eval_batch_size=1,
    weight_decay=0.01,
    save_total_limit=3,
    num_train_epochs=50,
    predict_with_generate=True,
    push_to_hub=False,
    logging_steps=20,
)

In [21]:
tokenized_our_dataset['train']

Dataset({
    features: ['text', 'summa', 'input_ids', 'attention_mask', 'labels'],
    num_rows: 16
})

In [22]:
from datasets import Dataset
from tqdm.auto import tqdm
for i in tqdm(range(16)):
  model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)

  ex_text = [tokenized_our_dataset['train'][i]['text']]
  ex_summa = [tokenized_our_dataset['train'][i]['summa']]
  ex_input_ids = [tokenized_our_dataset['train'][i]['input_ids']]
  ex_attention_mask = [tokenized_our_dataset['train'][i]['attention_mask']]
  ex_labels = [tokenized_our_dataset['train'][i]['labels']]

  test_dataset = Dataset.from_dict({'text': ex_text, 'summa': ex_summa, 
                                    'input_ids': ex_input_ids, 
                                    'attention_mask': ex_attention_mask,
                                    'labels': ex_labels})
  
  train_text = tokenized_our_dataset['train'][:i]['text'] + tokenized_our_dataset['train'][i+1:]['text']
  train_summa = tokenized_our_dataset['train'][:i]['summa'] + tokenized_our_dataset['train'][i+1:]['summa']
  train_input_ids = tokenized_our_dataset['train'][:i]['input_ids'] + tokenized_our_dataset['train'][i+1:]['input_ids']
  train_attention_mask = tokenized_our_dataset['train'][:i]['attention_mask'] + tokenized_our_dataset['train'][i+1:]['attention_mask']
  train_labels = tokenized_our_dataset['train'][:i]['labels'] + tokenized_our_dataset['train'][i+1:]['labels']

  train_dataset = Dataset.from_dict({'text': train_text, 'summa': train_summa, 
                                    'input_ids': train_input_ids, 
                                    'attention_mask': train_attention_mask,
                                    'labels': train_labels})
  trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,
    eval_dataset=test_dataset,
    tokenizer=tokenizer,
    data_collator=data_collator,
    compute_metrics=compute_metrics,
    )
  trainer.train()
  del model, trainer, train_dataset, test_dataset
  torch.cuda.empty_cache()
  

  0%|          | 0/16 [00:00<?, ?it/s]

Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7106,0.904814,0.0,0.0,0.0,0.0,18.0
40,1.3344,0.778441,0.0,0.0,0.0,0.0,18.0
60,0.8354,0.68056,0.0,0.0,0.0,0.0,13.0
80,0.6517,0.618375,0.0,0.0,0.0,0.0,13.0
100,0.8161,0.593361,0.0,0.0,0.0,0.0,13.0
120,0.5124,0.588665,0.0,0.0,0.0,0.0,9.0
140,0.4981,0.567931,0.0,0.0,0.0,0.0,9.0
160,0.2791,0.566925,0.0,0.0,0.0,0.0,9.0
180,0.5442,0.560118,0.0,0.0,0.0,0.0,11.0
200,0.4368,0.556757,0.0,0.0,0.0,0.0,19.0


True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Спасибо, техническая поддержка спбгу. Слушайте вас.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Спасибо, техническая поддержка спбгу. Слушайте вас.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Спасибо, техническая поддержка спбгу.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Спасибо, техническая поддержка спбгу.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Спасибо, техническая поддержка спбгу.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Забыл пароль от почты.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Забыл пароль от почты.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']
prediction: ['Забыл пароль от почты.']
True: ['Филатова Мария Евгеньевна забыла свой пароль от почты.']




Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.6547,0.551621,0.0,0.0,0.0,0.0,16.0
40,1.3596,0.379083,0.0,0.0,0.0,0.0,16.0
60,0.9555,0.415115,0.0,0.0,0.0,0.0,17.0
80,0.6534,0.482015,0.0,0.0,0.0,0.0,17.0
100,0.8184,0.563142,0.0,0.0,0.0,0.0,17.0
120,0.5132,0.591784,0.0,0.0,0.0,0.0,17.0
140,0.5345,0.588377,0.0,0.0,0.0,0.0,17.0
160,0.2998,0.597637,0.0,0.0,0.0,0.0,17.0
180,0.5716,0.602413,0.0,0.0,0.0,0.0,17.0
200,0.4315,0.628482,0.0,0.0,0.0,0.0,17.0


True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У нас тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У нас тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У пользователя тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У пользователя тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У пользователя тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У пользователя тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У пользователя тут в аудитории компьютер и доска не включаются.']
True: ['В аудитории компьютер и доска не включаются.']
prediction: ['У по



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.4776,3.645795,0.0,0.0,0.0,0.0,13.0
40,1.0224,3.58532,0.0,0.0,0.0,0.0,13.0
60,0.744,3.549623,0.0,0.0,0.0,0.0,10.0
80,0.5653,3.454996,0.0,0.0,0.0,0.0,10.0
100,0.5558,3.389133,0.0,0.0,0.0,0.0,16.0
120,0.4351,3.397509,0.0,0.0,0.0,0.0,16.0
140,0.3702,3.36797,0.0,0.0,0.0,0.0,16.0
160,0.3381,3.359494,0.0,0.0,0.0,0.0,18.0
180,0.4098,3.290139,0.0,0.0,0.0,0.0,16.0
200,0.3584,3.245709,0.0,0.0,0.0,0.0,17.0


True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['Спасибо, техническая поддержка спбгу.']
True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['Спасибо за техническую поддержку спбгу.']
True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['Проблема интернета отрубает.']
True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['Проблема интернета отрубает.']
True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['У пользователя уже который раз за день интернет отрубает.']
True: ['Интернет в общежитии номер пятнадцать, блок семьсот девять а отключается несколько раз за день.']
prediction: ['У пользователя уже который раз за день интернет отрубает.']
True: ['Интернет



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.556,3.88355,0.0,0.0,0.0,0.0,15.0
40,1.0529,4.063842,0.0,0.0,0.0,0.0,15.0
60,0.7438,4.125966,0.0,0.0,0.0,0.0,12.0
80,0.5382,4.25135,0.0,0.0,0.0,0.0,12.0
100,0.5772,4.430026,0.0,0.0,0.0,0.0,12.0
120,0.3741,4.647132,0.0,0.0,0.0,0.0,12.0
140,0.3042,4.773815,0.0,0.0,0.0,0.0,12.0
160,0.2857,4.957978,0.0,0.0,0.0,0.0,12.0
180,0.3379,5.000023,0.0,0.0,0.0,0.0,12.0
200,0.3383,5.096413,0.0,0.0,0.0,0.0,12.0


True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У меня на компьютере интернет не работает, что делать?']
True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У меня на компьютере интернет не работает, что делать?']
True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У пользователя на компьютере интернет не работает.']
True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У пользователя на компьютере интернет не работает.']
True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У пользователя на компьютере интернет не работает.']
True: ['Интернет на компьютере Ярослава Гуся в общежитии номер тринадцать не работает.']
prediction: ['У пользователя на компьютере интернет не работает.']
True: ['Интернет на компьютере Ярослава Гуся в общежитии



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.5933,0.938167,0.0,0.0,0.0,0.0,9.0
40,1.295,0.383742,0.0,0.0,0.0,0.0,10.0
60,0.9143,0.16165,0.0,0.0,0.0,0.0,11.0
80,0.6715,0.098834,0.0,0.0,0.0,0.0,11.0
100,0.8198,0.067333,0.0,0.0,0.0,0.0,11.0
120,0.5542,0.045693,0.0,0.0,0.0,0.0,11.0
140,0.4574,0.056544,0.0,0.0,0.0,0.0,11.0
160,0.5255,0.046116,0.0,0.0,0.0,0.0,11.0
180,0.4825,0.044782,0.0,0.0,0.0,0.0,11.0
200,0.4565,0.03539,0.0,0.0,0.0,0.0,11.0


True: ['У пользователя не открывается Блэкборд.']
prediction: ['Проверьте работу серверов.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У меня не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У пользователя не открывается Блэкборд.']
True: ['У пользователя не открывается Блэкборд.']
prediction: ['У п



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.5914,1.011968,0.0,0.0,0.0,0.0,13.0
40,1.2638,0.818612,0.0,0.0,0.0,0.0,13.0
60,0.8717,0.72403,1.0,0.0,1.0,1.0,15.0
80,0.6274,0.678032,1.0,0.0,1.0,1.0,15.0
100,0.8016,0.56743,1.0,0.0,1.0,1.0,16.0
120,0.5531,0.515617,1.0,0.0,1.0,1.0,16.0
140,0.4466,0.459986,1.0,0.0,1.0,1.0,12.0
160,0.5103,0.410961,0.6667,0.0,0.6667,0.6667,16.0
180,0.4824,0.331138,0.6667,0.0,0.6667,0.6667,16.0
200,0.4405,0.295998,0.6667,0.0,0.6667,0.6667,16.0


True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Спасибо, техническая поддержка СПбГУ.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Спасибо, техническая поддержка СПбГУ.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Это может быть место в облачном хранилище Google.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Это может быть место в облачном хранилище Google.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Возможно, можно получить место в облачном хранилище Google.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Возможно, можно получить место в облачном хранилище Google.']
True: ['Пользователь хочет получить место в облачном хранилище Google.']
prediction: ['Создайте место в облачном хранилище Google.']
True: ['Пользователь хочет получить м



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.6449,0.921157,0.0,0.0,0.0,0.0,13.0
40,1.4146,0.657358,0.0,0.0,0.0,0.0,13.0
60,0.9169,0.645153,0.0,0.0,0.0,0.0,19.0
80,0.7448,0.575688,0.0,0.0,0.0,0.0,19.0
100,0.8445,0.564574,0.0,0.0,0.0,0.0,19.0
120,0.5617,0.64042,0.0,0.0,0.0,0.0,19.0
140,0.4886,0.804054,0.0,0.0,0.0,0.0,19.0
160,0.5156,0.925744,0.0,0.0,0.0,0.0,19.0
180,0.4882,1.031208,0.0,0.0,0.0,0.0,19.0
200,0.409,1.140731,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['Это служба технической поддержки университета.']
True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['Это служба технической поддержки университета.']
True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['У пользователя проблемы с входом в тимс Он говорит, что мой пароль не']
True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['У пользователя проблемы с входом в тимс. Он говорит, что мой пароль']
True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['У пользователя проблемы с входом в тимс. Он говорит, что мой пароль']
True: ['У пользователя проблемы с входом в Тимс. Он говорит, что пароль неверен.']
prediction: ['У пользователя проблемы с входом в тимс. Он говорит, что мой пароль']
True: ['У пользователя проблемы с вход



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.6629,0.364357,0.0,0.0,0.0,0.0,13.0
40,1.3491,0.103728,0.0,0.0,0.0,0.0,19.0
60,0.8601,0.010478,0.0,0.0,0.0,0.0,19.0
80,0.724,0.004142,0.0,0.0,0.0,0.0,19.0
100,0.7655,0.002242,0.0,0.0,0.0,0.0,19.0
120,0.5195,0.0013,0.0,0.0,0.0,0.0,19.0
140,0.4693,0.001079,0.0,0.0,0.0,0.0,19.0
160,0.5084,0.00076,0.0,0.0,0.0,0.0,19.0
180,0.4903,0.00065,0.0,0.0,0.0,0.0,19.0
200,0.4043,0.000493,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['Это служба технической поддержки университета.']
True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['У меня проблемы с подключением к Вайфай на ПМ ПУ. Он']
True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он']
True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он']
True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он']
True: ['У пользователя проблемы с подключением к Вайфай на ПМ ПУ. Он постоянно запрашивает пароль.']
prediction: ['У пользователя пр



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7287,0.937149,0.0,0.0,0.0,0.0,13.0
40,1.3447,0.724601,0.0,0.0,0.0,0.0,17.0
60,0.8602,0.564131,0.0,0.0,0.0,0.0,18.0
80,0.6631,0.575677,0.0,0.0,0.0,0.0,18.0
100,0.7712,0.581,0.0,0.0,0.0,0.0,18.0
120,0.4906,0.697253,0.0,0.0,0.0,0.0,18.0
140,0.4437,0.78431,0.0,0.0,0.0,0.0,18.0
160,0.4909,0.857641,0.0,0.0,0.0,0.0,18.0
180,0.4848,0.859111,0.0,0.0,0.0,0.0,18.0
200,0.381,0.991738,0.0,0.0,0.0,0.0,18.0


True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['Это служба технической поддержки университета.']
True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['У меня проблемы с печатью курсовой. Принтер не отвечает.']
True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['У пользователя проблемы с печатью курсовой. Принтер не отвечает.']
True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['У пользователя проблемы с печатью курсовой. Принтер не отвечает.']
True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['У пользователя проблемы с печатью курсовой. Принтер не отвечает.']
True: ['У пользователя проблемы с печатью курсовой. Принтер в библиотеке не отвечает.']
prediction: ['У пользователя проблемы с печатью курсовой. Принтер не отвечает.']
True: ['У по



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7024,0.701435,0.0,0.0,0.0,0.0,10.0
40,1.3461,0.425106,0.0,0.0,0.0,0.0,19.0
60,0.9564,0.274396,0.0,0.0,0.0,0.0,19.0
80,0.7194,0.253206,0.0,0.0,0.0,0.0,19.0
100,0.7234,0.193948,0.0,0.0,0.0,0.0,19.0
120,0.5735,0.225306,0.0,0.0,0.0,0.0,19.0
140,0.445,0.145278,0.0,0.0,0.0,0.0,19.0
160,0.4962,0.170509,0.0,0.0,0.0,0.0,19.0
180,0.4892,0.145051,0.0,0.0,0.0,0.0,19.0
200,0.4039,0.139131,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['Что я могу вам помочь?']
True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['У меня проблемы с доступом к онлайн-библиотеке. Там написано,']
True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано']
True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано']
True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано']
True: ['У пользователя проблемы с доступом к онлайн-библиотеке. Там написано, что ему нужен пароль.']
prediction: ['У 



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7269,0.389974,0.0,0.0,0.0,0.0,7.0
40,1.329,0.149202,0.0,0.0,0.0,0.0,19.0
60,0.8493,0.030572,0.0,0.0,0.0,0.0,19.0
80,0.6997,0.013751,0.0,0.0,0.0,0.0,19.0
100,0.8148,0.00729,0.0,0.0,0.0,0.0,19.0
120,0.5582,0.006892,0.0,0.0,0.0,0.0,19.0
140,0.4566,0.004075,0.0,0.0,0.0,0.0,19.0
160,0.5178,0.00371,0.0,0.0,0.0,0.0,19.0
180,0.4192,0.004206,0.0,0.0,0.0,0.0,19.0
200,0.4084,0.002841,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['Спасибо за помощь.']
True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['У меня возникли проблемы с загрузкой файла в тимс. Пишет,']
True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет']
True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет']
True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет']
True: ['У пользователя возникли проблемы с загрузкой файла в тимс. Пишет, что файл слишком большой.']
prediction: ['У пользователя возникл



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7538,0.479466,0.0,0.0,0.0,0.0,19.0
40,1.3605,0.206004,0.0,0.0,0.0,0.0,19.0
60,0.9223,0.078676,0.0,0.0,0.0,0.0,19.0
80,0.688,0.046643,0.0,0.0,0.0,0.0,19.0
100,0.7963,0.042279,0.0,0.0,0.0,0.0,19.0
120,0.519,0.051984,0.0,0.0,0.0,0.0,19.0
140,0.3933,0.036958,0.0,0.0,0.0,0.0,19.0
160,0.5207,0.023983,0.0,0.0,0.0,0.0,19.0
180,0.461,0.03502,0.0,0.0,0.0,0.0,19.0
200,0.3614,0.034224,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанционной пары в тимсе.']
prediction: ['Проверьте настройки веб-камеры на вашем компьютере. Проверьте на']
True: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанционной пары в тимсе.']
prediction: ['У вас проблемы с веб-камерой. Она не работает во время дистанционной']
True: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанционной пары в тимсе.']
prediction: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанци']
True: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанционной пары в тимсе.']
prediction: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанци']
True: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанционной пары в тимсе.']
prediction: ['У пользователя проблемы с веб-камерой. Она не работает во время дистанци']
True: ['У пользователя проблемы с веб-камерой. Она не раб



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.7713,0.877863,0.0,0.0,0.0,0.0,7.0
40,1.3697,0.587445,0.0,0.0,0.0,0.0,19.0
60,0.8936,0.426111,0.0,0.0,0.0,0.0,19.0
80,0.6526,0.391333,0.0,0.0,0.0,0.0,19.0
100,0.7604,0.38918,0.0,0.0,0.0,0.0,19.0
120,0.5068,0.395527,0.0,0.0,0.0,0.0,19.0
140,0.3916,0.456919,0.0,0.0,0.0,0.0,19.0
160,0.5158,0.421218,0.0,0.0,0.0,0.0,19.0
180,0.4654,0.426608,0.0,0.0,0.0,0.0,19.0
200,0.3711,0.442926,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время онлайн-занятий.']
prediction: ['Спасибо за помощь.']
True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время онлайн-занятий.']
prediction: ['У меня проблемы с микрофоном. Он не улавливает мой голос во время онлайн-']
True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время онлайн-занятий.']
prediction: ['У пользователя проблемы с микрофоном. Он не улавливает мой голос во время онлайн']
True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время онлайн-занятий.']
prediction: ['У пользователя проблемы с микрофоном. Он не улавливает мой голос во время онлайн']
True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время онлайн-занятий.']
prediction: ['У пользователя проблемы с микрофоном. Он не улавливает мой голос во время онлайн']
True: ['У пользователя проблемы с микрофоном. Он не улавливает его голос во время он



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.6936,0.690079,0.0,0.0,0.0,0.0,19.0
40,1.2401,0.30726,0.0,0.0,0.0,0.0,17.0
60,0.9188,0.090128,0.0,0.0,0.0,0.0,18.0
80,0.7419,0.057149,0.0,0.0,0.0,0.0,18.0
100,0.7643,0.039837,0.0,0.0,0.0,0.0,18.0
120,0.57,0.055234,0.0,0.0,0.0,0.0,18.0
140,0.4127,0.064006,0.0,0.0,0.0,0.0,18.0
160,0.4881,0.120175,0.0,0.0,0.0,0.0,19.0
180,0.4494,0.074788,0.0,0.0,0.0,0.0,19.0
200,0.4729,0.170051,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['Мне нужно записаться на этот курс, чтобы пройти этот тест.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У меня проблемы с доступом к экзамену в экзамусе.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
True: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
prediction: ['У пользователя проблемы с доступом к экзамену в экзамусе.']
True: ['У пол



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.5934,1.609958,0.0,0.0,0.0,0.0,19.0
40,1.4515,1.414514,0.0,0.0,0.0,0.0,19.0
60,0.7961,1.260667,0.0,0.0,0.0,0.0,19.0
80,0.627,1.344335,0.0,0.0,0.0,0.0,19.0
100,0.7888,1.341041,0.0,0.0,0.0,0.0,19.0
120,0.4418,1.357858,0.0,0.0,0.0,0.0,19.0
140,0.3839,1.35229,0.0,0.0,0.0,0.0,19.0
160,0.5012,1.335147,0.0,0.0,0.0,0.0,19.0
180,0.4721,1.321859,0.0,0.0,0.0,0.0,19.0
200,0.3716,1.430409,0.0,0.0,0.0,0.0,19.0


True: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс. Он не начался вовремя.']
prediction: ['У меня проблемы с подключением к дистанционному экзамену в Тимс.']
True: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс. Он не начался вовремя.']
prediction: ['У меня проблемы с подключением к дистанционному экзамену в Тимс.']
True: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс. Он не начался вовремя.']
prediction: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс.']
True: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс. Он не начался вовремя.']
prediction: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс.']
True: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс. Он не начался вовремя.']
prediction: ['У пользователя проблемы с подключением к дистанционному экзамену в тимс.']
True: ['У пользователя проблемы с подключ



Step,Training Loss,Validation Loss,Rouge1,Rouge2,Rougel,Rougelsum,Gen Len
20,1.5738,0.918314,0.0,0.0,0.0,0.0,4.0
40,1.3632,0.762707,0.0,0.0,0.0,0.0,18.0
60,0.8421,0.656685,0.0,0.0,0.0,0.0,15.0
80,0.6732,0.6159,0.0,0.0,0.0,0.0,19.0
100,0.8175,0.604262,0.0,0.0,0.0,0.0,19.0
120,0.4805,0.545994,0.0,0.0,0.0,0.0,19.0
140,0.4633,0.48136,0.0,0.0,0.0,0.0,19.0
160,0.4941,0.449613,0.0,0.0,0.0,0.0,19.0
180,0.4475,0.407596,0.0,0.0,0.0,0.0,19.0
200,0.4215,0.373657,0.0,0.0,0.0,0.0,19.0


True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['Спасибо.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['Для использования программного обеспечения Matlab в своей работе.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['Программа с открытым исходным кодом Scilab.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['В СПбГУ предложена программа с открытым исходным кодом Scilab.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['В СПбГУ предложена программа с открытым исходным кодом Scilab.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['В СПбГУ предложена программа с открытым исходным кодом Scilab.']
True: ['Пользователь хочет использовать матлаб в своей работе.']
prediction: ['В СПбГУ предложена программа с открытым исходным кодом Scilab.']
True: ['Пользователь хочет использовать матлаб в своей работе.