In [1]:
import telebot
import torch 
from transformers import T5ForConditionalGeneration, T5Tokenizer

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model_name = "rut5_v7"
tokenizer = T5Tokenizer.from_pretrained(model_name)
model = T5ForConditionalGeneration.from_pretrained(model_name).cuda()
device = 'cuda'

In [3]:
# Best trial:
# Value:  33.436832361267065
# Params: 
# repetition_penalty: 0.03657671556007456
# num_beams: 4
# max_length: 0.4193862846988271
# length_penalty: 1.9554354329528894
# no_repeat_ngram_size: 1
# early_stopping: False

In [4]:
def generate(text, **kwargs):
    inputs = tokenizer(text, return_tensors='pt').to(device)
    with torch.no_grad():
        hypotheses = model.generate(**inputs, num_beams=4, max_length=len(text)*0.5, **kwargs)
    return tokenizer.decode(hypotheses[0], skip_special_tokens=True)

def generate_t5(text):
    inputs = tokenizer(text, return_tensors='pt').to(device)
    with torch.no_grad():
        hypotheses = model.generate(inputs["input_ids"], no_repeat_ngram_size=1) #, max_length=len(text)*0.7, max_length=30, num_beams=5
    return tokenizer.decode(hypotheses[0], skip_special_tokens=True)

# def paraphrase(text, beams=5, grams=4):
#     x = tokenizer(text, return_tensors='pt', padding=True).to(model.device)
#     max_size = int(x.input_ids.shape[1] * 1.5 + 10)
#     out = model.generate(**x, encoder_no_repeat_ngram_size=grams, num_beams=beams, max_length=max_size)
#     return tokenizer.decode(out[0], skip_special_tokens=True)

In [5]:
text = """В Питере в акватории Финского залива на флагштоках высотой 179,5 метров подняли флаги Российской Федерации, Российской империи и СССР.
«Поднятие флагов приурочено к большим историческим датам, связанным с учреждением каждого из них: 165 лет флагу Российской империи, 100 лет Красному знамени и 330 лет триколору Петра Первого», — сообщила пресс-служба «Газпрома»"""

In [6]:
generate_t5(text)



'В Питере подняли флаги Российской Федерации, Россиийской империей.'

In [None]:
bot = telebot.TeleBot('5859558869:AAHb_SjGmlqreUW5kXumA4aIMgR3UFzsR8g')

@bot.message_handler(commands=['start', 'help'])
def send_welcome(message):
    bot.reply_to(message, "Привет! Я умею упрощать текст. Отправь мне предложение и я его упрощу.")

@bot.message_handler(commands=['simplify'])
def simplify_text(message):
    input_text = message.text[10:]  # удаляем "/simplify " из сообщения
    output_text = generate_t5(f'simplify | {input_text}')  # обрабатываем текст
    bot.reply_to(message, output_text)

bot.polling()