In [None]:
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
MODEL_NAME = 'cointegrated/rut5-base-absum'
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)
model.eval();

def summarize(
    text, n_words=None, compression=None,
    max_length=1000, num_beams=3, do_sample=False, repetition_penalty=10.0, 
    **kwargs
):
    """
    Summarize the text
    The following parameters are mutually exclusive:
    - n_words (int) is an approximate number of words to generate.
    - compression (float) is an approximate length ratio of summary and original text.
    """
    if n_words:
        text = '[{}] '.format(n_words) + text
    elif compression:
        text = '[{0:.1g}] '.format(compression) + text
    x = tokenizer(text, return_tensors='pt', padding=True).to(model.device)
    with torch.inference_mode():
        out = model.generate(
            **x, 
            max_length=max_length, num_beams=num_beams, 
            do_sample=do_sample, repetition_penalty=repetition_penalty, 
            **kwargs
        )
    return tokenizer.decode(out[0], skip_special_tokens=True)

text = """Высота башни составляет 324 метра (1063 фута), примерно такая же высота, как у 81-этажного здания, и самое высокое сооружение в Париже. Его основание квадратно, размером 125 метров (410 футов) с любой стороны. Во время строительства Эйфелева башня превзошла монумент Вашингтона, став самым высоким искусственным сооружением в мире, и этот титул она удерживала в течение 41 года до завершения строительство здания Крайслер в Нью-Йорке в 1930 году. Это первое сооружение которое достигло высоты 300 метров. Из-за добавления вещательной антенны на вершине башни в 1957 году она сейчас выше здания Крайслер на 5,2 метра (17 футов). За исключением передатчиков, Эйфелева башня является второй самой высокой отдельно стоящей структурой во Франции после виадука Мийо."""


print(summarize(text))
# Эйфелева башня достигла высоты 300 метров.
print(summarize(text, n_words=10))
# Французская Эйфелева башня достигла высоты 300 метров.


In [None]:
pip install transformers

In [None]:
pip install sentencepiece==0.1.91


In [None]:
text = """Управление Следственного комитета по Новосибирской области возбудило уголовное дело в отношении лидера группы «Несчастный случай» Алексея Кортнева по статье об оскорблении представителя власти. Об этом сообщил телеграм-канал «Культуръка Новосибирска». Поводом для преследования стал инцидент на концерте в Новосибирске 14 февраля, когда музыкант, как утверждается, показал неприличный жест в адрес сотрудника полиции. Сам Кортнев в беседе с ТАСС подтвердил информацию об возбужденном деле, отметив, что считает свое уголовное преследование «абсолютно незаслуженным». Источник агентства в силовых структурах заявил, что материалы дела находятся в производстве отдела СК по расследованию особо важных дел. Статья 319 УК предусматривает штраф до 40 тысяч рублей или исправительные работы на срок до одного года."""

print(summarize(text))
# Эйфелева башня достигла высоты 300 метров.
print(summarize(text, n_words=10))


In [None]:
def summary(text: str, size: int = 10):
#     print(summarize(text))
    return summarize(text, n_words=size)

def summaryA(text: str, size: int = 10):
    sp = text.split("\n\n")
    return {'total': summary(text, size),
            'paragraphs': [summarize(paragraph, n_words=size) for paragraph in sp if paragraph.strip() != ""]
           }



In [None]:
summary("""Посольство Китая во Франции удалило из своего официального аккаунта в соцсети WeChat расшифровку интервью посла Лу Шая. Стенограмма была доступна несколько часов, но сейчас там, где она была опубликована, стоит пометка «удалена автором».

Лу Шай дал интервью французскому телеканалу LCI 21 апреля. Он, в числе прочего, заявил, что Крым «с самого начала принадлежал России», а Никита Хрущев «подарил Крым Украине во времена Советского Союза». Кроме того, посол Китая во Франции заявил, что страны бывшего СССР «не имеют эффективного статуса в международном праве, потому что не существует международного соглашения, которое придавало бы силу их статусу суверенных стран».

Интервью Лу Шая вызвало огромный резонанс, в частности, его осудили представители стран Балтии и Украины, а МИД КНР пришлось официально заявлять, что Китай уважает суверенитет всех стран, которые ранее входили в состав СССР, а его позиция по Крыму «остается неизменной».""")

In [None]:
summary("""Лу Шай дал интервью французскому телеканалу LCI 21 апреля. Он, в числе прочего, заявил, что Крым «с самого начала принадлежал России», а Никита Хрущев «подарил Крым Украине во времена Советского Союза». Кроме того, посол Китая во Франции заявил, что страны бывшего СССР «не имеют эффективного статуса в международном праве, потому что не существует международного соглашения, которое придавало бы силу их статусу суверенных стран».
Интервью Лу Шая вызвало огромный резонанс, в частности, его осудили представители стран Балтии и Украины, а МИД КНР пришлось официально заявлять, что Китай уважает суверенитет всех стран, которые ранее входили в состав СССР, а его позиция по Крыму «остается неизменной».""")

In [None]:
summaryA("""Посольство Китая во Франции удалило из своего официального аккаунта в соцсети WeChat расшифровку интервью посла Лу Шая. Стенограмма была доступна несколько часов, но сейчас там, где она была опубликована, стоит пометка «удалена автором».

Лу Шай дал интервью французскому телеканалу LCI 21 апреля. Он, в числе прочего, заявил, что Крым «с самого начала принадлежал России», а Никита Хрущев «подарил Крым Украине во времена Советского Союза». Кроме того, посол Китая во Франции заявил, что страны бывшего СССР «не имеют эффективного статуса в международном праве, потому что не существует международного соглашения, которое придавало бы силу их статусу суверенных стран».

Интервью Лу Шая вызвало огромный резонанс, в частности, его осудили представители стран Балтии и Украины, а МИД КНР пришлось официально заявлять, что Китай уважает суверенитет всех стран, которые ранее входили в состав СССР, а его позиция по Крыму «остается неизменной».""")

In [None]:
text = """Президент РФ Владимир Путин подписал указ, предусматривающий «передачу во временное управление» активов юридических и физических лиц из «недружественных стран» в случае изъятия российских активов за рубежом.

Указ, носящий название «О временном управлении некоторым имуществом», Указ переводит под временное управление Росимущества акции немецкой энергетической компании Uniper SE и Fortum Russia B.V. — совместного предприятия с участием финской государственной энергетической компании.

После начала полномасштабного вторжения войск РФ в Украину российские власти ввели ряд ограничений для иностранных компаний и бизнесменов из «недружественных стран», в список которых включены все государства, поддержавшие санкции в отношении России. Так, в частности, продажа компаниями из «недружественных стран» активов в России требует согласования правительственной комиссией. Условием согласования сделок является скидка — не менее 50% от рыночной стоимости активов, рассрочка оплаты или перечисление 10% от суммы сделки в бюджет РФ."""

summaryA(text)