In [1]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer

In [2]:
def load_tokenizer_and_model(model_name_or_path):
    return (GPT2Tokenizer.from_pretrained(model_name_or_path), 
            GPT2LMHeadModel.from_pretrained(model_name_or_path))


def generate(
        model, tok, text,
        do_sample=True, max_length=200, repetition_penalty=5.0,
        top_k=5, top_p=0.95, temperature=1,
        num_beams=None,
        no_repeat_ngram_size=2
):
    input_ids = tok.encode(text, return_tensors="pt")
    out = model.generate(
        input_ids,
        max_length=max_length,
        repetition_penalty=repetition_penalty,
        do_sample=do_sample,
        top_k=top_k, top_p=top_p, temperature=temperature,
        num_beams=num_beams, no_repeat_ngram_size=no_repeat_ngram_size
    )
    return list(map(tok.decode, out))

In [3]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt3large_based_on_gpt2")



In [4]:
generated = generate(model, tok, "Какой тип данных занимает меньше памяти в python: int или float?", num_beams=10)
generated[0]

'Какой тип данных занимает меньше памяти в python: int или float?\nПользователи часто задаются вопросом о том, какие типы данных занимают больше памяти. В этой статье мы постараемся ответить на этот вопрос и дать несколько полезных советов по работе с этими типами данных.\nДля начала давайте определимся с тем, что же такое «тип данных». Как правило, под этим термином подразумевают информацию, которая хранится в каком-либо устройстве (компьютере, планшете, смартфоне). Типы данных могут быть как текстовыми, так и цифровыми — это зависит от того, какое устройство вы используете для их хранения. Например, если у вас есть смартфон, то вам не нужно будет запоминать все те данные, которые будут храниться в вашем мобильном устройстве. Вы просто будете иметь доступ к этому устройству из любого места, где бы вы его ни использовали. Таким образом, чем больше типов данных хранит ваше устройство, тем лучше оно справляется со своими функциями.'

In [5]:
generated = generate(model, tok, "Какой тип данных занимает меньше памяти в python: int или float?", num_beams=5)
generated[0]

'Какой тип данных занимает меньше памяти в python: int или float?\nПользовательские типы данных занимают больше памяти, чем операторы присваивания. Это связано с тем, что они более устойчивы к ошибкам и могут быть легко заменены другими типами данных. Например, если вы хотите изменить значение переменной (например, добавить новую строку), вам не нужно создавать новый массив для каждой новой строки. Вы можете просто заменить все значения из массива на те, которые уже есть в массиве. Таким образом, у вас будет достаточно места для того, чтобы использовать несколько типов данных одновременно.\nКаким типом данных я могу воспользоваться при написании скрипта?\nВы можете использовать два типа данных во время работы над вашим скриптом. Во-первых, это может быть обычный текстовый файл, а во-вторых, он может содержать информацию о том, как работает ваш скрипт. В этом случае мы будем называть его «текстовым файлом». Текстовые файлы обычно используются'

In [6]:
generated = generate(model, tok, "Какие языки программирования поддерживают динамическую типизацию?",
                     num_beams=10)
generated[0]

'Какие языки программирования поддерживают динамическую типизацию?\nДинамическая типизация - это метод, который используется в программировании для того, чтобы сделать программный код более гибким и адаптивным к изменяющимся условиям окружающей среды.<s>\nЧто делать если я не могу зайти на сервер майнкрафт 1.5.2?\nПопробуй переустановить игру или скачай другой репак (если он у тебя есть), а так же проверь компьютер на вирусы антивирусом каспером. Если все равно не получается то обратись к админам сервера где ты играешь! Они должны знать как исправить эту проблему! А вообще советую скачать другую версию Майнкрафта с сайта майкрософта [ссылка заблокирована по решению администрации проекта] Там очень много интересных скриншотов и видеоуроков которые помогут тебе разобраться во всех тонкостях этого замечательного онлайн-геймплейного экшен-платформенного симулятора'

In [7]:
generated = generate(model, tok, "Какие языки программирования поддерживают динамическую типизацию?",
                     num_beams=5)
generated[0]

'Какие языки программирования поддерживают динамическую типизацию?\nДинамическая типизация (англ. dynamic typing) — один из методов машинного обучения, разработанный в 1980-х годах американскими учёными Ричардом Гуггенхаймом и Стивеном Вайнбергом. Суть метода заключается в том, что на основе множества входных данных строится алгоритм, который затем сравнивается с эталонным алгоритмом для того, чтобы получить более точное представление об объекте или явлении.<s>\nВ каких случаях можно отказаться от страховки по кредиту при досрочном погашении кредита?\nОтказаться от страховой премии вы можете только в одном случае - если кредит был оформлен под залог имущества заемщика. В этом случае страховая премия выплачивается за вычетом стоимости заложенного имущества. Если же речь идет о потребительском кредите, то отказ от страхования никак не повлияет на размер переплаты: она все равно будет рассчитываться исходя из ставки рефинансирования Центробанка Российской Федерации.'