In [1]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer

In [6]:
def load_tokenizer_and_model(model_name_or_path):
    return (GPT2Tokenizer.from_pretrained(model_name_or_path), 
            GPT2LMHeadModel.from_pretrained(model_name_or_path))


def generate(
        model, tok, text,
        do_sample=True, max_length=2000, repetition_penalty=5.0,
        top_k=5, top_p=0.95, temperature=1,
        num_beams=None,
        no_repeat_ngram_size=2
):
    input_ids = tok.encode(text, return_tensors="pt")
    out = model.generate(
        input_ids,
        max_length=max_length,
        repetition_penalty=repetition_penalty,
        do_sample=do_sample,
        top_k=top_k, top_p=top_p, temperature=temperature,
        num_beams=num_beams, no_repeat_ngram_size=no_repeat_ngram_size
    )
    return list(map(tok.decode, out))

In [7]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt3large_based_on_gpt2")



In [4]:
generated = generate(model, tok, "Какой тип данных занимает меньше памяти в python: int или float?", num_beams=10)
generated[0]

'Какой тип данных занимает меньше памяти в python: int или float?\nПользователи часто задаются вопросом о том, какие типы данных занимают больше памяти. В этой статье мы постараемся ответить на этот вопрос и дать несколько полезных советов по работе с этими типами данных.\nДля начала давайте определимся с тем, что же такое «тип данных». Как правило, под этим термином подразумевают информацию, которая хранится в каком-либо устройстве (компьютере, планшете, смартфоне). Типы данных могут быть как текстовыми, так и цифровыми — это зависит от того, какое устройство вы используете для их хранения. Например, если у вас есть смартфон, то вам не нужно будет запоминать все те данные, которые будут храниться в вашем мобильном устройстве. Вы просто будете иметь доступ к этому устройству из любого места, где бы вы его ни использовали. Таким образом, чем больше типов данных хранит ваше устройство, тем лучше оно справляется со своими функциями.'

In [5]:
generated = generate(model, tok, "Какой тип данных занимает меньше памяти в python: int или float?", num_beams=5)
generated[0]

'Какой тип данных занимает меньше памяти в python: int или float?\nПользовательские типы данных занимают больше памяти, чем операторы присваивания. Это связано с тем, что они более устойчивы к ошибкам и могут быть легко заменены другими типами данных. Например, если вы хотите изменить значение переменной (например, добавить новую строку), вам не нужно создавать новый массив для каждой новой строки. Вы можете просто заменить все значения из массива на те, которые уже есть в массиве. Таким образом, у вас будет достаточно места для того, чтобы использовать несколько типов данных одновременно.\nКаким типом данных я могу воспользоваться при написании скрипта?\nВы можете использовать два типа данных во время работы над вашим скриптом. Во-первых, это может быть обычный текстовый файл, а во-вторых, он может содержать информацию о том, как работает ваш скрипт. В этом случае мы будем называть его «текстовым файлом». Текстовые файлы обычно используются'

In [6]:
generated = generate(model, tok, "Какие языки программирования поддерживают динамическую типизацию?",
                     num_beams=10)
generated[0]

'Какие языки программирования поддерживают динамическую типизацию?\nДинамическая типизация - это метод, который используется в программировании для того, чтобы сделать программный код более гибким и адаптивным к изменяющимся условиям окружающей среды.<s>\nЧто делать если я не могу зайти на сервер майнкрафт 1.5.2?\nПопробуй переустановить игру или скачай другой репак (если он у тебя есть), а так же проверь компьютер на вирусы антивирусом каспером. Если все равно не получается то обратись к админам сервера где ты играешь! Они должны знать как исправить эту проблему! А вообще советую скачать другую версию Майнкрафта с сайта майкрософта [ссылка заблокирована по решению администрации проекта] Там очень много интересных скриншотов и видеоуроков которые помогут тебе разобраться во всех тонкостях этого замечательного онлайн-геймплейного экшен-платформенного симулятора'

In [7]:
generated = generate(model, tok, "Какие языки программирования поддерживают динамическую типизацию?",
                     num_beams=5)
generated[0]

'Какие языки программирования поддерживают динамическую типизацию?\nДинамическая типизация (англ. dynamic typing) — один из методов машинного обучения, разработанный в 1980-х годах американскими учёными Ричардом Гуггенхаймом и Стивеном Вайнбергом. Суть метода заключается в том, что на основе множества входных данных строится алгоритм, который затем сравнивается с эталонным алгоритмом для того, чтобы получить более точное представление об объекте или явлении.<s>\nВ каких случаях можно отказаться от страховки по кредиту при досрочном погашении кредита?\nОтказаться от страховой премии вы можете только в одном случае - если кредит был оформлен под залог имущества заемщика. В этом случае страховая премия выплачивается за вычетом стоимости заложенного имущества. Если же речь идет о потребительском кредите, то отказ от страхования никак не повлияет на размер переплаты: она все равно будет рассчитываться исходя из ставки рефинансирования Центробанка Российской Федерации.'

In [8]:
request = ("Дополни следующий текст:"
           "Тема сегодняшней лекции – типы данных в Python для начинающих. Какие бывают и как с ними работать? Python – это объектно-ориентированный язык программирования. Его основу составляют объекты и классы. Объект – это область памяти компьютера, которая описывается типом, он же называется классом, и значением. При этом от типа зависит область значения объекта, операции и методы, которые к нему можно применять. Python предоставляет богатый набор встроенных типов данных, поэтому при решении стандартных задач питанисты реже пишут собственные классы, чем, например, разработчик из Java. Сегодня мы рассмотрим, что такое строгая динамическая типизация в Python, что такое изменяемые и неизменяемые типизации. Python — это в целом язык программирования со строго динамической типизацией. Строгое означает, что язык не производит неявные преобразования типов и не создает сюрпризов при их случайном смешении. Например, если к целому числу прибавить строку, то Python выдаст ошибку о несовместимых типах. Динамическая типизация означает, что типы объектов определяются в процессе исполнения программы, поэтому питанисты могут не указывать типы переменных. Переменные в Python это всего лишь указатели на объекты, они не содержат информации о типе. При этом можно создавать и изменять переменные в любой момент, главное присвоить им значение. Вот в языках со статической типизацией, таких как C++, C Sharp и Java, типы объектов определяются еще на этапе компиляции, поэтому при попытке запустить код компилятор может выдать ошибку, если четко не обозначить тип переменной. Изменяемые и неизменяемые типы данных. Типы данных в Python делятся на эти две группы. Когда мы присваиваем новое значение неизменяемому объекту, Python не перезаписывает его, а создает новый объект с тем же именем. Чтобы в этом убедиться, достаточно проверить ID, уникальный номер, который присваивается каждому объекту в Python. Когда мы прибавляем 5 к переменной int-opt, на ее месте создается новый объект с тем же именем. При этом при первом выводе id имеет одно значение, а после выполнения операции сложения уже другое. При этом идентификатор списка list-optg не меняется, потому что списки в Python — это изменяемые объекты. К неизменяемым объектам относятся числа, строки и кортежи, а к изменяемым – списки, словари и множество. Это свойство нужно учитывать при передаче объекта в функцию. Например, если вы не хотите, чтобы функция изменила исходный список, передайте в нее копию этого списка. Теперь рассмотрим встроенные типы данных языка Python. В недрах интерпретатора Python зашито много типов данных. Их можно разделить на три группы. Простые, в них входят числа и строки, коллекции, это списки, кортежи и словари, и остальные. Сюда входят файлы, итераторы, сокет и данные типа none. При этом рекомендуется отдавать предпочтение встроенным типам. Они упрощают разработку и более эффективны, чем пользовательские классы, потому что представляют собой оптимизированные структуры данных на языке C. Программы на Python умеют работать с целыми числами int, числами с плавающей точкой float и комплексными числами complex. В целом, числовые объекты в Python поддерживают те же операции, что и числа в других языках программирования. Также в стандартной библиотеке Python есть модуль math, который подключается к директиве import math. Он содержит широкий набор функций для работы с числовыми данными. А теперь давайте ради примера получим какое-нибудь очень большое число. Например, возведем 27 в 560 степень. Для таких объектов в Python есть специальный тип long. Но если в том же C++ самый большой тип long ограничен 64 битами, это самое большое положительное число, то длинные числа, то есть с типом long, в Python не ограничены. Строки или string — это последовательности символов, поэтому к ним применимы многие методы других последовательностей, списков и кортежей. Например, обращение к элементу по индексу, вычисление количества символов, конкатенация и получение среза. Строки поддерживают работу с отрицательными индексами. Их удобно использовать, когда нужно обратиться к элементу с конца. Кроме того, у типа String есть ряд методов, уникальных для него. Списки, List — это упорядоченная коллекция объектов. Списки могут иметь сколько угодно уровней вложенности и хранить неограниченное количество объектов. Кроме того, в одном списке могут одновременно храниться объекты разных типов. Над списками можно производить те же операции, что и над строками. Но у списков есть и специфические методы, которые присущи только им. Например, можно добавить новый элемент в конце списка, удалить и ты элемент или отсортировать список. Кортежи или tuple – это те же списки, только неизменяемые. Над ними можно производить те же операции, что и над списками, кроме тех, которые изменяют кортеж. При попытке заменить элемент в кортеже, Python выдаст сообщение об ошибке. Вы спросите, зачем нужны кортежи, когда есть списки с более широким набором методов и операций? Как было сказано выше, иногда программистам важно быть уверенными, что функция не изменит значение объекта. Как раз для таких случаев и годятся кортежи. Словари или дикт – это неупорядоченная коллекция пар типа ключ-значения. В качестве ключей могут уступать любые неизменяемые объекты, числа, строки и даже кортежа. Получать доступ к элементам, удалять и создавать новые довольно просто. В качестве значений словарь может хранить объекты совершенно разных типов, даже другие словари. Глубина вложенности не ограничена. Так как словари являются отображениями, а не последовательностями, то элементы в них не упорядочены. Это значит, что при выводе элементов в цикле for их порядок не всегда будет совпадать с порядком, заданным при инициализации словаря. Файлы. Объекты файла позволяют работать с файловой системой компьютера. Чтобы создать такой объект, нужно передать функции open, имя файла и режим доступа, чтение или запись. Допустим, мы решили написать книгу о Python. Тогда нужно создать файловый объект в режиме записи, который обозначается как w, от write, а затем записывать в него строки текста с помощью метода write. Проверим, сохранилось ли все как надо. Для этого создадим новый объект файл с помощью той же функции open, но теперь в режиме чтения, который обозначается английской маленькой буквой r, r.read. Как вы можете убедиться, все строки, которые мы записали в файл, на месте. Что еще можно почитать про типы данных в Python? Ну, теперь вы знаете о типах в Python достаточно, чтобы решать простейшие задачи и даже ответить на вопросы на собеседование. Если хотите узнать о системе типов еще больше, можно почитать классические источники. Изучаем Python 3, часть 2, типы и операции от M.Lutz, программирование на Python 3, глава 2, типы данных Summerfield или документацию Python"
           "Перед резлуьтатом напиши: Последующий текст сгенерирован нейросетью:")

generated = generate(model, tok, request, num_beams=5)
generated[0]

'Дополни следующий текст:Тема сегодняшней лекции – типы данных в Python для начинающих. Какие бывают и как с ними работать? Python – это объектно-ориентированный язык программирования. Его основу составляют объекты и классы. Объект – это область памяти компьютера, которая описывается типом, он же называется классом, и значением. При этом от типа зависит область значения объекта, операции и методы, которые к нему можно применять. Python предоставляет богатый набор встроенных типов данных, поэтому при решении стандартных задач питанисты реже пишут собственные классы, чем, например, разработчик из Java. Сегодня мы рассмотрим, что такое строгая динамическая типизация в Python, что такое изменяемые и неизменяемые типизации. Python — это в целом язык программирования со строго динамической типизацией. Строгое означает, что язык не производит неявные преобразования типов и не создает сюрпризов при их случайном смешении. Например, если к целому числу прибавить строку, то Python выдаст ошибку о