# Fitting Description

## Mount Google Drive

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
cd /content/drive/MyDrive/digital_breakthrough/task_3

/content/drive/MyDrive/digital_breakthrough/task_3


In [None]:
!pip install -r requirements.txt

In [1]:
cd /content/drive/MyDrive/digital_breakthrough/task_3

/content/drive/MyDrive/digital_breakthrough/task_3


### SVC

In [272]:
import logging
import numpy as np
import pandas as pd

from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import TfidfTransformer, CountVectorizer
from sklearn.svm import LinearSVC
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_predict, KFold
from sklearn.feature_extraction.text import TfidfVectorizer
from definitions import DATA_PATH, SUB_PATH, TRAIN_IMAGES
from src.predict import prediction
from airotica.airotica import detectron


%matplotlib inline
%load_ext autoreload
%autoreload 2

log = logging.getLogger(__name__)

In [278]:
train = pd.read_csv(DATA_PATH / 'train.csv')
train_url_only = pd.read_csv(DATA_PATH / 'train_url_only.csv')
train_url_loaded_images = pd.read_csv(DATA_PATH / 'train_loaded_images.csv')
test = pd.read_csv(DATA_PATH / 'test.csv')
sample_submission = pd.read_csv(DATA_PATH / 'sample_submission.csv')

train_labels = train.typology.unique()
typology_to_label = dict(zip(sorted(train_labels), range(len(train_labels))))
label_to_typology = {v:k for k, v in typology_to_label.items()}


MAPPER = {0: 0, 1:1, 2:2, 3:3, 4:4, 5:5, 6:6, 
          7:7, 8:8, 9:9, 10:10, 11:12, 12:13, 13:14,
          -1: -1
          }

In [None]:
images_prediction = detectron(config_name='config5.yml', 
                              save_path='./sub/predictv3.csv',
                              model_path='./EXPERIMENTS/full_res/model_0001_0.857586.pth',
                              model_type='resnext101_32x8d',
                              save_result=False,
                              return_result=True,
                              use_description=False
                              )
description_prediction = prediction('predict.yaml')

In [281]:
test = test.drop('typology', axis=1)
test['typology_desc'] = -1
test['typology_images'] = -1
test.loc[description_prediction.index, 'typology_desc'] = description_prediction.values
d = images_prediction[images_prediction.sign_0 != -1]
test.loc[d.index, 'typology_images'] = d.sign_0.map(MAPPER).map(label_to_typology)

In [298]:
import os
from os import listdir
train_images = listdir(TRAIN_IMAGES)
guid_train_images = [f.split('.')[0] for f in train_images if os.path.getsize(f"{str(TRAIN_IMAGES / f)}") != 0]

In [299]:
dummy = test[test.guid.isin(guid_train_images)]
test_only_description = test[~(test.guid.isin(guid_train_images))]
test_only_images = dummy[dummy.description.isna()]
test_images_and_description = dummy[~(dummy.description.isna())]
print('without image or description:', len(test_only_description[test_only_description.description.isna()]))
print('only description:', test_only_description.shape[0])
print('only images:', test_only_images.shape[0])
print('images and description:', test_images_and_description.shape[0])

without image or description: 0
only description: 106
only images: 547
images and description: 570


In [300]:
true_labels = test_images_and_description[test_images_and_description.typology_desc == test_images_and_description.typology_images]
fake_labels = test_images_and_description[test_images_and_description.typology_desc != test_images_and_description.typology_images]

In [407]:
cat = ['фотографии и негативы', 'графика', 'живопись']
tps = fake_labels[fake_labels.typology_images.isin(cat)]
tps2 = fake_labels[~(fake_labels.typology_images.isin(cat))]
sample_submission.loc[tps.index, 'typology'] = tps.typology_images
sample_submission.loc[tps2.index, 'typology'] = tps2.typology_desc
sample_submission.loc[test_only_images.index, 'typology'] = test_only_images.typology_images
sample_submission.loc[test_only_description.index, 'typology'] = test_only_description.typology_desc

In [None]:
sample_submission.to_csv('./sub/bblbl4.csv', index=False)

In [None]:
for i, row in fake_labels[fake_labels.typology_images == 'графика'].iterrows():
    filename = row['guid']
    desc = row['typology_desc']
    im = row['typology_images']
    img = read_image(str(TRAIN_IMAGES / f'{filename}.jpg'))
    plt.imshow(img, label='1')
    plt.title(row['description'] + '\n' + f'{desc} ------ {im}')
    plt.legend()
    plt.show()


In [None]:
from airotica.utils import read_image
import matplotlib.pyplot as plt


for i, row in fake_labels.iterrows():
    filename = row['guid']
    desc = row['typology_desc']
    im = row['typology_images']
    img = read_image(str(TRAIN_IMAGES / f'{filename}.jpg'))
    plt.imshow(img, label='1')
    plt.title(row['description'] + '\n' + f'{desc} ------ {im}')
    plt.legend()
    plt.show()

In [342]:
def apply_new_desc(text):
    text = text + " - это"
    input_ids = tokenizer.encode(text, return_tensors="pt").cuda()
    out = model.generate(input_ids.cuda(), max_length=50)
    generated_text = list(map(tokenizer.decode, out))[0]
    return generated_text

In [None]:
fake_labels['description_generated'] = fake_labels['description'].apply(apply_new_desc)

In [345]:
s = pd.DataFrame()
s['description'] = fake_labels['description_generated']

In [346]:
pred_gen = prediction('predict.yaml', test=s)

tokenizing: 100%|██████████| 120/120 [00:00<00:00, 3860.50it/s]




tokenizing: 100%|██████████| 120/120 [00:00<00:00, 3702.63it/s]




In [406]:
pred_gen

1                            прочие
14                           прочие
28                           прочие
29              предметы археологии
38      предметы печатной продукции
                   ...             
1168    предметы печатной продукции
1169                        графика
1184           предметы нумизматики
1189                        графика
1198                         прочие
Length: 120, dtype: object

In [348]:
fake_labels['typology_gen'] = pred_gen

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """Entry point for launching an IPython kernel.


In [338]:
for i, row in fake_labels.iterrows():
    text = row['description'] + " - это"
    input_ids = tokenizer.encode(text, return_tensors="pt").cuda()
    out = model.generate(input_ids.cuda(), max_length=50)
    generated_text = list(map(tokenizer.decode, out))[0]
    print(row['description'])
    print(generated_text)
    print('--', row['typology_desc'])
    print('\n')

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Образец волос. Удмурты
Образец волос. Удмурты - это не только красивые, но и очень умные люди.

В Удмуртии есть свой национальный праздник - День оленевода.

В этом году он выпадает на 5 мая.

В этом
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Диафильм для детей «Конек – Горбунок. Часть 4»
Диафильм для детей «Конек – Горбунок. Часть 4» - это увлекательная история о том, как мальчик Конек и его друзья попали в волшебную страну, где живут добрые и злые гномы.
В этой сказке рассказывается
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Образец ткани Киржачского шелкового комбината "Черёмуха" из альбома №629
Образец ткани Киржачского шелкового комбината "Черёмуха" из альбома №629 - это не просто ткань, а ткань, которая была изготовлена в СССР в период с 1961 по 1991 год.

В этом
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пряслице
Пряслице - это не только прялка, но и ткацкий станок, и даже ткацкий станок с прялкой.

В старину пряслица была не только прялкой, но и ткацким станком
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Кемерово. Площадь Пушкина. Общий вид на памятник Пушкину.
Кемерово. Площадь Пушкина. Общий вид на памятник Пушкину. - это не просто памятник, это памятник, который стоит в городе Кемерово.

В этом году в городе Кемерово, как и в других городах Кузб
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Зал. Интерьер.
Зал. Интерьер. - это место, где можно увидеть и услышать все, что происходит в мире искусства.

Вход в зал свободный.

Вход в зал бесплатный.

Вход в зал бесплатный.

В
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Агитка Ипгефер Л.В.
Агитка Ипгефер Л.В. - это не только книга, но и целый мир. В ней рассказывается о том, как в начале XX века в России появилась первая в мире школа для детей с ограниченными возможностями здоровья.
В книге
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Жанр. Всадник-киргиз, стреляющий из лука
Жанр. Всадник-киргиз, стреляющий из лука - это не только красиво, но и очень опасно.

Всадник-киргиз, стреляющий из лука - это не только красиво, но и очень опасно
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Правительственная делегация Румынской Народной Республики в СССР. Проводы на Внуковском аэродроме. 
Правительственная делегация Румынской Народной Республики в СССР. Проводы на Внуковском аэродроме.  - это не просто дань памяти, это дань уважения и памяти всем, кто погиб в годы Великой Отечественной войны.

В этом году в Москве,
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Бляшка. Водянское городище
Бляшка. Водянское городище - это место, где археологи нашли останки людей, которые жили в эпоху бронзы.

Вход на территорию археологического музея бесплатный.

Вход на территорию археологического музея бесплатный.

-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Группа вооруженных туземцев из Педирстрека.
Группа вооруженных туземцев из Педирстрека. - это не шутка.

- А что это за группа? - спросил я.

- Это группа, которая хочет захватить власть в Педирстреке.

-
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотография. Сцена из оперы "Муха-цокотуха" в исполнении учащихся музыкальной школы.
Фотография. Сцена из оперы "Муха-цокотуха" в исполнении учащихся музыкальной школы. - это не просто фотография, это - картина, написанная художником.

В этом году в конкурсе приняли участие более 200 учащихся из разных
-- документы


Книга. Выступление по радио председателя государственного комитета обороны И.В.Сталина 3 июля 1941 года. 1-я Обр. тип. Огиза РСФСР треста "Полиграфкнига"
Книга. Выступление по радио председателя государственного комитета обороны И.В.Сталина 3 июля 1941 года. 1-я Обр. тип. Огиза РСФСР треста "Полиграфкнига" - это не просто типография, это
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Грампластинка Леонид Утесов "У Черного моря","Автоболельщик"
Грампластинка Леонид Утесов "У Черного моря","Автоболельщик" - это не просто песни, это целая философия, которая не только помогает нам жить, но и помогает нам любить.

В этом году испол
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Почетная грамота
Почетная грамота - это не только почет, но и уважение.

В этом году в конкурсе приняли участие более 200 человек.

В этом году в конкурсе приняли участие более 200 человек.

В этом году в конкурсе приняли участие
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


План  г. Вологды и план Октябрьского поселка-сада
План  г. Вологды и план Октябрьского поселка-сада - это два разных плана. План г. Вологды - это план города, а план Октябрьского поселка-сада - это план поселка.

В плане г. Вологды
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


«Данилевский Николай Николаевич».
«Данилевский Николай Николаевич». - это не просто фамилия, а имя и отчество.

Николай Николаевич Данилевский (1817-1885) - русский писатель, историк, публицист, общественный деятель.

Николай Николаевич
-- документы


Книга. Марксизм и борьба с социал-фашизмом. Речь на декабрьском пленуме Исполкома КИМ"а 1932 г. Москва. ОГИЗ - Молодая гвардия -1933 г.
Книга. Марксизм и борьба с социал-фашизмом. Речь на декабрьском пленуме Исполкома КИМ"а 1932 г. Москва. ОГИЗ - Молодая гвардия -1933 г. - это сборник статей, написанных в
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пуговица 
Пуговица  - это не только украшение, но и оберег.

Проведите рукой по пуговице, и она станет вашей защитой.

Проведите рукой по пуговице, и она станет вашей защитой.

-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Подошва
Подошва - это часть обуви, которая крепится к подошве.

Виды подошв:

1. Сапоги с мягкой подошвой.

2. Сапоги с жесткой подошвой.


-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Книги с подписями монгольского народа к 70-летию Сталина.
Книги с подписями монгольского народа к 70-летию Сталина. - это не просто сборник документов, это собрание документов, которые были написаны в период с 1917 по 1953 год. В них рассказывается о том, как в СССР создавался новый строй,
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Сперанский и Аракчеев.
Сперанский и Аракчеев. - это два разных человека.

- А что же это за человек?

- Это человек, который не может быть ни хорошим, ни плохим.

- А что же это за человек
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пуговица среднего размера с звездой, серпом и молотом.
Пуговица среднего размера с звездой, серпом и молотом. - это не просто украшение, а символ, который несет в себе определенную информацию.

В старину, когда люди верили в приметы, они считали, что если на одежде
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Газета. Ленинский путь. №30 (2353)
Газета. Ленинский путь. №30 (2353) - это не только газета, но и журнал, который выходит в Ленинском районе города. В нем публикуются материалы о жизни Ленинского района, о жизни города, о жизни района, о жизни
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Обломок сосуда
Обломок сосуда - это не только предмет, который можно разбить, но и символ, который может быть использован в качестве оберега.

В древности люди верили, что осколок сосуда может защитить от сглаза, порчи, сглаза,
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Документ. Фотография медсестер из медсанбата 105 отделения дивизии.
Документ. Фотография медсестер из медсанбата 105 отделения дивизии. - это не просто документ, это документ, который подтверждает, что медсестра, которая ухаживала за ранеными, была награждена медалью "За отвагу".

Мед
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Образец ткани Киржачского шелкового комбината "Крепдешин" из альбома №393
Образец ткани Киржачского шелкового комбината "Крепдешин" из альбома №393 - это ткань, которая была изготовлена в период с 1961 по 1965 годы.
В настоящее время ткань Киржачского шелкового
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Горшочек глиняный
Горшочек глиняный - это не горшок, а горшок.<s>
Как называется этот цветок?
Это не цветок, а горшок.<s>
Как называется этот цветок?
Это не цветок, а горшок.<s>
Как называется этот цветок?

-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Открытка иллюстрированная. Хабербергская церковь. Пауль Эмиль Габель. Изд-во Риземанн и Линталер, Кёнигсберг
Открытка иллюстрированная. Хабербергская церковь. Пауль Эмиль Габель. Изд-во Риземанн и Линталер, Кёнигсберг - это город, в котором я живу.

В этом городе я живу уже
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Божок в одежде.
Божок в одежде. - это не просто так. Это символ.

- А что это за символ?

- Это символ, который символизирует, что Бог есть.

- А что это за символ?

- Это
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 63, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


печатная графика. Lupo grigio - Gray wolf
печатная графика. Lupo grigio - Gray wolf - это не просто волк, а волк-оборотень.

В общем, если вы хотите посмотреть на это чудо, то вам сюда.

А вот и сам
-- графика


Фотография. Подъяпольская Н.И.  в роли Иванушки, Гарин В.И. в роли Бабы-Яги. "Два клена" (Режиссёр Васильев Е.Н. Художник Талалай В.Л.). Москва, Московский театр юного зрителя
Фотография. Подъяпольская Н.И.  в роли Иванушки, Гарин В.И. в роли Бабы-Яги. "Два клена" (Режиссёр Васильев Е.Н. Художник Талалай В.Л.). Москва, Московский театр юного зрителя - это театр
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Афиша выставки-ярмарки "В подарок женщинам - тепло самоцветов", проходившей в Азовском краеведческом музее.
Афиша выставки-ярмарки "В подарок женщинам - тепло самоцветов", проходившей в Азовском краеведческом музее. - это выставка-ярмарка, на которой можно было приобрести изделия народных промыслов, сувениры, изделия народных
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Билет железнодорожный Пронино-Клявлино
Билет железнодорожный Пронино-Клявлино - это билет на поезд, который отправляется с вокзала Пронино в городе Клявлино.
Расписание поездов Пронино-Клявлино на сегодня
Поезда Про
-- предметы нумизматики




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


рекламный листок
рекламный листок - это не просто рекламный листок, это - рекламный проспект. Рекламный проспект - это не просто рекламный проспект, это - рекламный проспект. Рекламный проспект - это не просто рекламный проспект, это -
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Карта. "План Праги".
Карта. "План Праги". - это карта города Праги. Карта Праги.

Прага - это город, который находится на территории Чехии.

Прага - это город, который находится на территории Чехии.
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


буклет
буклет - это не только реклама, но и возможность донести до потребителя информацию о товаре, услуге, компании.
В каталоге представлены товары и услуги, которые можно заказать в нашем интернет-магазине.
Мы предлагаем Вам ознакомиться с каталогом товаров
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Культармеец. № 22-23. 10-25 августа, 1932 года. Организационно-методический журнал политпросветработы. Издание Ленинградского Областного издательства.
Культармеец. № 22-23. 10-25 августа, 1932 года. Организационно-методический журнал политпросветработы. Издание Ленинградского Областного издательства. - это сборник статей, опубликованных в периодической печати в
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фрагмент преграды алтарной из храма №1 на Ильичевском городище (Х-ХIIIвв.), украшенной резным орнаментом (плетенка)
Фрагмент преграды алтарной из храма №1 на Ильичевском городище (Х-ХIIIвв.), украшенной резным орнаментом (плетенка) - это фрагмент ограды храма №1 на Ильичевском город
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Санитарно-гигиенические навыки в детском доме и методика их привития детям
Санитарно-гигиенические навыки в детском доме и методика их привития детям - это не только воспитание, но и обучение.
Воспитание - это процесс, в котором ребенок учится, развивается, познает мир.
В
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Ю.И. Стальский "О вреде аборта"
Ю.И. Стальский "О вреде аборта" - это не только книга, но и документальный фильм, который рассказывает о том, что аборты - это убийство.

В фильме рассказывается о том, что аборты -
-- живопись




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Б.Л. Кальманович "Что такое бациллоносительство"
Б.Л. Кальманович "Что такое бациллоносительство" - это книга, которая написана в соавторстве с профессором А.А. Фельдманом. В ней рассказывается о том, как в начале 20-х годов прошлого
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Талько-магнезитовый сланец
Талько-магнезитовый сланец - это минерал, который образуется в результате осаждения магния из магнезита.
Талько-магнезитовый сланец - это минерал, который образуется в результате осаждения
-- предметы минералогической коллекции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пластинка. «Вадим Мулерман», «Мелодия» г. Москва.
Пластинка. «Вадим Мулерман», «Мелодия» г. Москва. - это не просто музыка, это музыка, которая не просто звучит, а живет. Это музыка, которая не просто звучит, а живет
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Девятка червей. Из колоды игральных карт «Рождественские».
Девятка червей. Из колоды игральных карт «Рождественские». - это игра, в которой нужно угадать, что изображено на карточках.

В игре участвуют 4 игрока.

Игроки по очереди выкладывают карты
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Союз писателей. Портреты
Союз писателей. Портреты - это не только портреты, но и портреты.

В этом году в конкурсе приняли участие более 200 авторов.

В этом году в конкурсе приняли участие более 200 авторов.

В этом году в конкурсе приняли участие
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Ленинград (СПб). Кировский проспект. Перспектива улицы.
Ленинград (СПб). Кировский проспект. Перспектива улицы. - это не только архитектурный ансамбль, но и место, где можно отдохнуть и насладиться видами города.

Вход в парк бесплатный.

В парке есть кафе,
-- предметы печатной продукции


Буклет. XIII Международному конкурсу имени П.И. Чайковского посвящается. Выставка открыта с 8 июня по 1 июля 2007 года в Московском саду "Эрмитаж". - Москва, 2007.
Буклет. XIII Международному конкурсу имени П.И. Чайковского посвящается. Выставка открыта с 8 июня по 1 июля 2007 года в Московском саду "Эрмитаж". - Москва, 2007. - это не просто выставка, это целый
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотография ч/б "Политехническая выставка 1872 года. Морской отдел"
Фотография ч/б "Политехническая выставка 1872 года. Морской отдел" - это не просто фотография, это целый рассказ о том, как выглядела морская техника в то время.

В 1872 году в Петербурге проходила выставка,
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотография. Сличенко Н.А. Портрет. Москва, Московский музыкально-драматический цыганский театр "Ромэн"
Фотография. Сличенко Н.А. Портрет. Москва, Московский музыкально-драматический цыганский театр "Ромэн" - это не просто театр, это целый мир, в котором живут и работают артисты, режиссеры,
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Брошюра. Ершов В.П. Электрографический анализ возрастных особенностей функциональных показателей коры больших полушарий головного мозга теплокровных животных.
Брошюра. Ершов В.П. Электрографический анализ возрастных особенностей функциональных показателей коры больших полушарий головного мозга теплокровных животных. - это книга, которая поможет вам разобраться в том, как работает ваш мозг, и
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Киянка
Киянка - это не только украшение, но и средство для ухода за волосами.
Киянка - это не только украшение, но и средство для ухода за волосами.
Киянка - это не только украшение, но и средство для ухода
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 59, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Грамота.
Грамота. - это документ, удостоверяющий личность, который выдается в органах внутренних дел.

В документе, удостоверяющем личность, указываются фамилия, имя, отчество, дата и место рождения, пол, гражданство, серия и номер паспорта
-- документы


Рахаевы. Новогодняя поздравительная открытка к Р.Д. Нифонтовой с выражением восхищения ее талантом и исполнением роли Илоны в спектакле "Каменное гнездо". "Каменное гнездо (Женщины Нискавуори)". Москва. Государственный академический Малый театр СССР
Рахаевы. Новогодняя поздравительная открытка к Р.Д. Нифонтовой с выражением восхищения ее талантом и исполнением роли Илоны в спектакле "Каменное гнездо". "Каменное гнездо (Женщины Нискавуори)". Москва. Государственный академический Малый театр СССР - это театр
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Эскиз декорации. I акт. Перед магазином. "Иркутская история". Москва. Государственный академический театр имени Евг. Вахтангова
Эскиз декорации. I акт. Перед магазином. "Иркутская история". Москва. Государственный академический театр имени Евг. Вахтангова - это не только театр, но и музей, и музейная библиотека, и музейный центр
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Коллекция денежных знаков дореволюционного периода
Коллекция денежных знаков дореволюционного периода - это не только монеты, но и банкноты, купюры, банкноты, монеты, банкноты, монеты, банкноты, монеты, банкноты, монеты, банкно
-- предметы естественнонаучной коллекции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотография ч/б с изображением фрезерного станка производства ППЗ.
Фотография ч/б с изображением фрезерного станка производства ППЗ. - это фото-коллаж, который можно распечатать на принтере.
Фотография ч/б с изображением фрезерного станка производства ППЗ.
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Коробка для конфет. "Выборг".
Коробка для конфет. "Выборг". - это не просто коробка конфет, а целый набор для изготовления конфет.

В коробке для конфет. "Выборг".

В коробке для конфет. "Выборг".

В коробке
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Эскиз значка «Дом-музей С.В. Рахманинова» в Ивановке. Художник И.Н. Струков 1988г.
Эскиз значка «Дом-музей С.В. Рахманинова» в Ивановке. Художник И.Н. Струков 1988г. - это не просто дом, а целый музей. В нем собраны подлинные вещи
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Парад на площади перед дворцом в Гатчине
Парад на площади перед дворцом в Гатчине - это не только парад, но и демонстрация силы, мощи и величия России.

В этом году в параде приняли участие более 200 единиц техники.

В этом году в параде приняли
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Бляшка в виде амфорки.
Бляшка в виде амфорки. - это не амфора, а сосуд для хранения вина.

- А что это за амфора?
- Это сосуд для хранения вина.
- А что это за вино?
- Это
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


2 мая.
2 мая. - это было в воскресенье.

В воскресенье я была в гостях у подруги, которая живет в Москве. Она мне рассказала, что в Москве очень много бездомных собак. И что они все живут в подвалах. И что они
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 91, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Чехословакия
Чехословакия - это не только Чехия, но и Словакия, Словения, Словения, Словения, Словения, Словения, Словения, Словения, Словения, Словения, Словения, Словения
-- предметы прикладного искусства, быта и этнографии


Книга. А. П. Ветлугин и Ю. Б. Грозный. «Сталинградскому тракторному заводу 20 лет». (1930-1950).Хроника важнейших событий.Областное книгоиздательство. Сталинград. 1950 г. г. Сталинград. Книжно-бланочная типография № 2 Облполиграфиздата. Тираж 5 000 экз. 72 с. с ил.
Книга. А. П. Ветлугин и Ю. Б. Грозный. «Сталинградскому тракторному заводу 20 лет». (1930-1950).Хроника важнейших событий.Областное книгоиздательство. Сталинград. 1950 г. г. Сталинград. Книжно-бланочная типография № 2 Облполиграфиздата. Тираж 5 000 экз. 72 с. с ил. - это книга
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Справочник телефонный абонентов телефонной сети Тюменцевского района Алтайского края, с. Тюменцево, 1988 год.
Справочник телефонный абонентов телефонной сети Тюменцевского района Алтайского края, с. Тюменцево, 1988 год. - это справочник телефонов жителей села Тюменцево Алтайского края. В справочнике телефонов жителей села Тюменцево Алтайского края,
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Порода. Риолит.
Порода. Риолит. - это камень, который имеет форму шара.

- А что это за камень?

- Это камень, который имеет форму шара.

- А что это за камень?

- Это камень,
-- предметы минералогической коллекции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Графика. План Москвы после Сентября Месяца 1812 Года
Графика. План Москвы после Сентября Месяца 1812 Года - это план Москвы после Сентября месяца 1812 года.

В 1813 году, когда Наполеон вторгся в Россию, план Москвы был составлен по образцу плана Москвы 1813 года
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Икона  "Богоматерь Иверская"
Икона  "Богоматерь Иверская" - это икона, которая является покровительницей всех женщин. Она помогает женщинам в их материнстве, помогает им в воспитании детей, помогает им в воспитании внуков.
Икона "Богомат
-- живопись




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Приглашение на торжественный вечер "Полвека на ниве культуры", посвященный 70-летию со дня рождения Низамиева Музипа Тазиевича
Приглашение на торжественный вечер "Полвека на ниве культуры", посвященный 70-летию со дня рождения Низамиева Музипа Тазиевича - это не просто дань уважения великому поэту, но и возможность выразить свое отношение к его
-- документы


Карточка почтовая маркированная художественная двусторонняя. РФ. ИТЦ "Марка"-63-о/1995. С новым годом! Шишечка в колпачке. "В". 1995
Карточка почтовая маркированная художественная двусторонняя. РФ. ИТЦ "Марка"-63-о/1995. С новым годом! Шишечка в колпачке. "В". 1995 - это год, когда я впервые увидел эту
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Документ. Программа концерта матросской художественной самодеятельности XII Олимпиады матросской художественной самодеятельности Флота, 28 января 1950г.
Документ. Программа концерта матросской художественной самодеятельности XII Олимпиады матросской художественной самодеятельности Флота, 28 января 1950г. - это было первое выступление в Москве.

В программе концерта были песни, танцы, пляски, игры, конкурсы
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотография. Памятник Зое Космодемьянской 86 км Минского шоссе
Фотография. Памятник Зое Космодемьянской 86 км Минского шоссе - это памятник героине Советского Союза, уроженке города Минского района, уроженке города Минского района, уроженке города Минского района,
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Книга. Достоевский и революция / Юрий Миролюбов. - [репр. изд.]. - Aachen: [б. и.], 1979.
Книга. Достоевский и революция / Юрий Миролюбов. - [репр. изд.]. - Aachen: [б. и.], 1979. - это книга о Достоевском, написанная в Германии в конце XIX века.

В
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пропуск № 1009 Ф.Н.Петрова на право свободного прохода в Кремль
Пропуск № 1009 Ф.Н.Петрова на право свободного прохода в Кремль - это пропуск, который был выдан ему в Кремле в день убийства царя.

В.И.Ленин, "О праве на неприкосновенность частной жизни
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


А.Б. Чернышев. Выступление на теоретической конферениии ЭНИН
А.Б. Чернышев. Выступление на теоретической конферениии ЭНИН - это не только выступление, но и возможность для студентов и преподавателей познакомиться с новыми идеями и идеями, которые будут обсуждаться на конференции.
В ходе конференции
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Поздравительные открытки с праздником 1 Мая. Почтовая открытка. Декоративное блюдо "Слава труду!2. 1970 г. Керамика.
Поздравительные открытки с праздником 1 Мая. Почтовая открытка. Декоративное блюдо "Слава труду!2. 1970 г. Керамика. - это не просто красиво, это еще и очень вкусно. - это не просто красиво,
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Позвонок плезиозавра.
Позвонок плезиозавра. - это не просто так.

- А что это?

- Это - звонок.

- А что это?

- Это - звонок.

- А что это?

-- предметы естественнонаучной коллекции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Кн. "Степь ковыльная" Серг. Семенов, Ростов. кн. изд., 1982г.
Кн. "Степь ковыльная" Серг. Семенов, Ростов. кн. изд., 1982г. - это книга о Степном походе.

В книге рассказывается о том, как в 1612 году русские войска под предводительством
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Октябрь
Октябрь - это не только время года, но и время года в душе.

В этом году я решила, что пора уже начать вести дневник.

В этом году я решила, что пора уже начать вести дневник.

В этом
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Графика.  Старая башня.
Графика.  Старая башня. - это не только памятник архитектуры, но и символ города.

Внутри башни.

Вход в башню.

Вход в башню.

Вход в башню.

Вход
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 72, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Роспись для детского сада по керамической плитке. г. Новгород.
Роспись для детского сада по керамической плитке. г. Новгород. - это не просто рисунок, это целая история, которая может стать основой для создания настоящего шедевра.

В этом году мы решили сделать роспись для детского сада по керами
-- прочие


Ясли-детский сад. Большая Кинешемская мануфактура "Томна". 1916-1918гг.; Большая Кинешемская мануфактура "Томна". с. Томна. 1916-1918гг. Большая Кинешемская мануфактура "Томна".  Детский сад. Фасад, план.
Ясли-детский сад. Большая Кинешемская мануфактура "Томна". 1916-1918гг.; Большая Кинешемская мануфактура "Томна". с. Томна. 1916-1918гг. Большая Кинешемская мануфактура "Томна".  Детский сад. Фасад, план. - это здание
-- документы


Рабочий городок при Березниковском содовом заводе. 1920-1921 гг. Рабочий городок при Березниковском содовом заводе. Веснин Леонид Александрович. Проект жилого дома на 12 квартир. План.
Рабочий городок при Березниковском содовом заводе. 1920-1921 гг. Ра

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Русский императорски генералитет (Александр I, М.И. Кутузов, П.Х. Виттгенштейн, М.И. Платов, А.У. Веллингтон), гравюра
Русский императорски генералитет (Александр I, М.И. Кутузов, П.Х. Виттгенштейн, М.И. Платов, А.У. Веллингтон), гравюра - это не только парадная
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Журнал. Роман-газета. №13(635). Великие голодранцы.
Журнал. Роман-газета. №13(635). Великие голодранцы. - это не просто сборник рассказов, это - энциклопедия русской жизни. В ней собраны рассказы о людях, которые не только не голодают, но
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Жетон треугольной формы «4-В»
Жетон треугольной формы «4-В» - это не просто символ, а еще и символ удачи.
На лицевой стороне изображен символ «4-В», на оборотной стороне - «4-В».
На лицевой стороне
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Осенний пейзаж
Осенний пейзаж - это не только красота, но и здоровье.

В этом году я решила не ограничиваться только прогулками по городу, а сделать еще и фотосет.

В этом году я решила не ограничиваться только прогулками
-- живопись




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Дом братьев П. и С.Третьяковых. Дом братьев П.и С.Третьяковых в Москве. Фасады.
Дом братьев П. и С.Третьяковых. Дом братьев П.и С.Третьяковых в Москве. Фасады. - это не просто дом, это целый квартал, который был построен в конце XIX века.


-- графика


Проект дипломный Бурцева В.С. "Система управления командами и выбор чисел из электроакустического запоминающего устройства БЭСМ" (Московский ордена Ленина энергетический институт им. В.М. Молотова)
Проект дипломный Бурцева В.С. "Система управления командами и выбор чисел из электроакустического запоминающего устройства БЭСМ" (Московский ордена Ленина энергетический институт им. В.М. Молотова) - это дипломная
-- документы


Троице-Сергиева лавра. XV-XIX вв. Смета на реставрационно-восстановительные работы на 1958 г. по памятнику архитектуры - Больничные палаты - Загорского музея-заповедника.
Троице-Сергиева лавра. XV-XIX вв. Смета на реставрационно-восстановительные работы на 1958 г. по памятнику архитектуры - Больничные палаты - Загорск

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Программа. "Трильби". Москва, Свободная опера театрального акционерного общества С.И. Зимина
Программа. "Трильби". Москва, Свободная опера театрального акционерного общества С.И. Зимина - это не просто театр, это театр, который не просто ставит спектакли, а создает их, создает атмосферу, в которой они
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Программа. "Иван да Марья". Москва, Центральный театр транспорта
Программа. "Иван да Марья". Москва, Центральный театр транспорта - это не только театр, но и музей. В нем собрано множество экспонатов, которые рассказывают о жизни и творчестве великого русского писателя.

В программе:
- "Иван
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пластинка в бумажном конверте.
Пластинка в бумажном конверте. - это не просто подарок, это еще и возможность выразить свою благодарность.

В этом году мы решили сделать подарок для всех, кто любит читать.

В этом году мы решили сделать подарок для всех
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 143, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Книга кириллической печати. Букварь.
Книга кириллической печати. Букварь. - это книга, в которой собраны все буквы алфавита, которые используются в русском языке. Букварь - это книга, в которой собраны все буквы алфавита, которые используются в русском языке.
Бук
-- редкие книги


Книга. Н. Мизин. «Басни».Обложка и рисунки художника П. П. Островского.Областное Сталинградское книгоиздательство. Сталинград. 1949 г. Тираж 8 000 экз. 55 с. с ил. Дарственная надпись автора: «Первый экземпляр этой книжки дарю тебе, доченька, - человеку нашего недалёкого в своём ? коммунистического общества, свободного от пережитков капитализма в сознании людей. Может быть, читая эти басни, ты сможешь сказать, что отец пытался своим трудом, хоть в маленькой степени, помочь большевистской ?, в её неустанной борьбе за нового, прекрасного Человека. 10/I 50 г.».
Книга. Н. Мизин. «Басни».Обложка и рисунки художника П. П. Островского.Областное Сталинградское книгоиздательство. Сталинград. 1949 г. Тираж 8 000 экз. 5

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Документ.  Диплом Лауреата. Вепсскому народному хору.
Документ.  Диплом Лауреата. Вепсскому народному хору. - это не просто песня, это песня о любви.

Вепсский народный хор - это не просто песня, это песня о любви.


-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Книга. Русское зодчество по преданьям народной старины
Книга. Русское зодчество по преданьям народной старины - это не только памятники архитектуры, но и живые люди, которые жили в этих зданиях.

В книге рассказывается о том, как жили люди в древнерусских городах, как
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Книга. Эдгар Дега и его искусство
Книга. Эдгар Дега и его искусство - это не только картины, но и музыка, и поэзия, и архитектура, и скульптура, и живопись, и музыка, и архитектура, и живопись, и скульптура, и музыка, и
-- редкие книги




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фигурка "Австрийский ополченец из рядов ландвера" из набора "Пехота наполеоновской армии"
Фигурка "Австрийский ополченец из рядов ландвера" из набора "Пехота наполеоновской армии" - это не просто набор фигурок, это целый набор фигурок, который можно использовать в качестве подарка.


-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Пластинка виниловая "Песня о старшине милиции. Берёза"
Пластинка виниловая "Песня о старшине милиции. Берёза" - это не просто красивая, но и очень полезная вещь. Она поможет вам не только сохранить память о тех, кто погиб в борьбе с преступностью, но и
-- прочие




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Военная организация Финской коммунистической партии. Гараж.
Военная организация Финской коммунистической партии. Гараж. - это не просто гараж, а целый музей. Здесь собраны все экспонаты, которые когда-либо были в этом гараже.

В этом гараже хранится и коллекция оружия, и коллекция автомобилей,
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Зал для проведения периодических курсов Дворца труда.
Зал для проведения периодических курсов Дворца труда. - это место, где можно получить информацию о том, как найти работу, как найти работу в Москве, как найти работу в Санкт-Петербурге, как найти работу в Новосибирске, как найти работу в
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Гвоздь кованый
Гвоздь кованый - это не гвоздь, это гвоздь кованый.<s>
Какие есть способы, чтобы не платить за воду?
Подать заявление в управляющую компанию.<s>
Какие есть способы, чтобы
-- предметы археологии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Стержень с гравировкой
Стержень с гравировкой - это не просто украшение, это еще и символ, который говорит о том, что вы являетесь обладателем этого предмета.
Гравировка на стержне - это не просто украшение, это еще и символ, который говорит
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Альбом "Ветераны труда"
Альбом "Ветераны труда" - это не только дань памяти, но и дань уважения тем, кто в разные годы трудился на благо нашей страны.

В этом году в рамках празднования 70-летия Победы в Великой Отечественной войне в музее
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Карточка. Буксир с "Водолеем-4" на подходе к танкеру для его снабжения пресной водой
Карточка. Буксир с "Водолеем-4" на подходе к танкеру для его снабжения пресной водой - это, конечно, хорошо, но не слишком ли много?

- Да, - согласился я. - Но это
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Буэнос-Айрес. Отель "Плаза".
Буэнос-Айрес. Отель "Плаза". - это современный отель, расположенный в самом центре города. В отеле есть все необходимое для комфортного проживания. 
 Отель "Плаза" - это современный отель, расположенный в самом центре города.
-- предметы прикладного искусства, быта и этнографии




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Суринам. Парамарибо. 2 вида.
Суринам. Парамарибо. 2 вида. - это не только экзотические фрукты, но и очень полезные для здоровья.

Вкусные и полезные фрукты, которые можно купить в супермаркете, можно приготовить дома.

В
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Анкета фенологическая
Анкета фенологическая - это не просто вопрос, а вопрос, который должен быть задан в первую очередь самому себе.

В анкете нужно указать:

1. Имя и фамилию.
2. Возраст.
3. Место рождения
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 92, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Фотооригинал
Фотооригинал - это не только фото, но и видео.

В этом году в рамках фестиваля "Кинотавр" в Сочи пройдет конкурс короткометражных фильмов "Кинотавр-2014".

В этом году в
-- фотографии и негативы


Фотография. Сцена из сп-ля. Около лестницы-стремянки стоят, в рост Д.Л. Кара-Дмитриев - Ликчиз, в профиль влево, в руке платок и П.Н. Поль - Сарториус, в профиль вправо, в руках книга. "Лондонские трущобы" (реж. Э. Краснянский, худ. С. Герштейн.). Москва, Театр Сатиры
Фотография. Сцена из сп-ля. Около лестницы-стремянки стоят, в рост Д.Л. Кара-Дмитриев - Ликчиз, в профиль влево, в руке платок и П.Н. Поль - Сарториус, в профиль вправо, в руках книга. "Лондонские трущобы" (реж. Э. Краснянский, худ. С. Герштейн.). Москва, Театр Сатиры - это не
-- документы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Атлас. Топографический атлас королевства Ганновер и герцогства Брауншвейг Лист 60. Einbeck
Атлас. Топографический атлас королевства Ганновер и герцогства Брауншвейг Лист 60. Einbeck - это не только книга, но и журнал, который выходит раз в месяц. В нем публикуются статьи о различных аспектах географии
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 64, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Атлас. Топографический атлас королевства Вюртемберг Ряд IX, № 7. Лист LIII.
Атлас. Топографический атлас королевства Вюртемберг Ряд IX, № 7. Лист LIII. - это карта, на которой изображена территория, на которой находится город Вюртемберг. Карта была составлена в 1770 году.
-- предметы печатной продукции


Рембрандт.Доктор Фауст.Внизу: № 153. Dr. Faustus. Rembrandt. Почтовая открытка (с офорта). Лондон. Об.: K.F.A.S., 26 Alfred Place West, London, S.W.
Рембрандт.Доктор Фауст.Внизу: № 153. Dr. Faustus. Rembrandt. Почтовая открытка (с офорта). Лондон. Об.: K.F.A.S., 26 Alfred Place West, London, S.W. - это,
-- предметы печатной продукции




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Альбом фотографий «Золотоизвлекательная фабрика рудника «Ключи», треста Верхамурзолото»
Альбом фотографий «Золотоизвлекательная фабрика рудника «Ключи», треста Верхамурзолото» - это не просто фотографии, это рассказ о том, как добывали золото на Ключах.

В конце прошлого
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Альбом фотографий «II–му областному съезду женщин от Агинского Бурятского национального округа»
Альбом фотографий «II–му областному съезду женщин от Агинского Бурятского национального округа» - это не просто сборник фотографий, это еще и сборник рассказов о жизни и деятельности женщин, о том, как они живут, как работают,
-- фотографии и негативы




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Открытка немаркированная художественная двойная (сгиб слева) "С Новым годом!". Рисунок художника А. Семенова
Открытка немаркированная художественная двойная (сгиб слева) "С Новым годом!". Рисунок художника А. Семенова - это не просто поздравление, а целая история. В ней есть и любовь, и боль, и радость,
-- графика




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Медаль памятная "XXII Олимпиада. Москва" Ананьина А.Е. В футляре.
Медаль памятная "XXII Олимпиада. Москва" Ананьина А.Е. В футляре. - это медаль, которая вручается за выдающиеся спортивные достижения. Она имеет форму круга диаметром 32 мм. На лицевой стороне медали
-- предметы нумизматики




Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.
Input length of input_ids is 62, but ``max_length`` is set to 50.This can lead to unexpected behavior. You should consider increasing ``config.max_length`` or ``max_length``.


Плакат. «Под знаменем Ленина- вперед к Победе!».
Плакат. «Под знаменем Ленина- вперед к Победе!». - это не просто лозунг, это гимн, который должен быть в каждом доме.

В этом году в рамках празднования 70-летия Победы в Великой Отечественной войне, в городе
-- графика


Грампластинка. 1 ст.: "Голубка моя". Оркестр "Гармония" под упр. В.Варшавского. 2 ст.:"Маршъ Черняева". оркестр "Гармония" под упр.В.Варшавского.
Грампластинка. 1 ст.: "Голубка моя". Оркестр "Гармония" под упр. В.Варшавского. 2 ст.:"Маршъ Черняева". оркестр "Гармония" под упр.В.Варшавского. - это было
-- прочие




In [None]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer


model_name_or_path = "sberbank-ai/rugpt3large_based_on_gpt2"
tokenizer = GPT2Tokenizer.from_pretrained(model_name_or_path)
model = GPT2LMHeadModel.from_pretrained(model_name_or_path).cuda()


text = """Божок в одежде."""
input_ids = tokenizer.encode(text, return_tensors="pt").cuda()
out = model.generate(input_ids.cuda(), max_length=50)
generated_text = list(map(tokenizer.decode, out))[0]
print(generated_text)