In [1]:
%pip install ruprompts

Collecting ruprompts
  Downloading ruprompts-0.1.4-py3-none-any.whl (29 kB)
Collecting torch<2.0.0,>=1.10.0 (from ruprompts)
  Downloading torch-1.13.1-cp310-cp310-manylinux1_x86_64.whl (887.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m887.5/887.5 MB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting torchtyping<0.2.0,>=0.1.4 (from ruprompts)
  Downloading torchtyping-0.1.4-py3-none-any.whl (17 kB)
Collecting transformers<5.0.0,>=4.6.0 (from ruprompts)
  Downloading transformers-4.30.2-py3-none-any.whl (7.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.2/7.2 MB[0m [31m113.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting typeguard<3.0.0,>=2.13.3 (from ruprompts)
  Downloading typeguard-2.13.3-py3-none-any.whl (17 kB)
Collecting nvidia-cuda-runtime-cu11==11.7.99 (from torch<2.0.0,>=1.10.0->ruprompts)
  Downloading nvidia_cuda_runtime_cu11-11.7.99-py3-none-manylinux1_x86_64.whl (849 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In this tutorial we show how to load and use the pretrained prompts from HuggingFace Hub.

In [2]:
# although not used directly, this import is necessary,
# since it adds our custom pipelines to transformers
import ruprompts

from transformers import pipeline

Let's first load the joke prompt:

In [3]:
ppln_joke = pipeline("text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_joke", device=0)

No model was supplied, defaulted to sberbank-ai/rugpt3large_based_on_gpt2 and revision aa2b602 (https://huggingface.co/sberbank-ai/rugpt3large_based_on_gpt2).
Using a pipeline without specifying a model name and revision in production is not recommended.


Downloading (…)lve/main/config.json:   0%|          | 0.00/609 [00:00<?, ?B/s]



Downloading pytorch_model.bin:   0%|          | 0.00/3.14G [00:00<?, ?B/s]

Downloading (…)olve/main/vocab.json:   0%|          | 0.00/1.71M [00:00<?, ?B/s]

Downloading (…)olve/main/merges.txt:   0%|          | 0.00/1.27M [00:00<?, ?B/s]

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Xformers is not installed correctly. If you want to use memory_efficient_attention to accelerate training use the following command to install Xformers
pip install xformers.


Downloading (…)lve/main/prompt.json:   0%|          | 0.00/499 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/369k [00:00<?, ?B/s]

Note that we didn't specify the `model=` and `tokenizer=` arguments. They are inferred from pretrained prompt config.

Using the pipeline with prompt is almost identical to using the regular text generation pipeline:

In [4]:
ppln_joke("Говорит как-то дуб вороне")

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Говорит как-то дуб вороне, вороне, а на самом деле он говорит про себя.<pad>'}]

Although it is more convenient to omit model arguments, it leads to reinstantiation of the same model each time we create a pipeline. An easy fix is to create model and tokenizer once and then pass it to all the pipelines:

In [5]:
from transformers import GPT2LMHeadModel, AutoTokenizer

model_id = "sberbank-ai/rugpt3large_based_on_gpt2"
model = GPT2LMHeadModel.from_pretrained(model_id)
tokenizer = AutoTokenizer.from_pretrained(model_id)

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


It will speed up loading the proverb pipeline:

In [6]:
ppln_proverb = pipeline("text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_proverb", model=model, tokenizer=tokenizer, device=0)
ppln_proverb("Сколько ни")

Downloading (…)lve/main/prompt.json:   0%|          | 0.00/499 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/369k [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Сколько ни жить, а все умереть.<pad>'}]

Loading and using text2text prompts is almost identical:

In [7]:
ppln_detox = pipeline("text2text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_detox_russe", model=model, tokenizer=tokenizer, device=0)
ppln_detox({"toxic_comment": "Ублюдок, мать твою, а ну иди сюда"})

Downloading (…)lve/main/prompt.json:   0%|          | 0.00/837 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/738k [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'А ну иди сюда<pad>'}]

In [8]:
long_text = """Несмотря на споры, большинство учёных сошлись во мнении, что кошка является полуодомашненным животным, то есть она способна на сосуществование с человеком, но, потеряв с ним контакт, легко возвращаются к дикому образу существования. Хотя у кошки наблюдаются генетические изменения в сравнении с диким предком, эта разница в 10 раз меньше, чем у собак с волками. Учёные считают, что дикая кошка действительно могла сама прийти к человеку, чтобы питаться грызунами, а такие отношения характеризовались как соседские, и уже через несколько тысяч лет люди сами стали одомашнивать маленьких хищников. Это также, вероятно, объясняет, почему модель поведения кошки почти не изменилась; при одомашнивании собаки из волка человек изменил её образ жизни и среду обитания, кошка же претерпела минимальные изменения Кошка сумела сохранить модель поведения, присущую её диким предкам. Она почти так же хорошо охотится, как дикая кошка, но в то же время способна мирно сосуществовать с человеком, проявлять к нему эмоциональную привязанность, нежность или даже выказывать игривое поведение."""
ppln_summary = pipeline("text2text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_summarization_mlsum", model=model, tokenizer=tokenizer, device=0)

ppln_summary(long_text, num_beams=2, num_return_sequences=5)

Downloading (…)lve/main/prompt.json:   0%|          | 0.00/371 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/185k [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Учёные пришли к выводу, что кошка, потерявшая человеческий облик, могла самостоятельно прийти к человеку<pad><pad><pad><pad><pad><pad><pad><pad><pad><pad>'},
 {'generated_text': 'Миграция хищников, по мнению учёных, привела к тому, что у кошки, потерявшей с человеком контакт, почти не изменилась модель поведения<pad>'},
 {'generated_text': 'Учёные считают, что дикая кошка могла сама прийти к человеку, чтобы питаться грызунами<pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad>'},
 {'generated_text': 'Учёные считают, что дикая кошка могла сама прийти к человеку, чтобы питаться грызунами<pad><pad><pad><pad><pad><pad><pad><pad><pad><pad><pad>'},
 {'generated_text': 'Учёные полагают, что кошка, потеряв с человеком контакт, легко возвращаются к дикому образу существования<pad><pad><pad><pad><pad><pad><pad><pad><pad><pad>'}]

In [9]:
ppln_summary = pipeline("text2text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_title_mlsum", model=model, tokenizer=tokenizer, device=0)
ppln_summary(long_text, num_beams=2, num_return_sequences=5)

Downloading (…)lve/main/prompt.json:   0%|          | 0.00/371 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/185k [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Кошка и человек сосуществуют в природе<pad><pad><pad>'},
 {'generated_text': 'Кошки и волки: «дружба» продолжается<pad>'},
 {'generated_text': 'Дикая кошка стала домашним животным<pad><pad><pad><pad><pad><pad>'},
 {'generated_text': 'Дикая кошка смогла адаптироваться к человеку<pad><pad><pad><pad>'},
 {'generated_text': 'Дикая кошка смогла адаптироваться к человеку<pad><pad><pad><pad>'}]

In some cases pipeline takes multiple arguments:

In [10]:
context = """В 1997 году Шмидхубер и Сепп Хохрайтер опубликовали работу, описывающую рекуррентную нейронную сеть, которую авторы назвали «Долгая краткосрочная память». В 2015 году эта архитектура была использована в новой реализации распознавания речи в программном обеспечении компании Google для смартфонов.

Исследования Шмидхубера также включают в себя генерализации колмогоровской сложности и метрики «скорость важна» (Speed Prior), создание концепции Машины Гёделя.

В 2014 году Шмидхубер основал компанию Nnaisense для работы в сфере коммерческого применения технологий искусственного интеллекта в таких областях как финансы, тяжёлая промышленность и самоуправляемый автотранспорт. Сепп Хохрайтер и Яан Таллинн занимают в компании пост советников."""

ppln_qa = pipeline("text2text-generation-with-prompt", prompt="konodyuk/prompt_rugpt3large_qa_sberquad", model=model, tokenizer=tokenizer, device=0)
ppln_qa({"context": context, "question": "С кем Шмидхубер опубликовал работу?"})

Downloading (…)lve/main/prompt.json:   0%|          | 0.00/549 [00:00<?, ?B/s]

Downloading prompt_provider.bin:   0%|          | 0.00/369k [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Сепп Хохрайтер<pad>'}]

So far we needed to create a separate pipeline for each task. It may be inconvenient if you want to serve multiple prompts simultaneously. For this case we provide a more low-level interface, called MultiPrompt:

In [11]:
from ruprompts import MultiPrompt

mp = MultiPrompt({
    "detox": "konodyuk/prompt_rugpt3large_detox_russe",
    "qa": "konodyuk/prompt_rugpt3large_qa_sberquad",
})
mp.patch(model, tokenizer)


Now we need to create a regular generation pipeline:

In [12]:
ppln = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0, return_full_text=False, do_sample=True, eos_token_id=0, max_new_tokens=100)

To switch the task, we just need to change the key:

In [13]:
ppln(mp(key="detox", toxic_comment="Какого черта ты сюда припёрся?"))

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'Что ты так рано приехал<pad>'}]

In [14]:
ppln(mp(key="qa", context=context, question="В каком году была основана Nnaisense?"))

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


[{'generated_text': 'В 2014 году<pad>'}]