    # 1. Промт-инжиниринг
Промт-инжиниринг — это процесс создания эффективных текстовых запросов для моделей обработки естественного языка (NLP). Разные виды промтов позволяют решать различные задачи, такие как генерация текста, извлечение информации, классификация, перевод и многие другие.

Правильный выбор промта может значительно улучшить работу модели. Использование разных стратегий (zero-shot, few-shot, CoT, инструкционные) позволяет адаптировать модели под различные задачи.

# 2. Установка библиотек и загрузка модели
Сначала установим необходимые библиотеки и загрузим бесплатную модель с Hugging Face.

_*В приведенных примерах использована модель от Facebook AI "facebook/bart-large-cnn", обучена на наборе данных CNN/DailyMail. Эта модель является одной из бесплатных моделей на платформе Hugging Face. Построена на архитектуре BART (Bidirectional and Auto-Regressive Transformer). Предназначена для решения задачи суммаризирования (Text Summarization)*_

_*Модель facebook/bart-large-cnn оптимизирована только для английского языка. Это означает, что она показывает лучшие результаты на текстах на английском языке, так как была обучена на англоязычном датасете CNN/DailyMail.*_


In [None]:
pip install transformers



In [None]:
from transformers import pipeline

# Выбираем бесплатную модель для демонстрации
model_name = "facebook/bart-large-cnn"
nlp_pipeline = pipeline("summarization", model=model_name)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json: 0.00B [00:00, ?B/s]

model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

Device set to use cpu


# 3. Виды промтов и их примеры
# 3.1. Открытые промты (Zero-shot prompts)
Открытый промт дает модели минимальный контекст и полагается на ее общие знания

In [None]:
text = "The sun rises in the east and sets in the west."
result = nlp_pipeline(text)
print(result[0]["summary_text"])

Your max_length is set to 142, but your input_length is only 14. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=7)


The sun rises in the east and sets in the west. The sun rises and sets at the same time every day. It's a sign of the changing seasons, and a sign that it's time to get up and go to work. Click here for more information on the sunrise and sunset.


# 3.2. Few-shot промты
Few-shot промты дают модели примеры перед выполнением задачи.

In [None]:
prompt = """
Summarize the following text:
"The Eiffel Tower is a wrought-iron lattice tower in Paris, France. It is named after the engineer Gustave Eiffel, whose company designed and built the tower. The tower stands 330 meters tall and is a global cultural icon of France."

Summary:
"""
result = nlp_pipeline(prompt)
print(result[0]["summary_text"])


Your max_length is set to 142, but your input_length is only 71. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=35)


The Eiffel Tower is a wrought-iron lattice tower in Paris, France. The tower stands 330 meters tall and is a global cultural icon of France. It is named after the engineer Gustave Eiffer, whose company designed and built the tower.


# 3.3. Chain-of-thought (CoT) промты
Этот подход заставляет модель пошагово рассуждать.

In [None]:
prompt = """
Question: John has 3 apples. He gives 2 apples to Mary. How many apples does John have now?
Let's think step by step.
"""
result = nlp_pipeline(prompt)
print(result[0]["summary_text"])

Your max_length is set to 142, but your input_length is only 35. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=17)


Let's think step by step. John has 3 apples. He gives 2 apples to Mary. How many apples does John have now? John has 4 apples. Mary has 2 apples. John now has 5 apples. What do you think? Share your story with CNN iReport.


# 3.4. Инструкционные промты
Инструкционные промты дают модели четкие указания.

In [None]:
prompt = """
Extract the most important information from the following text:
"The Great Wall of China is one of the most famous landmarks in the world. It was built to protect Chinese states from invasions. It stretches over 13,000 miles."

Key Information:
"""
result = nlp_pipeline(prompt)
print(result[0]["summary_text"])


Your max_length is set to 142, but your input_length is only 58. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=29)


The Great Wall of China is one of the most famous landmarks in the world. It was built to protect Chinese states from invasions. It stretches over 13,000 miles and was completed in the late 19th century. The Wall is now one of China's most popular tourist attractions.


# 3.5. Контекстуально-обогащенные промты
Такие промты включают дополнительный контекст для повышения точности модели.

In [None]:
context = """
Paris is the capital of France and is known for its culture, history, and landmarks like the Eiffel Tower and the Louvre.
"""
question = "What is Paris known for?"
prompt = f"Context: {context}\nQuestion: {question}\nAnswer:"
result = nlp_pipeline(prompt)
print(result[0]["summary_text"])


Your max_length is set to 142, but your input_length is only 47. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=23)


Paris is the capital of France and is known for its culture, history, and landmarks like the Eiffel Tower and the Louvre. The French capital is also known as the most beautiful city in the world. It is home to some of the world's most famous landmarks, including the Arc de Triomphe, Notre Dame, and the Pantheon.


## Задание
### 1.Использовать facebook/bart-large-cnn с другими языками используя обходные пути, такие как переводчики. Найдите примеры их использования на HuggingFace, например, facebook/m2m100_418M. Напишите примеры промтов для задачи суммаризации текста на русском и выведите ответ также на русском.
### 2.Использовать другие модели для перевода и для задачи суммаризации текста, такие как T5, GPT-2, Pegasus и другие. Сравните результаты.
### 3.Попробуйте составить промты для описания столиц мира, например, "Moscow is the capital of Russia. It is known for the Red Square and the Kremlin." Тексты можно взять с Википедии.
    


In [None]:
from transformers import pipeline

# Загружаем модель перевода с русского на английский
translator = pipeline("translation", model="facebook/m2m100_418M")

# Загружаем модель суммаризации
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

# Текст на русском языке
text_ru = "Эйфелева башня — это железная решетчатая башня в Париже, Франция. \
Она была названа в честь инженера Гюстава Эйфеля, чья компания спроектировала и построила башню. \
Башня имеет высоту 330 метров и является мировым культурным символом Франции."

# Переводим на английский
translated_text = translator(text_ru, src_lang="ru", tgt_lang="en", max_length=512)[0]['translation_text']

# Делаем суммаризацию
summary_en = summarizer(translated_text, max_length=50, min_length=20, do_sample=False)[0]['summary_text']

# Переводим обратно на русский
translator_ru = pipeline("translation", model="facebook/m2m100_418M")
summary_ru = translator_ru(summary_en, src_lang="en", tgt_lang="ru", max_length=512)[0]['translation_text']

print("Резюме на русском:", summary_ru)


config.json:   0%|          | 0.00/908 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.94G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.94G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/233 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/298 [00:00<?, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/2.42M [00:00<?, ?B/s]

special_tokens_map.json: 0.00B [00:00, ?B/s]

Device set to use cpu
Device set to use cpu
Device set to use cpu


Резюме на русском: Эйфелевая башня является дождевой башней в Париже, Франция. башня имеет высоту 330 метров и является мировым культурным символом Франции.


#Обходной путь: BART + Перевод (M2M100) для суммаризации на русском



In [None]:
from transformers import pipeline

# 1. Переводчик: русский → английский → русский
translator_ru_to_en = pipeline("translation", model="facebook/m2m100_418M")
translator_en_to_ru = pipeline("translation", model="facebook/m2m100_418M")

# 2. Суммаризатор (только на английском)
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

# Текст на русском
text_ru = """Эйфелева башня — это железная решетчатая башня в Париже, Франция.
Она была названа в честь инженера Гюстава Эйфеля, чья компания спроектировала и построила башню.
Башня имеет высоту 330 метров и является мировым культурным символом Франции.
Ежегодно её посещают миллионы туристов."""

# Шаг 1: Перевод на английский
translated = translator_ru_to_en(text_ru, src_lang="ru", tgt_lang="en")[0]['translation_text']

# Шаг 2: Суммаризация на английском
summary_en = summarizer(translated, max_length=60, min_length=25, do_sample=False)[0]['summary_text']

# Шаг 3: Перевод обратно на русский
summary_ru = translator_en_to_ru(summary_en, src_lang="en", tgt_lang="ru")[0]['translation_text']

print("Оригинал (RU):", text_ru)
print("\nПеревод (EN):", translated)
print("\nКраткое содержание (EN):", summary_en)
print("\nРезюме (RU):", summary_ru)

Device set to use cpu
Device set to use cpu
Device set to use cpu


Оригинал (RU): Эйфелева башня — это железная решетчатая башня в Париже, Франция. 
Она была названа в честь инженера Гюстава Эйфеля, чья компания спроектировала и построила башню. 
Башня имеет высоту 330 метров и является мировым культурным символом Франции. 
Ежегодно её посещают миллионы туристов.

Перевод (EN): The Eiffel Tower is a rainbow tower in Paris, France. It was named in honor of the engineer Gustave Eiffel, whose company designed and built the tower. The tower has a height of 330 meters and is the world cultural symbol of France. Every year it is visited by millions of tourists.

Краткое содержание (EN): The Eiffel Tower is a rainbow tower in Paris, France. The tower has a height of 330 meters and is the world cultural symbol of France.

Резюме (RU): Эйфелевая башня является дождевой башней в Париже, Франция. башня имеет высоту 330 метров и является мировым культурным символом Франции.


#Пример: mT5 (мультиязычная, работает с русским напрямую!)



In [None]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch

model_name = "csebuetnlp/mT5_multilingual_XLSum"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

text_ru = "Эйфелева башня — это железная решетчатая башня в Париже, Франция. Она была названа в честь инженера Гюстава Эйфеля..."

# Промпт для суммаризации
input_text = "summarize: " + text_ru

inputs = tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True)

# Генерация
outputs = model.generate(
    **inputs,
    max_length=100,
    min_length=30,
    length_penalty=2.0,
    num_beams=4,
    early_stopping=True
)

summary_ru = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("mT5 суммаризация (RU):", summary_ru)

tokenizer_config.json:   0%|          | 0.00/375 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


pytorch_model.bin:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

mT5 суммаризация (RU): В этом списке мы собрали лучшие фотографии Эйфелева башни, которые вы могли увидеть на сайте BBC World Service.


#Промпты для описания столиц (с Википедии)



In [None]:
capitals_text = """
Москва — столица России, расположена на реке Москве в центре европейской части страны.
Город основан в 1147 году Юрием Долгоруким.
Известна Красной площадью, Кремлём, Собором Василия Блаженного.
Население — более 12 миллионов человек.
"""

#Промпт для T5 (fine-tuned на описания)



In [None]:
from transformers import T5Tokenizer, T5ForConditionalGeneration

model_name = "IlyaGusev/rut5_base_headline_gen_telegram"
tokenizer = T5Tokenizer.from_pretrained(model_name)
model = T5ForConditionalGeneration.from_pretrained(model_name)

text = "Москва — столица России. Расположена на реке Москве. Основана в 1147 году. Население — 12 млн."

input_text = "headline: " + text
inputs = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(**inputs, max_length=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

tokenizer_config.json:   0%|          | 0.00/327 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/828k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

config.json:   0%|          | 0.00/766 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/977M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/977M [00:00<?, ?B/s]

СМИ: Москва — столица России. Расположена на реке Москве. Население — 12 млн


#Промпты для генерации описания (GPT-2 / T5)



In [None]:
from transformers import pipeline, set_seed
import torch

# Включаем прогресс-бар
from transformers.utils import logging
logging.set_verbosity_info()

print("Загружаем модель... (это может занять 1-3 минуты)")

# Указываем device: 0 = GPU, -1 = CPU
device = 0 if torch.cuda.is_available() else -1
print(f"Используем устройство: {'GPU' if device == 0 else 'CPU'}")

# Загружаем ЛЕГКУЮ модель
generator = pipeline(
    "text-generation",
    model="sberbank-ai/rugpt3small_based_on_gpt2",
    device=device
)

print("Модель загружена! Генерируем...")

prompt = "Москва — столица России. Она известна Красной площадью и Кремлём."

set_seed(42)  # для воспроизводимости

output = generator(
    prompt,
    max_length=100,
    num_return_sequences=1,
    temperature=0.8,
    do_sample=True,
    truncation=True,
    pad_token_id=50256  # важно для GPT-2!
)

print("\n" + "="*50)
print("СГЕНЕРИРОВАННЫЙ ТЕКСТ:")
print("="*50)
print(output[0]['generated_text'])

loading configuration file config.json from cache at /root/.cache/huggingface/hub/models--sberbank-ai--rugpt3small_based_on_gpt2/snapshots/a9307e696cd3c5b7f953ff4cb19d76a4d81821d5/config.json
Model config GPT2Config {
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 1,
  "embd_pdrop": 0.1,
  "eos_token_id": 2,
  "gradient_checkpointing": false,
  "id2label": {
    "0": "LABEL_0"
  },
  "initializer_range": 0.02,
  "label2id": {
    "LABEL_0": 0
  },
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 2048,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 2048,
  "pad_token_id": 0,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,

Загружаем модель... (это может занять 1-3 минуты)
Используем устройство: CPU


Model config GPT2Config {
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 1,
  "embd_pdrop": 0.1,
  "eos_token_id": 2,
  "gradient_checkpointing": false,
  "id2label": {
    "0": "LABEL_0"
  },
  "initializer_range": 0.02,
  "label2id": {
    "LABEL_0": 0
  },
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 2048,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 2048,
  "pad_token_id": 0,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "transformers_version": "4.57.1",
  "use_cache": true,
  "vocab_size": 50264
}

loading weights file pytorch_model.bin from cache at /root/.cache/huggingface/hub/models--sberbank-ai--rugpt3

Модель загружена! Генерируем...

СГЕНЕРИРОВАННЫЙ ТЕКСТ:
Москва — столица России. Она известна Красной площадью и Кремлём.
На ней расположены три центральных государственных собора страны: Спасский собор, Успенский собор, Триумфальная арка Кремля, Троицкий собор, Знаменский собор.




Здание в стиле модерн


1. Скульптура «Озеро-Ори» — одна из самых известных архитектурных достопримечательностей Москвы. Она выполнена в духе классицизма.






2. Памятник Пушкину «Три сестры» — один из самых известных памятников Москвы.






3. Памятник А. В. Суворову на Красной площади.






4. Здание Государственной думы во имя Казанской иконы Божией Матери (1770–1780-е гг.).






5. Памятник В. И. Ленину в память о его жизни.





6. Знаменитая площадь у Кремлёвской стены в Кремле.





7. Памятник В. И. Ленину на Красной площади.





8. Памятник В. И. Ленину на Красной площади.





9. Памятник В. И. Ленину у
