# Промпты для LLM и оптимизация работы с ними (LangChain)

## Промпты

* [Prompt Engineering Guide](https://www.promptingguide.ai/)
* [Курс по промптингу от OpenAI](https://platform.openai.com/docs/guides/prompt-engineering/six-strategies-for-getting-better-results)
* [Курс ChatGPT Prompt Engineering for Developers](https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/)
* [Мануал The Prompt Report: A Systematic Survey of Prompting Techniques](https://arxiv.org/pdf/2406.06608)
* [LangChain Hub](https://smith.langchain.com/hub)
* [Anthropic's Prompt Engineering Interactive Tutorial](https://github.com/anthropics/courses/tree/master/prompt_engineering_interactive_tutorial)
* [Anthropic's System Prompts](https://docs.anthropic.com/en/release-notes/system-prompts)
* [Intent-based Prompt Calibration: Enhancing prompt optimization with synthetic boundary cases](https://arxiv.org/pdf/2402.03099)

Промпт (prompt - подсказка) — это запрос к LLM, который используется для управления ее выходными данными (генерацией).

Компоненты промпта:
* Запрос
    * Должен быть четким и однозначным
* Контекст
* Инструкция
    * Описание задачи
    * Задание роли
    * Задание мотивации (награда, угроза, помощь)
    * Описание формата выхода
    * Описание стиля выхода
    * И т.д.
* Примеры (few-shot)

Токен - базовая единица генерации LLM. Средняя длина BPE-токена: 3-5 символов.

In [9]:
prompt = """
Ты великий мыслитель, которому задают логические головоломки.
Ответь на предложенную головоломку и кратко обоснуй ответ.
Если не знаешь правильный ответ, отвечай: 'Это тайна, покрытая мраком'.

Головоломка: В квартире живут домашние животные: собаки и кошки. 
Из всех животных только одно не является собакой, при этом все питомцы, кроме одного, — кошки. 

Вопрос: Сколько всего кошек и собак?

Ответ: 
"""

In [10]:
# Ну такое
llm.invoke(prompt).content

'Всего в квартире живут 2 кошки и 1 собака. Поскольку из всех животных только одно не является собакой, а все питомцы, кроме одного, — кошки, то это означает, что один питомец - собака, а остальные - кошки.'

Можно передавать несколько контекстов, разделяя их специальными символами:

In [11]:
prompt = """
Ты профессиональный оратор и аниматор.
Напиши небольшое персональное поздравление для человека, 
опираясь на факты из его жизни.
Поздравление заверши словами: 'И, конечно, желаю счастья и здоровья!'

###

Девушке 28 лет.

###

Она художница.

###

Она очень любит свою кошку по кличке Марфа.

###

Поздравление: 
"""

In [12]:
llm.invoke(prompt).content

'Дорогая (имя), сегодня твой день, и я хочу поздравить тебя с твоим 28-летием! Ты такая талантливая художница, твои работы всегда вдохновляют и восхищают. Твоя любовь к искусству и красоте делает мир ярче и прекраснее.\n\nИ, конечно, как не упомянуть твою верную подругу - кошку Марфу! Твоя забота и любовь к ней просто невероятны, и это так трогательно.\n\nЖелаю тебе продолжать творить, вдохновляться и вдохновлять других своим талантом. Пусть каждый день приносит новые яркие краски в твою жизнь, а Марфа всегда будет рядом, радуя и лаская.\n\nИ, конечно, желаю счастья и здоровья! С днем рождения! 🎨🐱🎉'

## Общие советы

* Пишите так, чтобы было понятно, к чему относится каждое конкретное слово
* Делите текст на абзацы, включайте детали в запрос
* Добавляйте примеры: сгенерированный текст, факты для модели
* Выделяйте примеры специальными символами, например, тройными кавычками
* Просите модель "представить, что она <профессия>"
* Указывайте алгоритм выполнения задачи по небольшим шагам, которые должны выполняться по очереди
* Просите модель вернуть ответ в определенном формате, например JSON
* При необходимости ограничивайте длину сгенерированного ответа в словах или предложениях

## Техники

* [Zero-shot Prompting](https://www.promptingguide.ai/techniques/zeroshot)
* [Few-shot Prompting](https://www.promptingguide.ai/techniques/fewshot)
* [Chain-of-Thought Prompting](https://www.promptingguide.ai/techniques/cot)
* [Self-consistency Prompting](https://www.promptingguide.ai/techniques/consistency)
* [Tree of Thgouht](https://www.promptingguide.ai/techniques/tot)
* [Generated Knowledge Prompting](https://www.promptingguide.ai/techniques/knowledge)
* [PAL (Program-Aided Language Models)](https://www.promptingguide.ai/techniques/pal)
* Rephrase and Respond (RaR)
* In-context learning (ICL)

## Проблемы

* Repetition problem
* Infinite output loop

# LangChain - фреймворк для работы с LLM

* [LangChain docs](https://python.langchain.com/v0.2/docs/introduction/)
* [GigaChain github](https://github.com/ai-forever/gigachain)
* [Langchain - делаем AI chat бота поверх ваших документов // Курс «Machine Learning. Professional»](https://www.youtube.com/watch?v=aZVGQ-IlkF8&ab_channel=OTUS%D0%9E%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD-%D0%BE%D0%B1%D1%80%D0%B0%D0%B7%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5)
* [Курс Делаем свой AI-продукт на базе ChatGPT или других LLM моделей](https://stepik.org/course/178846/syllabus)
    * [GitHub курса: Prompt Engineering - выжми из модели максимум](https://github.com/a-milenkin/LLM_practical_course/blob/main/notebooks/M2.1_Prompt_Engineering_intro.ipynb)
* [A Complete LangChain Guide](https://nanonets.com/blog/langchain/)

## Шаблоны (prompt template)

Шаблон — это функция, которая содержит одну или несколько переменных, которые будут заменены некоторым текстом для создания промпта. 
Промпт может считаться экземпляром шаблона.

[Виды шаблонов в LangChain](https://python.langchain.com/v0.1/docs/modules/model_io/prompts/quick_start/):
* Message Prompts
* PromptTemplate
* ChatPromptTemplate
* FewShotPromptTemplate

In [13]:
from langchain import PromptTemplate

In [14]:
template = """
Ты великий мыслитель, которому задают логические головоломки.
Ответь на предложенную головоломку и кратко обоснуй ответ.
Если не знаешь правильный ответ, отвечай: 'Это тайна, покрытая мраком'.

Context: {context}

Question: {question}

Answer: 
"""

prompt_template = PromptTemplate(
    input_variables=['context', 'question'],
    template=template
)

In [15]:
prompt = prompt_template.format(
    context='Дом имеет четыре стены, причём все они смотрят на юг. Вокруг дома ходит медведь.',
    question='Какого цвета медведь?'
)
llm.invoke(prompt).content

'Белого цвета. Потому что если все стены дома смотрят на юг, значит дом находится на северном полюсе, где обитают белые медведи.'