In [1]:
import warnings
warnings.filterwarnings('ignore')

In [2]:
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # загружаем open_ai_key

## Принципы написания промптов

* Принцип 1: Писать ясные и точные инструкции
* Принцип 2: Дать модели время на "подумать"

### Тактики

#### Тактика 1: Использовать разделители для разграничения частей того, где инструкция, а где текст.
* Разделителями может быть все, что угодно подобно: ```, """, < >, `<tag> </tag>`, `:`

In [3]:
text = f"""
You should express what you want a model to do by \ 
providing instructions that are as clear and \ 
specific as you can possibly make them. \ 
This will guide the model towards the desired output, \ 
and reduce the chances of receiving irrelevant \ 
or incorrect responses. Don't confuse writing a \ 
clear prompt with writing a short prompt. \ 
In many cases, longer prompts provide more clarity \ 
and context for the model, which can lead to \ 
more detailed and relevant outputs.
"""
prompt = f"""
Summarize the text delimited by triple backticks \ 
into a single sentence.
```{text}```
"""


#### Тактика 2: запрашивать структурированный вывод
* JSON, HTML

In [4]:
prompt = f"""
Generate a list of three made-up book titles along \ 
with their authors and genres. 
Provide them in JSON format with the following keys: 
book_id, title, author, genre.
"""

#### Тактика 3: Просить модель проверить удовлетворено ли условие

In [5]:
text_1 = f"""
Making a cup of tea is easy! First, you need to get some \ 
water boiling. While that's happening, \ 
grab a cup and put a tea bag in it. Once the water is \ 
hot enough, just pour it over the tea bag. \ 
Let it sit for a bit so the tea can steep. After a \ 
few minutes, take out the tea bag. If you \ 
like, you can add some sugar or milk to taste. \ 
And that's it! You've got yourself a delicious \ 
cup of tea to enjoy.
"""
prompt = f"""
You will be provided with text delimited by triple quotes. 
If it contains a sequence of instructions, \ 
re-write those instructions in the following format:

Step 1 - ...
Step 2 - …
…
Step N - …

If the text does not contain a sequence of instructions, \ 
then simply write \"No steps provided.\"

\"\"\"{text_1}\"\"\"
"""

In [6]:
text_2 = f"""
The sun is shining brightly today, and the birds are \
singing. It's a beautiful day to go for a \ 
walk in the park. The flowers are blooming, and the \ 
trees are swaying gently in the breeze. People \ 
are out and about, enjoying the lovely weather. \ 
Some are having picnics, while others are playing \ 
games or simply relaxing on the grass. It's a \ 
perfect day to spend time outdoors and appreciate the \ 
beauty of nature.
"""
prompt = f"""
You will be provided with text delimited by triple quotes. 
If it contains a sequence of instructions, \ 
re-write those instructions in the following format:

Step 1 - ...
Step 2 - …
…
Step N - …

If the text does not contain a sequence of instructions, \ 
then simply write \"No steps provided.\"

\"\"\"{text_2}\"\"\"
"""

#### Тактика 4: "Few-shot" prompting или написание промпта несколькими кадрами (примерами)

In [7]:
prompt = f"""
Your task is to answer in a consistent style.

<child>: Teach me about patience.

<grandparent>: The river that carves the deepest \ 
valley flows from a modest spring; the \ 
grandest symphony originates from a single note; \ 
the most intricate tapestry begins with a solitary thread.

<child>: Teach me about resilience.
"""

### Принцип 2: Дать модели время на "подумать"

#### Тактика 1: Уточнить шаги, которые необходимы для решения задачи

In [8]:
text = f"""
In a charming village, siblings Jack and Jill set out on \ 
a quest to fetch water from a hilltop \ 
well. As they climbed, singing joyfully, misfortune \ 
struck—Jack tripped on a stone and tumbled \ 
down the hill, with Jill following suit. \ 
Though slightly battered, the pair returned home to \ 
comforting embraces. Despite the mishap, \ 
their adventurous spirits remained undimmed, and they \ 
continued exploring with delight.
"""
# example 1
prompt_1 = f"""
Perform the following actions: 
1 - Summarize the following text delimited by triple \
backticks with 1 sentence.
2 - Translate the summary into French.
3 - List each name in the French summary.
4 - Output a json object that contains the following \
keys: french_summary, num_names.

Separate your answers with line breaks.

Text:
```{text}```
"""

**Попросить вывод в определенном формате**

In [9]:
prompt_2 = f"""
Your task is to perform the following actions: 
1 - Summarize the following text delimited by 
  <> with 1 sentence.
2 - Translate the summary into French.
3 - List each name in the French summary.
4 - Output a json object that contains the 
  following keys: french_summary, num_names.

Use the following format:
Text: <text to summarize>
Summary: <summary>
Translation: <summary translation>
Names: <list of names in Italian summary>
Output JSON: <json with summary and num_names>

Text: <{text}>
"""

#### Тактика 2: Проинструктировать модель выработать свое собственно решение перед тем, как торопиться с выводами

In [10]:
prompt = f"""
Determine if the student's solution is correct or not.

Question:
I'm building a solar power installation and I need \
 help working out the financials. 
- Land costs $100 / square foot
- I can buy solar panels for $250 / square foot
- I negotiated a contract for maintenance that will cost \ 
me a flat $100k per year, and an additional $10 / square \
foot
What is the total cost for the first year of operations 
as a function of the number of square feet.

Student's Solution:
Let x be the size of the installation in square feet.
Costs:
1. Land cost: 100x
2. Solar panel cost: 250x
3. Maintenance cost: 100,000 + 100x
Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000
"""

**Обратите внимание, что решение студента не всегда верно.**  
**Это можно исправить, проинструктировав модель сначала выработать свое собственное решение.**.

In [11]:
prompt = f"""
Your task is to determine if the student's solution \
is correct or not.
To solve the problem do the following:
- First, work out your own solution to the problem. 
- Then compare your solution to the student's solution \ 
and evaluate if the student's solution is correct or not. 
Don't decide if the student's solution is correct until 
you have done the problem yourself.

Use the following format:
Question:
```
question here
```
Student's solution:
```
student's solution here
```
Actual solution:
```
steps to work out the solution and your solution here
```
Is the student's solution the same as actual solution \
just calculated:
```
yes or no
```
Student grade:
```
correct or incorrect
```

Question:
```
I'm building a solar power installation and I need help \
working out the financials. 
- Land costs $100 / square foot
- I can buy solar panels for $250 / square foot
- I negotiated a contract for maintenance that will cost \
me a flat $100k per year, and an additional $10 / square \
foot
What is the total cost for the first year of operations \
as a function of the number of square feet.
``` 
Student's solution:
```
Let x be the size of the installation in square feet.
Costs:
1. Land cost: 100x
2. Solar panel cost: 250x
3. Maintenance cost: 100,000 + 100x
Total cost: 100x + 250x + 100,000 + 100x = 450x + 100,000
```
Actual solution:
"""

## Итеративность разработки промптов

Написали промпт, оценили вывод модели, осознали чего не хватает, откорректировали промпт, повторяем до удовлетворения выводом модели.

## Саммаризация

Просим модель кратко описать текст, уточняя на что делать акцент и, например, попросить уложиться в 50 слов.  
Вместа краткого описания (summary) можно пробовать использовать инструкцию выделить/определить (extract).

## Inferring или выводы о теме и сентименте

Сентименты:
* Идентифицируй сентимент одним словом (положительный/отрицательный)
* Идентифицируй типы эмоций
* Идентифицируй конкретную эмоцию, например, гнев.

NER:
* Выдели товар, о котором идет речь в отзыве
* Выдели название компании, которая произвела товар в отзыве

Можно давать сразу несколько инструкций:
* Сентимент
* Товар
* Тема

Определение тем:
* Определи 5 тем, которые есть в сообщение
* Определи, говорится ли в сообщение об одной из каких-то 10 тем
* Верни список с 0 и 1 напротив тем, которые есть в каком-то сообщении

## Трансформация

* Переведи текст
* Измени тон сообщения (из обычного в бизнес, например) - можно описать тон, или попросить модель описать тон и использовать его позже
* Трансформировать JSON в HTML
* Проверить на пунктуационные и грамматические ошибки

## Expanding (Расширение)

Кастомизировать автоматический ответ к письму клиента.

In [12]:
# given the sentiment from the lesson on "inferring",
# and the original customer message, customize the email
sentiment = "negative"

# review for a blender
review = f"""
So, they still had the 17 piece system on seasonal \
sale for around $49 in the month of November, about \
half off, but for some reason (call it price gouging) \
around the second week of December the prices all went \
up to about anywhere from between $70-$89 for the same \
system. And the 11 piece system went up around $10 or \
so in price also from the earlier sale price of $29. \
So it looks okay, but if you look at the base, the part \
where the blade locks into place doesn’t look as good \
as in previous editions from a few years ago, but I \
plan to be very gentle with it (example, I crush \
very hard items like beans, ice, rice, etc. in the \ 
blender first then pulverize them in the serving size \
I want in the blender then switch to the whipping \
blade for a finer flour, and use the cross cutting blade \
first when making smoothies, then use the flat blade \
if I need them finer/less pulpy). Special tip when making \
smoothies, finely cut and freeze the fruits and \
vegetables (if using spinach-lightly stew soften the \ 
spinach then freeze until ready for use-and if making \
sorbet, use a small to medium sized food processor) \ 
that you plan to use that way you can avoid adding so \
much ice if at all-when making your smoothie. \
After about a year, the motor was making a funny noise. \
I called customer service but the warranty expired \
already, so I had to buy another one. FYI: The overall \
quality has gone done in these types of products, so \
they are kind of counting on brand recognition and \
consumer loyalty to maintain sales. Got it in about \
two days.
"""

In [13]:
prompt = f"""
You are a customer service AI assistant.
Your task is to send an email reply to a valued customer.
Given the customer email delimited by ```, \
Generate a reply to thank the customer for their review.
If the sentiment is positive or neutral, thank them for \
their review.
If the sentiment is negative, apologize and suggest that \
they can reach out to customer service. 
Make sure to use specific details from the review.
Write in a concise and professional tone.
Sign the email as `AI customer agent`.
Customer review: ```{review}```
Review sentiment: {sentiment}
"""

## Чат бот

#### OrderBot
Мы можем автоматизировать сбор пользовательских запросов и ответов ассистента для создания OrderBot. OrderBot будет принимать заказы в пиццерии.

Секрет в том, чтобы описать контекст и доступные боту варианты в системном сообщении или инструкции.

In [14]:
context = [ {'role':'system', 'content':"""
You are OrderBot, an automated service to collect orders for a pizza restaurant. \
You first greet the customer, then collects the order, \
and then asks if it's a pickup or delivery. \
You wait to collect the entire order, then summarize it and check for a final \
time if the customer wants to add anything else. \
If it's a delivery, you ask for an address. \
Finally you collect the payment.\
Make sure to clarify all options, extras and sizes to uniquely \
identify the item from the menu.\
You respond in a short, very conversational friendly style. \
The menu includes \
pepperoni pizza  12.95, 10.00, 7.00 \
cheese pizza   10.95, 9.25, 6.50 \
eggplant pizza   11.95, 9.75, 6.75 \
fries 4.50, 3.50 \
greek salad 7.25 \
Toppings: \
extra cheese 2.00, \
mushrooms 1.50 \
sausage 3.00 \
canadian bacon 3.50 \
AI sauce 1.50 \
peppers 1.00 \
Drinks: \
coke 3.00, 2.00, 1.00 \
sprite 3.00, 2.00, 1.00 \
bottled water 5.00 \
"""}]

## Примеры работы с LangChain

#### Инстациируем чатбота

In [15]:
from langchain.chat_models import ChatOpenAI

In [16]:
model='gpt-3.5-turbo'
# model='gpt-4' # дорогая для использования

In [17]:
chat = ChatOpenAI(temperature=0.0,model=model)
chat

ChatOpenAI(cache=None, verbose=False, callbacks=None, callback_manager=None, tags=None, metadata=None, client=<class 'openai.api_resources.chat_completion.ChatCompletion'>, model_name='gpt-3.5-turbo', temperature=0.0, model_kwargs={}, openai_api_key='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', openai_api_base='', openai_organization='', openai_proxy='', request_timeout=None, max_retries=6, streaming=False, n=1, max_tokens=None, tiktoken_model_name=None)

#### Как базово работает LangChain

![Model I/O](https://python.langchain.com/assets/images/model_io-1f23a36233d7731e93576d6885da2750.jpg)

1. Создается `promptTemplate` (темнозеленый), который ждет переменных `x` и `y` в этом случае (светлозеленый)
2. `promptTemplate` с переменными отправляется модели (фиолетовый)
3. Парсится вывод модели при необходимости (синий)

#### PromptTemplate
[Доки питона по промптам](https://python.langchain.com/docs/modules/model_io/prompts/)  
[Описание сущности промптов в лангчейне](https://docs.langchain.com/docs/components/prompts/) (Ниже перевод текста по этой ссылке)

Новый способ программирования моделей осуществляется с помощью промптов (prompts). "Промпт" относится к вводу для модели. Этот ввод редко жестко закодирован, а чаще всего формируется из нескольких компонентов. Класс PromptTemplate отвечает за построение этого ввода. LangChain предоставляет несколько классов и функций, чтобы упростить создание и работу с промптами.

Этот раздел документации разделен на четыре секции:

PromptValue

Класс, представляющий ввод для модели.

Шаблоны промптов

Класс, отвечающий за построение PromptValue.

Примеры-селекторы

Часто бывает полезно включать примеры в промпты. Эти примеры могут быть закодированы жестко, но часто более эффективно, если они выбираются динамически.

Парсеры вывода

Языковые модели (и модели чатов) выдают текст. Но часто вы можете хотеть получить более структурированную информацию, чем просто текст. Вот где появляются парсеры вывода. Парсеры вывода отвечают за (1) инструктирование модели о том, как должен быть отформатирован вывод, (2) разбор вывода в желаемом формате (включая повторную попытку, если необходимо).

##### Простое построение промпта

In [18]:
a_prompt = '''Переведи текст на русский.

Текст: ```{text}```
'''
# Можно несколько переменных

In [19]:
from langchain.prompts import ChatPromptTemplate

prompt_template = ChatPromptTemplate.from_template(a_prompt)

In [20]:
prompt_template.messages[0].prompt

PromptTemplate(input_variables=['text'], output_parser=None, partial_variables={}, template='Переведи текст на русский.\n\nТекст: ```{text}```\n', template_format='f-string', validate_template=True)

In [21]:
prompt_template.messages[0].prompt.input_variables
# Тогда несколько переменных будут отображены и здесь

['text']

In [22]:
eng_text = """
Arrr, I be fuming that me blender lid \
flew off and splattered me kitchen walls \
with smoothie! And to make matters worse, \
the warranty don't cover the cost of \
cleaning up me kitchen. I need yer help \
right now, matey!
"""

In [23]:
# метод перевода промпт в PromptValue
customer_messages = prompt_template.format_messages(
                    text=eng_text)

In [24]:
print(type(customer_messages))
print(type(customer_messages[0]))

<class 'list'>
<class 'langchain.schema.messages.HumanMessage'>


In [25]:
print(customer_messages[0])

content="Переведи текст на русский.\n\nТекст: ```\nArrr, I be fuming that me blender lid flew off and splattered me kitchen walls with smoothie! And to make matters worse, the warranty don't cover the cost of cleaning up me kitchen. I need yer help right now, matey!\n```\n" additional_kwargs={} example=False


In [26]:
# Call the LLM to translate to the style of the customer message
customer_response = chat(customer_messages)

In [27]:
print(customer_response.content)

Аррр, я в ярости, что крышка моего блендера отлетела и облила стенки моей кухни смузи! И чтобы дела стали еще хуже, гарантия не покрывает стоимость уборки моей кухни. Мне нужна твоя помощь прямо сейчас, приятель!


#### OutputParser

Хотим, чтобы вывод был в виде JSON.  
```JSON
{
  "gift": False,
  "delivery_days": 5,
  "price_value": "pretty affordable!"
}
```

In [28]:
from langchain.output_parsers import ResponseSchema # используем для каждого ключа в JSON
from langchain.output_parsers import StructuredOutputParser # сам парсер, к которому применяем схемы
                                                            # Он то и будет парсить

In [29]:
# Делаем схемы
gift_schema = ResponseSchema(name="gift",
                             description="Was the item purchased\
                             as a gift for someone else? \
                             Answer True if yes,\
                             False if not or unknown.")
delivery_days_schema = ResponseSchema(name="delivery_days",
                                      description="How many days\
                                      did it take for the product\
                                      to arrive? If this \
                                      information is not found,\
                                      output -1.")
price_value_schema = ResponseSchema(name="price_value",
                                    description="Extract any\
                                    sentences about the value or \
                                    price, and output them as a \
                                    comma separated Python list.")

# кладем их в список
response_schemas = [gift_schema, 
                    delivery_days_schema,
                    price_value_schema]

In [30]:
# создаем парсер
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

In [31]:
# Это один из методов парсера, который возвращает инструкцию для LLM
format_instructions = output_parser.get_format_instructions()


In [32]:
print(format_instructions)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"gift": string  // Was the item purchased                             as a gift for someone else?                              Answer True if yes,                             False if not or unknown.
	"delivery_days": string  // How many days                                      did it take for the product                                      to arrive? If this                                       information is not found,                                      output -1.
	"price_value": string  // Extract any                                    sentences about the value or                                     price, and output them as a                                     comma separated Python list.
}
```


In [33]:
# Из этого текста будем извлекать JSON
customer_review = """\
This leaf blower is pretty amazing.  It has four settings:\
candle blower, gentle breeze, windy city, and tornado. \
It arrived in two days, just in time for my wife's \
anniversary present. \
I think my wife liked it so much she was speechless. \
So far I've been the only one using it, and I've been \
using it every other morning to clear the leaves on our lawn. \
It's slightly more expensive than the other leaf blowers \
out there, but I think it's worth it for the extra features.
"""


In [34]:
# Создаем инструкцию, в которой есть место для текста и для инструкций форматирования
review_template_2 = """\
For the following text, extract the following information:

gift: Was the item purchased as a gift for someone else? \
Answer True if yes, False if not or unknown.

delivery_days: How many days did it take for the product\
to arrive? If this information is not found, output -1.

price_value: Extract any sentences about the value or price,\
and output them as a comma separated Python list.

text: {text}

{format_instructions}
"""

prompt = ChatPromptTemplate.from_template(template=review_template_2)

# Создаем из PromptTemplate PromtValue
messages = prompt.format_messages(text=customer_review, 
                                format_instructions=format_instructions)

In [35]:
# Посмотрим целиком 
print(messages[0].content)

For the following text, extract the following information:

gift: Was the item purchased as a gift for someone else? Answer True if yes, False if not or unknown.

delivery_days: How many days did it take for the productto arrive? If this information is not found, output -1.

price_value: Extract any sentences about the value or price,and output them as a comma separated Python list.

text: This leaf blower is pretty amazing.  It has four settings:candle blower, gentle breeze, windy city, and tornado. It arrived in two days, just in time for my wife's anniversary present. I think my wife liked it so much she was speechless. So far I've been the only one using it, and I've been using it every other morning to clear the leaves on our lawn. It's slightly more expensive than the other leaf blowers out there, but I think it's worth it for the extra features.


The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```

In [36]:
response = chat(messages)

In [37]:
print(response.content)

```json
{
	"gift": false,
	"delivery_days": "2",
	"price_value": "It's slightly more expensive than the other leaf blowers out there, but I think it's worth it for the extra features."
}
```


^ Это строка.

In [38]:
print(type(response.content))


<class 'str'>


In [39]:
# Переводим ее в JSON с помощью нашего парсера
output_dict = output_parser.parse(response.content)

In [40]:
output_dict

{'gift': False,
 'delivery_days': '2',
 'price_value': "It's slightly more expensive than the other leaf blowers out there, but I think it's worth it for the extra features."}

In [41]:
type(output_dict)

dict

In [42]:
output_dict.get('delivery_days')

'2'

### Память (Memory)

[Документация](https://python.langchain.com/docs/modules/memory.html)  
[Описание сущности](https://docs.langchain.com/docs/components/memory/)

**Память можно добавить почти куда угодно.**

Память - это концепция сохранения и извлечения данных в процессе разговора. Существует два основных метода:

На основе ввода извлекайте все соответствующие фрагменты данных.
На основе ввода и вывода соответствующим образом обновляйте состояние.
Существует два основных типа памяти: краткосрочная и долгосрочная.

Краткосрочная память, как правило, относится к тому, как передавать данные в контексте отдельного разговора (как правило, это предыдущие ChatMessages или их резюме).

Долгосрочная память занимается тем, как извлекать и обновлять информацию между разговорами.

![Memory](https://python.langchain.com/assets/images/memory_diagram-0627c68230aa438f9b5419064d63cbbc.png)

##### Типы памяти

Есть много типов памяти: [Типы памяти](https://python.langchain.com/docs/modules/memory/types/)

* ConversationBufferMemory (сохраняет всю историю в буффере)
* ConversationBufferWindowMemory (сохраняет последних n сообщений в буффере)
* ConversationTokenBufferMemory (сохраняет n токенов в буффере)
* ConversationSummaryMemory (сохраняет саммаризацию диалога в буффере)

In [43]:
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

In [44]:
memory = ConversationBufferMemory()
conversation = ConversationChain(
    llm=chat, 
    memory = memory,
    verbose=True
)

In [45]:
conversation('Привет!')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Привет!
AI:[0m

[1m> Finished chain.[0m


{'input': 'Привет!', 'history': '', 'response': 'Привет! Как могу помочь?'}

In [46]:
conversation('Я просто проверяю память LangChain')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Привет!
AI: Привет! Как могу помочь?
Human: Я просто проверяю память LangChain
AI:[0m

[1m> Finished chain.[0m


{'input': 'Я просто проверяю память LangChain',
 'history': 'Human: Привет!\nAI: Привет! Как могу помочь?',
 'response': 'О, я знаю о LangChain! Это блокчейн-платформа, разработанная для обеспечения безопасности и прозрачности языковых данных. Она использует технологию блокчейна для хранения и обработки языковых данных, таких как переводы, аудиозаписи и тексты. LangChain также предоставляет возможность создания и управления смарт-контрактами, связанными с языковыми данными. Это очень интересный проект! Что именно вы хотите проверить в памяти LangChain?'}

In [47]:
conversation('А вот это называется галлюцинация :)')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Привет!
AI: Привет! Как могу помочь?
Human: Я просто проверяю память LangChain
AI: О, я знаю о LangChain! Это блокчейн-платформа, разработанная для обеспечения безопасности и прозрачности языковых данных. Она использует технологию блокчейна для хранения и обработки языковых данных, таких как переводы, аудиозаписи и тексты. LangChain также предоставляет возможность создания и управления смарт-контрактами, связанными с языковыми данными. Это очень интересный проект! Что именно вы хотите проверить в памяти LangChain?
Human: А вот это называется галлюцинация :)
AI:[0m

[1m> Finished chain.[0m


{'input': 'А вот это называется галлюцинация :)',
 'history': 'Human: Привет!\nAI: Привет! Как могу помочь?\nHuman: Я просто проверяю память LangChain\nAI: О, я знаю о LangChain! Это блокчейн-платформа, разработанная для обеспечения безопасности и прозрачности языковых данных. Она использует технологию блокчейна для хранения и обработки языковых данных, таких как переводы, аудиозаписи и тексты. LangChain также предоставляет возможность создания и управления смарт-контрактами, связанными с языковыми данными. Это очень интересный проект! Что именно вы хотите проверить в памяти LangChain?',
 'response': 'Галлюцинация - это восприятие человеком чего-то, чего на самом деле нет в окружающей действительности. Это может быть зрительное, слуховое, обонятельное или осязательное восприятие, которое не соответствует реальности. Галлюцинации могут быть вызваны различными причинами, такими как наркотики, психические расстройства или физические заболевания.'}

### Цепи (Chains)

[Доки](https://python.langchain.com/docs/modules/chains.html)  
[Описание сущности](https://docs.langchain.com/docs/components/chains/)

Цепи - это крайне универсальная концепция, которая представляет собой последовательность модульных компонентов (или других цепей), объединенных определенным образом для достижения общего использования.

Самый часто используемый тип цепи - это LLMChain, который объединяет PromptTemplate, Model и Guardrails, чтобы взять пользовательский ввод, отформатировать его соответствующим образом, передать модели, получить ответ, а затем проверить и исправить (если необходимо) вывод модели.

Бывают разные типы цепей:
* LLMChain (обычная цепь, промпт с содержанием на вход, ответ на выход)
* Sequential Chains (Последовательные цепи) 
  * SimpleSequentialChain (Простая - что-то на вход, выход первой цепи, становится входом для следующей)
  * SequentialChain (Сложная - типа DAG)
* Router Chain (Цепь, которая определяет куда пойдет сообщение в зависимости от условий)

**Цепям можно добавить память.**

#### LLMChain

In [48]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain

In [49]:
llm = ChatOpenAI(temperature=0.9)


In [50]:
prompt = ChatPromptTemplate.from_template(
    "What is the best name to describe \
    a company that makes {product}?"
)

In [51]:

chain = LLMChain(llm=llm, prompt=prompt)

In [52]:
product = "Queen Size Sheet Set"
chain.run(product)

'"RegalRest Linens"'

#### SimpleSequentialChain

In [53]:
from langchain.chains import SimpleSequentialChain

In [54]:
llm = ChatOpenAI(temperature=0.9)

# prompt template 1
first_prompt = ChatPromptTemplate.from_template(
    "What is the best name to describe \
    a company that makes {product}?"
)

# Chain 1
chain_one = LLMChain(llm=llm, prompt=first_prompt)

In [55]:

# prompt template 2
second_prompt = ChatPromptTemplate.from_template(
    "Write a 20 words description for the following \
    company:{company_name}"
)
# chain 2
chain_two = LLMChain(llm=llm, prompt=second_prompt)

In [56]:
overall_simple_chain = SimpleSequentialChain(chains=[chain_one, chain_two],
                                             verbose=True
                                            )

In [57]:
overall_simple_chain.run(product)



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3mThe Royal Linens Co.[0m
[33;1m[1;3mThe Royal Linens Co. specializes in luxury bedding and home textiles, offering exquisite designs and unparalleled comfort for your home.[0m

[1m> Finished chain.[0m


'The Royal Linens Co. specializes in luxury bedding and home textiles, offering exquisite designs and unparalleled comfort for your home.'

#### SequentialChain

In [58]:
from langchain.chains import SequentialChain

In [59]:
llm = ChatOpenAI(temperature=0.9)

# prompt template 1: translate to english
first_prompt = ChatPromptTemplate.from_template(
    "Translate the following review to english:"
    "\n\n{Review}"
)
# chain 1: input= Review and output= English_Review
chain_one = LLMChain(llm=llm, prompt=first_prompt, 
                     output_key="English_Review"
                    )


In [60]:
second_prompt = ChatPromptTemplate.from_template(
    "Can you summarize the following review in 1 sentence:"
    "\n\n{English_Review}"
)
# chain 2: input= English_Review and output= summary
chain_two = LLMChain(llm=llm, prompt=second_prompt, 
                     output_key="summary"
                    )


In [61]:
# prompt template 3: translate to english
third_prompt = ChatPromptTemplate.from_template(
    "What language is the following review:\n\n{Review}"
)
# chain 3: input= Review and output= language
chain_three = LLMChain(llm=llm, prompt=third_prompt,
                       output_key="language"
                      )


In [62]:

# prompt template 4: follow up message
fourth_prompt = ChatPromptTemplate.from_template(
    "Write a follow up response to the following "
    "summary in the specified language:"
    "\n\nSummary: {summary}\n\nLanguage: {language}"
)
# chain 4: input= summary, language and output= followup_message
chain_four = LLMChain(llm=llm, prompt=fourth_prompt,
                      output_key="followup_message"
                     )


In [63]:
# overall_chain: input= Review 
# and output= English_Review,summary, followup_message
overall_chain = SequentialChain(
    chains=[chain_one, chain_two, chain_three, chain_four],
    input_variables=["Review"],
    output_variables=["English_Review", "summary","followup_message"],
    verbose=True
)

In [64]:
import pandas as pd
df = pd.read_csv('../data/example_data/Data.csv')

In [65]:
review = df.Review[5]
overall_chain(review)



[1m> Entering new SequentialChain chain...[0m

[1m> Finished chain.[0m


{'Review': "Je trouve le goût médiocre. La mousse ne tient pas, c'est bizarre. J'achète les mêmes dans le commerce et le goût est bien meilleur...\nVieux lot ou contrefaçon !?",
 'English_Review': "I find the taste poor. The foam doesn't hold, it's weird. I buy the same ones from the store and the taste is much better...\nOld batch or counterfeit!?",
 'summary': 'The reviewer is dissatisfied with the taste of the product they purchased, suggesting it might be either an old batch or a counterfeit.',
 'followup_message': "Réponse de suivi :\n\nCher(e) client(e),\n\nMerci d'avoir pris le temps de nous donner votre avis sur notre produit. Nous sommes désolés d'apprendre que vous n'êtes pas satisfait(e) de son goût. Nous tenons à vous assurer que notre entreprise attache une grande importance à la qualité de nos produits.\n\nIl est possible que vous ayez reçu un lot périmé ou contrefait. Nous nous excusons sincèrement pour cette expérience désagréable et nous aimerions en savoir plus afin d

#### Router Chain

In [66]:
physics_template = """You are a very smart physics professor. \
You are great at answering questions about physics in a concise\
and easy to understand manner. \
When you don't know the answer to a question you admit\
that you don't know.

Here is a question:
{input}"""


math_template = """You are a very good mathematician. \
You are great at answering math questions. \
You are so good because you are able to break down \
hard problems into their component parts, 
answer the component parts, and then put them together\
to answer the broader question.

Here is a question:
{input}"""

history_template = """You are a very good historian. \
You have an excellent knowledge of and understanding of people,\
events and contexts from a range of historical periods. \
You have the ability to think, reflect, debate, discuss and \
evaluate the past. You have a respect for historical evidence\
and the ability to make use of it to support your explanations \
and judgements.

Here is a question:
{input}"""


computerscience_template = """ You are a successful computer scientist.\
You have a passion for creativity, collaboration,\
forward-thinking, confidence, strong problem-solving capabilities,\
understanding of theories and algorithms, and excellent communication \
skills. You are great at answering coding questions. \
You are so good because you know how to solve a problem by \
describing the solution in imperative steps \
that a machine can easily interpret and you know how to \
choose a solution that has a good balance between \
time complexity and space complexity. 

Here is a question:
{input}"""

In [67]:
prompt_infos = [
    {
        "name": "physics", 
        "description": "Good for answering questions about physics", 
        "prompt_template": physics_template
    },
    {
        "name": "math", 
        "description": "Good for answering math questions", 
        "prompt_template": math_template
    },
    {
        "name": "History", 
        "description": "Good for answering history questions", 
        "prompt_template": history_template
    },
    {
        "name": "computer science", 
        "description": "Good for answering computer science questions", 
        "prompt_template": computerscience_template
    }
]

In [68]:
from langchain.chains.router import MultiPromptChain
from langchain.chains.router.llm_router import LLMRouterChain,RouterOutputParser
from langchain.prompts import PromptTemplate

In [69]:
llm = ChatOpenAI(temperature=0)

In [70]:

destination_chains = {}
for p_info in prompt_infos:
    name = p_info["name"]
    prompt_template = p_info["prompt_template"]
    prompt = ChatPromptTemplate.from_template(template=prompt_template)
    chain = LLMChain(llm=llm, prompt=prompt)
    destination_chains[name] = chain  
    
destinations = [f"{p['name']}: {p['description']}" for p in prompt_infos]
destinations_str = "\n".join(destinations)

In [71]:
default_prompt = ChatPromptTemplate.from_template("{input}")
default_chain = LLMChain(llm=llm, prompt=default_prompt)

In [72]:
MULTI_PROMPT_ROUTER_TEMPLATE = """Given a raw text input to a \
language model select the model prompt best suited for the input. \
You will be given the names of the available prompts and a \
description of what the prompt is best suited for. \
You may also revise the original input if you think that revising\
it will ultimately lead to a better response from the language model.

<< FORMATTING >>
Return a markdown code snippet with a JSON object formatted to look like:
```json
{{{{
    "destination": string \ name of the prompt to use or "DEFAULT"
    "next_inputs": string \ a potentially modified version of the original input
}}}}
```

REMEMBER: "destination" MUST be one of the candidate prompt \
names specified below OR it can be "DEFAULT" if the input is not\
well suited for any of the candidate prompts.
REMEMBER: "next_inputs" can just be the original input \
if you don't think any modifications are needed.

<< CANDIDATE PROMPTS >>
{destinations}

<< INPUT >>
{{input}}

<< OUTPUT (remember to include the ```json)>>"""

In [73]:
router_template = MULTI_PROMPT_ROUTER_TEMPLATE.format(
    destinations=destinations_str
)
router_prompt = PromptTemplate(
    template=router_template,
    input_variables=["input"],
    output_parser=RouterOutputParser(),
)

router_chain = LLMRouterChain.from_llm(llm, router_prompt)

In [74]:
chain = MultiPromptChain(router_chain=router_chain, 
                         destination_chains=destination_chains, 
                         default_chain=default_chain, verbose=True
                        )

In [75]:
chain.run("What is black body radiation?")



[1m> Entering new MultiPromptChain chain...[0m
physics: {'input': 'What is black body radiation?'}
[1m> Finished chain.[0m


'Black body radiation refers to the electromagnetic radiation emitted by an object that absorbs all incident radiation and reflects or transmits none. It is called "black body" because it absorbs all wavelengths of light, appearing black at room temperature. \n\nAccording to Planck\'s law, black body radiation is characterized by a continuous spectrum of wavelengths and intensities, which depend on the temperature of the object. As the temperature increases, the peak intensity of the radiation shifts to shorter wavelengths, resulting in a change in color from red to orange, yellow, white, and eventually blue at very high temperatures.\n\nBlack body radiation is a fundamental concept in physics and has significant applications in various fields, including astrophysics, thermodynamics, and quantum mechanics. It played a crucial role in the development of quantum theory and understanding the behavior of light and matter.'

In [76]:
chain.run("what is 2 + 2")



[1m> Entering new MultiPromptChain chain...[0m
math: {'input': 'what is 2 + 2'}
[1m> Finished chain.[0m


"Thank you for your kind words! As a mathematician, I am happy to help with any math questions, no matter how simple or complex they may be.\n\nNow, let's solve the problem at hand. The question is asking for the sum of 2 and 2. To find the answer, we can simply add the two numbers together:\n\n2 + 2 = 4\n\nTherefore, the sum of 2 and 2 is 4."

In [77]:
chain.run("Why does every cell in our body contain DNA?")



[1m> Entering new MultiPromptChain chain...[0m
None: {'input': 'Why does every cell in our body contain DNA?'}
[1m> Finished chain.[0m


'Every cell in our body contains DNA because DNA is the genetic material that carries the instructions for the development, functioning, and reproduction of all living organisms. DNA contains the information necessary for the synthesis of proteins, which are essential for the structure and function of cells. It serves as a blueprint for the production of specific proteins that determine the characteristics and traits of an organism. Additionally, DNA is responsible for the transmission of genetic information from one generation to the next, ensuring the continuity of life. Therefore, every cell in our body contains DNA to ensure proper cellular function and to pass on genetic information to future generations.'

### Q&A о документах

**LangChain умеет отвечать на запросы про документы.**

[Доки](https://python.langchain.com/docs/use_cases/question_answering.html)  
[Описание сущности](https://docs.langchain.com/docs/use-cases/qa-docs)

Хотя многослойные языковые модели (LLM) могут быть мощными, они не обладают информацией, на которой не были обучены. Если вы хотите использовать LLM для ответов на вопросы о документах, на которых он не был обучен, вам придется предоставить ему информацию о тех документах. Самый распространенный способ сделать это - через "ретриев-усиленную генерацию".

Идея ретриев-усиленной генерации заключается в том, что при получении вопроса вы сначала выполняете этап извлечения, чтобы получить все соответствующие документы. Затем вы передаете эти документы вместе с исходным вопросом модели и просите ее сгенерировать ответ. Однако для этого сначала необходимо иметь документы в таком формате, чтобы их можно было опрашивать таким образом. Эта страница описывает общие идеи между этими двумя шагами: (1) введение документов в формат, который можно опрашивать, а затем (2) цепочку ретриев-усиленной генерации.

### Оценка качества ответов модели (Evaluation)

[Доки](https://python.langchain.com/docs/guides/evaluation/)

В сущности проверять либо глазами, либо самой моделью.

[String Evaluators](https://python.langchain.com/docs/guides/evaluation/string/): Проверка строк, сравнивая с референтной.  
Например: оценка по критерию краткости, или является ли ответ про математику и т.д. См. доки


[Trajectory Evaluators](https://python.langchain.com/docs/guides/evaluation/trajectory/): Оценка последовательности действий агента.  


[Comparison Evaluators](https://python.langchain.com/docs/guides/evaluation/comparison/): Сравнение выводов моделей, цепей, агентов.  
Например, парное сравнение выводов двух разных цепей.

Каждый тип оценщика в LangChain поставляется с готовыми реализациями, которые можно использовать без дополнительных настроек, а также с расширяемым API, позволяющим настраивать их в соответствии с вашими уникальными требованиями. 

Каждый из этих оценщиков предоставляет простой способ измерить производительность и интегритет моделей на разнообразных данных. Кроме того, расширяемое API позволяет настраивать их поведение в зависимости от ваших специфических требований.

Эти оценщики могут быть легко применены в различных сценариях и могут быть использованы с разными цепями и реализациями LLM в библиотеке LangChain.

### Агенты

[Документация](https://python.langchain.com/docs/modules/agents/)  
Концептуальные части переведены здесь.  
Можно писать свои тулзы.  

Основная идея агентов заключается в использовании LLM для выбора последовательности действий. В цепях последовательность действий закодирована (в коде). В агентах языковая модель используется в качестве рассудочного движка (reasoning engine) для определения, какие действия предпринять и в каком порядке.

**Агент (Agent)**  
Этот класс отвечает за принятие решения о следующем шаге. Это осуществляется с помощью языковой модели и промпта. Этот промпт может включать в себя следующее:

* Личность агента (полезно для того, чтобы он отвечал определенным образом).
* Контекст агента (полезно, чтобы дать ему больше контекста о типах задач, которые ему предлагаются).
* Промпт стратегии для более логичного рассуждения (самой известной и широко используемой является ReAct).
  
LangChain предоставляет несколько различных типов агентов для начала работы. Тем не менее, вы, вероятно, захотите настроить этих агентов с помощью частей (1) и (2). Для полного списка типов агентов смотрите раздел "Типы агентов" ([agent types](https://python.langchain.com/docs/modules/agents/agent_types/)).

**Инструменты (Tools)**  
Инструменты - это функции, которые вызывает агент. Здесь существуют два важных аспекта:

1. Предоставление агенту доступа к правильным инструментам.
2. Описание инструментов таким образом, чтобы оно было наиболее полезным для агента.

Без обоих аспектов агент, которого вы пытаетесь создать, не будет работать. Если вы не предоставите агенту доступ к правильному набору инструментов, он никогда не сможет достичь поставленной цели. Если вы не правильно описываете инструменты, агент не будет знать, как их правильно использовать.

LangChain предоставляет широкий набор инструментов для начала работы, но также облегчает определение собственных инструментов (включая настраиваемые описания). Для полного списка инструментов, смотрите [здесь](https://python.langchain.com/docs/modules/agents/tools/).

**Набор инструментов (Toolkits)**   
Часто набор инструментов, к которым агент имеет доступ, более важен, чем отдельный инструмент. Для этого LangChain предоставляет концепцию наборов инструментов - групп инструментов, необходимых для достижения конкретных целей. Обычно в каждом наборе инструментов содержится примерно 3-5 инструментов.

LangChain предоставляет широкий набор наборов инструментов для начала работы. Для полного списка наборов инструментов, смотрите [здесь](https://python.langchain.com/docs/modules/agents/toolkits/).

In [78]:
from langchain.agents.agent_toolkits import create_python_agent
from langchain.agents import load_tools, initialize_agent
from langchain.agents import AgentType
from langchain.tools.python.tool import PythonREPLTool
from langchain.python import PythonREPL
from langchain.chat_models import ChatOpenAI

In [79]:
llm = ChatOpenAI(temperature=0)

In [80]:
tools = load_tools(["llm-math","wikipedia"], llm=llm)

Обратите внимание на тип агента и на тулзы.  
Агенту можно добавить память.

In [81]:
agent= initialize_agent(
    tools, 
    llm, 
    agent=AgentType.CHAT_ZERO_SHOT_REACT_DESCRIPTION,
    handle_parsing_errors=True,
    verbose = True)

In [82]:
agent("What is the 25% of 300?")



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mI can use the calculator tool to find the answer to this question.

Action:
```json
{
  "action": "Calculator",
  "action_input": "25% of 300"
}
```[0m
Observation: [36;1m[1;3mAnswer: 75.0[0m
Thought:[32;1m[1;3mThe answer is 75.0.
Final Answer: 75.0[0m

[1m> Finished chain.[0m


{'input': 'What is the 25% of 300?', 'output': '75.0'}

In [83]:
question = "Tom M. Mitchell is an American computer scientist \
and the Founders University Professor at Carnegie Mellon University (CMU)\
what book did he write?"
result = agent(question) 



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: I can use Wikipedia to find out what book Tom M. Mitchell wrote.
Action:
```json
{
  "action": "Wikipedia",
  "action_input": "Tom M. Mitchell"
}
```[0m
Observation: [33;1m[1;3mPage: Tom M. Mitchell
Summary: Tom Michael Mitchell (born August 9, 1951) is an American computer scientist and the Founders University Professor at Carnegie Mellon University (CMU). He is a founder and former Chair of the Machine Learning Department at CMU. Mitchell is known for his contributions to the advancement of machine learning, artificial intelligence, and cognitive neuroscience and is the author of the textbook Machine Learning. He is a member of the United States National Academy of Engineering since 2010. He is also a Fellow of the American Academy of Arts and Sciences, the American Association for the Advancement of Science and a Fellow and past President of the Association for the Advancement of Artificial Intelligence. In Oct

#### Python Agent

In [84]:
agent = create_python_agent(
    llm,
    tool=PythonREPLTool(),
    verbose=True
)

In [85]:
customer_list = [["Harrison", "Chase"], 
                 ["Lang", "Chain"],
                 ["Dolly", "Too"],
                 ["Elle", "Elem"], 
                 ["Geoff","Fusion"], 
                 ["Trance","Former"],
                 ["Jen","Ayai"]
                ]

In [86]:
agent.run(f"""Sort these customers by \
last name and then first name \
and print the output: {customer_list}""") 



[1m> Entering new AgentExecutor chain...[0m


Python REPL can execute arbitrary code. Use with caution.


[32;1m[1;3mI can use the `sorted()` function to sort the list of customers. I will need to provide a key function that specifies the sorting order based on last name and then first name.
Action: Python_REPL
Action Input: sorted([['Harrison', 'Chase'], ['Lang', 'Chain'], ['Dolly', 'Too'], ['Elle', 'Elem'], ['Geoff', 'Fusion'], ['Trance', 'Former'], ['Jen', 'Ayai']], key=lambda x: (x[1], x[0]))[0m
Observation: [36;1m[1;3m[0m
Thought:[32;1m[1;3mThe customers have been sorted by last name and then first name.
Final Answer: [['Jen', 'Ayai'], ['Harrison', 'Chase'], ['Lang', 'Chain'], ['Elle', 'Elem'], ['Geoff', 'Fusion'], ['Trance', 'Former'], ['Dolly', 'Too']][0m

[1m> Finished chain.[0m


"[['Jen', 'Ayai'], ['Harrison', 'Chase'], ['Lang', 'Chain'], ['Elle', 'Elem'], ['Geoff', 'Fusion'], ['Trance', 'Former'], ['Dolly', 'Too']]"

#### View detailed outputs of the chains

In [87]:
import langchain
langchain.debug=True
agent.run(f"""Sort these customers by \
last name and then first name \
and print the output: {customer_list}""") 
langchain.debug=False

[32;1m[1;3m[chain/start][0m [1m[1:chain:AgentExecutor] Entering Chain run with input:
[0m{
  "input": "Sort these customers by last name and then first name and print the output: [['Harrison', 'Chase'], ['Lang', 'Chain'], ['Dolly', 'Too'], ['Elle', 'Elem'], ['Geoff', 'Fusion'], ['Trance', 'Former'], ['Jen', 'Ayai']]"
}
[32;1m[1;3m[chain/start][0m [1m[1:chain:AgentExecutor > 2:chain:LLMChain] Entering Chain run with input:
[0m{
  "input": "Sort these customers by last name and then first name and print the output: [['Harrison', 'Chase'], ['Lang', 'Chain'], ['Dolly', 'Too'], ['Elle', 'Elem'], ['Geoff', 'Fusion'], ['Trance', 'Former'], ['Jen', 'Ayai']]",
  "agent_scratchpad": "",
  "stop": [
    "\nObservation:",
    "\n\tObservation:"
  ]
}
[32;1m[1;3m[llm/start][0m [1m[1:chain:AgentExecutor > 2:chain:LLMChain > 3:llm:ChatOpenAI] Entering LLM run with input:
[0m{
  "prompts": [
    "Human: You are an agent designed to write and execute python code to answer questions.\nYou