## Сценарий

Предположим, у вас есть набор документов (PDF-файлы, концептуальные страницы, вопросы клиентов и т.д.), и вы хотите обобщить содержание.

LLM - отличный инструмент для этого, учитывая их умение понимать и синтезировать текст.

В этом пошаговом руководстве мы рассмотрим, как выполнить обобщение документов с помощью LLM. 

![Image description](https://github.com/langchain-ai/langchain/blob/master/docs/static/img/summarization_use_case_1.png?raw=1)

## Обзор

Центральным вопросом при создании модуля краткого перессказа является то, как передать ваши документы в контекстное окно LLM. Двумя распространенными подходами для этого являются:

1. `Stuff`: Просто "запихните" все ваши документы в один промпт. Это самый простой подход (вот [здесь](https://python.langchain.com/docs/modules/chains#lcel-chains) дополнительная информация по `create_stuff_documents_chain` конструктору, который используется для этого метода).

2. `Map-reduce`: Обобщите каждый документ отдельно на шаге "map" и затем преобразуйте в итоговое резюме на шаге "reduce" (вот [здесь](https://python.langchain.com/docs/modules/chains#legacy-chains) можно найти дополнительную информацию по `MapReduceDocumentsChain`, который используется в этом методе).

![Image description](https://github.com/langchain-ai/langchain/blob/master/docs/static/img/summarization_use_case_2.png?raw=1)

## Быстрый старт

Для краткости отметим, что любой конвейер может быть обернут в один объект: `load_summarize_chain`.

Предположим, мы хотим подвести итог записи в блоге. Мы можем сделать это с помощью нескольких строк кода.

Сначала задаем переменные окружения и устанавливаем пакеты:

In [2]:
%pip install --upgrade --quiet  yandexcloud==0.255.0 chromadb==0.5.0 langchain==0.1.4 requests==2.31.0 bs4==0.0.2 langchainhub==0.1.18 transformers==4.41.2

# Определите переменные SA_ID, KEY_ID, YC_FOLDER_ID или загрузите их из .env файла
# import dotenv

# dotenv.load_dotenv()


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.0.1[0m[39;49m -> [0m[32;49m24.0[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpython3 -m pip install --upgrade pip[0m


Можно использовать `chain_type="stuff"

А также `chain_type="map_reduce"` или `chain_type="refine"`.

##### Получаем IAM-токен для работы с YandexGPT

In [3]:
import time
import jwt
import requests
import os
service_account_id = os.environ["SA_ID"]
key_id = os.environ["KEY_ID"]
folder_id = os.environ["YC_FOLDER_ID"]
private_key = "-----BEGIN PRIVATE KEY-----ЗДЕСЬ УКАЖИТЕ ВАШ ПРИВАТНЫЙ КЛЮЧ-----END PRIVATE KEY-----\n"
# Получаем IAM-токен
now = int(time.time())
payload = {
        'aud': 'https://iam.api.cloud.yandex.net/iam/v1/tokens',
        'iss': service_account_id,
        'iat': now,
        'exp': now + 360}
# Формирование JWT
encoded_token = jwt.encode(
    payload,
    private_key,
    algorithm='PS256',
    headers={'kid': key_id})
url = 'https://iam.api.cloud.yandex.net/iam/v1/tokens'
x = requests.post(url,  
                  headers={'Content-Type': 'application/json'},
                  json = {'jwt': encoded_token}).json()
token = x['iamToken']

KeyError: 'SA_ID'

In [None]:
from langchain.chains.summarize import load_summarize_chain
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.chat_models import ChatYandexGPT
# url = "https://cloud.yandex.ru/ru/docs/yandexgpt/concepts/"
url = "https://cloud.yandex.ru/ru/docs/security/standarts"
loader = WebBaseLoader(url)
docs = loader.load()

# model_uri = "gpt://"+str(folder_id)+"/yandexgpt-lite/latest"
# model_uri = "gpt://"+str(folder_id)+"/yandexgpt/latest"
model_uri = "gpt://"+str(folder_id)+"/summarization/latest" #модель, специально обученная для решения задачи краткого перессказа
llm = ChatYandexGPT(iam_token = token, model_uri=model_uri, temperature = 0)

chain = load_summarize_chain(llm, chain_type="stuff")

print(chain.run(docs))

## Вариант 1. Stuff

Когда мы используем `load_summarize_chain` с `chain_type="stuff"`, мы применяем [StuffDocumentsChain](https://api.python.langchain.com/en/latest/chains/langchain.chains.combine_documents.stuff.StuffDocumentsChain.html#langchain.chains.combine_documents.stuff.StuffDocumentsChain).

Цепочка возьмет список документов, вставит их все в приглашение и передаст это приглашение LLM:

In [None]:
from langchain.chains.combine_documents.stuff import StuffDocumentsChain
from langchain.chains.llm import LLMChain
from langchain.prompts import PromptTemplate

# Определим промпт
prompt_template = """Напишите краткое изложение следующего:
"{text}"
Краткое изложение:"""
prompt = PromptTemplate.from_template(prompt_template)

# Определим LLM цепочку
# model_uri = "gpt://"+str(folder_id)+"/yandexgpt-lite/latest"
# model_uri = "gpt://"+str(folder_id)+"/yandexgpt/latest"
model_uri = "gpt://"+str(folder_id)+"/summarization/latest" #модель, специально обученная для решения задачи краткого перессказа
llm = ChatYandexGPT(iam_token = token, model_uri=model_uri, temperature = 0)

llm_chain = LLMChain(llm=llm, prompt=prompt)

# Определим StuffDocumentsChain
stuff_chain = StuffDocumentsChain(llm_chain=llm_chain, document_variable_name="text")

docs = loader.load()
print(stuff_chain.run(docs))
# print(stuff_chain.invoke(docs))

Мы можем видеть, что мы воспроизводим более ранний результат, используя `load_summarize_chain`.

## Вариант 2. Map-Reduce

Давайте разберемся с подходом map reduce. Для этого мы сначала сопоставим каждый документ с отдельным перессказом, используя `LLMChain`. После этого используем `ReduceDocumentsChain` чтоб объединить эти пересказы в общую краткую сводку.

Сначала мы указываем цепочку LLMChain, которую будем использовать для сопоставления каждого документа с отдельным кратким пересказом:

In [None]:
from langchain.chains import MapReduceDocumentsChain, ReduceDocumentsChain
from langchain_text_splitters import CharacterTextSplitter
from langchain.text_splitter import RecursiveCharacterTextSplitter

# model_uri = "gpt://"+str(folder_id)+"/yandexgpt-lite/latest"
# model_uri = "gpt://"+str(folder_id)+"/yandexgpt/latest"
model_uri = "gpt://"+str(folder_id)+"/summarization/latest" #модель, специально обученная для решения задачи краткого перессказа
llm = ChatYandexGPT(iam_token = token, model_uri=model_uri, temperature = 0)

# Map
map_template = """Ниже приведен набор документов
{docs}
Основываясь на этом списке документов, пожалуйста, определи основные темы
Полезный ответ:"""
map_prompt = PromptTemplate.from_template(map_template)
map_chain = LLMChain(llm=llm, prompt=map_prompt)

Можем также использовать Prompt Hub для хранения и извлечения промптов.

Это будет работать с вашим [LangSmith API key](https://docs.smith.langchain.com/).

Например, пример map промпта [здесь](https://smith.langchain.com/hub/rlm/map-prompt).

In [None]:
from langchain import hub

map_prompt = hub.pull("rlm/map-prompt")
map_chain = LLMChain(llm=llm, prompt=map_prompt)

`ReduceDocumentsChain` обрабатывает получение результатов сопоставления документов и сведение их в единый вывод. Он оборачивает общий `CombineDocumentsChain` (как и `StuffDocumentsChain`) но добавляет возможность сворачивать документы перед передачей их в `CombineDocumentsChain` если их совокупный размер превышает `token_max`. В этом примере мы действительно можем сократить цепочку для объединения всех документов, чтобы также свернуть наши документы.

Таким образом, если совокупное количество токенов в наших сопоставленных документах превысит 4000 токенов, то мы будем рекурсивно передавать документы пакетами по < 4000 токенов в наш`StuffDocumentsChain` для создания групповых сводок.И как только эти групповые сводки в совокупности составят менее 4000 токенов, мы передадим их все в последний раз в `StuffDocumentsChain` чтобы создать итоговую сводку.

In [None]:
# Reduce
reduce_template = """Ниже приведен набор кратких выжимок из документов:
{docs}
Возьми их и сформируй из них окончательное, сводное резюме по основным темам.
Полезный ответ:"""
reduce_prompt = PromptTemplate.from_template(reduce_template)

In [None]:
# Note we can also get this from the prompt hub, as noted above
reduce_prompt = hub.pull("rlm/map-prompt")

In [None]:
reduce_prompt

In [None]:
# Run chain
reduce_chain = LLMChain(llm=llm, prompt=reduce_prompt)

# Берет список документов, объединяет их в одну строку и передает в LLMChain
combine_documents_chain = StuffDocumentsChain(
    llm_chain=reduce_chain, document_variable_name="docs"
)

# Объединяет и итеративно сокращает сопоставленные документы
reduce_documents_chain = ReduceDocumentsChain(
    # Это конечная цепочка, которая вызывается.
    combine_documents_chain=combine_documents_chain,
    # Если размер документов выходит за рамки контекста для `StuffDocumentsChain`
    collapse_documents_chain=combine_documents_chain,
    # Максимальное количество токенов для группировки документов.
    token_max=4000,
)

Объединяет нашу map and reduce цепочку в одну:

In [None]:
# Объединение документов путем сопоставления цепочки над ними, а затем объединение результатов
map_reduce_chain = MapReduceDocumentsChain(
    # Map chain
    llm_chain=map_chain,
    # Reduce chain
    reduce_documents_chain=reduce_documents_chain,
    # Имя переменной в llm_chain в которую помещаются документы
    document_variable_name="docs",
    # Возвращает результаты выполнения шагов сопоставления в выходных данных
    return_intermediate_steps=False,
)
CHUNK_SIZE = 1000
CHUNK_OVERLAP = 0
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=CHUNK_SIZE, 
    chunk_overlap=CHUNK_OVERLAP)
# text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
#     chunk_size=1000, chunk_overlap=0
# )
split_docs = text_splitter.split_documents(docs)

In [None]:
print(map_reduce_chain.run(split_docs))

### Дополнительная информация

**Что можно "подкрутить"**

* Как показано выше, вы можете настроить LLM и промпты для этапов map and reduce.

**Реальный сценарий**

* См. [этот блог-пост](https://blog.langchain.dev/llms-to-improve-documentation/) тематическое исследование по анализу взаимодействий с пользователями (вопросы по LangChain документации)
  
* Связанный с этим [репозиторий](https://github.com/mendableai/QA_clustering) также представляет кластеризацию как средство для суммаризации (краткого перессказа).
* Это открывает третий путь помимо `stuff` или `map-reduce` подходов, который имеет смысл рассматривать

![описание схемы](https://github.com/langchain-ai/langchain/blob/master/docs/static/img/summarization_use_case_3.png?raw=1)

## Вариант 3. Refine

[RefineDocumentsChain](https://python.langchain.com/docs/modules/chains#legacy-chains) похож на map-reduce:

> The refine documents создает ответ, перебирая входные документы и итеративно обновляя свой ответ. Для каждого документа он передает все входные данные, не относящиеся к документу, текущий документ и последний промежуточный ответ в цепочку LLM, чтобы получить новый ответ.

Это можно легко запустить с помощью `chain_type="refine"`.

In [None]:
chain = load_summarize_chain(llm, chain_type="refine")
print(chain.run(split_docs))

Также возможно ввести запрос и вернуть промежуточные шаги.

In [None]:
prompt_template = """Напишите краткое изложение следующего:
{text}
КРАТКОЕ ИЗЛОЖЕНИЕ:"""
prompt = PromptTemplate.from_template(prompt_template)

refine_template = (
    "Твоя задача подготовить окончательное краткое содержание\n"
    "Мы предоставили существующую краткую сводку до определенного момента: {existing_answer}\n"
    "У нас есть возможность доработать существующую краткую сводку"
    "(только если требуется) с еще некоторым контекстом ниже.\n"
    "------------\n"
    "{text}\n"
    "------------\n"
    "Учитывая новый контекст, доработайте первоначальную краткую сводку на русском языке"
    "Если контекст бесполезен, верните исходную краткую сводку."
)
refine_prompt = PromptTemplate.from_template(refine_template)
chain = load_summarize_chain(
    llm=llm,
    chain_type="refine",
    question_prompt=prompt,
    refine_prompt=refine_prompt,
    return_intermediate_steps=True,
    input_key="input_documents",
    output_key="output_text",
)
result = chain({"input_documents": split_docs}, return_only_outputs=True)

In [None]:
print(result["output_text"])

In [None]:
print("\n\n".join(result["intermediate_steps"][:3]))

## Разбивка и суммирование в единую цепочку
Для удобства мы можем объединить как разбиение текста нашего длинного документа, так и подведение итогов в одном документе.`AnalyzeDocumentsChain`.

In [4]:
from langchain.chains import AnalyzeDocumentChain

summarize_document_chain = AnalyzeDocumentChain(
    combine_docs_chain=chain, text_splitter=text_splitter
)
summary=summarize_document_chain.invoke(docs[0].page_content)

NameError: name 'chain' is not defined

In [None]:
summary

In [None]:
print(summary.get('input_document'))
print(summary.get('intermediate_steps'))