## Работа с YandexGPT и OpenSearch с помощью фреймворка Langchain

### 1. Устанавливаем необходимые библиотеки

In [2]:
%pip install -r requirements.txt

Defaulting to user installation because normal site-packages is not writeable
Collecting urllib3>=1.26.18 (from opensearch-py->-r requirements.txt (line 3))
  Using cached urllib3-2.2.1-py3-none-any.whl.metadata (6.4 kB)
Collecting packaging<24.0,>=23.2 (from langchain-core<0.2.0,>=0.1.41->langchain-community->-r requirements.txt (line 5))
  Using cached packaging-23.2-py3-none-any.whl.metadata (3.2 kB)
Using cached urllib3-2.2.1-py3-none-any.whl (121 kB)
Using cached packaging-23.2-py3-none-any.whl (53 kB)
Installing collected packages: urllib3, packaging
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
streamlit 1.24.0 requires pympler<2,>=0.9, which is not installed.
ml-kernel 0.0.1 requires urllib3==1.25.11, but you have urllib3 2.2.1 which is incompatible.
argilla 1.16.0 requires typer<0.8.0,>=0.6.0, but you have typer 0.9.0 which is incompatible.
chro

После установки библиотек необходимо перегазгрузить Kernel. Для этого в верхнем меню выберите Kernel -> Restart Kernel

### 2. Подключение к кластеру OpenSearch

Документация по подключению: https://cloud.yandex.ru/docs/managed-opensearch/operations/connect

#### Получение SSL-сертификата

In [3]:
!mkdir -p /home/jupyter/datasphere/project/.opensearch && \
wget "https://storage.yandexcloud.net/cloud-certs/CA.pem" \
     --output-document /home/jupyter/datasphere/project/.opensearch/root.crt && \
chmod 0600 /home/jupyter/datasphere/project/.opensearch/root.crt

--2024-04-13 15:42:50--  https://storage.yandexcloud.net/cloud-certs/CA.pem
Resolving storage.yandexcloud.net (storage.yandexcloud.net)... 213.180.193.243, 2a02:6b8::1d9
Connecting to storage.yandexcloud.net (storage.yandexcloud.net)|213.180.193.243|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3579 (3.5K) [application/x-x509-ca-cert]
Saving to: ‘/home/jupyter/datasphere/project/.opensearch/root.crt’

     0K ...                                                   100% 3.55G=0s

2024-04-13 15:42:50 (3.55 GB/s) - ‘/home/jupyter/datasphere/project/.opensearch/root.crt’ saved [3579/3579]



#### Тестируем подключение к кластеру

In [4]:
CA = '/home/jupyter/datasphere/project/.opensearch/root.crt'

import os
#Укажите пароль для пользователя admin
PASS = os.environ['MDB_OS_PWD'] # Обратиться к секрету <имя_секрета> из переменных окружения
#Укажите список хостов кластера
HOSTS = os.environ['MDB_OS_HOSTS'].split(",")

In [5]:
from opensearchpy import OpenSearch

conn = OpenSearch(
  HOSTS,
  http_auth=('admin', PASS),
  use_ssl=True,
  verify_certs=True,
  ca_certs=CA)

print(conn.info())

{'name': 'rc1a-9r5h0inf2p0f3tk2.mdb.yandexcloud.net', 'cluster_name': 'c9qthb5rf6to08jrn7uo', 'cluster_uuid': 'us1xtR19RCe9tSmOydAvOg', 'version': {'distribution': 'opensearch', 'number': '2.8.0', 'build_type': 'deb', 'build_hash': '8cbab9609696cd93c45fd5f3090560648c04f5af', 'build_date': '2023-10-04T14:42:52.695597332Z', 'build_snapshot': False, 'lucene_version': '9.6.0', 'minimum_wire_compatibility_version': '7.10.0', 'minimum_index_compatibility_version': '7.0.0'}, 'tagline': 'The OpenSearch Project: https://opensearch.org/'}


При правильной настройке подключения код выше вернет объект dict с информацией об имени кластера, uuid, версии и т.д.

### 2. Получаем IAM-токен для работы с YandexGPT

In [6]:
import time
import jwt
import requests

Для того, чтобы обратиться из DataSphere к YandexGPT в настройках проекта необходимо указать сервисный аккаунт, у которого есть роль ai.languageModels.user. Для сервисного аккаунта необходимо создать **авторизованный** ключ доступа. 

In [10]:
service_account_id = os.environ["SA_ID"] #обращаемся к переменным окружения
key_id = os.environ["KEY_ID"]
private_key = "-----BEGIN PRIVATE KEY-----\nsdsadasdasdasdasds\n-----END PRIVATE KEY-----\n"

In [9]:
# Получаем IAM-токен

now = int(time.time())
payload = {
        'aud': 'https://iam.api.cloud.yandex.net/iam/v1/tokens',
        'iss': service_account_id,
        'iat': now,
        'exp': now + 360}

# Формирование JWT
encoded_token = jwt.encode(
    payload,
    private_key,
    algorithm='PS256',
    headers={'kid': key_id})

url = 'https://iam.api.cloud.yandex.net/iam/v1/tokens'
x = requests.post(url,  
                  headers={'Content-Type': 'application/json'},
                  json = {'jwt': encoded_token}).json()
token = x['iamToken']

### 3. Создаем индекс в OpenSearch для поиска релевантных документов

Устанавливаем LangChain. **LangChain** — это фреймворк для разработки приложений на базе языковых моделей.

In [11]:
import langchain
from operator import itemgetter
from langchain.document_loaders import DirectoryLoader, PyPDFLoader, TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.memory import ConversationBufferMemory

In [12]:
# Указываем путь к папке с документами в Object Storage. Для этого выберите Сopy Path
source_dir = "/home/jupyter/datasphere/s3/...."

In [13]:
# Создаем объект для считывания документов из S3 бакета 
loader = DirectoryLoader(source_dir, 
                         glob="**/*.pdf", 
                         loader_cls=PyPDFLoader, 
                         silent_errors=True,
                         show_progress=True, 
                         recursive=True
)

In [14]:
# Указываем длины фрагмента, на который разбиваются документы

CHUNK_SIZE = 1000
CHUNK_OVERLAP = 100

In [15]:
# Считываем документы и разбиваем на фрагменты

documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=CHUNK_SIZE, 
    chunk_overlap=CHUNK_OVERLAP
)
docs = text_splitter.split_documents(documents)

print(f"Количество фрагментов, на которые разбиты все документы = {len(docs)}")

100%|██████████| 2/2 [00:01<00:00,  1.84it/s]

Количество фрагментов, на которые разбиты все документы = 15





In [18]:
# Cоздаем объект YandexGPTEmbeddings для построения векторов с помощью YandexGPT
from yandex_chain import YandexEmbeddings
folder_id = os.environ["YC_FOLDER_ID"]
embeddings = YandexEmbeddings(folder_id=folder_id, iam_token = token)
embeddings.sleep_interval = 0.1 #текущее ограничение эмбеддера 10 RPS, делаем задержку 1/10 секунды, чтобы не выйти за это ограничение

In [19]:
text_to_print = f"Ориентировочное время оцифровки = {len(documents)*embeddings.sleep_interval} с."
print(text_to_print)

Ориентировочное время оцифровки = 0.7000000000000001 с.


In [20]:
# Строим вектора по документам и добавляем их в базу OpenSearch
from langchain_community.vectorstores import OpenSearchVectorSearch

docsearch = OpenSearchVectorSearch.from_documents(
     docs,
     embeddings,
     opensearch_url=HOSTS,
     http_auth=("admin", PASS),
     use_ssl = True,
     verify_certs = True,
     ca_certs = CA,
     engine = 'lucene',
     index_name = "yagpt-rag-demo-1000-100", # индекс, к которому будут добавлены новые вектора текущей документации
     bulk_size=1000000,
     space_type="cosinesimil"
)
# space_type: "l2", "l1", "cosinesimil", "linf", "innerproduct"; default: "l2"

In [25]:
# Если эмбеддинги уже есть, то запускаем эту строчку
docsearch2 = OpenSearchVectorSearch (
    embedding_function=embeddings,
    index_name = "yc-docs-md-1000-200", # уже существующий индекс, с которым будем работать дальше (к нему ничего не добавляется)
    opensearch_url=HOSTS,
    http_auth=("admin", PASS),
    use_ssl = True,
    verify_certs = True,
    ca_certs = CA,
    engine = 'lucene'
)  

In [22]:
# Тестируем сохраненные вектора в docssearch
query = "Как устроена сеть в облаке?"
docs = docsearch.similarity_search(query, k=2)
docs

[Document(page_content='13.02.2024, 16:08 Устройство сети в Yandex Cloud | Yandex Cloud - Документация\nhttps://cloud.yandex.ru/ru/docs/vpc/concepts/network-overview 2/5\nОдин из основных компонентов физической сети — транспортная сеть Yandex Cloud.\nК транспортной сети подключаются:\nЦОД (зоны доступности) Yande x Cloud.\nТочки присутствия (Point of Presence или PoP). На точках прис утствия размещается сетевое оборудование транспортной сети. На отдельных точка\nвнешним се тям и  интернету (Internet Peering). На отдельных точках присутствия клиентам Yande x Cloud предоставляется возможность организова\nсобственной инфраструктуре и облачными ресурсами  и публичным се рвисам  Yande x Cloud с п омощью услуги Yande x Cloud Interconne ct.\nТранспортная сеть Yande x Cloud со стоит из двух уровней:\nУровень оптической сети DWD M. Оборудование оптического спектрального уплотнения (DWD M ) обеспечивает подключение оборудования уро', metadata={'source': '/home/jupyter/datasphere/s3/ds-knights-de

In [26]:
# Тестируем сохраненные вектора в docssearch2
docs2 = docsearch2.similarity_search(query, k=2)
docs2

[Document(page_content='description: "Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом."\nkeywords:\n  - облачная сеть\n  - облако\n  - сеть\n\nОблачные сети и подсети\n\nОблачные сети {#network}\n\nОблачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом.\n\nДля виртуальных машин Yandex Compute Cloud и хостов баз данных доступ из интернета и в интернет открыт через публичные IP-адреса.\n\nУправлять трафиком в облачных сетях и подсетях можно с помощью групп безопасности. Они содержат правила, которые определяют протоколы и IP-адреса для приема и отправки трафика.\n\nПодсети {#subnet}', metadata={'source': '/home/jupyter/datasphere/s3/dz-yc-docs-feb-2024/yc-ru-gen-md/vpc/concepts/network.md', 'st

In [30]:
# Поисковая выдача N1 по тематическому фрагменту документации
print(docs[0].page_content)

13.02.2024, 16:08 Устройство сети в Yandex Cloud | Yandex Cloud - Документация
https://cloud.yandex.ru/ru/docs/vpc/concepts/network-overview 2/5
Один из основных компонентов физической сети — транспортная сеть Yandex Cloud.
К транспортной сети подключаются:
ЦОД (зоны доступности) Yande x Cloud.
Точки присутствия (Point of Presence или PoP). На точках прис утствия размещается сетевое оборудование транспортной сети. На отдельных точка
внешним се тям и  интернету (Internet Peering). На отдельных точках присутствия клиентам Yande x Cloud предоставляется возможность организова
собственной инфраструктуре и облачными ресурсами  и публичным се рвисам  Yande x Cloud с п омощью услуги Yande x Cloud Interconne ct.
Транспортная сеть Yande x Cloud со стоит из двух уровней:
Уровень оптической сети DWD M. Оборудование оптического спектрального уплотнения (DWD M ) обеспечивает подключение оборудования уро


In [29]:
# Поисковая выдача N1 по большой документации
print(docs2[0].page_content)

description: "Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом."
keywords:
  - облачная сеть
  - облако
  - сеть

Облачные сети и подсети

Облачные сети {#network}

Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом.

Для виртуальных машин Yandex Compute Cloud и хостов баз данных доступ из интернета и в интернет открыт через публичные IP-адреса.

Управлять трафиком в облачных сетях и подсетях можно с помощью групп безопасности. Они содержат правила, которые определяют протоколы и IP-адреса для приема и отправки трафика.

Подсети {#subnet}


In [53]:
# Попробуем использовать ретривер, а не similarity_search
# Сначала по тематическому фрагменту документации
retriever = docsearch.as_retriever(search_kwargs={"k": 2})
docs = retriever.invoke(query)
docs

[Document(page_content='13.02.2024, 16:08 Устройство сети в Yandex Cloud | Yandex Cloud - Документация\nhttps://cloud.yandex.ru/ru/docs/vpc/concepts/network-overview 2/5\nОдин из основных компонентов физической сети — транспортная сеть Yandex Cloud.\nК транспортной сети подключаются:\nЦОД (зоны доступности) Yande x Cloud.\nТочки присутствия (Point of Presence или PoP). На точках прис утствия размещается сетевое оборудование транспортной сети. На отдельных точка\nвнешним се тям и  интернету (Internet Peering). На отдельных точках присутствия клиентам Yande x Cloud предоставляется возможность организова\nсобственной инфраструктуре и облачными ресурсами  и публичным се рвисам  Yande x Cloud с п омощью услуги Yande x Cloud Interconne ct.\nТранспортная сеть Yande x Cloud со стоит из двух уровней:\nУровень оптической сети DWD M. Оборудование оптического спектрального уплотнения (DWD M ) обеспечивает подключение оборудования уро', metadata={'source': '/home/jupyter/datasphere/s3/ds-knights-de

In [54]:
# Теперь используем ретривер по большой документации
retriever2=docsearch2.as_retriever(search_kwargs={"k": 2})
docs2 = retriever2.invoke(query)
docs2

[Document(page_content='description: "Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом."\nkeywords:\n  - облачная сеть\n  - облако\n  - сеть\n\nОблачные сети и подсети\n\nОблачные сети {#network}\n\nОблачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом.\n\nДля виртуальных машин Yandex Compute Cloud и хостов баз данных доступ из интернета и в интернет открыт через публичные IP-адреса.\n\nУправлять трафиком в облачных сетях и подсетях можно с помощью групп безопасности. Они содержат правила, которые определяют протоколы и IP-адреса для приема и отправки трафика.\n\nПодсети {#subnet}', metadata={'source': '/home/jupyter/datasphere/s3/dz-yc-docs-feb-2024/yc-ru-gen-md/vpc/concepts/network.md', 'st

In [36]:
# Чуть более читаемый вывод результатов поиска по тематическому фрагменту документации
for i in range(2):
    print(docs[i].page_content)

13.02.2024, 16:08 Устройство сети в Yandex Cloud | Yandex Cloud - Документация
https://cloud.yandex.ru/ru/docs/vpc/concepts/network-overview 2/5
Один из основных компонентов физической сети — транспортная сеть Yandex Cloud.
К транспортной сети подключаются:
ЦОД (зоны доступности) Yande x Cloud.
Точки присутствия (Point of Presence или PoP). На точках прис утствия размещается сетевое оборудование транспортной сети. На отдельных точка
внешним се тям и  интернету (Internet Peering). На отдельных точках присутствия клиентам Yande x Cloud предоставляется возможность организова
собственной инфраструктуре и облачными ресурсами  и публичным се рвисам  Yande x Cloud с п омощью услуги Yande x Cloud Interconne ct.
Транспортная сеть Yande x Cloud со стоит из двух уровней:
Уровень оптической сети DWD M. Оборудование оптического спектрального уплотнения (DWD M ) обеспечивает подключение оборудования уро
13.02.2024, 16:08 Устройство сети в Yandex Cloud | Yandex Cloud - Документация
https://cloud.yand

In [37]:
# Чуть более читаемый вывод результатов поиска по большой документации
for i in range(2):
    print(docs2[i].page_content)

description: "Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом."
keywords:
  - облачная сеть
  - облако
  - сеть

Облачные сети и подсети

Облачные сети {#network}

Облачная сеть — это аналог традиционной локальной сети в дата-центре. Облачные сети создаются в каталогах и используются для передачи информации между облачными ресурсами и связи ресурсов с интернетом.

Для виртуальных машин Yandex Compute Cloud и хостов баз данных доступ из интернета и в интернет открыт через публичные IP-адреса.

Управлять трафиком в облачных сетях и подсетях можно с помощью групп безопасности. Они содержат правила, которые определяют протоколы и IP-адреса для приема и отправки трафика.

Подсети {#subnet}
Облака и их виды

Облако — это сеть мощных компьютеров, расположенных в дата-центрах и доступных через интернет. Существует три основных вида облака: час

### 4. Обращаемся при помощи LLM к выбранным документам

In [116]:
# Сначала определим шаблоны промптов для обработки документов и для языковой модели с учетом истории общения

from langchain.prompts.prompt import PromptTemplate
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.messages import AIMessage, HumanMessage, get_buffer_string
from langchain_core.prompts import format_document

_template = """Учитывая историю общения и текущий вопрос, составь из всего этого отдельный общий вопрос на русском языке.

История общения:
{chat_history}
Текущий вопрос: {question}
Отдельный общий вопрос:"""
CONDENSE_QUESTION_PROMPT = PromptTemplate.from_template(_template)

template = """Отвечай на вопрос по информации из предоставленного ниже ДОКУМЕНТА. 
Если ответ в ДОКУМЕНТЕ отсутствует, отвечай: "Я не знаю" даже если думаешь, что знаешь ответ на вопрос. 
Не вздумай добавлять какие-то пояснения к "Я не знаю".
ДОКУМЕНТ: {context}
Вопрос: {question}
"""
ANSWER_PROMPT = ChatPromptTemplate.from_template(template)

DEFAULT_DOCUMENT_PROMPT = PromptTemplate.from_template(template="{page_content}")


def _combine_documents(
    docs, document_prompt=DEFAULT_DOCUMENT_PROMPT, document_separator="\n\n"
):
    doc_strings = [format_document(doc, document_prompt) for doc in docs]
    return document_separator.join(doc_strings)

In [117]:
# инициируем модуль памяти
memory = ConversationBufferMemory(
    return_messages=True, output_key="answer", input_key="question"
)

In [118]:
from langchain_community.chat_models import ChatYandexGPT
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_core.output_parsers import StrOutputParser

# Сначала мы добавляем шаг для загрузки содержимого памяти
# Поэтому добавляем ключ "memory" во входящий объект
loaded_memory = RunnablePassthrough.assign(
    chat_history=RunnableLambda(memory.load_memory_variables) | itemgetter("history"),
)
# выбираем какую yandexgpt модель будем использовать, и выставляем ее temperature = 0
# model_uri = "gpt://"+str(folder_id)+"/yandexgpt-lite/latest"
model_uri = "gpt://"+str(folder_id)+"/yandexgpt/latest"
yagpt_model = ChatYandexGPT(iam_token = token, model_uri=model_uri, temperature = 0, max_tokens=8000)

# Теперь определяем standalone_question (композитный вопрос, который учитывает историю общения)
standalone_question = {
    "standalone_question": {
        "question": lambda x: x["question"],
        "chat_history": lambda x: get_buffer_string(x["chat_history"]),
    }
    | CONDENSE_QUESTION_PROMPT
    | yagpt_model
    | StrOutputParser()
}
# Теперь извлекаем нужные документы по композитному запросу, используя ранее определенный ретривер 
# retriever - для тематического фрагмента документации или retriever2 - для всей документации на Яндекс Облако
retrieved_documents = {
    "docs": itemgetter("standalone_question") | retriever2,
    "question": lambda x: x["standalone_question"],
}

# Конструируем вводные для финального промпта
final_inputs = {
    "context": lambda x: _combine_documents(x["docs"]),
    "question": itemgetter("question"),
}
# Теперь запускаем выдачу ответов
answer = {
    "answer": final_inputs | ANSWER_PROMPT | yagpt_model,
    "docs": itemgetter("docs"),
}
# И собираем всю цепочку вместе!
final_chain = loaded_memory | standalone_question | retrieved_documents | answer

In [119]:
inputs = {"question": "Как устроена сеть в Яндекс Облаке?"}
result = final_chain.invoke(inputs)
result

{'answer': AIMessage(content='Сеть в Яндекс Облаке состоит из физической и виртуальной сетей.\n\nОдин из основных компонентов физической сети — транспортная сеть Yandex Cloud, к которой подключаются ЦОД (зоны доступности) Yandex Cloud и точки присутствия (PoP). На отдельных точках присутствия организуются подключения к внешним сетям и интернету, а также предоставляется услуга Yandex Cloud Interconnect.\n\nТранспортная сеть Yandex Cloud состоит из двух уровней: трафик из внешнего мира к облачным ресурсам распределяется по всем зонам доступности Yandex Cloud, а трафик во внешний мир от облачных ресурсов распределяется по точкам присутствия. Все зоны доступности равнозначны и обеспечивают одинаковую сетевую связность.\n\nВиртуальная сеть в Yandex Cloud предоставляет пользователям возможность организации сетевого взаимодействия между облачными ресурсами и интернетом, а также дополнительные сетевые функции по обработке трафика.', id='run-2c5d3fc0-a262-4527-9956-443551dc1c9d-0'),
 'docs': [D

In [120]:
# Обратите внимание, что память не сохраняется автоматически
# В будущем это будет улучшено
# А пока вам нужно сохранять данные в память самостоятельно
memory.save_context(inputs, {"answer": result["answer"].content})

In [121]:
# подгружаем данные из памяти (диалог по тематическому фрагменту документации)
memory.load_memory_variables({})

{'history': [HumanMessage(content='Как устроена сеть в Яндекс Облаке?'),
  AIMessage(content='Сеть в Яндекс Облаке состоит из физической и виртуальной сетей.\n\nОдин из основных компонентов физической сети — транспортная сеть Yandex Cloud, к которой подключаются ЦОД (зоны доступности) Yandex Cloud и точки присутствия (PoP). На отдельных точках присутствия организуются подключения к внешним сетям и интернету, а также предоставляется услуга Yandex Cloud Interconnect.\n\nТранспортная сеть Yandex Cloud состоит из двух уровней: трафик из внешнего мира к облачным ресурсам распределяется по всем зонам доступности Yandex Cloud, а трафик во внешний мир от облачных ресурсов распределяется по точкам присутствия. Все зоны доступности равнозначны и обеспечивают одинаковую сетевую связность.\n\nВиртуальная сеть в Yandex Cloud предоставляет пользователям возможность организации сетевого взаимодействия между облачными ресурсами и интернетом, а также дополнительные сетевые функции по обработке трафика.

In [124]:
print(memory.load_memory_variables({})['history'][1].content)

Сеть в Яндекс Облаке состоит из физической и виртуальной сетей.

Один из основных компонентов физической сети — транспортная сеть Yandex Cloud, к которой подключаются ЦОД (зоны доступности) Yandex Cloud и точки присутствия (PoP). На отдельных точках присутствия организуются подключения к внешним сетям и интернету, а также предоставляется услуга Yandex Cloud Interconnect.

Транспортная сеть Yandex Cloud состоит из двух уровней: трафик из внешнего мира к облачным ресурсам распределяется по всем зонам доступности Yandex Cloud, а трафик во внешний мир от облачных ресурсов распределяется по точкам присутствия. Все зоны доступности равнозначны и обеспечивают одинаковую сетевую связность.

Виртуальная сеть в Yandex Cloud предоставляет пользователям возможность организации сетевого взаимодействия между облачными ресурсами и интернетом, а также дополнительные сетевые функции по обработке трафика.


In [123]:
inputs = {"question": "Но как же она устроена?"}
result = final_chain.invoke(inputs)
result

{'answer': AIMessage(content='Сеть в Яндекс Облаке можно условно разделить на две большие части: физическую сеть и виртуальную сеть.\n\n**Физическая сеть** — это аппаратная сеть внутри центров обработки данных (ЦОД), транспортная сеть между ЦОД и в местах подключения к внешним сетям и интернету. Физическую сеть часто называют термином Underlay.\n\n **Виртуальная сеть** работает поверх физической сетевой инфраструктуры. Сервисы виртуальной сети Virtual Private Cloud (VPC) предоставляют пользователю IP-связность между облачными ресурсами и доступ облачных ресурсов к интернету. Виртуальную сеть часто называют Overlay. В одном каталоге ресурсов может быть создана одна или несколько виртуальных сетей. Виртуальные сети изолированы друг от друга, даже если они находятся в одном каталоге ресурсов.', id='run-3ec11c6f-ab52-465f-a235-9b5840bf3b1f-0'),
 'docs': [Document(page_content='Физическая сеть в Yandex Cloud {#underlay}\n\nФизическую сеть в Yandex Cloud можно представить следующим образом:\

In [125]:
print(result['answer'].content)

Сеть в Яндекс Облаке можно условно разделить на две большие части: физическую сеть и виртуальную сеть.

**Физическая сеть** — это аппаратная сеть внутри центров обработки данных (ЦОД), транспортная сеть между ЦОД и в местах подключения к внешним сетям и интернету. Физическую сеть часто называют термином Underlay.

 **Виртуальная сеть** работает поверх физической сетевой инфраструктуры. Сервисы виртуальной сети Virtual Private Cloud (VPC) предоставляют пользователю IP-связность между облачными ресурсами и доступ облачных ресурсов к интернету. Виртуальную сеть часто называют Overlay. В одном каталоге ресурсов может быть создана одна или несколько виртуальных сетей. Виртуальные сети изолированы друг от друга, даже если они находятся в одном каталоге ресурсов.


In [126]:
# Посмотреть источники информации (в данном случае их 2)
for i in range(2):
    print(f"{result['docs'][i].page_content}\n ****************************************** \n")

Физическая сеть в Yandex Cloud {#underlay}

Физическую сеть в Yandex Cloud можно представить следующим образом:

Один из основных компонентов физической сети — транспортная сеть Yandex Cloud.

К транспортной сети подключаются:

ЦОД (зоны доступности) Yandex Cloud.

Точки присутствия (Point of Presence или PoP). На точках присутствия размещается сетевое оборудование транспортной сети. На отдельных точках присутствия организуются подключения к внешним сетям и интернету (Internet Peering). На отдельных точках присутствия клиентам Yandex Cloud предоставляется возможность организовать IP-связность между своими ресурсами в собственной инфраструктуре и облачными ресурсами и публичным сервисам Yandex Cloud с помощью услуги Yandex Cloud Interconnect.

Транспортная сеть Yandex Cloud состоит из двух уровней:
 ****************************************** 

Устройство сети в Yandex Cloud

Сеть в Yandex Cloud можно условно разделить на две большие части:

Физическая сеть — это аппаратная сеть внутри ц

In [127]:
# Посмотреть метаданные по источника информации
for i in range(2):
    print(f"{result['docs'][i].metadata['source']}\n")

/home/jupyter/datasphere/s3/dz-yc-docs-feb-2024/yc-ru-gen-md/_includes/overview/network.md

/home/jupyter/datasphere/s3/dz-yc-docs-feb-2024/yc-ru-gen-md/_includes/overview/network.md



In [128]:
memory

ConversationBufferMemory(chat_memory=ChatMessageHistory(messages=[HumanMessage(content='Как устроена сеть в Яндекс Облаке?'), AIMessage(content='Сеть в Яндекс Облаке состоит из физической и виртуальной сетей.\n\nОдин из основных компонентов физической сети — транспортная сеть Yandex Cloud, к которой подключаются ЦОД (зоны доступности) Yandex Cloud и точки присутствия (PoP). На отдельных точках присутствия организуются подключения к внешним сетям и интернету, а также предоставляется услуга Yandex Cloud Interconnect.\n\nТранспортная сеть Yandex Cloud состоит из двух уровней: трафик из внешнего мира к облачным ресурсам распределяется по всем зонам доступности Yandex Cloud, а трафик во внешний мир от облачных ресурсов распределяется по точкам присутствия. Все зоны доступности равнозначны и обеспечивают одинаковую сетевую связность.\n\nВиртуальная сеть в Yandex Cloud предоставляет пользователям возможность организации сетевого взаимодействия между облачными ресурсами и интернетом, а также д

In [108]:
type(memory)
dir(memory)

langchain.memory.buffer.ConversationBufferMemory

In [129]:
# Очистка памяти
memory.clear()

In [130]:
# подгружаем данные из памяти (диалог по тематическому фрагменту документации)
memory.load_memory_variables({})

{'history': []}

In [131]:
inputs = {"question": "Но как же устроено то, о чем только что говорили?"}
result = final_chain.invoke(inputs)
print(result['answer'].content)

Я не знаю.
