In [76]:
import os
from abc import ABC, abstractmethod
from typing import List, Dict, Any
from langchain.docstore.document import Document
from langchain.vectorstores import FAISS
from langchain_gigachat.embeddings.gigachat import GigaChatEmbeddings

from vectorisation import FAISSVectorStore, save_vector_store, load_vector_store

In [77]:
from dotenv import load_dotenv
load_dotenv()

True

In [78]:
gigachat_credentials = os.getenv("GIGACHAT_CREDENTIALS")
gigachat_scope = os.getenv("GIGACHAT_SCOPE")

In [79]:
embedding=GigaChatEmbeddings(
        credentials=gigachat_credentials,
        scope=gigachat_scope,
        verify_ssl_certs=False,
)

Чанки (пример)

In [80]:
documents = [
        Document(
            page_content="# Функция HelloWorld\nОписание: Выполняет задачу HelloWorld.\n\n## Код\n```python\ndef HelloWorld():\n    print(\"Задача HelloWorld выполнена\")\n```",
            metadata={"id": "function_X", "source": "function_X.md, function_X.py"}
        ),
        Document(
            page_content="# Функция Help\nОписание: Выполняет задачу Help.\n\n## Код\n```python\ndef Help():\n    print(\"Задача Help выполнена\")\n```",
            metadata={"id": "function_Y", "source": "function_Y.md, function_Y.py"}
        ),
        Document(
            page_content="# Функция Y\nОписание: Выполняет задачу Y.\n\n## Код\n```python\ndef Y():\n    print(\"Задача Y выполнена\")\n```",
            metadata={"id": "function_Y", "source": "function_Y.md, function_Y.py"}
        )
    ]

Создание векторной базы

In [81]:
vector_store = FAISSVectorStore(embedding, vector_store_path="vector_store")
vector_store.create_vector_store(documents)

Сохранение векторной базы

In [82]:
save_vector_store(vector_store)

Загрузка данных

In [83]:
loaded_vector_store = load_vector_store("vector_store", embedding)

Проверка

In [84]:
query = "Задача Help"
results = loaded_vector_store.search(query, k=2)
for result in results:
    print(f"Найденный чанк: {result.page_content}\nМетаданные: {result.metadata}\n")

Найденный чанк: # Функция Help
Описание: Выполняет задачу Help.

## Код
```python
def Help():
    print("Задача Help выполнена")
```
Метаданные: {'id': 'function_Y', 'source': 'function_Y.md, function_Y.py'}

Найденный чанк: # Функция HelloWorld
Описание: Выполняет задачу HelloWorld.

## Код
```python
def HelloWorld():
    print("Задача HelloWorld выполнена")
```
Метаданные: {'id': 'function_X', 'source': 'function_X.md, function_X.py'}

