# Макетирование работы с векторной базой данных

Для реализации хранение пользовательских данных используем комбинацию:
[langchain](https://www.langchain.com/), [chromaDB](https://github.com/chroma-core/chroma).

Макетируем следующие варианты использования:
* сохранение пользовательской информации в векторную базу данных.
* использование векторные базы данных (ВБД) в ходе диалога.

In [None]:
# сохранение пользовательской информации в векторную базу данных.

import chromadb

# Иницилизируем клиентский объект
client = chromadb.Client()

# Создаём базу данных. get_collection, get_or_create_collection, delete_collection также доступны!
collection = client.create_collection("all-my-documents")

In [7]:
# Загрузка данных
# Формат данных
docs = [
    {
        "id": "doc1",
        "text": "This is document1",
        "metadata": {"source": "notion"},
    },
    {
        "id": "doc2",
        "text": "This is document2",
        "metadata": {"source": "google-docs"},
    }
]

# Добавляем документы в коллекцию. Также возможно update and delete.
collection.add(
    documents=[el["text"] for el in docs], 
    metadatas=[el["metadata"] for el in docs], 
    ids=[el["id"] for el in docs]) 

Insert of existing embedding ID: doc1
Insert of existing embedding ID: doc2
Add of existing embedding ID: doc1
Add of existing embedding ID: doc2


In [8]:
# Запрос данных из БД.
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"source": "notion"}, 
    # where_document={"$contains":"search_string"}  
)
print(results)

{'ids': [['doc1', 'doc2']], 'distances': [[0.9026355743408203, 1.035815954208374]], 'metadatas': [[{'source': 'notion'}, {'source': 'google-docs'}]], 'embeddings': None, 'documents': [['This is document1', 'This is document2']]}
