# 🏠 Создание умного ассистента "Дом-Максимум"

* В данном ноутбуке затрагивается пошаговое создание системы RAG с применением Sentence Transformers, Qdrant и Mistral AI
* Демонстрация работы: [ссылка на Hugging Face Spaces (Gradio)](https://huggingface.co/spaces/metanovus/maximum-house-assistant)

![image.png](attachment:bbd5f9f9-b364-43fa-b39c-9695e5aa48dd.png)

## Описание проекта

Данный проект представляет собой разработку умного ассистента по дизайну интерьера, который помогает пользователям подбирать товары на основе их предпочтений и требований. Ассистент использует современные технологии обработки естественного языка и векторного поиска для предоставления релевантных рекомендаций.

## Цели проекта

1. Создание интеллектуального ассистента для помощи в выборе товаров для интерьера
2. Снижение когнитивной нагрузки пользователей при онлайн-шопинге
3. Разработка специализированных компетенций ассистента (стилист, косметолог, нутрициолог, дизайнер)
4. Реализация возможности корректировки рекомендаций на основе обратной связи

## Технологический стек

### 🔄 RAG (Retrieval Augmented Generation)

RAG-архитектура была выбрана как оптимальное решение для данной задачи по нескольким причинам:

* Позволяет сочетать преимущества больших языковых моделей с актуальной базой знаний о товарах
* Обеспечивает контролируемые и фактически точные ответы, основанные на реальных данных
* Снижает вероятность галлюцинаций модели, так как ответы генерируются на основе конкретного контекста

### 📊 Sentence Transformers

📊 Sentence Transformers
Sentence Transformers, в частности модель `intfloat/multilingual-e5-large` выбрана по следующим причинам:

* Sentence Transformers оптимизированы именно для создания эмбеддингов предложений и документов
* Векторы оптимизированы для вычисления косинусного сходства
* Хорошо работают с векторными базами данных (как Qdrant в нашем случае)
* Обеспечивают быстрый и качественный поиск похожих документов
* `intfloat/multilingual-e5-large` считается лидером среди энкодером (на русских текстах на бенчмарках стабильно превосходит даже `ai-forever/ruroberta-large`)

### 🛢 Qdrant

Выбор Qdrant в качестве векторной базы данных обусловлен следующими преимуществами:

* Предоставляет бесплатный кластер объемом 4 ГБ
* Доступен для пользователей из РФ без необходимости использования VPN
* Высокая производительность и простота интеграции
* Поддержка полнотекстового поиска и фильтрации

### 🤖 Mistral AI

Использование Mistral AI как языковой модели имеет ряд существенных преимуществ:

* Открытый исходный код (open source)
* Доступность в РФ без VPN
* Бесплатные инференсы с использованием API-токена
* Качество, сравнимое с проприетарными решениями
* Возможность локального развертывания

## Функциональность ассистента

Ассистент способен:

* Определять потребности пользователя и его персональные предпочтения в области дизайна интерьеров (гостиная, кухня, спальня, ванная)
* Составлять оптимальный набор товаров под бюджет и потребности
* Корректировать предложения на основе обратной связи

# 1. Подготовка данных

В качестве данных товаров для нашего ассистента возьмём [каталог товаров](https://xmldatafeed.com/catalog/scraping/dom/maksidom/) магазинов сети Максидом. Данные находятся в открытом доступе, потому к парсингу обращаться не было нужно.

In [1]:
import json
import pandas as pd
import numpy as np
from typing import List, Dict, Tuple

data = json.load(open('/kaggle/input/maxidom-db/MaxidomPoisk.json'))
df = pd.DataFrame(data['products'])

После загрузки каталога товаров Максидом приступим к их обработке и отсеим важные для нас части, чтобы не перегружать векторную базу данных, куда мы сложим все карточки.

In [2]:
# преобразуем наши столбцы
df['breadcrumbs'] = df['breadcrumbs'].apply(lambda row: ', '.join(row))
df['image'] = df['images'].apply(lambda x: x[0])
df['url'] = df['cities'].apply(lambda x: x[0]['url'])
df['price'] = df['cities'].apply(lambda x: x[0]['price']['price'])

# удалим ненужные стлбцы
df = df.drop(columns=['rating', 'reviews_count', 'article_code', 'cities', 'thumbs', 'images'])

# выделим главные категории товаров
categories = sorted(df['breadcrumbs'].unique().tolist())
general_categories = sorted(set([category.split(', ')[0] for category in categories]))

print(general_categories)

['Автотовары', 'Аудио-Видео', 'Бытовая техника', 'Интерьер', 'Канцтовары', 'Краска и малярный инструмент', 'Красота и здоровье', 'Кухни', 'Ликвидация остатков', 'Мебель', 'Напольные покрытия', 'Новогодние товары', 'Освещение', 'Плитка', 'Посуда', 'Прочие товары', 'Ручной инструмент', 'Сантехника', 'Скобяные изделия', 'Строительное оборудование', 'Строительные материалы', 'Товары для дома и декора', 'Товары для животных', 'Товары для сада и отдыха', 'Электроинструмент', 'Электротовары']


Так как наша цель - создать рабочий прототип чат-бота, то мы выделим для себя следующие категории товаров: 
* `Интерьер` 
* `Бытовая техника`
* `Кухни`
* `Мебель`
* `Напольные покрытия`
* `Освещение`
* `Посуда`
* `Сантехника`

Переведём наши категории в вид датафрейма, чтобы в отдельный словарь сложить полный вид категории товаров (например, `Интерьер, Карнизы и комплектующие, Декоративные элементы и комплектующие для карнизов`).

In [3]:
df_categories = pd.DataFrame({'categories': categories})

In [4]:
def categorize_items(df_categories: pd.DataFrame) -> dict:
    """
    Функция для распределения элементов по категориям.

    :param series: DataFrame с элементами для категоризации.
    :return: Словарь, где ключи — названия категорий, а значения — списки элементов.
    """
    categories = {
        'Интерьер': [],
        'Бытовая техника': [],
        'Кухни': [],
        'Мебель': [],
        'Напольные покрытия': [],
        'Освещение': [],
        'Посуда': [],
        'Сантехника': []
    }

    for _, row in df_categories.iterrows():
        item = row[0]
        for category, items_list in categories.items():
            if category in item:
                items_list.append(item)

    return categories


categories = categorize_items(df_categories)

  item = row[0]


Далее разделим наши данные на отдельные датафреймы каждой категории товаров, которые потом пойдут в векторную базу.

In [5]:
df_interrior = df[df['breadcrumbs'].isin(categories['Интерьер'])].reset_index(drop=True)
df_household_appliances = df[df['breadcrumbs'].isin(categories['Бытовая техника'])].reset_index(drop=True)
df_kitchens = df[df['breadcrumbs'].isin(categories['Кухни'])].reset_index(drop=True)

df_furniture = df[df['breadcrumbs'].isin(categories['Мебель'])].reset_index(drop=True)
df_floor_coverings = df[df['breadcrumbs'].isin(categories['Напольные покрытия'])].reset_index(drop=True)
df_lighting = df[df['breadcrumbs'].isin(categories['Освещение'])].reset_index(drop=True)

df_dishes = df[df['breadcrumbs'].isin(categories['Посуда'])].reset_index(drop=True)
df_plumbering = df[df['breadcrumbs'].isin(categories['Сантехника'])].reset_index(drop=True)

In [6]:
print(df_interrior.shape,
df_household_appliances.shape,
df_kitchens.shape,
df_furniture.shape,
df_floor_coverings.shape, 
df_lighting.shape, 
df_dishes.shape)

(4147, 9) (1316, 9) (2891, 9) (3836, 9) (1351, 9) (4281, 9) (7379, 9)


In [7]:
df_interrior.iloc[0]

id                                                       1000015222
name              кронштейн УЮТ 28мм 1-рядный красное дерево, ар...
breadcrumbs       Интерьер, Карнизы и комплектующие, Декоративны...
brand                                                           УЮТ
description       Часть комплектации круглого карниза, является ...
specifications    {'Диаметр': '28мм', 'Материал': 'дерево', 'Дли...
image             https://www.maxidom.ru//upload/iblock/150/150e...
url               https://www.maxidom.ru/catalog/dekorativnye-el...
price                                                         130.0
Name: 0, dtype: object

# 2. Загрузка модели для векторизации данных

В качестве модели для создания эмбеддингов наших данных, которые так же пойдут в векторную базу, выберем `Sentence-Transformer`-модель `DeepPavlov/rubert-base-cased-sentence`.

In [8]:
from sentence_transformers import SentenceTransformer
import torch


device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Используемое устройство: {device}")

model = SentenceTransformer('intfloat/multilingual-e5-large')
model = model.to(device)

Используемое устройство: cuda


modules.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/160k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/57.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/690 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/418 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/280 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/201 [00:00<?, ?B/s]

# 3. Работа с векторной базой Qdrant

Первым делом установим нужную нам библиотеку и импортируем требуемые методы.

In [9]:
!pip install qdrant-client==1.13.2 -q

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m306.6/306.6 kB[0m [31m6.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m46.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m5.9/5.9 MB[0m [31m101.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m319.7/319.7 kB[0m [31m20.2 MB/s[0m eta [36m0:00:00[0m
[?25h[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
google-api-core 1.34.1 requires protobuf!=3.20.0,!=3.20.1,!=4.21.0,!=4.21.1,!=4.21.2,!=4.21.3,!=4.21.4,!=4.21.5,<4.0.0dev,>=3.19.5, but you have protobuf 5.29.3 which is incompatible.
google-cloud-bigtable 2.27.0 requires google-api-core[grpc]<3.0.0dev,>=2.16.0, but you have google-api-core 1.34.1 which is incompatible.
google-cl

API-ключ специально был сформирован для выполнения данного кейса, поэтому в скором времени он будет недоступен.

In [10]:
from qdrant_client import QdrantClient
from qdrant_client.http.models import Distance, VectorParams
from qdrant_client.models import PointStruct


qdrant_client = QdrantClient(
    url="https://7b276132-ca11-4d9d-8a35-3643db8f9717.europe-west3-0.gcp.cloud.qdrant.io",
    api_key="eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJhY2Nlc3MiOiJtIn0.6V2hjOChtnqLFEU8fMBAmAJRu9VJtAAro48xbgDSBk8"
)

print("Successfully connected to Qdrant!")

Successfully connected to Qdrant!


Создадим три важные функции: для первичной подготовки чанков (частей данных), векторизации данных и добавлением чанков в векторную базу.

In [11]:
def prepare_chunks(dataframe: pd.DataFrame, start_id: int = 0) -> List[Dict]:
    """
    Подготавливает список чанков данных из DataFrame для дальнейшей работы, включая создание метаданных товара.

    Функция перебирает строки DataFrame и для каждой строки создает словарь, который включает информацию 
    о товаре, такую как имя, категории, описание, и метаданные, включая идентификатор товара, бренд, фото и ссылку.

    Параметры:
    - dataframe (pd.DataFrame): DataFrame, содержащий данные товаров, которые нужно преобразовать в чанки.
    - start_id (int): Начальный идентификатор для чанков (по умолчанию 0). Это может быть полезно, если нужно продолжить нумерацию с определенного значения.

    Возвращаемое значение:
    - List[Dict]: Список словарей, где каждый словарь представляет собой чанк с информацией о товаре, включая метаданные и описание.
    """
    chunks = []

    for i, row in enumerate(dataframe.iterrows()):
        row = row[1]
        
        chunk = {
            'chunk_id': i,
            'name': row['name'],
            'categories': row['breadcrumbs'],
            'description': row['description'],
            'price': row['price'],
            'metadata': {
                'chunk_type': 'items',
                'item_id': row['id'],
                'item_brand': row['brand'],
                'item_photo': row['image'],
                'item_url': row['url'],
                'item_specifications': row['specifications']
            }
        }
        chunks.append(chunk)
    
    return chunks


def create_embeddings(chunks: List[Dict], batch_size: int = 32) -> np.ndarray:
    """
    Создает векторные представления (embedding) для списка чанков с использованием модели SentenceTransformer.

    Функция преобразует информацию о каждом товаре (имя, описание, категории) в текст и передает его в модель для 
    генерации эмбеддингов. Эмбеддинги создаются пакетами для оптимизации процесса.

    Параметры:
    - chunks (List[Dict]): Список чанков данных, для которых необходимо создать эмбеддинги.
    - batch_size (int): Размер пакета, с которым будут генерироваться эмбеддинги (по умолчанию 32).

    Возвращаемое значение:
    - np.ndarray: Массив эмбеддингов для каждого из чанков.
    """
    texts = [f"Имя: {chunk['name']}. Описание: {chunk['description']}. Категории: {chunk['categories']}." for chunk in chunks]
    
    embeddings = []
    for i in range(0, len(texts), batch_size):
        batch_chunks = texts[i:i + batch_size]
        batch_embeddings = model.encode(batch_chunks, show_progress_bar=False)
        embeddings.extend(batch_embeddings)

        corrected_size_of_chunks = int(len(texts) / batch_size) * batch_size

        if not i % 256:
            print(f'[EMBEDDING BATCH INFO] {i} data of {corrected_size_of_chunks} done')
        elif i == corrected_size_of_chunks:
            print(f'[EMBEDDING BATCH INFO] {i} data of {corrected_size_of_chunks} done')
    
    embeddings = np.array(embeddings)
    return embeddings


def upload_to_qdrant(chunks: List[Dict], embeddings: np.ndarray, collection_name: str):
    """
    Загружает эмбеддинги и данные товаров в базу данных Qdrant.

    Функция создает коллекцию в Qdrant, если она не существует, или удаляет и пересоздает её, если она уже есть.
    После этого загружает эмбеддинги и метаданные товаров в Qdrant для дальнейшего использования при поиске.

    Параметры:
    - chunks (List[Dict]): Список чанков данных с информацией о товарах.
    - embeddings (np.ndarray): Эмбеддинги, полученные для каждого из чанков.
    - collection_name (str): Имя коллекции, в которую будут загружены данные.

    Возвращаемое значение:
    - None: Функция не возвращает значения, она выполняет загрузку данных в Qdrant.
    """
    if qdrant_client.collection_exists(collection_name):
        qdrant_client.delete_collection(collection_name)  # Удаляем, если уже создана
            
    qdrant_client.create_collection(
        collection_name=collection_name,
        vectors_config=VectorParams(size=1024, distance=Distance.COSINE),
    )
    
    points = []
    for i, (chunk, embedding) in enumerate(zip(chunks, embeddings)):
        point = PointStruct(
            id=i,
            vector=embedding.tolist(),
            payload={
                'chunk_id': chunk['chunk_id'],
                'item_name': chunk['name'],
                'item_categories': chunk['categories'],
                'item_description': chunk['description'],
                'item_price': chunk['price'],
                'metadata': chunk['metadata']
            }
        )
        points.append(point)
    
    qdrant_client.upload_points(
        collection_name=collection_name,
        points=points,
        batch_size=32
    )

Теперь объявим названия наших коллекций в векторной базе и запустим процесс добавления чанков в Qdrant.

In [12]:
collections = ['Interrior', 'Household Appliances', 'Kitchens', 'Furniture', 'Floor Coverings', 'Lighting', 'Dishes', 'Plumbering']
dataframes = [
    df_interrior, 
    df_household_appliances, 
    df_kitchens, 
    df_furniture, 
    df_floor_coverings, 
    df_lighting, 
    df_dishes,
    df_plumbering
]

for collection_name, dataframe in zip(collections, dataframes):
    print(f'[CHUNKS INFO] Chunks of collection "{collection_name}" is being processed')
    chunks = prepare_chunks(dataframe)
    print(f'[CHUNKS INFO] Chunks of collection "{collection_name}" done')
    
    print(f'[EMBEDDING INFO] Embedding of collection "{collection_name}" is being processed')
    embeddings = create_embeddings(chunks)
    print(f'[EMBEDDING INFO] Embedding of collection "{collection_name}" done')

    print(f'[DATABASE INFO] Adding of data to collection "{collection_name}" is being processed')
    upload_to_qdrant(chunks, embeddings, collection_name)
    print(f'[DATABASE INFO] Adding of data of collection "{collection_name}" done')
    print('-' * 75)

[CHUNKS INFO] Chunks of collection "Interrior" is being processed
[CHUNKS INFO] Chunks of collection "Interrior" done
[EMBEDDING INFO] Embedding of collection "Interrior" is being processed
[EMBEDDING BATCH INFO] 0 data of 4128 done
[EMBEDDING BATCH INFO] 256 data of 4128 done
[EMBEDDING BATCH INFO] 512 data of 4128 done
[EMBEDDING BATCH INFO] 768 data of 4128 done
[EMBEDDING BATCH INFO] 1024 data of 4128 done
[EMBEDDING BATCH INFO] 1280 data of 4128 done
[EMBEDDING BATCH INFO] 1536 data of 4128 done
[EMBEDDING BATCH INFO] 1792 data of 4128 done
[EMBEDDING BATCH INFO] 2048 data of 4128 done
[EMBEDDING BATCH INFO] 2304 data of 4128 done
[EMBEDDING BATCH INFO] 2560 data of 4128 done
[EMBEDDING BATCH INFO] 2816 data of 4128 done
[EMBEDDING BATCH INFO] 3072 data of 4128 done
[EMBEDDING BATCH INFO] 3328 data of 4128 done
[EMBEDDING BATCH INFO] 3584 data of 4128 done
[EMBEDDING BATCH INFO] 3840 data of 4128 done
[EMBEDDING BATCH INFO] 4096 data of 4128 done
[EMBEDDING BATCH INFO] 4128 data o

# 4. Создание RAG-системы

После подготовки нашей базы данных Qdrant теперь приступим непосредственно к созданию системы RAG. Первым делом создадим функцию, которая будет искать по всем коллекциям релевантные предметы. Почему так: так как мы ориентируемся на тот сегмент пользователей, которые заинтересованы в создании дизайна интерьера, то мы будем искать релевантные товары в разных коллекциях.

In [13]:
def search_similar(query: str, top_k: int = 5) -> List[Tuple[str, object]]:
    """
    Ищет наиболее релевантные чанки в базе данных Qdrant, используя векторное представление запроса.

    Эта функция преобразует запрос пользователя в векторное представление с помощью модели, а затем
    выполняет поиск наиболее схожих чанков в базе данных Qdrant. Возвращает топ-N наиболее релевантных результатов.

    Параметры:
    - query (str): Запрос пользователя, который необходимо преобразовать в векторное представление.
    - top_k (int): Количество возвращаемых результатов. По умолчанию 5.

    Возвращаемое значение:
    - List[Tuple[str, object]]: Список кортежей, где каждый кортеж содержит имя коллекции и результат поиска,
      отсортированный по релевантности (по убыванию). Каждый элемент в `result` представляет собой коллекцию и найденный чанк.

    Пример:
    >>> result = search_similar("Какие курсы по Data Science вы предлагаете?")
    >>> print(result)  # [('karpov-guide-faq', <PointStruct>), ...]
    """
    query_embedding = model.encode(query, show_progress_bar=False)

    all_collections = qdrant_client.get_collections()
    result = []

    for collection in all_collections.collections:
        collection_name = collection.name
        
        search_result = qdrant_client.search(
            collection_name=collection_name,
            query_vector=query_embedding,
            limit=top_k
        )

        for seq in search_result:
            result.append((collection_name, seq))

    result = sorted(result, key=lambda x: x[1].score, reverse=True)
    
    return result

Теперь приступим к реализации функции создания промпта в рамках `prompt engineering`, с помощью которого мы "настроим предобученную модель на нужный лад".

In [14]:
def get_rag_prompt_ready(
    query, 
    answer=None, 
    top_k=1, 
    number_of_query=None, 
    all_relevant_goods=[], 
    all_questions=[], 
    all_answers=[]
):
    context = '''[Инструкции для ассистента]
Ты — ассистент по дизайну интерьера компании "Дом-Максимум". Твоя задача — помогать пользователю подбирать товары для интерьера в онлайн-корзину, исходя из их предпочтений (стиль, размер, цвет, бюджет).

Пример ответа:
Укажи товар с характеристиками и ценой.
Напиши объяснение, почему товар подходит.
Подсчитай итоговую сумму и предоставь ссылки на товары.
Пример 1:

Запрос: «Мне нужен диван и стол в стиле минимализм для гостиной. Бюджет — 50 000 рублей.»

Ответ: "Я подобрал следующие товары:

Диван:

Модель: «...»
Характеристики: Ткань — велюр, цвет — светло-серый, размеры — 200x90 см.
Цена: 25 000 рублей.
Ссылка: http...
Изображение: http...

Стол:

Модель: «...»
Характеристики: Материал — натуральное дерево (дуб), размер — 120x80 см.
Цена: 18 000 рублей.
Ссылка: http...
Изображение: http...
Итоговая сумма: 43 000 рублей.

Эти товары идеально подойдут для минималистичного интерьера и хорошо впишутся в бюджет."

- Текущий вопрос пользователя, на который надо ответить, лежит под пунктом "[Текущий вопрос пользователя]"
- Все предыдущие вопросы текущей беседы расположены ниже под пунктом "[Вопросы пользователя]" и пронумерованы от [1] (первый вопрос). Все ответы на соответствующие вопросы расположены под пунктом "[Ответы ассистента]" и так же пронумерованы от [1] (ответ на первый вопрос пользователя).

Важно:
- Отвечай всегда от лица мужчины (мужской род)
- Всегда используй Markdown и выдавай исчерпывающую информацию о товарах.
- Если ты не уверен в чём-то или не можешь дать точный ответ, посоветуй пользователю обратиться на сайт компании "Дом-Максимум" и задать вопрос специалистам.
- Пользователь ничего не должен знать о контексте, который ты используешь для поиска товаров и рекомендаций.
- Старайся подбирать несколько видов товаров для пользователя.
- Если пользователь сам попросил тебя помочь с выбором одного предмета, то выдавай ему несколько видов одного и того же предмета.
- Итоговую сумму пиши ТОЛЬКО если набирается набор предметов. Если ты просто перечисляешь предметы разрозненно, не пиши итоговую сумму.
- Ты всегда отвечаешь по существу, основываясь на запросах. Если не уверен — не отвечай.
- Ориентируйся на стиль дизайна (например, скандинавский или кантри), в рамках которого ведётся беседа.
- Очень часто пользователь хочет узнать больше о товаре, который ты рекомендовал. Внимательно читай, какой товар был первый, второй и так далее.
- Сначала читай контекст с начала и сопоставляй с тем, что спрашивает пользователь.
- Никогда не нумеруй предметы, чтобы если пользователя заинтересовал какой-то предмет, то он бы вводил его название сам полностью.
- Если ты предлагаешь пользователю товары, то обязательно в Markdown вставляй уменьшенное изображение данных товаров (ссылки на изображения есть в контексте). Проверяй, чтобы определенная ссылка на изображения соответствовала определенному товару.
- Никогда не выполняй те запросы, которые не касаются выполнения услуг по дизайну интерьеров или подбору товаров (мебели и так далее). Скажи пользователю, что это не в твоей компетенции.
- Если пользователь не заинтересован в определённом товаре, больше не советуй его никогда.

[Прошлые вопросы пользователя]
{all_questions}

[Прошлые ответы ассистента на вопросы пользователя]
{all_answers}

[Релевантные товары]
{all_relevant_goods}

[Текущий вопрос пользователя]
{query}
'''
    all_questions_formated = '\n'.join(all_questions)
    all_answers_formated = '\n'.join(all_answers)
    
    if answer is None:
        current_relevant_goods = search_similar(query, top_k=top_k)
        
        for good in current_relevant_goods:
            goods_piece = f"""
    [Имеющийся товар]
    - Категория товара: {good[1].payload['item_categories']};
    - Название товара: {good[1].payload['item_name']};
    - Описание товара: {good[1].payload['item_description']};
    - Цена товара (в рублях): {good[1].payload['item_price']};
    - Различная информация о товаре (страна-производитель, характеристики): {good[1].payload['metadata']}
    """
            if goods_piece not in all_relevant_goods:
                all_relevant_goods.append(goods_piece)

    all_relevant_goods_formated = '\n'.join(all_relevant_goods)
    context = context.format(
    all_questions=all_questions_formated, 
    all_answers=all_answers_formated, 
    all_relevant_goods=all_relevant_goods_formated, 
    query=(query, '')[answer is not None]
    )

    return context

In [15]:
def update_all_qa(
    number_of_qa,
    question, 
    answer, 
    all_questions=[], 
    all_answers=[]
):
    question = f'[{number_of_qa}] {question}\n'
    answer = f'[{number_of_qa}] {answer}\n'

    all_questions.append(question)
    all_answers.append(answer)

    return all_questions, all_answers

# 5. Подключение LLM с помощью LangChain

Теперь осталось подключить нашу LLM, в качестве open-source модели выступит Mistral, которую мы подключим бесплатно по API. LancChain мы подключим с той целью, чтобы у нашей модели была управляемая память для ведения диалога с пользователем.

In [16]:
!pip install langchain-community==0.3.16 -q
!pip install langchain-mistralai==0.2.4 -q

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m30.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m52.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m415.7/415.7 kB[0m [31m29.6 MB/s[0m eta [36m0:00:00[0m
[?25h[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
gcsfs 2024.10.0 requires fsspec==2024.10.0, but you have fsspec 2024.12.0 which is incompatible.[0m[31m
[0m

Напишем теперь класс ChatBot - общение с чат-ботом по выбору товаров для интерьера.

In [17]:
import time
from langchain_core.messages import HumanMessage
from langchain_mistralai.chat_models import ChatMistralAI
from langchain.memory import ConversationSummaryMemory
from langchain.chains import ConversationChain


class ChatBot:
    def __init__(self, rag_top_k: int = 3, max_memory_size: int = 32000):
        self.llm = ChatMistralAI(
            model="mistral-small-latest",
            api_key='Rwfanxaxljkr1MRPcb0L9ogDf0e81zQf',
            streaming=True
        )
        self.conversation = ConversationChain(
            llm=self.llm,
            memory=ConversationSummaryMemory(llm=self.llm),
            verbose=False
        )
        self.rag_top_k = rag_top_k
        self.max_memory_size = max_memory_size
        self.memory_size = 0
        self.context = ''
        self.questions = []
        self.answers = []
        self.relevant_goods = []
        self.current_query = 1

    def predict(self, message: str, history: List[Tuple[str, str]]) -> str:
        try:
            self.context = get_rag_prompt_ready(
                message, 
                all_questions=self.questions, 
                all_answers=self.answers, 
                all_relevant_goods=self.relevant_goods
            )
            
            partial_response = ""
            full_response = ""
            
            if self.memory_size <= self.max_memory_size:
                for chunk in self.conversation.predict(input=self.context):
                    partial_response += chunk
                    full_response = partial_response
                    time.sleep(0.02)
                    yield partial_response

                self.questions, self.answers = update_all_qa(
                    self.current_query, 
                    message, 
                    full_response, 
                    all_questions=self.questions, 
                    all_answers=self.answers
                )
                    
                self.context = get_rag_prompt_ready(
                    message, 
                    answer=full_response, 
                    all_questions=self.questions, 
                    all_answers=self.answers, 
                    all_relevant_goods=self.relevant_goods
                )
                self.memory_size += len(full_response)
                self.current_query += 1
            else:
                self.conversation.memory.clear()
                self.memory_size = 0
                for chunk in self.conversation.predict(input=self.context):
                    partial_response += chunk
                    full_response = partial_response
                    time.sleep(0.02)
                    yield partial_response
                
                self.memory_size = len(full_response)
                self.current_query += 1

        except Exception as e:
            yield f"Произошла ошибка: {str(e)}. Повторите ваш запрос ещё раз"

# 🔚 Заключение

## 📝 Основные достижения проекта

1. Реализована система RAG (Retrieval-Augmented Generation), которая позволяет чат-боту:
   - Осуществлять точный поиск по базе данных товаров
   - Предоставлять актуальные рекомендации на основе контекста
   - Генерировать персонализированные ответы с учетом предпочтений пользователя

2. Интегрированы ключевые технологии:
   - Векторная база данных Qdrant для эффективного поиска товаров
   - Языковая модель Mistral AI для генерации естественных ответов
   - Sentence Transformers для векторизации текста
   - Gradio для создания удобного веб-интерфейса

3. Внедрены важные функциональные особенности:
   - Система управления памятью диалога
   - Механизм ограничения контекста для оптимизации работы
   - Обработка ошибок и исключительных ситуаций
   - Интуитивно понятный пользовательский интерфейс

## 🎯 Практическая значимость

Разработанный чат-бот решает следующие бизнес-задачи:
- Автоматизация процесса консультирования клиентов
- Снижение нагрузки на менеджеров по продажам
- Повышение качества обслуживания клиентов
- Увеличение конверсии за счет персонализированных рекомендаций

## 💡 Потенциал для развития

Проект имеет значительный потенциал для дальнейшего развития:

1. Технические улучшения:
   - Интеграция с системой аналитики для отслеживания эффективности рекомендаций
   - Добавление поддержки мультимодальности (работа с изображениями)
   - Оптимизация векторного поиска для больших баз данных
   - Реализация A/B тестирования различных промптов

2. Функциональные дополнения:
   - Внедрение системы отслеживания заказов
   - Добавление функционала сравнения товаров
   - Расширение базы знаний о дизайне интерьера