In [4]:
import pandas as pd
import joblib

# Load the dataset
data_dir = '../../data'
dataset = pd.read_csv(f'{data_dir}/full_dataset.csv', index_col=False)
dataset.head()

Unnamed: 0,Quest,Ans,URL,Department
0,Внутрикорпоративные термины Продуктовая книга,Доставка товара в определенные дату и время в ...,http://confluence/pages/viewpage.action?pageId...,CMK
1,Стандарт _Оформление выдачи груза_,Устанавливает требования к процедуре оформлени...,http://confluence/pages/viewpage.action?pageId...,CMK
2,Концепт ролевои модели прав в новом ЛК,Права полномочий пользователя ЛК свойства логи...,http://confluence/pages/viewpage.action?pageId...,CMK
3,Создание договорных документов в Фенаис,Часто задаваемые вопросы Скорее всего у вас не...,http://confluence/pages/viewpage.action?pageId...,CMK
4,Программа лояльности,Регистрация в программе лояльности в офисе Ча...,http://confluence/pages/viewpage.action?pageId...,CMK


In [7]:
# Load the pre-trained vectorizer and model
vectorizer = joblib.load('../../model/tfidf_vectorizer.joblib')
model = joblib.load('../../model/nearest_neighbors_model.joblib')

In [9]:
X = vectorizer.transform(dataset['Quest'])

In [10]:
def find_closest_match(query):
    """
    Найти наиболее похожее совпадение для запроса, используя модель и векторайзер.
    
    Args:
        query (str): Строка запроса пользователя.
    
    Returns:
        dict: Словарь с наиболее подходящими Quest, Ans, URL и Department.
    """
    query = query.strip().lower()
    query_vec = vectorizer.transform([query])
    distances, indices = model.kneighbors(query_vec, n_neighbors=1)
    closest_idx = indices[0][0]
    distance = distances[0][0]
    result = {
        'Quest': dataset.iloc[closest_idx]['Quest'],
        'Answer': dataset.iloc[closest_idx]['Ans'],
        'URL': dataset.iloc[closest_idx]['URL'],
        'Department': dataset.iloc[closest_idx]['Department'],
        'Distance': distance  # Добавляем расстояние для отладки
    }
    return result

if __name__ == "__main__":
    print("Введите запрос для поиска (или 'выход' для завершения):")
    while True:
        user_query = input("> ").strip()
        if user_query == 'выход':
            print("Программа завершена.")
            break
        if not user_query:
            print("Пожалуйста, введите запрос.")
            continue

        match = find_closest_match(user_query)
        
        print("\nНаиболее похожее совпадение:")
        print(f"Quest: {match['Quest']}")
        print(f"Answer: {match['Answer']}")
        print(f"URL: {match['URL']}")
        print(f"Department: {match['Department']}")
        print(f"Distance: {match['Distance']}\n")

Введите запрос для поиска (или 'выход' для завершения):


>  продукт



Наиболее похожее совпадение:
Quest: Внутрикорпоративные термины  Продуктовая книга
Answer: Доставка товара в определенные дату и время в конкретный пункт Уведомление о выполнении расчётной операции о переводе денег поступлении платёжных документов и т п Акт приёма передачи Б База знаний Бизнес юнит Возвратные документы Весо  габаритные характеристики Вес Длина Ширина Высота Вынужденное хранение Водитель экспедитор Внешняя экономическая деятельность Грузополучатель Габаритнопалетная рама грузоотправитель Доставка день в день Департамент доставки Департамент ИТ технологий Дистанционное обслуживание Договор транспортноэкспедиционного обслуживания Департамент по работе с клиентами Дополнительное соглашение Доставка в торговые сети Директор филиала Департамент филиальной сети Документ удостоверяющий личность Департамент экономической безопасности Журнал грузов Журнал обзвона Защитная транспортировочная упаковка Западный скоростной диаметр  Уникальный номер присваиваемый конкретному государ

>  продуктовая книга



Наиболее похожее совпадение:
Quest: GLOBAL  Продуктовая книга
Answer: Информация на сайте по перевозке в Армениюhttpspecomruinfopekglobalavtoperevozkivrespublikuarmeniya Внимание Армения не принимает запчасти с санкционными кодами перед отправкой необходимо обязательное согласование кода ТН ВЭД с терминалом в Ереване  Для оказания услуги по международной перевозке груза из Российской Федерации в Республику Армения Отправителю груза необходимо предоставить следующие документы  Перечень сопроводительных документов при перевозке из Республики Армения в Российскую Федерацию    Страхование  оформляется по умолчанию согласно условиям и тарифам насайте    Выдача груза осуществляется при соблюдении условий ТРЕБОВАНИЯ К ДОКУМЕНТУ На армянскомНа русскомДругое при условии предоставления официального перевода на белорусский для РБармянский для РА или русский язык Условия оплаты Плательщик резидент РФ Направление перевозки Валюта оплаты Место оплаты Форма оплаты Юр Лицо оказывающее услуги РоссияАр

>  закон



Наиболее похожее совпадение:
Quest: Внутрикорпоративные термины  Продуктовая книга
Answer: Доставка товара в определенные дату и время в конкретный пункт Уведомление о выполнении расчётной операции о переводе денег поступлении платёжных документов и т п Акт приёма передачи Б База знаний Бизнес юнит Возвратные документы Весо  габаритные характеристики Вес Длина Ширина Высота Вынужденное хранение Водитель экспедитор Внешняя экономическая деятельность Грузополучатель Габаритнопалетная рама грузоотправитель Доставка день в день Департамент доставки Департамент ИТ технологий Дистанционное обслуживание Договор транспортноэкспедиционного обслуживания Департамент по работе с клиентами Дополнительное соглашение Доставка в торговые сети Директор филиала Департамент филиальной сети Документ удостоверяющий личность Департамент экономической безопасности Журнал грузов Журнал обзвона Защитная транспортировочная упаковка Западный скоростной диаметр  Уникальный номер присваиваемый конкретному государ

>  центр



Наиболее похожее совпадение:
Quest: Внутрикорпоративные термины  Продуктовая книга
Answer: Доставка товара в определенные дату и время в конкретный пункт Уведомление о выполнении расчётной операции о переводе денег поступлении платёжных документов и т п Акт приёма передачи Б База знаний Бизнес юнит Возвратные документы Весо  габаритные характеристики Вес Длина Ширина Высота Вынужденное хранение Водитель экспедитор Внешняя экономическая деятельность Грузополучатель Габаритнопалетная рама грузоотправитель Доставка день в день Департамент доставки Департамент ИТ технологий Дистанционное обслуживание Договор транспортноэкспедиционного обслуживания Департамент по работе с клиентами Дополнительное соглашение Доставка в торговые сети Директор филиала Департамент филиальной сети Документ удостоверяющий личность Департамент экономической безопасности Журнал грузов Журнал обзвона Защитная транспортировочная упаковка Западный скоростной диаметр  Уникальный номер присваиваемый конкретному государ

>  груз



Наиболее похожее совпадение:
Quest: Клиент передал груз в ПЭК в своеи ЗТУ
Answer: Причины по которым груз мог быть упакован 1 Упаковка Клиента не обеспечивает сохранность груза имеются незащищенные участки 2 Упаковка Клиента повреждена или нарушены ребра жесткости 3 Упаковка недостаточно прочная и не соответствует требованиям к ЗТУ 4 ЗТУ выставлена ошибочно
URL: http://confluence/pages/viewpage.action?pageId=88444593
Department: DRK
Distance: 0.604364081073461



>  пэк



Наиболее похожее совпадение:
Quest: Как узнать реквизиты филиалов ПЭК почтовыи адрес ПЭК
Answer: Почтовых адресов два 109428 г Москва 1й Вязовский проезд дом  4 корпус 19 109378 ая 10 httpspecomruinfoustavnyedokumentyooopek Реквизиты ПЭК Райффайзенбанк_рубли  для клиентовdocx Путь 1С  Операции  Регистр сведений  Далее в выпавшем окне выбрать  Реквизиты подразделений  Переход на страницу всех отделений ПЭК двойным щелчком мыши нужно провалиться в нужное отделение  Будут открыты реквизиты Чтобы посмотреть рс и данные банка  необходимо на рс нажать правой кнопкой мыши и открыть Чтобы посмотреть реквизиты банка  необходимо на банк нажать правой кнопкой мыши и открыть
URL: http://confluence/pages/viewpage.action?pageId=163782259
Department: DRK
Distance: 0.45523130822906444



>  реквизиты пэк



Наиболее похожее совпадение:
Quest: Как узнать реквизиты филиалов ПЭК почтовыи адрес ПЭК
Answer: Почтовых адресов два 109428 г Москва 1й Вязовский проезд дом  4 корпус 19 109378 ая 10 httpspecomruinfoustavnyedokumentyooopek Реквизиты ПЭК Райффайзенбанк_рубли  для клиентовdocx Путь 1С  Операции  Регистр сведений  Далее в выпавшем окне выбрать  Реквизиты подразделений  Переход на страницу всех отделений ПЭК двойным щелчком мыши нужно провалиться в нужное отделение  Будут открыты реквизиты Чтобы посмотреть рс и данные банка  необходимо на рс нажать правой кнопкой мыши и открыть Чтобы посмотреть реквизиты банка  необходимо на банк нажать правой кнопкой мыши и открыть
URL: http://confluence/pages/viewpage.action?pageId=163782259
Department: DRK
Distance: 0.3920061848509905



>  филиал



Наиболее похожее совпадение:
Quest: Верификация обособленного подразделения филиал
Answer: Контрагента можно создать если заявка пришла с галкой на создание и с родителем Отправители и получатели если заявка пришла с другим родителем необходимо создатьэталонв 1с пегас Открыть заявку двумя нажатиями на заявку или скопировать ИНН из письма на почте НСИ и вставить в групповую обработкуИнструкция по групповой обработке  Взять в обработку  данные заявки  Проверить дубли контрагента поиск дублей Если дубли отсутствуют закрыть окно поиска дублей  обработать заявку на созданиеЕсли дубли есть  это заявка наизменение  Данные Заявки  Заполнить карточкуТк нельзя проверить данное наименование по ЕГРЮЛ нужно сделать ссылку на создание контрагента АвторомФорма собственности должна быть идентична с головным контрагентомНаименование должно быть без кавычек точек тире и формы собственностиПолное наименование в полном наименовании должна стоять расшифрованная форма собственностиНаименование для печати ф

>  >



Наиболее похожее совпадение:
Quest: Внутрикорпоративные термины  Продуктовая книга
Answer: Доставка товара в определенные дату и время в конкретный пункт Уведомление о выполнении расчётной операции о переводе денег поступлении платёжных документов и т п Акт приёма передачи Б База знаний Бизнес юнит Возвратные документы Весо  габаритные характеристики Вес Длина Ширина Высота Вынужденное хранение Водитель экспедитор Внешняя экономическая деятельность Грузополучатель Габаритнопалетная рама грузоотправитель Доставка день в день Департамент доставки Департамент ИТ технологий Дистанционное обслуживание Договор транспортноэкспедиционного обслуживания Департамент по работе с клиентами Дополнительное соглашение Доставка в торговые сети Директор филиала Департамент филиальной сети Документ удостоверяющий личность Департамент экономической безопасности Журнал грузов Журнал обзвона Защитная транспортировочная упаковка Западный скоростной диаметр  Уникальный номер присваиваемый конкретному государ

>  деньги



Наиболее похожее совпадение:
Quest: Внутрикорпоративные термины  Продуктовая книга
Answer: Доставка товара в определенные дату и время в конкретный пункт Уведомление о выполнении расчётной операции о переводе денег поступлении платёжных документов и т п Акт приёма передачи Б База знаний Бизнес юнит Возвратные документы Весо  габаритные характеристики Вес Длина Ширина Высота Вынужденное хранение Водитель экспедитор Внешняя экономическая деятельность Грузополучатель Габаритнопалетная рама грузоотправитель Доставка день в день Департамент доставки Департамент ИТ технологий Дистанционное обслуживание Договор транспортноэкспедиционного обслуживания Департамент по работе с клиентами Дополнительное соглашение Доставка в торговые сети Директор филиала Департамент филиальной сети Документ удостоверяющий личность Департамент экономической безопасности Журнал грузов Журнал обзвона Защитная транспортировочная упаковка Западный скоростной диаметр  Уникальный номер присваиваемый конкретному государ

>  пункт



Наиболее похожее совпадение:
Quest: Что значит пункт _Принят с повреждениями__
Answer: Если при приемке груза на складе обнаруживаются повреждения первичной упаковки или груза царапинысмятиесколы и тд ставится отметка Принят с повреждениями Данная пометка не всегда означает что груз поврежденвозможно была затертаязаклееннаяпомятая упаковка
URL: http://confluence/pages/viewpage.action?pageId=152462202
Department: DRK
Distance: 0.5642713013295637



>  выход


Программа завершена.
