## Разработка Telegram-бота

### Критерии оценки
- создан файл bot.py (1 балл)
- в решении использована библиотека aiogram (1 балл)
- файл faq.json выгружен в переменную data (1 балл)
- реализован алгоритм выбора ответа (по правилам или с использованием эмбеддингов) (3 балла)
- добавлены 2 кнопки (1 балл за реализацию каждой кнопки)
- представлены скриншотом с демонстрацией работы кнопок и ответами бота (1 балл за скриншот с демонстрацией кнопок и 1 балл с демонстрацией ответов бота)
### Задание
1. Проходим туториал с прошлого семинара: https://github.com/vifirsanova/compling/blob/main/practice/tg_practice.ipynb

2. Создаём файл с названием bot.py

3. Создаём бота с помощью библиотеки aiogram согласно требованиям

**Требования для базового уровня**

1. Бот обрабатывает faq.json (в этом файле хранится словарь с частозадаваемыми вопросами)

  - файл хранится по ссылке `https://github.com/vifirsanova/compling/blob/main/tasks/task3/faq.json`
  - образец загрузки *.json вы найдете в ячейке ниже
  - вам нужно загрузить файл и сохранить его в `data`

2. Бот отвечает на вопросы по ключевым словам, которые получает от пользователя

  - список ключевых слов
    ```
    * Цены: "цены", "стоимость", "заказ", "оплата"
    * Часы работы: "часы работы", "время работы", "доступность"
    * Доставка: "доставка", "сроки доставки", "стоимость доставки", "отслеживание"
    * Возврат: "возврат", "обмен", "возврат товара", "гарантия"
    * Контакты: "связаться", "телефон", "email", "адрес"
    ```
  - если в запросе пользователя встречается одно из ключевых слов, бот возвращает подходящий ответ из документа `data`

3. Добавьте кнопки "О компании" и "Связаться с оператором"

  - при нажатии кнопки "О компании" бот выдает текст "Наша компания занимается доставкой товаров по всей стране."
  - при нажатии кнопки "Связаться с оператором" бот выдает текст "Перевожу на оператора..."

4. Запустите бот в Telegram, добавьте скриншоты, на которых продемонстрирована работа кнопок, а также пример одного ответа на вопрос пользователя

5. Удалите свой API-токен из файла `bot.py`

6. Добавьте в свой репозиторий файл `bot.py`

7. Добавьте в файл README.md скриншоты с образцом работы бота

In [7]:
import json

with open('faq.json', encoding='utf-8') as f:
  data = json.load(f)

data

{'faq': [{'question': 'Каковы ваши цены?',
   'answer': 'Наши цены конкурентоспособны и зависят от конкретного товара. Вы можете найти подробную информацию о ценах на страницах товаров в нашем интернет-магазине.'},
  {'question': 'Какие способы оплаты вы принимаете?',
   'answer': 'Мы принимаем к оплате банковские карты (Visa, Mastercard), электронные кошельки (Yandex.Money, QIWI) и наложенный платеж.'},
  {'question': 'В какие часы работает ваш магазин?',
   'answer': 'Наш интернет-магазин работает круглосуточно, 7 дней в неделю. Вы можете делать заказы в любое удобное для вас время.'},
  {'question': 'Как связаться с вами?',
   'answer': 'Вы можете связаться с нами по телефону +7 (XXX) XXX-XX-XX, по электронной почте info@example.com или через форму обратной связи на нашем сайте.'},
  {'question': 'Как осуществляется доставка?',
   'answer': 'Мы сотрудничаем с курьерскими службами и предлагаем доставку по всей России. Стоимость и сроки доставки зависят от вашего местоположения и спос

**Требования для продвинутого уровня**

1. Бот обрабатывает faq.json (в этом файле хранится словарь с частозадаваемыми вопросами)

  - файл хранится по ссылке `https://github.com/vifirsanova/compling/blob/main/tasks/task3/faq.json`
  - образец загрузки *.json вы найдете в ячейке ниже
  - вам нужно загрузить файл и сохранить его в `data`

2. Бот выбирает наиболее подходящий ответ на вопросы пользователя на основе оценки семантического сходства (см. образец в ячейке ниже)

  - реализуйте 2 базовых метода: TF-IDF и Word2Vec
  - эти методы строят векторные представления для запросов и возможных вариантов ответа, а потом выбирают наиболее подходящий ответ на основе косинусного сходства

3. Добавьте кнопки "О компании" и "Пожаловаться"

  - при нажатии кнопки "О компании" бот выдает текст "Наша компания занимается доставкой товаров по всей стране."
  - при нажатии кнопки "Пожаловаться" бот принимает на вход картинку (например, скриншот) и возвращает её название и размер файла, а также текст "Ваш запрос передан специалисту"

4. Запустите бот в Telegram, добавьте скриншоты, на которых продемонстрирована работа кнопок, а также пример одного ответа на вопрос пользователя

5. Удалите свой API-токен из файла `bot.py`

6. Добавьте в свой репозиторий файл `bot.py`

7. Добавьте в файл README.md скриншоты с образцом работы бота

In [8]:
# 1. Загружаем библиотеки для векторизации и оценки косинусного сходства
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# 2. Образец списка вопросов: замените на этот пример на автоматическое извлечение данных из переменной data
faq_questions = [
    "Каковы ваши цены?", "Какие способы оплаты вы принимаете?", "В какие часы работает ваш магазин?",
    "Как связаться с вами?", "Как осуществляется доставка?", "Какая ваша политика возврата?",
    "Где вы находитесь?", "Как я могу отследить свой заказ?"
]

faq_answers = [
    "Наши цены конкурентоспособны...", "Мы принимаем к оплате банковские карты...",
    "Наш интернет-магазин работает круглосуточно...", "Вы можете связаться с нами по телефону...",
    "Мы сотрудничаем с курьерскими службами...", "Вы можете вернуть товар в течение 14 дней...",
    "Мы интернет-магазин и не имеем физического магазина...", "После отправки заказа вы получите письмо..."
]

# TF-IDF преобразование
vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(faq_questions)

# Запрос пользователя
query = "Где мой заказ?"

# Преобразуем запрос в вектор
query_vec = vectorizer.transform([query])

# Вычисляем косинусное сходство
similarities = cosine_similarity(query_vec, tfidf_matrix)

# Ищем индекс наиболее близкого вопроса на основе косинусного сходства
best_match_idx = similarities.argmax()
best_answer = faq_answers[best_match_idx]

print(f"Вопрос: {faq_questions[best_match_idx]}")
print(f"Ответ: {best_answer}")

Вопрос: Где вы находитесь?
Ответ: Мы интернет-магазин и не имеем физического магазина...


In [14]:
# Загрузка Word2Vec из Gensim
import gensim
import numpy as np
from gensim.models import Word2Vec
from sklearn.metrics.pairwise import cosine_similarity

# Подгружаем Word2Vec
sentences = [q.split() for q in faq_questions]
model = Word2Vec(sentences, vector_size=100, window=5, min_count=1, workers=4)

# Функция для усреднения векторов слов в вопросе
def sentence_vector(sentence, model):
    words = sentence.split()
    vectors = [model.wv[word] for word in words if word in model.wv]
    return np.mean(vectors, axis=0) # Берем среднее значение по всем векторам, чтобы одно предложение представлял один вектор

# Векторизуем вопросы
faq_vectors = np.array([sentence_vector(q, model) for q in faq_questions])

# Образец запроса пользователя
query = "Где мой заказ?"
query_vector = sentence_vector(query, model).reshape(1, -1)

# Оценка косинусного сходства
similarities = cosine_similarity(query_vector, faq_vectors)
best_match_idx = similarities.argmax()
best_answer = faq_answers[best_match_idx]

print(f"Вопрос: {faq_questions[best_match_idx]}")
print(f"Ответ: {best_answer}")

Вопрос: Где вы находитесь?
Ответ: Мы интернет-магазин и не имеем физического магазина...
