# Анализ возможных подходов к задаче

## 1. Information Retrieval + Ranking

В данном случае, Sberquad - это база знаний (corpus).

>\+ Легко имплементируется \
>\+ Применим для больших баз данных


>\- Ограничен корпусом знаний \
>\- Ограничен качеством ранжирования: если полученный документ не содержит точного ответа, точность системы падает \
>\- Не всегда извлекает конкретные ответы, а только релевантные документы


## 2. Information Retrieval + RAG

В данном случае, Sberquad - это база знаний (corpus).

>\+ Более точные ответы за счет генеративной части \
>\+ Может комбинировать несколько источников данных, улучшая точность

>\- Сложнее в реализации и требует больше ресурсов, как вычислительных, так и временных \
>\- Генеративная часть может ошибаться или придумывать ответы

## 3. Encoder-decoder model

В данном случае, датасет Sberquad - это датасет для тренировки модели.

>\+ Подходит для вопросов, где требуется сложная интерпретация данных или перефразирование \
>\+ Способна генерировать ответы на естественном языке, даже если ответ не представлен явно в контексте

>\- Требует больше данных и **вычислительных ресурсов для обучения**
>\- Склонна к генерации некорректных или не полностью релевантных ответов; может создавать ответ, которого не было в контексте

## 4. Start/end token search

В данном случае, датасет Sberquad - это датасет для тренировки модели.


>\+ Точный и детерминированный, извлекает конкретный ответ из контекста \
>\+ Высокая эффективность, поиск токенов быстрее, чем генерация ответа


>\- Ограничен задачами, где ответ представлен явно в контексте \
>\- Не подходит для более сложных вопросов, требующих понимания контекста

# Выводы

Методы на основе IR, такие как ранжирование и RAG, обладают преимуществами при работе с большими базами знаний. Но для задачи, где ответы уже содержатся в контексте, такие методы могут быть излишне сложными и менее точными, так как требуют больше вычислительных ресурсов и могут не всегда извлекать конкретные ответы, полагаясь на сложные ранжирования или генерацию. В итоге, такие подходы чаще дают приблизительные или даже неверные ответы, особенно когда речь идет об **extractive QA**, а не generative QA.

Подход с encoder-decoder моделью полезен в ситуациях, когда ответ не явно присутствует в тексте и требуется перефразирование или сложная интерпретация. Однако в задачах, где ответ уже содержится в контексте, этот подход может быть менее эффективным, так как генерация ответов может быть менее точной, требовать больше данных для обучения и быть более ресурсоемкой.

Подводя итоги, метод с поиском start/end токенов, является самым эффективным для задачи extractive QA. Он нацелен на точное извлечение ответа, который уже есть в контексте, что делает его:

* Более точным: модель чётко указывает на начало и конец ответа в тексте, что снижает вероятность ошибок.
* Более быстрым: за счет того, что модель просто извлекает уже существующие фрагменты текста, а не генерирует новые ответы, она требует меньше вычислительных ресурсов и быстрее находит решение.

Таким образом, для задачи построения QA-системы с явным извлечением ответа из текста наилучший подход - это **модель с поиском start/end токенов**. Она предлагает наивысшую точность и быстроту для extractive QA, делая её оптимальным выбором по сравнению с более сложными и ресурсоемкими методами. Поэтому выбор пал на модели с поиском start/end токенов, такие как multilingual DistilBert и RuBert.