Skip to content

MathAndProgs/RetrieverBenchmarking

Repository files navigation

Retriever Benchmarking

Система для оценки качества поиска документов с метриками, независимыми от чанкинга.

Содержимое

  • Метрики оценки: metrics.py - FlexBench для оценки качества поиска
  • Базовый пайплайн: baseline/ - полный пайплайн индексации и оценки
  • Данные: ragflow_docs/ - документация RAGflow для тестирования
  • Тесты: tests/ - юнит-тесты и тестовые данные

Установка

# 1. Установить зависимости
uv sync --extra baseline

# 2. Настроить OpenAI API ключ
export OPENAI_API_KEY=your_key_here

Запуск

# Полный пайплайн (индексация + оценка)
uv run python baseline/run.py

# Только индексация документов
uv run python baseline/ingest.py

# Только оценка
uv run python baseline/evaluate.py

# Тесты
uv run pytest

Результаты

Результаты сохраняются в tests/data/baseline_results.json с метрикой:

  • flexible_rate - доля запросов где все golden spans пересекаются с результатами

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published