Multi-Source RAG Demo (RealRoute)

This repository provides an installable demo package for a DeepSieve-derived multi-source RAG system with:

Multi-source retrieval
Evidence-level selection
Adaptive Cap (preferred_source + fixed quotas)
Streamlit UI for workflow, evidence, and trace inspection

Installable Package Link

Source repository: https://github.com/Joseph1951210/RealRoute
Installable package ( demo artifact): https://github.com/Joseph1951210/RealRoute/archive/refs/tags/v1.0.1- -demo.zip

Environment Requirements

Python 3.10+ (recommended: Python 3.10 or 3.11)
macOS/Linux shell
OpenAI-compatible API key (OPENAI_API_KEY)

Quick Start (Demo UI)

python3 -m pip install -r requirements.txt
export OPENAI_API_KEY=your_api_key
python3 -m streamlit run demo/app.py

Open the local Streamlit URL shown in the terminal (typically http://localhost:8501).

Dataset Availability in Release `v1.0- -demo`

The v1.0- -demo package includes tracked datasets required for the original 2-source preset (e.g., hotpot_qa local/global files).

For 3-source / 4-source presets (multi_source, mixed_4source), make sure the corresponding files exist under data/rag/ before running those presets:

{dataset}.json
{dataset}_profiles.json
{dataset}_corpus_*.json

If these files are missing, those presets will fail at data-loading time.

What the Demo Shows

Configure dataset preset and mode (Hard Routing or Adaptive Cap)
Run the pipeline with configurable retrieval/selection parameters
Inspect run-level summary (output directory, config snapshot, overall metrics)
Inspect query-level traces (subqueries, routing, evidence, final answer, metrics)
Compare baseline vs Adaptive Cap in the same UI

System Workflow (Implemented Behavior)

Query input (preset dataset or uploaded custom queries)
Optional decomposition into subqueries (decompose)
Ordered subquery execution with variable binding
Retrieval:
- Hard Routing: route to one source then retrieve
- Adaptive Cap mode: retrieve from all sources, then select evidence
Evidence selection using selector with optional Adaptive Cap
Subquery answer generation (optional reflection retries)
Final answer fusion
Save traces and run summaries under outputs/

Main Entrypoints

CLI pipeline: runner/main_rag_only.py
Web UI: demo/app.py

CLI Examples

Hard Routing (2-source baseline)

python3 runner/main_rag_only.py \
  --dataset hotpot_qa \
  --rag_type naive \
  --sample_size 100 \
  --decompose \
  --use_routing \
  --use_reflection

Hard Routing (N-source: 3/4-source datasets)

python3 runner/main_rag_only.py \
  --dataset multi_source \
  --rag_type naive \
  --sample_size 100 \
  --decompose \
  --use_reflection \
  --multi_source \
  --hard_routing_multi

Adaptive Cap (example configuration)

python3 runner/main_rag_only.py \
  --dataset mixed_4source \
  --rag_type naive \
  --sample_size 100 \
  --openai_model gpt-4o \
  --decompose \
  --use_reflection \
  --multi_source \
  --top_k_per_source 8 \
  --keep_k 8 \
  --preferred_cap 5 \
  --other_cap 2 \
  --selector score

Parameter Notes

top_k_per_source: candidates retrieved per source before selection
keep_k: final evidence budget for answer generation
preferred_cap / other_cap: source quota in Adaptive Cap mode
selector: evidence selector (score, norm_score, routing_weighted, rrf, llm)

Important: current Adaptive Cap is not confidence-calibrated. It uses routing-preferred source + fixed quotas.

Web UI Features

Dataset presets: 2-source / 3-source / 4-source
Mode toggle: Hard Routing vs Adaptive Cap
Pipeline toggles: decompose, use_reflection, sample_size, optional query_index
Compare mode: run baseline and Adaptive Cap on the same query set
Trace view tabs: primary trace, side-by-side compare, comparison trace
Trace download: JSONL and JSON

Custom Queries Upload

Custom queries override preset query loading but still use preset corpora.

Supported formats:

JSON:

[
  {"query": "Who wrote ...?", "ground_truth": "..."},
  {"query": "What is ...?"}
]

CSV:
- required column: query
- optional column: ground_truth

If ground_truth is provided, EM/F1 is shown; otherwise answer/trace only.

Custom Source Upload (Optional)

The UI can add one uploaded source corpus to the selected preset sources.

Required fields: source_name, source_profile
File format: JSON or CSV

JSON examples:

[
  {"title": "Doc 1", "text": "Document content..."},
  {"title": "Doc 2", "text": "Another content..."}
]

or

[
  "plain document text 1",
  "plain document text 2"
]

CSV:

required: text
optional: title

Output Artifacts

Each run writes to a directory in outputs/ (directory name encodes key settings).

Common files:

query_{i}_results.jsonl
query_{i}_fusion_prompt.txt
overall_results.json
overall_results.txt
demo_run_meta.json (UI run metadata)

Typical JSONL record types:

query_info
final_answer
evaluation_metrics
performance_metrics
execution_result
fused_answer_step

Common Runtime Issues

OPENAI_API_KEY is required:
- Ensure export OPENAI_API_KEY=... is executed in the same shell session before launching Streamlit.
pip: command not found:
- Use python3 -m pip ... instead of pip ....

Release Checklist (Installable Package for Demo)

Push the latest code to GitHub.
Create a version tag (e.g., v1.0- -demo).
Create a GitHub Release from that tag.
Upload a downloadable source archive (.zip or .tar.gz) as release asset.
Replace [[TODO: add GitHub Release asset URL]] above with the release asset link.

Relation to the Original DeepSieve Baseline

This repository keeps DeepSieve-style components (decomposition, routing, reflection, fusion) and extends them with multi-source retrieval, evidence selection, Adaptive Cap, and a trace-oriented demo UI.

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
Fig		Fig
data/rag		data/rag
demo		demo
pipeline		pipeline
rag		rag
runner		runner
scripts		scripts
utils		utils
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
run_with_encoding_fix.sh		run_with_encoding_fix.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multi-Source RAG Demo (RealRoute)

Installable Package Link

Environment Requirements

Quick Start (Demo UI)

Dataset Availability in Release `v1.0- -demo`

What the Demo Shows

System Workflow (Implemented Behavior)

Main Entrypoints

CLI Examples

Hard Routing (2-source baseline)

Hard Routing (N-source: 3/4-source datasets)

Adaptive Cap (example configuration)

Parameter Notes

Web UI Features

Custom Queries Upload

Custom Source Upload (Optional)

Output Artifacts

Common Runtime Issues

Release Checklist (Installable Package for Demo)

Relation to the Original DeepSieve Baseline

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors 3

Languages

Folders and files

Latest commit

History

Repository files navigation

Multi-Source RAG Demo (RealRoute)

Installable Package Link

Environment Requirements

Quick Start (Demo UI)

Dataset Availability in Release v1.0- -demo

What the Demo Shows

System Workflow (Implemented Behavior)

Main Entrypoints

CLI Examples

Hard Routing (2-source baseline)

Hard Routing (N-source: 3/4-source datasets)

Adaptive Cap (example configuration)

Parameter Notes

Web UI Features

Custom Queries Upload

Custom Source Upload (Optional)

Output Artifacts

Common Runtime Issues

Release Checklist (Installable Package for Demo)

Relation to the Original DeepSieve Baseline

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors 3

Languages

Dataset Availability in Release `v1.0- -demo`

Packages