# 🚀 RAG Research System

## Wissenschaftliches RAG-System für Big-Data-Analyse

**Einfache Bedienung in 3 Schritten:**
1. ⚙️ Konfiguration setzen
2. ▶️ Experiment starten
3. 📊 Ergebnisse analysieren

**Automatische Metriken:**
- Precision@5, Recall@5, F1-Score
- RAGAS (Context Relevance, Answer Relevance, Faithfulness)
- Inferenzgeschwindigkeit (Queries/Sekunde)
- MRR, nDCG

**Datenbasis:** DSGVO-Verordnung (403KB, 3633 Zeilen)

In [None]:
# 📦 Setup & Imports
import sys
import os
from pathlib import Path

# Pfad-Setup für src/
project_root = Path.cwd()
if project_root.name == 'src':
    project_root = project_root.parent
sys.path.insert(0, str(project_root / 'src'))

# Core Imports
from research_rag import ResearchRAG
from dotenv import load_dotenv

# API Key laden
load_dotenv(project_root / '.env')
api_key = os.getenv('OPENAI_API_KEY', 'demo-key')

print('✅ Research RAG System bereit')
print(f'🔑 API Key: {"✅ Geladen" if api_key != "demo-key" else "⚠️ Demo-Modus"}')

## ⚙️ 1. Konfiguration

**Wählen Sie Ihre RAG-Komponenten:**

In [None]:
# 🔧 RAG-Konfiguration (einfach anpassen)
config = {
    # Chunking-Strategie
    'chunker': 'line',  # 'line' oder 'recursive'
    'chunk_size': 1000,
    'chunk_overlap': 200,
    
    # Embedding-Modell
    'embedding': 'sentence_transformers',  # 'sentence_transformers' oder 'openai'
    
    # Vector Store
    'vector_store': 'in_memory',  # 'in_memory' oder 'chroma'
    
    # Language Model
    'llm': 'openai',  # 'openai' oder 'local'
    'api_key': api_key,
    
    # Evaluation
    'num_test_questions': 5,  # Anzahl Test-Fragen
    'top_k': 5  # Top-K für Retrieval
}

print('⚙️ Konfiguration:')
for key, value in config.items():
    if key != 'api_key':
        print(f'   {key}: {value}')
print('✅ Konfiguration bereit')

## ▶️ 2. Experiment starten

**Ein Klick - Vollständige Evaluation:**

In [None]:
# 🚀 RAG-System initialisieren und ausführen
rag = ResearchRAG(config)

print('🔄 Starte vollständige RAG-Evaluation...')
print('   📄 Lade DSGVO-Daten')
print('   🔧 Initialisiere Komponenten')
print('   📊 Führe Evaluation durch')
print('   ⏱️ Messe Performance')

# Vollständige Evaluation mit allen Metriken
results = rag.run_full_evaluation()

print('\n✅ Evaluation abgeschlossen!')

## 📊 3. Ergebnisse & Analyse

**Wissenschaftliche Metriken:**

In [None]:
# 📈 Ergebnisse anzeigen
rag.display_results(results)