# üöÄ RAG Research System

## Wissenschaftliches RAG-System f√ºr Big-Data-Analyse

**Einfache Bedienung in 3 Schritten:**
1. ‚öôÔ∏è Konfiguration setzen
2. ‚ñ∂Ô∏è Experiment starten
3. üìä Ergebnisse analysieren

**Automatische Metriken:**
- Precision@5, Recall@5, F1-Score
- RAGAS (Context Relevance, Answer Relevance, Faithfulness)
- Inferenzgeschwindigkeit (Queries/Sekunde)
- MRR, nDCG

**Datenbasis:** DSGVO-Verordnung (403KB, 3633 Zeilen)

In [None]:
# üì¶ Setup & Imports
import sys
import os
from pathlib import Path

# Pfad-Setup f√ºr src/
project_root = Path.cwd()
if project_root.name == 'src':
    project_root = project_root.parent
sys.path.insert(0, str(project_root / 'src'))

# Core Imports
from research_rag import ResearchRAG
from dotenv import load_dotenv

# API Key laden
load_dotenv(project_root / '.env')
api_key = os.getenv('OPENAI_API_KEY', 'demo-key')

print('‚úÖ Research RAG System bereit')
print(f'üîë API Key: {"‚úÖ Geladen" if api_key != "demo-key" else "‚ö†Ô∏è Demo-Modus"}')

## ‚öôÔ∏è 1. Konfiguration

**W√§hlen Sie Ihre RAG-Komponenten:**

In [None]:
# üîß RAG-Konfiguration (einfach anpassen)
config = {
    # Chunking-Strategie
    'chunker': 'line',  # 'line' oder 'recursive'
    'chunk_size': 1000,
    'chunk_overlap': 200,
    
    # Embedding-Modell
    'embedding': 'sentence_transformers',  # 'sentence_transformers' oder 'openai'
    
    # Vector Store
    'vector_store': 'in_memory',  # 'in_memory' oder 'chroma'
    
    # Language Model
    'llm': 'openai',  # 'openai' oder 'local'
    'api_key': api_key,
    
    # Evaluation
    'num_test_questions': 5,  # Anzahl Test-Fragen
    'top_k': 5  # Top-K f√ºr Retrieval
}

print('‚öôÔ∏è Konfiguration:')
for key, value in config.items():
    if key != 'api_key':
        print(f'   {key}: {value}')
print('‚úÖ Konfiguration bereit')

## ‚ñ∂Ô∏è 2. Experiment starten

**Ein Klick - Vollst√§ndige Evaluation:**

In [None]:
# üöÄ RAG-System initialisieren und ausf√ºhren
rag = ResearchRAG(config)

print('üîÑ Starte vollst√§ndige RAG-Evaluation...')
print('   üìÑ Lade DSGVO-Daten')
print('   üîß Initialisiere Komponenten')
print('   üìä F√ºhre Evaluation durch')
print('   ‚è±Ô∏è Messe Performance')

# Vollst√§ndige Evaluation mit allen Metriken
results = rag.run_full_evaluation()

print('\n‚úÖ Evaluation abgeschlossen!')

## üìä 3. Ergebnisse & Analyse

**Wissenschaftliche Metriken:**

In [None]:
# üìà Ergebnisse anzeigen
rag.display_results(results)