<p><font size="6" color='grey'> <b>

Generative KI. Verstehen. Anwenden. Gestalten.
</b></font> </br></p>

<font size="5" color='grey'> <b>
SQL RAG mit Chat-Historie (Optimiert)
</b></font> </br>

**Optimierte Version von M13_SQL_RAG.ipynb**

---

<font color='black' size="5">
Optimierungen gegen√ºber M13
</font>

| # | Optimierung | Vorher (M13) | Nachher (M13a) |
|---|-------------|-------------|----------------|
| 1 | **Schema-Caching** | `db.get_table_info()` bei jedem Chain-Aufruf | Einmalig laden, Variable `db_schema` |
| 2 | **Structured Output** | `StrOutputParser()` + Regex-Bereinigung | `with_structured_output(SQLQuery)` |
| 3 | **Chain-Wiederverwendung** | `analysis_chain` bei jedem Aufruf neu erstellt | Einmalig definiert, wiederverwendet |
| 4 | **SQL-Validierung integriert** | `validate_sql()` existiert, aber nicht genutzt | In `execute_query()` integriert |
| 5 | **DB-Pfad** | Hardcoded `/content/northwind.db` | Relativer Pfad `northwind.db` |
| 6 | **Imports konsolidiert** | Doppelte Imports in Abschnitt 4 und 5 | Ein Import-Block |
| 7 | **Mermaid parametrisiert** | 4x fast identisches Diagramm | Funktion `show_architecture(highlight)` |
| 8 | **Historie ausgelagert** | Formatierung in `chatbot_response()` | Eigene Funktion `format_history()` |

In [None]:
#@title üîß Umgebung einrichten{ display-mode: "form" }
!uv pip install --system -q git+https://github.com/ralf-42/GenAI.git#subdirectory=04_modul
from genai_lib.utilities import (
    check_environment,
    get_ipinfo,
    setup_api_keys,
    mprint,
    install_packages,
    mermaid,
    get_model_profile,
    extract_thinking,
    load_chat_prompt_template
)
setup_api_keys(['OPENAI_API_KEY', 'HF_TOKEN'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()

In [None]:
#@title üìÇ Datenbank { display-mode: "form" }
# Northwind-Datenbank herunterladen
!rm -rf northwind.db
!curl -L https://raw.githubusercontent.com/ralf-42/GenAI/main/02_daten/05_sonstiges/northwind.db -o northwind.db

<p><font color='black' size="5">
‚è∏Ô∏è 5-Minuten-Check:
</font></p>

**Ziel:** Pr√ºfen, ob du das vorherige Kapitel verstanden hast ‚Äì nicht, ob es gerade l√§uft.

**Aufgabe** (5 Minuten, ohne Vorlage):

Rekonstruiere die zentrale Idee oder Code-Struktur des letzten Abschnitts selbstst√§ndig
(kein Copy & Paste, kein Nachschlagen).

W√§hle eine der folgenden Optionen:

+ Erkl√§re in 1‚Äì2 S√§tzen, was hier konzeptionell passiert.

+ Ver√§ndere eine Kleinigkeit (z. B. Prompt, Parameter, Reihenfolge) und beschreibe die Auswirkung.

+ Markiere eine Stelle, die du nicht sicher erkl√§ren kannst, und formuliere eine konkrete Frage dazu.

**Hinweis:**
Nicht alles muss ‚Äûfertig‚Äú oder ‚Äûkorrekt‚Äú sein. Entscheidend ist, wo dein Verst√§ndnis gerade endet

# 1 | Einf√ºhrung in SQL RAG
---

SQL RAG ist eine Technologie, die Large Language Models (LLMs) mit Datenbankabfragen kombiniert. Sie erm√∂glicht es, nat√ºrlichsprachliche Anfragen in SQL-Abfragen zu √ºbersetzen und die Ergebnisse intelligent zu interpretieren.

Diese Technologie √ºberbr√ºckt die L√ºcke zwischen menschlicher Sprache und Datenbankstrukturen, indem sie:

- Nat√ºrliche Sprache in pr√§zise SQL-Abfragen umwandelt
- Datenbankschemas analysiert, um korrekte Abfragen zu generieren
- Die Abfrageergebnisse in verst√§ndliche Antworten umformuliert

SQL RAG erweitert die F√§higkeiten von LLMs, indem es ihnen Zugriff auf strukturierte Daten erm√∂glicht und so pr√§zisere, faktenbasierte Antworten liefert.

<p><font color='black' size="5">
Warum SQL f√ºr RAG?
</font></p>



Das Erstellen eines Retrieval-Augmented Generation (RAG)-Systems bringt mehrere Herausforderungen mit sich, aber SQL k√∂nnte helfen, diese zu bew√§ltigen:

- **SQL kann helfen, komplexe Daten abzurufen**
    
    Das Abrufen relevanter Informationen aus riesigen und vielf√§ltigen Datens√§tzen kann komplex sein, insbesondere beim Umgang mit unstrukturierten oder semistrukturierten Datenquellen wie Textdokumenten, Bildern oder Multimedia. Die Integration effizienter Retrieval-Mechanismen, die diese Komplexit√§t bew√§ltigen k√∂nnen, ist eine bedeutende Herausforderung. Die Abfragefunktionen von SQL erm√∂glichen den effizienten Abruf relevanter Informationen aus diesen Datenquellen. Durch das Generieren von SQL-Abfragen, die auf bestimmte Kriterien zugeschnitten sind, und die Nutzung erweiterter Suchfunktionen kann SQL den Datenabrufprozess optimieren und so die Komplexit√§t des Zugriffs auf verschiedene Datens√§tze bew√§ltigen.
    
- **SQL kann helfen, Qualit√§tsdaten abzurufen**
    
    Die Sicherstellung der Qualit√§t und Relevanz der abgerufenen Daten ist entscheidend f√ºr die Generierung genauer und sinnvoller Antworten. Verrauschte oder veraltete Daten sowie irrelevante Informationen k√∂nnen die Leistung des RAG-Systems jedoch negativ beeinflussen. Die Entwicklung von Algorithmen zum effektiven Filtern und Ranking abgerufener Daten ist eine Herausforderung. SQL bietet Mechanismen zum Filtern und Ranking abgerufener Daten basierend auf verschiedenen Kriterien wie Zeitstempeln, Kategorien oder Relevanzwerten.
    
- **SQL bietet Skalierbarkeit und Flexibilit√§t**
    
    Da Datens√§tze an Gr√∂√üe und Komplexit√§t zunehmen, wird Skalierbarkeit zu einer gro√üen Herausforderung f√ºr RAG-Systeme. Die Sicherstellung, dass das System mit zunehmenden Datenmengen umgehen kann und gleichzeitig Leistung und Reaktionsf√§higkeit aufrechterh√§lt, erfordert ein effizientes Architekturdesign und Optimierungsstrategien. SQL-Datenbanken sind darauf ausgelegt, riesige Mengen strukturierter Daten effizient zu verwalten. Die Integration von SQL in RAG-Systeme adressiert eine der wichtigsten Herausforderungen im Bereich der KI: die Skalierung des Retrieval-Mechanismus zur Handhabung umfangreicher Datens√§tze, ohne die Leistung zu beeintr√§chtigen. Dar√ºber hinaus erm√∂glicht die Flexibilit√§t von SQL bei der Formulierung von Abfragen RAG, komplexe Informationen abzurufen und dabei die Breite und Tiefe der w√§hrend des Generierungsprozesses ber√ºcksichtigten Daten anzupassen.
    
- **SQL hilft beim Abrufen von Echtzeitdaten**
    
    Die Bereitstellung von Echtzeitantworten ist f√ºr viele Anwendungen von RAG-Systemen, wie z. B. Chatbots oder virtuelle Assistenten, von entscheidender Bedeutung. Das Erreichen niedriger Latenzzeiten bei gleichzeitiger Aufrechterhaltung der Qualit√§t der generierten Inhalte stellt eine Herausforderung dar, insbesondere in Szenarien mit strengen Latenzanforderungen. Die Optimierungstechniken von SQL, wie z. B. Query-Caching und Indizierung, k√∂nnen die Query-Verarbeitungszeiten erheblich reduzieren und es RAG-Systemen erm√∂glichen, Echtzeitantworten bereitzustellen.
    


# 2 | Vergleich SQL RAG vs RAG
---

W√§hrend sowohl SQL RAG als auch RAG (Retrieval-Augmented Generation) die F√§higkeiten von LLMs erweitern, gibt es wichtige Unterschiede:



| Merkmal         | SQL RAG      | Retrieval-Augmented Generation (RAG)    |
| --------------- | ------------------------------------ | --------------------------------------- |
| Datenquelle     | Strukturierte Datenbanken            | Textdokumente, Wissensbasen             |
| Abfragemethode  | SQL-Generierung                      | Semantische Suche, Embedding-Vergleiche |
| Datenstruktur   | Schema-basiert, tabellarisch         | Unstrukturiert oder semi-strukturiert   |
| Genauigkeit     | Pr√§zise durch Datenbankintegrit√§t    | Abh√§ngig von der Retrieval-Qualit√§t     |
| Anwendungsf√§lle | Gesch√§ftsanalysen, Berichterstellung | Dokumentensuche, Wissensbasis-Anfragen  |
| Aktualisierung  | In Echtzeit durch aktuelle DB-Daten  | Erfordert Neuindexierung bei √Ñnderungen |



SQL RAG eignet sich besonders f√ºr Szenarien, in denen pr√§zise, aktuelle Daten ben√∂tigt werden, w√§hrend RAG St√§rken bei der Verarbeitung gro√üer Textmengen hat.



# 3 | Integration LLM und DB
---



Die Integration von LLMs mit Datenbanken erfolgt √ºber mehrere Komponenten:

1. **Schema-Analyse**: Das LLM muss das Datenbankschema verstehen (Tabellen, Spalten, Beziehungen)
2. **Anfrage-√úbersetzung**: Umwandlung der nat√ºrlichsprachlichen Anfrage in SQL
3. **Abfrage-Ausf√ºhrung**: Verbindung zur Datenbank und Ausf√ºhrung der generierten SQL-Abfrage
4. **Ergebnis-Interpretation**: Analyse und Interpretation der Abfrageergebnisse

<img src="https://raw.githubusercontent.com/ralf-42/GenAI/main/07_image/sql_rag_process.png" width="750" alt="Avatar">


In [None]:
# Grundlegender SQL RAG-Ablauf
from langchain.chat_models import init_chat_model
from langchain_community.utilities import SQLDatabase

# 1. Datenbankverbindung herstellen
db = SQLDatabase.from_uri("sqlite:///northwind.db")

# 2. LLM initialisieren (Kurznotation: "provider:model")
llm = init_chat_model("openai:gpt-4o-mini", temperature=0.0)

# 3. ‚úÖ OPTIMIERUNG: Schema einmalig laden und cachen
#    (statt bei jedem Chain-Aufruf db.get_table_info() aufzurufen)
db_schema = db.get_table_info()

In [None]:
# 3. Gecachtes Schema anzeigen (kein erneuter DB-Aufruf n√∂tig)
print(db_schema)

In [None]:
# 4. Nat√ºrlichsprachliche Anfrage
user_query = "Wie viele Mitarbeiter haben wir?"

# 5. SQL-Abfrage generieren und ausf√ºhren
# (Detaillierte Umsetzung folgt in sp√§teren Abschnitten)

Die Herausforderung liegt in der korrekten Interpretation des Schemas und der pr√§zisen √úbersetzung der Anfragen.



# 4 | SQL-Generierung mit LLMs
---



Die SQL-Generierung ist ein kritischer Bestandteil von SQL RAG und erfolgt in mehreren Schritten:

1. **Prompt-Engineering**: Entwicklung spezifischer Prompts, die das Datenbankschema und die Anforderungen enthalten
2. **Query-Planung**: Analyse der Anfrage, um die ben√∂tigten Tabellen und Joins zu identifizieren
3. **SQL-Syntax-Generierung**: Erzeugung syntaktisch korrekter SQL-Abfragen
4. **Validierung**: √úberpr√ºfung der generierten Abfrage vor der Ausf√ºhrung

In [None]:
from pydantic import BaseModel, Field
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# ‚úÖ OPTIMIERUNG: Pydantic-Model f√ºr strukturierte SQL-Ausgabe
#    Ersetzt StrOutputParser + Regex-Bereinigung
class SQLQuery(BaseModel):
    """Strukturierte SQL-Abfrage."""
    sql: str = Field(description="Reine SQL-Abfrage (nur SELECT, ohne Markdown/Formatierung)")

In [None]:
# ChatPromptTemplate mit System/Human Messages
sql_prompt = ChatPromptTemplate.from_messages([
    ("system", """Du bist ein SQL-Experte. Deine Aufgabe ist es, Benutzeranfragen in SQL-Abfragen zu √ºbersetzen.
Verwende die SQLite-Syntax und nur die Tabellen und Spalten aus dem bereitgestellten Schema.

Datenbank-Schema:
{schema}"""),
    ("human", "{query}")
])

# ‚úÖ OPTIMIERUNG: with_structured_output statt StrOutputParser
sql_llm = llm.with_structured_output(SQLQuery)

In [None]:
# ‚úÖ OPTIMIERUNG: Schema aus Cache, structured output statt Parser
sql_generator = (
    RunnablePassthrough.assign(schema=lambda _: db_schema)
    | sql_prompt
    | sql_llm
)

In [None]:
# Verwendung - Ergebnis ist ein Pydantic-Objekt
result = sql_generator.invoke({"query": user_query})
print(f"Generierte SQL: {result.sql}")
print(f"Typ: {type(result)}")  # SQLQuery

In [None]:
# ‚úÖ OPTIMIERUNG: Kein Regex-Cleanup mehr n√∂tig!
# with_structured_output() garantiert saubere Ausgabe als Pydantic-Objekt.
# Die SQL-Abfrage ist direkt √ºber result.sql verf√ºgbar.
#
# Vorher (M13):
#   if "```" in sql_query:
#       sql_query = re.sub(r'```sql\s*(.*?)\s*```', r'\1', sql_query, flags=re.DOTALL)
#       sql_query = sql_query.replace("```", "").strip()
#
# Nachher (M13a):
sql_query = result.sql
print(f"Saubere SQL: {sql_query}")

# 5 | Hands-On: SQL RAG `northwind.db`
---


LangChain bietet leistungsstarke Tools f√ºr die Implementierung von SQL RAG-L√∂sungen:

1. **SQLDatabase**: Verbindung zur Datenbank mit `db.run()` Methode
2. **ChatPromptTemplate**: Strukturierte Prompts mit System/Human Messages  
3. **LCEL**: LangChain Expression Language f√ºr Chains
4. **SQL Agent** (optional): Intelligente Agents f√ºr komplexe Queries


<p><font color='black' size="5">
Erl√§uterung des SQL RAG-Beispiels
</font></p>

Das Beispiel demonstriert eine vollst√§ndige SQL RAG-Anwendung mit folgenden Komponenten:

1. **Datenbankintegration**: Northwind-Datenbank √ºber SQLite
2. **LLM-Anbindung**: √úber `init_chat_model()` (LangChain 1.0+)
3. **Structured Output**: `with_structured_output(SQLQuery)` statt StrOutputParser + Regex
4. **Schema-Caching**: DB-Schema einmalig geladen, nicht bei jedem Chain-Aufruf
5. **SQL-Validierung**: Sicherheitspr√ºfung direkt in `execute_query()` integriert
6. **Vordefinierte Chains**: `sql_generator` und `analysis_chain` einmalig definiert
7. **Benutzeroberfl√§che**: Gradio-basiertes Chatinterface mit Historie

Die optimierte Architektur:

1. Der Benutzer stellt eine Frage in nat√ºrlicher Sprache
2. `sql_generator` erzeugt via `with_structured_output()` ein sauberes `SQLQuery`-Objekt
3. `execute_query()` validiert die SQL und f√ºhrt sie aus
4. `analysis_chain` interpretiert die Ergebnisse (einmalig definiert, wiederverwendet)
5. Die formatierte Antwort wird dem Benutzer pr√§sentiert

<p><font color='black' size="5">
üí¨ Chat-Historie
</font></p>

Das System unterst√ºtzt **kontextbewusste Konversationen** durch Chat-Historie:

**Wie funktioniert es?**
1. **Historie-Speicherung**: Gradio speichert automatisch die letzten Konversationen
2. **Kontext-Extraktion**: Die letzten 3 Frage-Antwort-Paare werden in den Prompt eingebettet
3. **Intelligente SQL-Generierung**: Das LLM nutzt den Kontext f√ºr Folge-Fragen
4. **Kontextuelle Analyse**: Antworten beziehen sich auf vorherige Ergebnisse

**Beispiel-Konversation:**
```
üë§ User: "Welche Produkte sind nicht auf Lager?"
ü§ñ Bot: [Zeigt 3 Produkte: Chai, Chang, Gorgonzola]

üë§ User: "Zeige mir mehr Details zu diesen Produkten"
ü§ñ Bot: [Generiert SQL mit WHERE-Klausel f√ºr die 3 Produkte]

üë§ User: "Welche Lieferanten haben diese Produkte geliefert?"
ü§ñ Bot: [JOIN mit Suppliers-Tabelle basierend auf Kontext]
```

**Implementierung:**
- System/Human Message Templates mit `{history_text}` Platzhalter
- Automatische Extraktion relevanter Informationen aus vorherigen Antworten
- Limitierung auf letzte 3 Eintr√§ge zur Token-Optimierung

[DatenbankSchema](https://upload.wikimedia.org/wikiversity/en/a/ac/Northwind_E-R_Diagram.png)



[Datenbankbeschreibung](https://techwriter.me/downloads/samples/Database/Access2003Northwind.pdf)

In [None]:
#@markdown   <p><font size="4" color='green'> üßú Mermaid-Diagramm</font> </br></p>

# ‚úÖ OPTIMIERUNG: Parametrisierte Funktion statt 4x kopiertes Diagramm
def show_architecture(highlight=None):
    """Zeigt die SQL-RAG Architektur mit optionaler Hervorhebung.

    Args:
        highlight: None, "sql", "output" oder "ui"
    """
    styles = {
        "sql": "\n    style SQL fill:#4a90d9,stroke:#2d5a87,color:#fff",
        "output": "\n    style Output fill:#4a90d9,stroke:#2d5a87,color:#fff",
        "ui": "\n    style Gradio fill:#4a90d9,stroke:#2d5a87,color:#fff\n    style RESULT fill:#4a90d9,stroke:#2d5a87,color:#fff",
    }

    diagram = """
flowchart LR
    USER["User"] --> Gradio["Gradio: chatbot_response()"]

    subgraph SQL["<b>SQL-Abfrage</b>"]
        direction TB
        schema_cache["db_schema (cached)"]
        sql_gen["sql_generator (structured output)"]
        validate["validate_sql()"]
        exec["execute_query()"]
        schema_cache --> sql_gen --> validate --> exec
    end

    subgraph Output["<b>Erstellung Output </b>"]
        direction TB
        analyze["analysis_chain"]
    end

    Gradio --> schema_cache
    Gradio --> LLM["LLM"]
    exec --> analyze
    analyze --> RESULT["Gradio: Antwort"]

    DB[(northwind.db)] -.-> |"Schema (einmalig)"| schema_cache
    exec -.-> |"SQL"| DB
    DB -.-> |"Ergebnis"| exec

    LLM -.-> sql_gen
    LLM -.-> analyze
""" + styles.get(highlight, "")

    mermaid(diagram, width=1100, height=400)

# Gesamt√ºbersicht
show_architecture()

<p><font color='black' size="5">
Programm
</font></p>

In [None]:
# ‚úÖ OPTIMIERUNG: Konsolidierte Imports (kein 're' mehr n√∂tig!)
import gradio as gr
from pydantic import BaseModel, Field
from langchain_community.utilities import SQLDatabase
from langchain.chat_models import init_chat_model
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

In [None]:
# ‚úÖ OPTIMIERUNG: Relativer Pfad (statt hardcoded /content/northwind.db)
DB_PATH = "northwind.db"
DB_URI = f"sqlite:///{DB_PATH}"

In [None]:
# LLM (Kurznotation: "provider:model")
llm = init_chat_model("openai:gpt-4o-mini", temperature=0.0)

# SQL-Datenbank initialisieren
db = SQLDatabase.from_uri(DB_URI)

# ‚úÖ OPTIMIERUNG: Schema einmalig laden und cachen
#    Das Schema √§ndert sich nicht zur Laufzeit - kein Grund es bei jedem
#    Chain-Aufruf neu zu laden.
db_schema = db.get_table_info()
print(f"Schema geladen: {len(db_schema)} Zeichen")

<p><font color='black' size="5">
SQL & Analyse Prompts
</font></p>

In [None]:
# ‚úÖ OPTIMIERUNG: Prompt braucht keine "KEINE Markdown" Anweisung mehr,
#    da with_structured_output() die Formatierung erzwingt.
sql_prompt = ChatPromptTemplate.from_messages([
    ("system", """Du bist ein SQL-Experte. Deine Aufgabe ist es, Benutzeranfragen in SQL-Abfragen zu √ºbersetzen.
Verwende die SQLite-Syntax und nur die Tabellen und Spalten aus dem bereitgestellten Schema.

Gebe neben den Id auch den Namen von Produkten, Kunden, etc. mit aus.
Gebe maximal 10 Zeilen einer Liste aus.

Bei Ja/Nein-Fragen oder Fragen, die eine Analyse erfordern (z.B. "Sind alle Artikel auf Lager?"),
erstelle eine SQL-Abfrage, die ALLE relevanten Daten zur√ºckgibt, damit eine fundierte Antwort gegeben werden kann.

KONTEXT: Ber√ºcksichtige die bisherige Gespr√§chshistorie, um Folge-Fragen korrekt zu interpretieren.
Wenn sich die aktuelle Frage auf vorherige Ergebnisse bezieht (z.B. "Und wie viele davon...", "Zeige mir mehr Details dazu"),
nutze den Kontext aus der Historie.

Datenbank-Schema:
{schema}"""),
    ("human", "{history_text}\n\nAktuelle Frage: {query}")
])

In [None]:
# Template f√ºr die Ergebnisinterpretation mit Historie
analysis_prompt = ChatPromptTemplate.from_messages([
    ("system", """Du bist ein Business-Analyst, der SQL-Abfrageergebnisse interpretiert und verst√§ndliche Antworten gibt.

Beantworte die Benutzeranfrage basierend auf den SQL-Ergebnissen.
Bei Ja/Nein-Fragen gib eine klare Antwort und erkl√§re die Gr√ºnde.
Bei Fragen nach Empfehlungen oder notwendigen Anpassungen, analysiere die Daten und gib konkrete Vorschl√§ge.

KONTEXT: Ber√ºcksichtige die bisherige Gespr√§chshistorie, um deine Antwort im Kontext zu formulieren.
Wenn dies eine Folge-Frage ist, beziehe dich auf vorherige Ergebnisse."""),
    ("human", """{history_text}

Aktuelle Benutzeranfrage: {query}
SQL-Abfrage: {sql_query}
Abfrageergebnisse:
{results}

Deine Analyse und Antwort:""")
])

<p><font color='black' size="5">
SQL-Abfrage
</font></p>

In [None]:
# ‚úÖ OPTIMIERUNG: Wiederverwendung der parametrisierten Funktion
show_architecture(highlight="sql")

In [None]:
# ‚úÖ OPTIMIERUNG: Pydantic-Model f√ºr strukturierte SQL-Ausgabe
class SQLQuery(BaseModel):
    """Strukturierte SQL-Abfrage."""
    sql: str = Field(description="Reine SQL-Abfrage (nur SELECT, ohne Markdown/Formatierung)")

# with_structured_output: LLM gibt direkt ein SQLQuery-Objekt zur√ºck
sql_llm = llm.with_structured_output(SQLQuery)

In [None]:
# ‚úÖ OPTIMIERUNG: Schema aus Cache + structured output
sql_generator = (
    RunnablePassthrough.assign(schema=lambda _: db_schema)
    | sql_prompt
    | sql_llm
)

# ‚úÖ OPTIMIERUNG: Analysis-Chain einmalig definieren (statt bei jedem Aufruf neu)
analysis_chain = analysis_prompt | llm | StrOutputParser()

In [None]:
# ‚úÖ OPTIMIERUNG: SQL-Validierung direkt in execute_query integriert
#    (statt in separatem, ungenutztem Abschnitt 6)
def validate_sql(sql_query: str) -> tuple[bool, str]:
    """Validiert eine SQL-Abfrage auf Sicherheit."""
    if not sql_query.strip().upper().startswith("SELECT"):
        return False, "Nur SELECT-Anweisungen sind erlaubt."

    dangerous_commands = ["DROP", "DELETE", "TRUNCATE", "UPDATE", "INSERT", "ALTER"]
    for command in dangerous_commands:
        if f" {command} " in sql_query.upper():
            return False, f"Unerlaubter SQL-Befehl: {command}"

    return True, "OK"


def execute_query(sql_query: str) -> str:
    """Validiert und f√ºhrt eine SQL-Abfrage aus."""
    # Sicherheitspr√ºfung vor Ausf√ºhrung
    is_valid, message = validate_sql(sql_query)
    if not is_valid:
        return f"‚ö†Ô∏è Sicherheitsfehler: {message}"

    try:
        result = db.run(sql_query)
        if not result or result.strip() == "":
            return "Keine Ergebnisse gefunden."
        return result
    except Exception as e:
        return f"Fehler bei der Ausf√ºhrung: {str(e)}"

<p><font color='black' size="5">
Erstellung Output
</font></p>

In [None]:
# ‚úÖ OPTIMIERUNG: Wiederverwendung der parametrisierten Funktion
show_architecture(highlight="output")

In [None]:
# ‚úÖ OPTIMIERUNG: Historie-Formatierung als eigene Funktion
def format_history(history) -> str:
    """Formatiert Gradio-Historie f√ºr LLM-Kontext (letzte 3 Eintr√§ge)."""
    if not history:
        return ""

    parts = []
    for i, (user_msg, bot_msg) in enumerate(history[-3:], 1):
        parts.append(f"[Vorherige Frage {i}]: {user_msg}")
        if bot_msg and "### Analyse" in bot_msg:
            analysis_part = bot_msg.split("### Analyse")[-1].strip()
            parts.append(f"[Vorherige Antwort {i}]: {analysis_part[:300]}")
    return "\n".join(parts)


# ‚úÖ OPTIMIERUNG: Nutzt vordefinierte analysis_chain (statt pro Aufruf neu)
def analyze_results(query, sql_query, results, history_text=""):
    """Analysiert die Ergebnisse und gibt eine nat√ºrlichsprachliche Antwort zur√ºck."""
    return analysis_chain.invoke({
        "query": query,
        "sql_query": sql_query,
        "results": results,
        "history_text": history_text
    })

<p><font color='black' size="5">
UI Gradio In/Out
</font></p>

In [None]:
# ‚úÖ OPTIMIERUNG: Wiederverwendung der parametrisierten Funktion
show_architecture(highlight="ui")

In [None]:
# ‚úÖ OPTIMIERUNG: Schlanker dank ausgelagerter Funktionen und structured output
def chatbot_response(message, history):
    """Verarbeitet Benutzeranfragen mit optimierter SQL-RAG Pipeline."""
    try:
        # Historie formatieren (ausgelagerte Funktion)
        history_text = format_history(history)

        # SQL generieren (structured output - kein Regex n√∂tig!)
        result = sql_generator.invoke({
            "query": message,
            "history_text": history_text
        })
        sql_query = result.sql  # Pydantic-Objekt ‚Üí sauberer String

        # Debug-Ausgabe
        print(f"Generierte SQL: {sql_query}")

        # Abfrage Datenbank (mit integrierter Validierung)
        results = execute_query(sql_query)

        # Analysiere die Ergebnisse (vordefinierte Chain)
        analysis = analyze_results(message, sql_query, results, history_text)

        # Antwort formatieren
        return f"""### Deine Anfrage
{message}

### SQL-Abfrage
```sql
{sql_query}
```

### Ergebnisse
{results}

### Analyse
{analysis}"""

    except Exception as e:
        import traceback
        error_details = traceback.format_exc()
        print(f"Fehler Details:\n{error_details}")
        return f"Ein Fehler ist aufgetreten: {str(e)}\n\nDetails siehe Console-Output."

In [None]:
# Beispielfragen f√ºr Gradio-Interface definieren
example_questions = [
    "Welche Produkte sind aktuell nicht mehr auf Lager? Nenne die Top 3.",
    "Welche Bestellung von welchem Kunden hatte den h√∂chsten Gesamtwert? Nenne die Top 3.",
    "Aus welchen L√§ndern stammen die meisten Kunden? Nenne die Top 3.",
    "Sind alle Artikel der Bestellung der Rattlesnake Canyon Grocery vom 1998-05-06 in ausreichender Anzahl auf Lager?",
]

In [None]:
# Gradio Interface erstellen
demo = gr.ChatInterface(
    fn=chatbot_response,
    title="üìö SQL RAG - Optimierte Version (LangChain 1.0+)",
    description="""**Features:**
- üí¨ **Chat-Historie**: Stelle Folge-Fragen basierend auf vorherigen Antworten
- ü§ñ **Structured Output**: SQL-Generierung √ºber `with_structured_output()` (kein Regex)
- üîí **Integrierte Validierung**: SQL-Sicherheitspr√ºfung vor jeder Ausf√ºhrung
- ‚ö° **Schema-Caching**: DB-Schema einmalig geladen (Performance)
- üìä **Intelligente Analyse**: Automatische Interpretation der Ergebnisse

""",
    examples=example_questions,
)

<p><font color='black' size="5">
Starten der App
</font></p>

**Beispiel-Fragen:**



+ Gib die Artikelliste f√ºr die Bestellung 11031 mit Einzelpreis und Gesamtpreis aus, wobei sich der Gesamtpreis aus der Anzahl und dem Einzelpreis ergibt.
+ Welcher Mitarbeiter ist f√ºr die Bestellung mit der Nummer 10266 zust√§ndig?
+ √úber welche Versandfirma wurde die Bestellung 10266 ausgeliefert?
+ Sind alle Artikel der Bestellung der Rattlesnake Canyon Grocery vom 1998-05-06 in ausreichender Anzahl auf Lager?
+ Welche Kunden haben schon Artikel der Firma 'Escargots Nouveaux' gekauft?




In [None]:
# App starten
demo.launch()


# 6 | Validierung und Sicherheit
---



Die Sicherheit ist bei der Arbeit mit datenbankgesteuerten Anwendungen von entscheidender Bedeutung. SQL RAG-Implementierungen m√ºssen folgende Sicherheitsaspekte ber√ºcksichtigen:

1. **SQL-Injection-Pr√§vention**:
    
    - Validierung und Bereinigung generierter SQL-Abfragen
    - Verwendung von parametrisierten Abfragen
    - Beschr√§nkung der SQL-Befehle (z.B. nur SELECT-Anweisungen zulassen)
2. **Zugriffskontrolle**:
    
    - Verwendung von Datenbanknutzern mit eingeschr√§nkten Rechten
    - Zugriffsbeschr√§nkungen auf bestimmte Tabellen oder Ansichten
    - Implementierung von Row-Level-Security
3. **Datenvalidierung**:
    
    - √úberpr√ºfung der generierten SQL-Abfragen auf verd√§chtige Muster
    - Begrenzung der Abfragekomplexit√§t und -l√§nge
    - Timeouts f√ºr lang laufende Abfragen


In [None]:
# ‚úÖ OPTIMIERUNG: In dieser Version ist die Validierung bereits in execute_query()
#    integriert (siehe Abschnitt 5). Hier nochmal die Standalone-Version zur Demonstration:

def validate_sql_query(sql_query):
    """Validiert eine SQL-Abfrage auf potenziell gef√§hrliche Muster."""

    # Nur SELECT-Anweisungen erlauben
    if not sql_query.strip().upper().startswith("SELECT"):
        return False, "Nur SELECT-Anweisungen sind erlaubt."

    # Keine gef√§hrlichen SQL-Befehle erlauben
    dangerous_commands = ["DROP", "DELETE", "TRUNCATE", "UPDATE", "INSERT", "ALTER"]
    for command in dangerous_commands:
        if f" {command} " in sql_query.upper():
            return False, f"Unerlaubter SQL-Befehl: {command}"

    return True, "SQL-Abfrage ist g√ºltig."

# Test mit verschiedenen Abfragen
print("SELECT-Test:", validate_sql_query("SELECT * FROM Products"))
print("DROP-Test:  ", validate_sql_query("DROP TABLE Products"))
print("DELETE-Test:", validate_sql_query("DELETE FROM Products WHERE id=1"))

Eine gr√ºndliche Validierung vor der Ausf√ºhrung ist entscheidend f√ºr die Sicherheit der Anwendung.


# 7 | Praktische Anwendungsf√§lle
---

SQL RAG eignet sich f√ºr zahlreiche praktische Anwendungsf√§lle:

1. **Business Intelligence Dashboards**:
    
    - Nat√ºrlichsprachliche Abfragen f√ºr Gesch√§ftskennzahlen
    - Dynamische Berichte basierend auf Benutzeranfragen
    - Trends und Anomalien in Daten identifizieren
2. **Datenanalyse f√ºr Nicht-Techniker**:
    
    - Erm√∂glicht Benutzern ohne SQL-Kenntnisse, komplexe Datenabfragen durchzuf√ºhren
    - Vereinfacht den Zugang zu Unternehmensdaten
3. **Automatisierte Berichterstellung**:
    
    - Generierung regelm√§√üiger Berichte basierend auf Datenabfragen
    - Intelligente Zusammenfassung und Interpretation von Gesch√§ftsdaten
4. **Kundenservice-Anwendungen**:
    
    - Schneller Zugriff auf Kundendaten f√ºr Support-Mitarbeiter
    - Automatisierte Beantwortung h√§ufiger Kundenanfragen
5. **Interne Wissensmanagement-Systeme**:
    
    - Intelligente Suche in Unternehmensdaten
    - Verkn√ºpfung verschiedener Datenquellen f√ºr umfassende Antworten

Durch die Kombination von LLMs mit Datenbankabfragen kann SQL RAG komplexe Analyseaufgaben automatisieren und den Zugang zu Daten demokratisieren.



# A | Aufgabe
---

Die Aufgabestellungen unten bieten Anregungen, Sie k√∂nnen aber auch gerne eine andere Herausforderung angehen.

Angenommen, es wird f√ºr ein kleines Unternehmen gearbeitet, das eine Kundendatenbank verwaltet. Ziel ist es, eine generative KI einzusetzen, um Anfragen in nat√ºrlicher Sprache zu verstehen und relevante Informationen aus der Datenbank abzurufen.  

**Datenbankstruktur (SQLite-Format)**  
Die Kundendatenbank enth√§lt eine Tabelle `customers.db` mit den folgenden Spalten:  

| id | name  | city    | purchases |
|----|-------|--------|-----------|
| 1  | Alice  | Berlin  | 5         |
| 2  | Bob    | Hamburg | 2         |
| 3  | Carol  | M√ºnchen | 7         |
| 4  | David  | K√∂ln    | 3         |



**Aufgabenstellung**  
1. **Abfrage erstellen**, um die Anzahl der Eink√§ufe (`purchases`) eines bestimmten Kunden anhand seines Namens abzurufen.  
2. **Python-Funktion entwickeln**, die eine GPT-API nutzt, um nat√ºrliche Sprachabfragen in SQL-Abfragen zu √ºbersetzen.  
3. **Funktion testen**, indem eine Frage wie *‚ÄûWie viele Eink√§ufe hat Alice gemacht?‚Äú* gestellt wird, woraufhin das System automatisch die entsprechende SQL-Abfrage generiert.  

