![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/genai-banner-2.jpg)

<p><font size="5" color='grey'> <b>
Snippets GenAI
</b></font> </br></p>

---

# 0 | Setup & Konfiguration
---

# 0.1 | Install Kursbibliothek 📌

In [None]:
!uv pip install --system -q git+https://github.com/ralf-42/Python_Modules

# 0.2 | Import Kursbibliothek 📌

In [None]:
from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint, install_packages
from genai_lib.chromadb_statistics import display_chromadb_statistics, export_statistics_to_json
from genai_lib.show_md import show_md

# 0.3 | Kursbibliothek - Inhalt



🛠️ utilities.py

**Umgebungs- und Setup-Funktionen:**

`check_environment()`

- Zeigt die aktuelle Python-Version an
- Listet alle installierten LangChain-Bibliotheken auf
- Unterdrückt störende Deprecation-Warnungen

`install_packages(modules)`

- Installiert Python-Module automatisch mit `uv pip install`
- Prüft vorher, ob Module bereits verfügbar sind
- Optimiert für Google Colab mit ruhiger Installation

`get_ipinfo()`

- Ruft Geoinformationen zur aktuellen öffentlichen IP-Adresse ab
- Zeigt IP, Standort, Provider und weitere Netzwerkdaten an

`setup_api_keys(key_names, create_globals=True)`

- Lädt API-Keys aus Google Colab userdata
- Setzt sie als Umgebungsvariablen und optional als globale Variablen
- Unterstützt mehrere Keys gleichzeitig (OpenAI, Anthropic, Hugging Face, etc.)

`mprint(text)`

- Gibt Text als formatiertes Markdown in Jupyter-Notebooks aus
- Nutzt IPython's `display()` und `Markdown()` für bessere Darstellung

`process_response(response)`

- Extrahiert strukturierte Informationen aus LLM-Antworten
- Parst Token-Nutzungsdaten (Prompt, Completion, Total)
- Gibt bereinigten Text und Metadaten als Dictionary zurück


---

🔍 **chromadb_statistics.py**    
Umfassendes Analysetool für ChromaDB-Vektor-Datenbanken:
* `analyze_collection(name, path)` - Analysiert einzelne Collection (Chunks, Dokumente, Quellen)
* `get_database_statistics(path)` - Erstellt Gesamtübersicht aller Collections
* `get_collection_chunks(name, path, limit)` - Ruft Chunk-Daten mit Paginierung ab
* `analyze_chunk_sizes(name, path)` - Untersucht Größenverteilung der Text-Chunks
* `search_chunks_by_source(name, path, filter)` - Filtert Chunks nach Quelldatei
* `export_statistics_to_json(path, file)` - Exportiert Statistiken als JSON
* `display_chromadb_statistics(path)` - Formatierte Konsolen-Ausgabe aller Analysen
* `compare_collections(path, names)` - Vergleicht mehrere Collections miteinander

**Anwendung**: Monitoring, Performance-Optimierung und Qualitätsanalyse von RAG-Systemen


---


🎨 show_md.py

Markdown-Display-Funktionen für Jupyter Notebooks:

- **`show_md(text, prefix)`** - Basis-Markdown-Anzeige mit optionalem Prefix
- **`show_title(text)`** - Zeigt Titel mit 💡-Emoji (`# Titel 💡`)
- **`show_subtitle(text)`** - Zeigt Untertitel (`## Untertitel`)
- **`show_info(text)`** - Info-Meldung mit ℹ️-Symbol
- **`show_warning(text)`** - Warnung mit ⚠️-Symbol
- **`show_success(text)`** - Erfolgsmeldung mit ✅-Symbol

**Anwendung**: Strukturierte und visuell ansprechende Notebook-Ausgaben

---



🎯 Typische Anwendung

```python
# 1. Umgebung prüfen und API-Keys laden
check_environment()
setup_api_keys(["OPENAI_API_KEY"])

# 2. Strukturierte Notebook-Ausgaben
show_title("Mein KI-Projekt")
show_info("Experiment gestartet")

# 3. PREPARE-Prompts erstellen
prompt = apply_prepare_framework(
    task="Erkläre maschinelles Lernen",
    role="KI-Tutor",
    tone="verständlich"
)

# 4. LLM-Antworten verarbeiten
result = process_response(llm_response)
show_success(f"Antwort erhalten: {result['tokens_total']} Tokens")
```

**Ideal für**: KI-Kurse, Jupyter-Notebooks, LangChain-Projekte, strukturierte Prompt-Engineering

# 0.4 | Umgebung einrichten 📌

In [None]:
#@title 🔧 Umgebung einrichten{ display-mode: "form" }
!uv pip install --system -q git+https://github.com/ralf-42/Python_Modules
from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint, install_packages
setup_api_keys(['OPENAI_API_KEY', 'HF_TOKEN'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()
# ---
# Bei Bedarf: Trennen zwischen Installationsname () und Importname (für Python) beide Angaben in Klammern
# install_packages([('markitdown[all]', 'markitdown'), 'langchain_chroma', ]

# 0.5 | Standard-Importe für GenAI

In [None]:
# Moderne LangChain-Imports (Version 0.2.0+)
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser

# Standard-Python-Imports
import os
from IPython.display import Markdown, display

# 0.6 | Namenskonventionen

**Empfohlene Namenskonventionen (snake_case):**

**Variablen:**
- `user_input` - Benutzereingabe
- `system_prompt` - Systemnachricht
- `chat_history` - Chatverlauf
- `model_name` - Modellname
- `temperature` - Temperatur-Parameter
- `response` - API-Antwort
- `result` - Verarbeitetes Ergebnis

**LangChain-Objekte:**
- `prompt_template` - Prompt-Vorlage
- `prompt` - Fertiger Prompt
- `llm` - Sprachmodell
- `chain` - Verarbeitungskette
- `parser` - Output-Parser

# 0.7 | Temperatur-Guidelines

**Temperatur-Richtlinien für KI-Modelle**

| Temperatur | Kategorie | Wert | Anwendungsbereich | Beschreibung |
|------------|-----------|------|-------------------|--------------|
| **Faktisch** | `factual` | 0.0 | Mathematik, Code, Datenanalyse | Deterministische Ausgaben für präzise, reproduzierbare Ergebnisse |
| **Ausgewogen** | `balanced` | 0.3 | Allgemeine Fragen, Erklärungen | Leicht variierte Antworten bei gleichbleibender Genauigkeit |
| **Kreativ** | `creative` | 0.7 | Brainstorming, Texterstellung | Vielfältige und innovative Antworten für kreative Aufgaben |
| **Sehr kreativ** | `very_creative` | 1.0 | Experimentelle Inhalte | Maximale Kreativität und Unvorhersagbarkeit |

**Verwendungshinweise**

- **Niedrige Temperatur (0.0-0.3)**: Für sachliche, präzise Antworten
- **Mittlere Temperatur (0.4-0.6)**: Für ausgewogene Kommunikation
- **Hohe Temperatur (0.7-1.0)**: Für kreative und experimentelle Ausgaben



# 1 | Erste Schritte
---

# 1.1 | Einfachster LLM-Aufruf

In [None]:
# Einfachster LLM-Aufruf
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.0)
user_input = "Erkläre mir KI in einem Satz"

# Direkter Aufruf
response = llm.invoke([HumanMessage(content=user_input)])
print(response.content)

# 1.2 | Mit System-Prompt

In [None]:
# System-Prompt mit modernem Ansatz
system_prompt = "Du bist ein hilfreicher KI-Assistent. Antworte kurz und präzise."
user_input = "Was ist Machine Learning?"

messages = [
    SystemMessage(content=system_prompt),
    HumanMessage(content=user_input)
]

response = llm.invoke(messages)
print(response.content)

# 1.3 | Streaming-Ausgabe

In [None]:
# Streaming für Echtzeit-Ausgabe
print("🤖 Antwort: ", end="")
for chunk in llm.stream([HumanMessage(content="Erzähle eine kurze Geschichte über KI")]):
    print(chunk.content, end="", flush=True)
print("\n")

# 2 | Prompts & Templates
---

# 2.1 | Einfacher String-Prompt

In [None]:
# Einfacher String-Prompt
frage = "Wer ist Albert Einstein?"
user_input = f"Du bist ein hilfreicher Assistent. Beantworte die Frage: {frage}"

# Als HumanMessage verwenden
response = llm.invoke([HumanMessage(content=user_input)])
print(f"🎯 Antwort: {response.content}")

# 2.2 | PromptTemplate

In [None]:
from langchain_core.prompts import PromptTemplate

# Prompt definieren
prompt = PromptTemplate.from_template(
    "Systemanweisung: {system_prompt}\n"
    "Benutzereingabe: {input}\n"
    "Antwort:"
)

# 2.3 | ChatPromptTemplate

In [None]:
# Modernes ChatPromptTemplate (einfache Version)
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "Du bist ein hilfreicher Assistent."),
    ("human", "{user_input}")
])

In [None]:
# Direkt mit Chain verwenden (moderne LCEL-Syntax)
chain = prompt_template | llm | StrOutputParser()
result = chain.invoke({"user_input": "Was ist Machine Learning?"})

print(f"🎯 Ergebnis: {result}")

# 2.4 | ChatPromptTemplate - History 📌

In [None]:
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

# Erweitert mit Chat-History
prompt_template = ChatPromptTemplate.from_messages([
    ("system", "{system_prompt}"),
    MessagesPlaceholder(variable_name="chat_history"),
    ("human", "{user_input}")
])

In [None]:
# Moderne Chain-Syntax
chain = prompt_template | llm | StrOutputParser()

# Ausführung mit Input-Dictionary
result = chain.invoke({
    "system_prompt": "Du bist ein Experte für Wissenschaft.",
    "chat_history": [],  # Leer für erstes Gespräch
    "user_input": "Erkläre mir die Relativitätstheorie"
})

print(f"📋 Ergebnis: {result}")

# 2.5 | FewShotPromptTemplate

In [None]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder, FewShotChatMessagePromptTemplate
from langchain_core.messages import HumanMessage, AIMessage

# Beispiele direkt als Liste von (input, output)
examples = [
    {"input": "Was ist die Hauptstadt von Frankreich?", "output": "Die Hauptstadt von Frankreich ist Paris."},
    {"input": "Wie viele Kontinente gibt es?", "output": "Es gibt sieben Kontinente."}
]

In [None]:
# Few-Shot Prompt als Nachrichtenblock
few_shot_template = FewShotChatMessagePromptTemplate.from_examples(
    examples=examples,
    example_prompt=ChatPromptTemplate.from_messages([
        ("human", "{user_input}"),
        ("ai", "{output}")
    ])
)

In [None]:
# Finales PromptTemplate mit Systemrolle, Few-Shot-Beispielen, Chat-Verlauf und neuer Eingabe
prompt = ChatPromptTemplate.from_messages([
    ("system", "{system_prompt}"),
    *few_shot.messages,
    MessagesPlaceholder(variable_name="chat_history"),
    ("human", "{user_input}")
])

# 2.6 | ChatMessagePromptTemplate

In [None]:
from langchain_core.prompts.chat import ChatMessagePromptTemplate

moderator_message_template = ChatMessagePromptTemplate(
    role="moderator",
    prompt="Bitte bleib respektvoll und höflich."
)

In [None]:
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages([
    ("system", "Du bist ein hilfreicher Assistent."),
    moderator_prompt,  # eigene Rolle
    ("human", "{user_input}")
])

# 2.7 | partial_variables

In [None]:
from langchain_core.prompts import ChatPromptTemplate

# Prompt mit zwei Variablen
template = ChatPromptTemplate.from_messages([
    ("system", "{system_prompt}"),
    ("human", "{user_input}")
])

# system_prompt wird hier "fest verdrahtet"
prompt_with_fixed_system = template.partial(system_prompt="Du bist ein KI-Experte für Geschichte.")

In [None]:
# Jetzt muss man beim .invoke() nur noch input übergeben
response = (prompt_with_fixed_system | llm | parser).invoke({
    "user_input": "Was war die Ursache des Dreißigjährigen Krieges?"
})

# 3 | Model & Chains
---

# 3.1 | Model - simple

In [None]:
from langchain_openai import ChatOpenAI

model = "gpt-4o-mini"
temperature = 0.0
llm = ChatOpenAI(model=model, temperatur=temperatur)

# Modell aufrufen
response = llm.invoke(prompt)

# 3.3 | Chain 📌

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

model = "gpt-4o-mini"
temperature = 0.0
llm = ChatOpenAI(model=model, temperature=temperature)

parser = StrOutputParser()  # Wenn noch kein eigener Parser existiert

# LCEL-Chain
chain = prompt | llm | parser

In [None]:
# Beispielhafte Eingabewerte
input_variables = {
    "system_prompt": system_prompt,
    "chat_history": history,
    "input": user_input
}

# Aufruf der Kette mit Eingabewerten
response = chain.invoke(input_variables)

In [None]:
# Historie aktualisieren
history.append(HumanMessage(content=user_input))
history.append(AIMessage(content=response.content))

# 3.4 | Konfigurationsfunktion

In [None]:
# Verschiedene LLM-Konfigurationen (moderne Syntax)
def create_llm(model_name: str = "gpt-4o-mini", temp: float = 0.0):
    """
    Erstellt ein LLM mit modernen Parametern
    """
    return ChatOpenAI(
        model=model_name,
        temperature=temp,
        max_tokens=1000,
        timeout=30,
        max_retries=2
    )

# Verschiedene Modell-Varianten
llm_creative = create_llm("gpt-4o-mini", 0.8)  # Kreativ
llm_factual = create_llm("gpt-4o-mini", 0.0)   # Faktisch
llm_balanced = create_llm("gpt-4o-mini", 0.3)  # Ausgewogen

print("🤖 LLM-Instanzen erstellt")

# 3.5 | Runnables-Methoden

Jedes Runnable unterstützt standardmäßig folgende Methoden:

1. **invoke()**: Für einzelne, synchrone Anfragen
2. **batch()**: Verarbeitet mehrere Eingaben parallel
3. **stream()**: Gibt Teilergebnisse zurück, sobald sie verfügbar sind
4. **ainvoke()**: Asynchrone Version von invoke
5. **abatch()**: Asynchrone Version von batch
6. **astream()**: Asynchrone Version von stream

# 4 | Output Parser
---

# 4.1 | Simple

In [None]:
result = {
    "text": response.content,
    "tokens_used": response.response_metadata["token_usage"]["total_tokens"]
}

# 4.2 | StrOutputParser 📌

In [None]:
from langchain_core.output_parsers.string import StrOutputParser

parser = StrOutputParser()

In [None]:
chain = prompt| llm | parser
response = chain.invoke()

# 4.3 | SimpleJsonOutputParser

In [None]:
from langchain.output_parsers import SimpleJsonOutputParser

# Nur wenn keine spezifische Struktur benötigt wird
simple_parser = SimpleJsonOutputParser()

# 4.4 | Strukturierter Output mit Pydantic

In [None]:
from pydantic import BaseModel, Field
from langchain_core.output_parsers import PydanticOutputParser

# Pydantic-Model definieren
class QuestionAnswer(BaseModel):
    question: str = Field(description="Die gestellte Frage")
    answer: str = Field(description="Die Antwort auf die Frage")
    confidence: int = Field(description="Vertrauen in die Antwort (0-100)")
    category: str = Field(description="Kategorie der Frage")

# Parser erstellen
pydantic_parser = PydanticOutputParser(pydantic_object=QuestionAnswer)

# Chain mit strukturiertem Output
structured_chain = (
    ChatPromptTemplate.from_messages([
        ("system", "Du bist ein Experte. {format_instructions}"),
        ("user", "{question}")
    ]).partial(format_instructions=pydantic_parser.get_format_instructions())
    | llm
    | pydantic_parser
)

# Testen
try:
    structured_result = structured_chain.invoke({"question": "Was ist Photosynthese?"})
    print(f"📦 Strukturiertes Ergebnis: {structured_result}")
    print(f"🎯 Antwort: {structured_result.answer}")
    print(f"📊 Vertrauen: {structured_result.confidence}%")
except Exception as e:
    print(f"❌ Pydantic-Parser Fehler: {e}")

# 5 | Chat-History & Memory
---

# 5.1 | Simple History 📌

In [None]:
# Moderne Chat-History-Verwaltung
chat_history = []

def add_to_history(user_msg: str, ai_msg: str):
    """ Fügt Nachrichten zur Chat-History hinzu """
    chat_history.extend([
        HumanMessage(content=user_msg),
        AIMessage(content=ai_msg)
    ])

# Chat-Chain mit History
history_chain = (
    ChatPromptTemplate.from_messages([
        ("system", "Du bist ein hilfreicher Assistent."),
        MessagesPlaceholder(variable_name="history"),
        ("user", "{input}")
    ])
    | llm
    | StrOutputParser()
)

# Erste Nachricht
user_input = "Mein Name ist Max"
response = history_chain.invoke({"history": chat_history, "input": user_input})
add_to_history(user_input, response)

print(f"🤖 Antwort 1: {response}")
print(f"💬 History-Länge: {len(chat_history)}")

# 5.2 | Simple History (Max=10)

In [None]:
# Chat-History mit maximal 10 Einträgen
chat_history = []

def add_to_history(user_msg: str, ai_msg: str):
    """ Fügt Nachrichten zur Chat-History hinzu und begrenzt auf 10 Einträge """
    # Neue Nachrichten hinzufügen
    chat_history.extend([
        HumanMessage(content=user_msg),
        AIMessage(content=ai_msg)
    ])

    # Auf maximal 10 Einträge begrenzen
    if len(chat_history) > 10:
        chat_history.pop(0)  # Ältesten Eintrag entfernen
        chat_history.pop(0)  # Nächsten Eintrag entfernen (damit Paare erhalten bleiben)

# Chat-Chain mit History
history_chain = (
    ChatPromptTemplate.from_messages([
        ("system", "Du bist ein hilfreicher Assistent."),
        MessagesPlaceholder(variable_name="history"),
        ("user", "{input}")
    ])
    | llm
    | StrOutputParser()
)

# Erste Nachricht
user_input = "Mein Name ist Max"
response = history_chain.invoke({"history": chat_history, "input": user_input})
add_to_history(user_input, response)

print(f"🤖 Antwort 1: {response}")
print(f"💬 History-Länge: {len(chat_history)}")

# Zweite Nachricht
user_input = "Wie ist mein  Name?"
response = history_chain.invoke({"history": chat_history, "input": user_input})
add_to_history(user_input, response)

print(f"🤖 Antwort 1: {response}")
print(f"💬 History-Länge: {len(chat_history)}")

# 6 | RAG
---

# 6.1 | Load Documents

In [None]:
# Loader-Konfiguration
loader_mapping = {
    "*.md": UnstructuredMarkdownLoader,
    "*.docx": UnstructuredWordDocumentLoader,
    "*.pdf": PyPDFLoader,
    "*.txt": UnstructuredFileLoader,  # Loader für .txt Dateien
}

# Funktion zum Laden der Dokumente
def load_documents_from_directory(directory_path):
    """Lädt Dokumente aus dem angegebenen Verzeichnis basierend auf den unterstützten Dateitypen."""
    documents = []
    for file_pattern, loader_cls in loader_mapping.items():
        loader = DirectoryLoader(directory_path, glob=file_pattern, loader_cls=loader_cls)
        documents.extend(loader.load())
    return documents

# Dokumente laden
directory_path = "/content/files"

documents = load_documents_from_directory(directory_path)

# 6.2 | Chunking

In [None]:
# Text-Splitter konfigurieren und Dokumente aufteilen
chunk_size = 900
chunk_overlap = 300

text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_overlap, chunk_overlap=chunk_overlap)
docs = text_splitter.split_documents(documents)

# 6.3 | Embedding

In [None]:
# Embeddingsmodell festlegen
embedding_model = "text-embedding-3-small"
embeddings = OpenAIEmbeddings(model=embedding_model)

# 6.4 | Vectorstore

In [None]:
# Vektordatenbank erstellen und speichern
persistent_directory = "/content/chroma_db"
vectorstore = Chroma.from_documents(docs, embeddings, persist_directory=persistent_directory)

# 6.5 | Retriever

In [None]:
# Festlegen LLM und Retriever
model_name = 'gpt-4o-mini'
temperature = 0
llm = ChatOpenAI(model=model_name, temperature=temperature)

retriever = vectorstore.as_retriever()

# 6.6 | Inference

In [None]:
rag_prompt = hub.pull("rlm/rag-prompt")

> You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.    
Question: {question}      
Context: {context}         
Answer:

In [None]:
# Aufbereitung Ergebnis Retriever
def format_documents(documents):
    return "\n\n".join(doc.page_content for doc in documents)

In [None]:
# Chat-Verlauf initialisieren
chat_history = []

chain = (
    {"context": retriever | format_documents, "question": RunnablePassthrough()}
    | rag_prompt
    | llm
    | StrOutputParser()
)

In [None]:
# Aufruf
input = "Was macht Tariq Hassan?"
response = chain.invoke(input)

# 6.7 | SQL RAG

In [None]:
# SQL-Datenbank initialisieren
DB_PATH = "/content/northwind.db"
DB_URI = f"sqlite:///{DB_PATH}"

db = SQLDatabase.from_uri(DB_URI)

In [None]:
# Erweiterten Prompt für SQL-Abfragen erstellen
prompt_template = """
Du bist ein SQL-Experte. Deine Aufgabe ist es, Benutzeranfragen in SQL-Abfragen zu übersetzen.
Verwende die SQLite-Syntax und nur die Tabellen und Spalten aus dem bereitgestellten Schema.
Schreibe NUR die SQL-Abfrage ohne Präfixe oder Kommentare.
Gebe neben den Id auch den Namen von Produkten, Kunden, etc. mit aus.
Gebe maximal 10 Zeilen einer Liste aus.

Wichtig: Bei Ja/Nein-Fragen oder Fragen, die eine Analyse erfordern (z.B. "Sind alle Artikel auf Lager?"),
erstelle eine SQL-Abfrage, die ALLE relevanten Daten zurückgibt, damit eine fundierte Antwort gegeben werden kann.
Für komplexe Fragen mit Bedingungen wie "vom 1998-05-06" oder einem bestimmten Kundennamen,
stelle sicher, dass diese Bedingungen in der WHERE-Klausel korrekt berücksichtigt werden.
Achte darauf, ob bei der Frage nach einer Id oder dem Namen von Produkten, Kunden, Unternehmen, etc. gefragt wird.

Datenbank-Schema:
{schema}

Benutzeranfrage: {query}

SQL-Abfrage:
"""

# Template für die Ergebnisinterpretation
analysis_template = """
Du bist ein Business-Analyst, der SQL-Abfrageergebnisse interpretiert und verständliche Antworten gibt.
Beantworte die Benutzeranfrage basierend auf den SQL-Ergebnissen.

Bei Ja/Nein-Fragen gib eine klare Antwort und erkläre die Gründe.
Bei Fragen nach Empfehlungen oder notwendigen Anpassungen, analysiere die Daten und gib konkrete Vorschläge.

Benutzeranfrage: {query}
SQL-Abfrage: {sql_query}
Abfrageergebnisse:
{results}

Deine Analyse und Antwort:
"""

In [None]:
# SQL erstellen
def get_schema(_):
    return db.get_table_info()

sql_generator = (
    RunnablePassthrough.assign(schema=get_schema)
    | PromptTemplate.from_template(prompt_template)
    | llm
    | StrOutputParser()
)

In [None]:
# Datenbank abfragen
def execute_query(sql_query: str) -> str:
    """Führt eine SQL-Abfrage aus und formatiert die Ergebnisse als String."""
    try:
        # Bereinige die Abfrage von eventuellen Formatierungen
        cleaned_query = sql_query.strip()

        conn = sqlite3.connect(DB_PATH)
        cursor = conn.cursor()
        cursor.execute(cleaned_query)

        # Spaltenüberschriften abrufen
        column_names = [description[0] for description in cursor.description]

        # Ergebnisse abrufen
        results = cursor.fetchall()

        # Ergebnisse formatieren
        output = "| " + " | ".join(column_names) + " |\n"
        output += "| " + " | ".join(["---" for _ in column_names]) + " |\n"

        for row in results:
            output += "| " + " | ".join([str(cell) for cell in row]) + " |\n"

        conn.close()

        # Keine Ergebnisse gefunden
        if len(results) == 0:
            return "Keine Ergebnisse gefunden."

        return output

    except Exception as e:
        return f"Fehler bei der Ausführung der Abfrage: {str(e)}\nAbfrage: {cleaned_query}"

In [None]:
# Analyse des Ergebnisses der Datenbank-Abfrage durch ein LLM
def analyze_results(query, sql_query, results):
    """Analysiert die Ergebnisse und gibt eine natürlichsprachliche Antwort zurück."""
    analysis_prompt = PromptTemplate.from_template(analysis_template)
    analysis_chain = analysis_prompt | llm | StrOutputParser()

    return analysis_chain.invoke({
        "query": query,
        "sql_query": sql_query,
        "results": results
    })

In [None]:
# Funktion für Aufruf der Kette aus Gradio
def chatbot_response(mesSQL, history):
    """Verarbeitet Benutzeranfragen, erstellt SQL und gibt formatierte Ergebnisse mit Analyse zurück."""
    try:
        # SQL-Abfrage mit LLM generieren
        sql_query = sql_generator.invoke({"query": mesSQL})

        # Bereinige eventuelles Markdown-Markup
        sql_query = re.sub(r'```sql\s*(.*?)\s*```', r'\1', sql_query, flags=re.DOTALL)
        sql_query = sql_query.replace("```", "").strip()

        # Debug-Ausgabe
        print(f"Generierte SQL: {sql_query}")

        # Führe die Abfrage aus
        results = execute_query(sql_query)

        # Analysiere die Ergebnisse für komplexe Fragen
        analysis = analyze_results(mesSQL, sql_query, results)

        # Antwort formatieren
        response = f"### Deine Anfrage\n{mesSQL}\n\n### SQL-Abfrage\n```sql\n{sql_query}\n```\n\n### Ergebnisse\n{results}\n\n### Analyse\n{analysis}"

        return response

    except Exception as e:
        return f"Ein Fehler ist aufgetreten: {str(e)}"

# 7 | Image, Audio, Video
---

![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/under_construction_dall_e_klein.png)

# 8 | Agent
---

![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/under_construction_dall_e_klein.png)

# 9 | Fine-Tuning & Local Models
---

![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/under_construction_dall_e_klein.png)