![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/genai-banner-2.jpg)

<p><font size="5" color='grey'> <b>
Modellsteuerung -und optimierung
</b></font> </br></p>

---

In [None]:
#@title 🔧 Umgebung einrichten{ display-mode: "form" }
!uv pip install --system -q git+https://github.com/ralf-42/Python_Modules
from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint, install_packages
setup_api_keys(['OPENAI_API_KEY', 'HF_TOKEN'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()
# ---
# Bei Bedarf: Trennen zwischen Installationsname () und Importname (für Python) beide Angaben in Klammern
# install_packages([('markitdown[all]', 'markitdown'), 'langchain_chroma', ]

# 1 | Intro Modellsteuerung/-optimierung
---


Die rasante Entwicklung im Bereich der künstlichen Intelligenz (KI) hat zu beeindruckenden Fortschritten bei großen Sprachmodellen (LLMs) geführt. Diese Modelle erzeugen menschenähnlichen Text, übersetzen Sprachen und beantworten komplexe Fragen. Um die gewünschten Ergebnisse zielgerichtet zu erreichen, bedarf es Verfahren zur Modellsteuerung  und -optimierung, die das Modellverhalten steuern, verbessern und an spezifische Anforderungen anpassen. Die nachfolgende Tabelle liefert eine Übersicht über Verfahren, die zur Modellsteuerung und -optimierung eingesetzt werden können.



| Nr. | Methode                        | Relevanz (★) | Technischer Aufwand  | Typische Anwendung                   | Erläuterung                                                                                     |
| :-- | :----------------------------- | :----------- | :------------------- | :----------------------------------- | :---------------------------------------------------------------------------------------------- |
| 1   | Prompt Engineering             | ★★★★★        | sehr gering          | Basis für alle LLM-Anwendungen       | Systematische Gestaltung von Eingabetexten zur Optimierung der Modellausgaben.                  |
| 2   | Few-Shot Learning              | ★★★★★        | sehr gering          | Schnelle Aufgabenanpassung           | Bereitstellung weniger Beispiele im Prompt, damit das Modell neue Aufgaben ohne Training lernt. |
| 3   | RAG (Retrieval-Augmented Gen.) | ★★★★★        | mittel               | Wissensbasierte Anwendungen          | Kombination von Informationsabruf aus externen Datenquellen mit Textgenerierung.                |
| 4   | Chain-of-Thought Prompting     | ★★★★☆        | sehr gering          | Komplexe Reasoning-Aufgaben          | Anleitung des Modells, Denkschritte explizit zu formulieren für bessere Problemlösung.          |
| 5   | API Parameter Tuning           | ★★★★☆        | sehr gering          | Optimierung von Output-Qualität      | Anpassung von Temperature, Top-p, Max-Tokens etc. zur Steuerung der Ausgabecharakteristik.      |
| 6   | Function Calling / Tool Use    | ★★★★☆        | gering               | Integration ext. Services/Daten      | Ermöglicht dem Modell, strukturierte externe Funktionen und APIs aufzurufen.                    |
| 7   | Adapter-Tuning / LoRA          | ★★★★☆        | mittel – hoch        | Effiziente Modellanpassung           | Trainiert nur kleine Adapterschichten statt des gesamten Modells für spezifische Aufgaben.      |
| 8   | LangChain / LCEL Pipelines     | ★★★★☆        | mittel               | Komplexe LLM-Anwendungsarchitekturen | Framework zur Orchestrierung komplexer LLM-Workflows und -Ketten.                               |
| 9   | Self-Consistency Prompting     | ★★★☆☆        | gering               | Verbesserung der Antwortqualität     | Mehrfache Ausführung derselben Anfrage und Auswahl der konsistentesten Antwort.                 |
| 10  | Context Engineering            | ★★★☆☆        | gering – mittel      | Strukturierung komplexer Inputs      | Strategische Anordnung und Strukturierung von Kontextinformationen im Prompt.                   |
| 11  | Multimodal Prompting           | ★★★☆☆        | gering               | Text + Bild/Audio/Video Verarbeitung | Verwendung mehrerer Eingabemodaliäten (Text, Bild, Audio) in einem Prompt.                      |
| 12  | Fine-Tuning                    | ★★★☆☆        | hoch                 | Spezialisierung auf Domain/Task      | Training des gesamten Modells auf spezifischen Daten für maximale Anpassung.                    |
| 13  | Agentic Workflows              | ★★★☆☆        | mittel – hoch        | Autonome, mehrstufige Prozesse       | Aufbau autonomer Systeme, die eigenständig Entscheidungen treffen und Aktionen ausführen.       |
| 14  | Instruction Tuning             | ★★☆☆☆        | nicht selbst machbar | Grundlegende Verhaltensanpassung     | Training auf Instruktions-Response-Paaren zur Verbesserung der Befolgung von Anweisungen.       |
| 15  | Modell-Ensemble / Routing      | ★★☆☆☆        | mittel – hoch        | Spezial-Anwendungen, Redundanz       | Kombination mehrerer Modelle oder intelligente Weiterleitung an spezialisierte Modelle.         |


<p><font color='black' size="4">
<b>Legende</b>
</font></p>

- *Relevanz:* Praktische Wichtigkeit für typische LLM-Projekte (5★ = essentiell, 1★ = Nische)
- *Technischer Aufwand*: Implementierungsaufwand und Ressourcenbedarf
- *Typische Anwendung*: Haupteinsatzgebiete der jeweiligen Methode
- *Erläuterung*: Kurze Beschreibung der Methode und ihres Zwecks

<p><font color='black' size="4">
<b>Einordnung</b>
</font></p>

+ *Einstiegsmethoden (★★★★★):* Die ersten drei Verfahren bilden das Fundament jeder KI-Anwendung und sollten zuerst beherrscht werden.

+ *Erweiterte Techniken (★★★★☆):* Verfahren 4-8 bieten erhebliche Verbesserungen bei moderatem Aufwand und sind für professionelle Anwendungen essentiell.

+ *Spezialisierte Ansätze (★★★☆☆):* Verfahren 9-13 eignen sich für spezifische Use Cases und erweiterte Optimierungen.

+ *Nischenlösungen (★★☆☆☆):* Verfahren 14-15 sind für hochspezialisierte Anwendungen oder wenn andere Methoden nicht ausreichen.

[Modellsteuerung und -optimierung](https://editor.p5js.org/ralf.bendig.rb/full/um423ggnD)

<p><font color='darkblue' size="4">
ℹ️ <b>Information</b>
</font></p>

Nachfolgend werden in einem ersten Schritt 4 Methoden näher betrachtet.

![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/Modellansteuerung.png)




# 2 | Prompt Engineering
---

Prompting ist die einfachste und direkteste Methode zur Steuerung von LLMs. Dabei wird dem Modell eine Textaufforderung, der sogenannte `Prompt`, gegeben, der die gewünschte Ausgabe beschreibt. Die Qualität der Ausgabe hängt stark von der Qualität des Prompts ab. Ein gut formulierter Prompt sollte klar, prägnant und spezifisch sein.


[Say What You See](https://artsandculture.google.com/experiment/say-what-you-see/jwG3m7wQShZngw)

<p><font color='black' size="5">
Prompt-Elemente
</font></p>

Eingabeaufforderungen bestehen in der Regel aus vier wesentlichen Elementen, die je nach Aufgabe variieren können. Die Hauptbestandteile sind:

* **Anweisungen** – Definieren die Aufgabe des Modells, entweder als Aufgabenbeschreibung oder als konkrete Handlungsanweisung.  
* **Kontext** – Liefert ergänzende Informationen, um das Modell bei der Bearbeitung zu unterstützen.  
* **Eingabedaten** – Enthalten die spezifischen Informationen, zu denen eine Antwort generiert werden soll.  
* **Ausgabeindikator** – Signalisiert den Übergang zur erwarteten Modellantwort.  

Weitere Beispiele zur Anwendung dieser Struktur folgen später.

Nachfolgend ein Beispiel für eine Eingabeaufforderung zur Erstellung einer Produktzusammenfassung.

```
Fassen Sie die folgende Produktbewertung in einem Satz zusammen:
Produkt: Intelligente digitale Personenwaage für Körpergewicht, Fett, BMI, Muskelmassezusammensetzung
Produktbewertung: Diese Waage ist fantastisch! Der Einrichtungsvorgang war schnell und einfach und
dauerte nur wenige Minuten. Ich konnte die App kostenlos auf mein etwas veraltetes iPhone 8
herunterladen. Die Funktion, bei der Ihr Gewicht sofort mit der App synchronisiert wird, macht die
Nachverfolgung mühelos. Die Funktionen zur Essensplanung und Kalorienzählung der App sind unglaublich
benutzerfreundlich. Ich bin absolut begeistert! Außerdem hat die Waage ein elegantes, modernes
Erscheinungsbild, das wirklich attraktiv ist.


Zusammenfassung: ...
```

Diese Eingabeaufforderung erzeugt möglicherweise die folgende Ausgabe:

```
Die intelligente digitale Personenwaage wird für ihre schnelle Einrichtung, die einfache
Synchronisierung mit ihrer App auf älteren Telefonen zur mühelosen Nachverfolgung, die
benutzerfreundlichen Funktionen zur Essensplanung und Kalorienzählung sowie ihr schlankes, modernes
Design hoch gelobt.
```

<p><font color='black' size="5">
Code-Beispiel
</font></p>

In [None]:
from openai import OpenAI, chat

client = OpenAI()

user_input = """
Fassen Sie die folgende Produktbewertung in einem Satz zusammen:
Produkt: Intelligente digitale Personenwaage für Körpergewicht, Fett, BMI, Muskelmassezusammensetzung
Produktbewertung: Diese Waage ist fantastisch! Der Einrichtungsvorgang war schnell und einfach und
dauerte nur wenige Minuten. Ich konnte die App kostenlos auf mein etwas veraltetes iPhone 8
herunterladen. Die Funktion, bei der Ihr Gewicht sofort mit der App synchronisiert wird, macht die
Nachverfolgung mühelos. Die Funktionen zur Essensplanung und Kalorienzählung der App sind unglaublich
benutzerfreundlich. Ich bin absolut begeistert! Außerdem hat die Waage ein elegantes, modernes
Erscheinungsbild, das wirklich attraktiv ist.
"""

completion = chat.completions.create(
  model="gpt-4o-mini",
  messages=[
    {"role": "system", "content": "Du bist ein hilfreicher KI-Assistent."},
    {"role": "user", "content": user_input}
  ]
)

mprint('## 🤖 KI:')
mprint(completion.choices[0].message.content)

# 3 | Context Engineering
---

**Context Engineering** erweitert das klassische Prompting, indem nicht nur eine einzelne Eingabe formuliert wird, sondern der *gesamte Kontext* der Kommunikation mit dem Modell bewusst gestaltet wird.

**Ziel:**
Durch präzise Steuerung von Systemnachricht, Rollen, Beispiel-Dialogen, Formatvorgaben oder eingebetteten Informationen kann das Modell *konsistenter*, *zielgerichteter* und *nachvollziehbarer* antworten.



**Typische Elemente des Kontext-Engineerings:**

| Element            | Beschreibung                                                                 |
|--------------------|------------------------------------------------------------------------------|
| **Systemrolle**     | Definiert die grundsätzliche Identität oder Aufgabe des Modells             |
| **Beispiel-Prompts**| Demonstrieren erwartete Eingabe-/Ausgabeformate                             |
| **Formatvorgaben**  | Regeln zur Antwortstruktur (z. B. JSON, Bullet-Points, Markdown etc.)       |
| **Dynamische Daten**| Integration von Nutzerprofil, Session-Kontext, Wissensdatenbanken etc.     |



**Unterschied zu klassischem Prompting**

| Klassisches Prompting                | Context Engineering                                       |
|-------------------------------------|-----------------------------------------------------------|
| „Antworte als Medizinexperte.“     | Strukturierter Kontext: Rolle, Regeln, Beispiele, Daten   |
| Einzeiliger Prompt                  | Mehrteiliger, kontextreicher Input                        |
| Manuell formuliert                  | Automatisiert, modular, oft per Tool gesteuert            |

---

**Beispiel (mit System- und Nutzerrolle):**

```json
[
  {"role": "system", "content": "Du bist ein rechtssicherer KI-Assistent für Medizinrecht. Antworte immer in vollständigen Sätzen mit Quellenangabe."},
  {"role": "user", "content": "Welche Aufbewahrungsfrist gilt für Röntgenbilder in Deutschland?"}
]


# 4 | Retrieval-Augmented Generation
---

RAG (Retrieval-Augmented Generation) ist eine **hybride Methode**, die die Stärken von **LLMs** mit denen von **Information-Retrieval-Systemen** **kombiniert**. Dabei greift das LLM auf llm-externe Wissensdatenbanken zu, um seine Antworten zu verbessern und die Probleme von Halluzinationen und veralteten Informationen zu mindern.

**Funktionsweise:**

+ Der Benutzer gibt eine Anfrage in das RAG-System ein.
+ Das System sucht in externe Wissens nach relevanten Informationen.
+ Die relevanten Informationen werden dem LLM als Kontext bereitgestellt.
+ Das LLM generiert eine Antwort basierend auf der Anfrage **und** dem Kontext.


**Einsatzszenarien:**

RAG eignet sich besonders für Aufgaben, die aktuelle oder domänenspezifische Informationen erfordern, wie z. B.:

+ Kundensupport mit Zugriff auf Produktdatenbanken
+ Medizinische Diagnose mit Zugriff auf aktuelle Forschungsergebnisse
+ Finanzplanung mit Zugriff auf Marktdaten
+ Beantwortung von Fragen zu Unternehmensinformationen



# 5 | Fine-Tuning
---

Fine-Tuning ist eine Methode, bei der ein bereits **trainiertes LLM** auf einer kleineren, **aufgabenspezifischen** Datenmenge weiter trainiert wird. Dadurch kann das Modell an **spezifische** **Anforderungen** angepasst und seine Leistung für diese Aufgaben verbessert werden.

**Funktionsweise:**

+ Ein vortrainiertes LLM wird ausgewählt.
+ Eine aufgabenspezifische Datenmenge wird vorbereitet.
+ Das LLM wird auf dieser Datenmenge trainiert.
+ Die Parameter des LLM werden angepasst, um die Leistung für die spezifische Aufgabe zu optimieren.


**Einsatzszenarien:**

Fine-Tuning eignet sich besonders für Aufgaben, die eine hohe Genauigkeit und **Domänenspezialisierung** erfordern, wie z. B.:

+ fachlich spezialisierte LLMs (Recht, Medizin, ...)
+ Sentimentanalyse
+ Textklassifizierung
+ Spam-Erkennung
+ Personalisierte Kundeninteraktionen




# 6 | Entscheidungskriterien
---

Die Wahl der geeigneten Methode hängt von verschiedenen Faktoren ab, darunter:

[Modellsteuerung Decision Matrix](https://editor.p5js.org/ralf.bendig.rb/full/xb3zPgRSr)


| Kriterium               | Prompt Engineering | Context Engineering | RAG | Fine-Tuning |
|-------------------------|-----------|---------------------|-----|-------------|
| **Komplexität**         | Niedrig<br><br>Die Implementierung ist <br>einfach und erfordert keine <br>Änderungen am Modell. | Mittel<br><br>Benötigt durchdachte<br>Strukturierung des Kontexts<br>und ggf. Framework-Einsatz. | Mittel<br><br>RAG erfordert die Integration<br>von Retrieval-Mechanismen<br>und einer Wissensdatenbank. | Hoch<br><br>Fine-Tuning beinhaltet<br>einen komplexeren Prozess<br>des weiteren Trainings. |
| **Effizienz**           | Hoch<br><br>Prompting ermöglicht eine<br>schnelle und flexible<br>Interaktion mit dem Modell. | Hoch<br><br>Effizient bei wiederverwendbaren<br>Kontextbausteinen und Rollenstrukturen. | Mittel<br><br>RAG benötigt zusätzliche<br>Schritte für den Datenabruf,<br>was die Effizienz mindert. | Niedrig<br><br>Fine-Tuning ist rechen-<br>intensiv und zeitaufwendig. |
| **Genauigkeit**         | Niedrig<br><br>Die Genauigkeit hängt stark<br>von der Qualität des<br>Prompts ab. | Mittel<br><br>Höhere Genauigkeit durch<br>strukturierte Kontexte und<br>Beispiele. | Mittel<br><br>RAG bietet höhere<br>Genauigkeit durch externe<br>Informationen. | Hoch<br><br>Führt zu höherer<br>Genauigkeit bei<br>spezifischen Aufgaben. |
| **Flexibilität**        | Hoch<br><br>Sehr flexibel und für<br>verschiedene Aufgaben<br>einsetzbar. | Hoch<br><br>Erlaubt modulare, kontext-<br>abhängige Anpassung<br>ohne Modelländerung. | Mittel<br><br>Flexibler als Fine-Tuning,<br>aber weniger flexibel als<br>Prompting. | Niedrig<br><br>Ist auf bestimmte Aufgaben<br>spezialisiert und weniger<br>anpassungsfähig. |
| **Ressourcen-<br>bedarf** | Niedrig<br><br>Benötigt nur minimale<br>Ressourcen für die<br>Ausführung. | Niedrig–Mittel<br><br>Abhängig von der<br>Komplexität der Kontextsteuerung. | Mittel<br><br>Ressourcen für Datenbank-<br>verwaltung und Retrieval<br>erforderlich. | Hoch<br><br>Erfordert erhebliche<br>Rechenleistung und Zeit<br>für Training. |
| **Datenbedarf**         | Niedrig<br><br>Keine zusätzlichen<br>Trainingsdaten<br>erforderlich. | Niedrig<br><br>Evtl. strukturierte<br>Beispiele oder Metadaten. | Mittel<br><br>Benötigt Wissensdatenbank<br>mit relevanten<br>Informationen. | Hoch<br><br>Benötigt große Mengen an<br>spezifischen<br>Trainingsdaten. |
| **Beschreibung**        | Einfache Methode mit<br>Textanweisungen für das<br>Modell. | Strukturierte Gestaltung<br>von Rollen, Kontext, Beispielen<br>und Regeln für bessere<br>Steuerbarkeit. | Kombination von LLMs mit<br>Information-Retrieval-<br>Systemen. | Weiteres Training des<br>Modells auf spezifischen<br>Datensätzen. |


