![My Image](https://raw.githubusercontent.com/ralf-42/Image/main/genai-banner-2.jpg)

<p><font size="5" color='grey'> <b>
Grundlagen Modellansteuerung
</b></font> </br></p>

---

In [None]:
#@title
#@markdown   <p><font size="4" color='green'>Umgebung einrichten</font> </br></p>
!uv pip install --system --prerelease allow -q git+https://github.com/ralf-42/genai_lib
from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint
setup_api_keys(['OPENAI_API_KEY', 'HF_TOKEN'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()

# 1 | √úberblick
---


Die rasante Entwicklung im Bereich der k√ºnstlichen Intelligenz (KI) hat zu beeindruckenden Fortschritten bei gro√üen Sprachmodellen (LLMs) gef√ºhrt. Diese Modelle k√∂nnen menschen√§hnlichen Text generieren, Sprachen √ºbersetzen und komplexe Fragen beantworten. Doch wie genau steuert man diese Modelle, um die gew√ºnschten Ergebnisse zu erzielen? In diesem Modul werden drei g√§ngige Methoden der Modellansteuerung untersucht: Prompting, Retrieval-Augmented Generation (RAG) und Fine-Tuning.



<img src="https://raw.githubusercontent.com/ralf-42/Image/main/rag_klein.jpg" width="500
" alt="Avatar">

üîÑ **1. Prompting**

* **Was passiert?**    
  Das Modell wird **nicht ver√§ndert**, sondern durch **clever gestaltete Eingaben** (Prompts) zu einer gew√ºnschten Leistung gebracht.

* **Modellanpassung?**   
  ‚úÖ *indirekte, tempor√§re Anpassung*   
  ‚ùå *keine √Ñnderung des Modells selbst*

* **Beispiel:**
  *‚ÄûDu bist ein Experte f√ºr Medizinrecht. Antworte nur mit rechtlich abgesicherten Aussagen.‚Äú*

* **Vorteil:** Schnell, flexibel, keine Trainingskosten

* **Nachteil:** Begrenzte Steuerbarkeit, kein echtes ‚ÄûLernen‚Äú





üìö **2. RAG (Retrieval-Augmented Generation)**

* **Was passiert?**   
  Das Modell bekommt Zugriff auf externe Wissensquellen (z.‚ÄØB. PDF, Datenbank, Vektorensuche) ‚Äì diese Infos werden **zur Laufzeit in den Prompt eingef√ºgt**.

* **Modellanpassung?**   
  ‚úÖ *strukturelle Anpassung durch Architektur*   
  ‚ùå *Modell selbst bleibt unver√§ndert*

* **Beispiel:**   
  Eine Frage zu internen Firmenrichtlinien wird durch Retrieval aus dem Firmen-Wiki beantwortet.

* **Vorteil:** Aktuelle & dom√§nenspezifische Infos, ohne das Modell zu ver√§ndern

* **Nachteil:** Qualit√§t h√§ngt stark von der Dokumentenstruktur und Vektorsuche ab





üß† **3. Fine-Tuning (Nachtraining auf Basisdaten)**

* **Was passiert?**   
  Das Modell wird mit eigenen Beispielen **nachtrainiert**, um z.‚ÄØB. den Tonfall, Fachsprache oder Verhalten gezielt zu √§ndern.

* **Modellanpassung?**   
  ‚úÖ *tiefe, permanente Modellanpassung*   
  üõ†Ô∏è *reelles ‚ÄûLernen‚Äú auf Parameter-Ebene*

* **Beispiel:**   
  Ein Modell wird mit tausenden juristischen F√§llen nachtrainiert, um bessere Schrifts√§tze zu erzeugen.

* **Vorteil:** Sehr genaue Steuerung m√∂glich, konsistentes Verhalten

* **Nachteil:** Aufw√§ndig, teuer, ben√∂tigt viele Daten + GPU-Ressourcen




| Technik         | Modellparameter<br> ge√§ndert? | Anpassungstiefe        | Beispiel                           |
| --------------- | ------------------------- | ---------------------- | ---------------------------------- |
| **Prompting**   | ‚ùå nein                    | leicht (oberfl√§chlich) | Rollenanweisung im Prompt          |
| **RAG**         | ‚ùå nein                    | mittel (strukturell)   | Infos aus PDF automatisch einf√ºgen |
| **Fine-Tuning** | ‚úÖ ja                      | tief (parametrisch)    | Modell kennt neue Fachbegriffe     |


# 2 | Prompting
---

Prompting ist die einfachste und direkteste Methode zur Steuerung von LLMs. Dabei wird dem Modell eine Textaufforderung, der sogenannte `Prompt`, gegeben, der die gew√ºnschte Ausgabe beschreibt. Die Qualit√§t der Ausgabe h√§ngt stark von der Qualit√§t des Prompts ab. Ein gut formulierter Prompt sollte klar, pr√§gnant und spezifisch sein.


[Say What You See](https://artsandculture.google.com/experiment/say-what-you-see/jwG3m7wQShZngw)

<p><font color='black' size="5">
Prompt-Elemente
</font></p>

Eingabeaufforderungen bestehen in der Regel aus vier wesentlichen Elementen, die je nach Aufgabe variieren k√∂nnen. Die Hauptbestandteile sind:

* **Anweisungen** ‚Äì Definieren die Aufgabe des Modells, entweder als Aufgabenbeschreibung oder als konkrete Handlungsanweisung.  
* **Kontext** ‚Äì Liefert erg√§nzende Informationen, um das Modell bei der Bearbeitung zu unterst√ºtzen.  
* **Eingabedaten** ‚Äì Enthalten die spezifischen Informationen, zu denen eine Antwort generiert werden soll.  
* **Ausgabeindikator** ‚Äì Signalisiert den √úbergang zur erwarteten Modellantwort.  

Weitere Beispiele zur Anwendung dieser Struktur folgen sp√§ter.

Nachfolgend ein Beispiel f√ºr eine Eingabeaufforderung zur Erstellung einer Produktzusammenfassung.

```
Fassen Sie die folgende Produktbewertung in einem Satz zusammen:
Produkt: Intelligente digitale Personenwaage f√ºr K√∂rpergewicht, Fett, BMI, Muskelmassezusammensetzung
Produktbewertung: Diese Waage ist fantastisch! Der Einrichtungsvorgang war schnell und einfach und
dauerte nur wenige Minuten. Ich konnte die App kostenlos auf mein etwas veraltetes iPhone 8
herunterladen. Die Funktion, bei der Ihr Gewicht sofort mit der App synchronisiert wird, macht die
Nachverfolgung m√ºhelos. Die Funktionen zur Essensplanung und Kalorienz√§hlung der App sind unglaublich
benutzerfreundlich. Ich bin absolut begeistert! Au√üerdem hat die Waage ein elegantes, modernes
Erscheinungsbild, das wirklich attraktiv ist.


Zusammenfassung: ...
```

Diese Eingabeaufforderung erzeugt m√∂glicherweise die folgende Ausgabe:

```
Die intelligente digitale Personenwaage wird f√ºr ihre schnelle Einrichtung, die einfache
Synchronisierung mit ihrer App auf √§lteren Telefonen zur m√ºhelosen Nachverfolgung, die
benutzerfreundlichen Funktionen zur Essensplanung und Kalorienz√§hlung sowie ihr schlankes, modernes
Design hoch gelobt.
```

<p><font color='black' size="5">
Code-Beispiel
</font></p>

In [None]:
from openai import OpenAI, chat

client = OpenAI()

user_input = """
Fassen Sie die folgende Produktbewertung in einem Satz zusammen:
Produkt: Intelligente digitale Personenwaage f√ºr K√∂rpergewicht, Fett, BMI, Muskelmassezusammensetzung
Produktbewertung: Diese Waage ist fantastisch! Der Einrichtungsvorgang war schnell und einfach und
dauerte nur wenige Minuten. Ich konnte die App kostenlos auf mein etwas veraltetes iPhone 8
herunterladen. Die Funktion, bei der Ihr Gewicht sofort mit der App synchronisiert wird, macht die
Nachverfolgung m√ºhelos. Die Funktionen zur Essensplanung und Kalorienz√§hlung der App sind unglaublich
benutzerfreundlich. Ich bin absolut begeistert! Au√üerdem hat die Waage ein elegantes, modernes
Erscheinungsbild, das wirklich attraktiv ist.
"""

completion = chat.completions.create(
  model="gpt-4o-mini",
  messages=[
    {"role": "system", "content": "Du bist ein hilfreicher KI-Assistent."},
    {"role": "user", "content": user_input}
  ]
)

mprint('## ü§ñ KI:')
mprint(completion.choices[0].message.content)

# 3 | Retrieval-Augmented Generation
---

RAG (Retrieval-Augmented Generation) ist eine **hybride Methode**, die die St√§rken von **LLMs** mit denen von **Information-Retrieval-Systemen** **kombiniert**. Dabei greift das LLM auf llm-externe Wissensdatenbanken zu, um seine Antworten zu verbessern und die Probleme von Halluzinationen und veralteten Informationen zu mindern.

**Funktionsweise:**

+ Der Benutzer gibt eine Anfrage in das RAG-System ein.
+ Das System sucht in externe Wissens nach relevanten Informationen.
+ Die relevanten Informationen werden dem LLM als Kontext bereitgestellt.
+ Das LLM generiert eine Antwort basierend auf der Anfrage **und** dem Kontext.


**Einsatzszenarien:**

RAG eignet sich besonders f√ºr Aufgaben, die aktuelle oder dom√§nenspezifische Informationen erfordern, wie z. B.:

+ Kundensupport mit Zugriff auf Produktdatenbanken
+ Medizinische Diagnose mit Zugriff auf aktuelle Forschungsergebnisse
+ Finanzplanung mit Zugriff auf Marktdaten
+ Beantwortung von Fragen zu Unternehmensinformationen



# 4 | Fine-Tuning
---

Fine-Tuning ist eine Methode, bei der ein bereits **trainiertes LLM** auf einer kleineren, **aufgabenspezifischen** Datenmenge weiter trainiert wird. Dadurch kann das Modell an **spezifische** **Anforderungen** angepasst und seine Leistung f√ºr diese Aufgaben verbessert werden.

**Funktionsweise:**

+ Ein vortrainiertes LLM wird ausgew√§hlt.
+ Eine aufgabenspezifische Datenmenge wird vorbereitet.
+ Das LLM wird auf dieser Datenmenge trainiert.
+ Die Parameter des LLM werden angepasst, um die Leistung f√ºr die spezifische Aufgabe zu optimieren.


**Einsatzszenarien:**

Fine-Tuning eignet sich besonders f√ºr Aufgaben, die eine hohe Genauigkeit und **Dom√§nenspezialisierung** erfordern, wie z. B.:

+ fachlich spezialisierte LLMs (Recht, Medizin, ...)
+ Sentimentanalyse
+ Textklassifizierung
+ Spam-Erkennung
+ Personalisierte Kundeninteraktionen




# 5 | Entscheidungskriterien
---

Die Wahl der geeigneten Methode h√§ngt von verschiedenen Faktoren ab, darunter:


| Kriterium | Prompting | RAG | Fine-Tuning |
|-----------|-----------|-----|-------------|
| **Komplexit√§t** | Niedrig<br><br>Die Implementierung ist <br>einfach und erfordert keine <br>√Ñnderungen am Modell. | Mittel<br><br>RAG erfordert die Integration<br>von Retrieval-Mechanismen<br>und einer Wissensdatenbank. | Hoch<br><br>Fine-Tuning beinhaltet<br>einen komplexeren Prozess<br>des weiteren Trainings. |
| **Effizienz** | Hoch<br><br>Prompting erm√∂glicht eine<br>schnelle und flexible<br>Interaktion mit dem Modell. | Mittel<br><br>RAG ben√∂tigt zus√§tzliche<br>Schritte f√ºr den Datenabruf,<br>was die Effizienz mindert. | Niedrig<br><br>Fine-Tuning ist rechen-<br>intensiv und zeitaufwendig. |
| **Genauigkeit** | Niedrig<br><br>Die Genauigkeit h√§ngt stark<br>von der Qualit√§t des<br>Prompts ab. | Mittel<br><br>RAG bietet h√∂here<br>Genauigkeit durch externe<br>Informationen. | Hoch<br><br>F√ºhrt zu h√∂herer<br>Genauigkeit bei<br>spezifischen Aufgaben. |
| **Flexibilit√§t** | Hoch<br><br>Sehr flexibel und f√ºr<br>verschiedene Aufgaben<br>einsetzbar. | Mittel<br><br>Flexibler als Fine-Tuning,<br>aber weniger flexibel als<br>Prompting. | Niedrig<br><br>Ist auf bestimmte Aufgaben<br>spezialisiert und weniger<br>anpassungsf√§hig. |
| **Ressourcen-<br>bedarf** | Niedrig<br><br>Ben√∂tigt nur minimale<br>Ressourcen f√ºr die<br>Ausf√ºhrung. | Mittel<br><br>Ressourcen f√ºr Datenbank-<br>verwaltung und Retrieval<br>erforderlich. | Hoch<br><br>Erfordert erhebliche<br>Rechenleistung und Zeit<br>f√ºr Training. |
| **Datenbedarf** | Niedrig<br><br>Keine zus√§tzlichen<br>Trainingsdaten<br>erforderlich. | Mittel<br><br>Ben√∂tigt Wissensdatenbank<br>mit relevanten<br>Informationen. | Hoch<br><br>Ben√∂tigt gro√üe Mengen an<br>spezifischen<br>Trainingsdaten. |
| **Beschreibung** | Einfache Methode mit<br>Textanweisungen f√ºr das<br>Modell. | Kombination von LLMs mit<br>Information-Retrieval-<br>Systemen. | Weiteres Training des<br>Modells auf spezifischen<br>Datens√§tzen. |

