# Wie generieren wir Texte mit LLMs?

Hier nutzen wir die OpenAI API, um Anfragen zu senden und LLM (GPT 4.1-mini) Antworten von OpenAI zu erhalten.
Wir verwenden die Langchain-Klasse AzureOpenAI, um diese Interaktion zu verwalten. Der Prozess ist dann äußerst einfach:

Wir generieren eine Input-Prompt und verwenden die "invoke" Methode der AzureOpenAI Klasse.

Beachten Sie, dass jedes LLM eine begrenzte Kontextlänge hat, die den maximalen Input und Output begrenzt, den es verarbeiten kann. Wenn der generierte Output also zu lang wird, wird die Antwort abgeschnitten. Dies ist ein allgemeines Problem, das auf viele Arten angegangen werden kann - die einfachste davon ist der Versuch, Prompt Engineering zu nutzen, um (die meisten) dieser Fälle zu verhindern.

In [1]:
from IPython.display import Markdown, display  # for displaying markdown
from langchain_openai import AzureChatOpenAI   # get the AzureOpenAI class

In [10]:
def get_chat_generator(model_name = "gpt-4.1-mini"):
    return AzureChatOpenAI(model=model_name, temperature=0.0)

In [11]:
input_prompt = "Write someting."

In [12]:
chat_generator = get_chat_generator("gpt-4.1-mini")

In [None]:
response = chat_generator.invoke(input_prompt)
display(Markdown(response.content))

Bis jetzt machen wir keine "retrieval augmented generation":

In [None]:
input_prompt = "Explain the what the Whisper technology by Bürkert Fluid Control Systems GmbH is. If you don't know the answer, say that you don't know."
response = chat_generator.invoke(input_prompt)
display(Markdown(response.content))

# Tasks

Aufgabe 1.1: Vergleichen Sie 4.1-mini und das größere 4-o-Modell - sehen Sie einen Unterschied?

Aufgabe 1.2: Wenn alles in der obigen Zelle funktioniert, sollte das Modell Ihnen mitteilen, dass es es nicht weiß. Wissen Sie warum?

Aufgabe 1.3: Wie können Sie den Prompt ändern, um das Modell zum Halluzinieren zu bringen? Welche anderen Möglichkeiten fallen Ihnen ein, um das Auftreten einer Halluzination in einer Antwort zu verhindern oder anzuzeigen?

Aufgabe 1.4 (etwas fortgeschrittener): Wie können Sie die obige Generierung Retrieval-augmentiert gestalten? Denken Sie an eine super einfache und manuelle Methode.

Aufgabe 1.5 (falls Sie sich langweilen): Können Sie den Vektorstore aus dem vorherigen Notebook verwenden, um ein einfaches RAG-System unter Verwendung der obigen Funktionen zu implementieren?
