# Assistenten und Agenten

Dieser Abschnitt nennt sich ja _Assistenten und Agenten_... aber was ist das?

## Assistenten
Fangen wir mit den Assistenten an. Diese findet man unter unterschiedlichen Namen, je nachdem bei welchem Anbieter von KIs man sich befindet. So nenn man die Assistenten bei OpenAI (also ChatGPT) Custom-GPTs.
Ein Assistent ist im Grunde genommen ein Chatbot, der eine bestimmte Instruktion erhalten hat. In dieser Instruktion wird aufgeführt, was der Assisten für eine Aufgabe hat. Das ist praktisch der System-Prompt für diesen Assistenten. Häufig bekommen die Assistenten aber mehr Möglichkeiten, so sind sie häufig in der Lage Dateien auszuwerten (per RAG). Manchmal können sie auch Code erzeugen und sogar ausführen um eine Aufgabe zu lösen. So können z.B. die Assistenten bei OpenAI mit der Option "Code Interpreter" Python-Code erstellen und in einer Sandbox-Umgebung ausführen. So kann man z.B. eine CSV-Datei (und viele andere Formate) hochladen und den Assistenten bitten ein Diagramm zu erzeugen, das man dann herunterladen kann. Das Diagramm wird dann meist mithilfe von Python-Bibliotheken erstellt.

Aber wie unterscheidet sich ein Assistent von einem Agenten? Eigentlich gar nicht wirklich. Von Assistenten spricht man gerne, wenn man über eine Oberfläche den Assistenten konfigurieren kann. Es ist also praktisch ein einfacher Agent-Baukasten.

![OpenAI Assistent](bilder/openai-assistent.png)

Was hat das mit uns zu tun? Das ist doch ein "Klicki-Bunti-Tool"!!!111 Naja, das ist schon sehr nützlich für uns, denn die Assistenten können wir zum einen über API-Aufrufe ausführen und auch erstellen. D.h. wir haben hier einen sehr einfachen Weg um einen Assistenten in unsere Anwendung einzubauen. Wir müssen uns also nicht um Themen wie RAG oder Code-Ausführung Gedanken machen.



Lasst uns einen Assistenten via API erstellen und anschliessend benutzen. Du kannst anstelle die API zu nutzen auch über https://platform.openai.com/assistants einen Assistenten erstellen. Einfach einen vernünftigen Namen aussuchen und bei _Instructions_ die Aufgabe des Assistenten beschreiben. Die Tools kannst du alle deaktiviert lassen, die brauchen wir jetzt erstmal nicht. Bei Modell gerne gpt-4o auswählen. Anschliessend brauchst du nur die Assistenten-ID zu kopieren.

Das sind die _Instructions_ die ich nutze:

In [3]:
instruction = """Du bist ein Assistent, der ein absoluter Experte in Sachen agiler Softwareentwicklung ist. 
Du hilfst dem Benutzer Userstories richtig zu formulieren. Du leitest den Benutzer an und fragst nach allen fehlenden Informationen. 
Wenn alle notwendigen Angaben gesammelt wurden, formulierst du die Userstory."""

Wir fangen mit der Installation der Bibliotheken an und importieren dann ein Haufen Zeugs...

In [2]:
!pip install langchain langchain_openai langchain_community python-dotenv


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.1[0m[39;49m -> [0m[32;49m24.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Wir legen jetzt den Assistenten per API an. Falls du über die Oberfläche den Assistenten erstellt hast, dann überspringe diesen Punkt und gehe zum nächstne Code-Block.

In [10]:
import os
from dotenv import load_dotenv
from langchain_community.agents.openai_assistant.base import OpenAIAssistantV2Runnable

load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

# Die Instruction haben wir oben definiert!

userstory_assistant = OpenAIAssistantV2Runnable.create_assistant(
    name="Userstory Assistent",
    instructions=instruction,
    tools=[],
    model="gpt-4o",
)


Variante "Assistent über Oberfläche":

In [12]:
userstory_assistant = OpenAIAssistantV2Runnable(assistant_id="asst_i0sYKWJ6Xr9YWQX7RKLfBruO")

  warn_beta(


In [13]:
output = userstory_assistant.invoke({"content": "Ich brauche eine Userstory für das Anlegen eines neuen Benutzers."})
output

[Message(id='msg_eZSSR7uigMEnCtLieTNUZDmV', assistant_id='asst_i0sYKWJ6Xr9YWQX7RKLfBruO', attachments=[], completed_at=None, content=[TextContentBlock(text=Text(annotations=[], value='Gerne helfe ich dir dabei! Um eine vollständige und präzise Userstory zu formulieren, benötige ich einige zusätzliche Informationen:\n\n1. **Wer ist der Benutzer oder die Rolle?** (z.B. Administrator, Endbenutzer, Manager)\n2. **Was ist das Ziel oder die Funktionalität?** (z.B. neuen Benutzer anlegen, Benutzerprofil bearbeiten)\n3. **Was ist der Nutzen oder der Mehrwert?** (z.B. um Zugriff auf das System zu gewähren, um Benutzerrechte zu verwalten)\n4. **Gibt es spezifische Akzeptanzkriterien?** (z.B. Felder, die ausgefüllt werden müssen, Validierungen, Bestätigungen)\n5. **Gibt es besondere Anforderungen oder Einschränkungen?** (z.B. bestimmte Felder, die Pflichtfelder sind, bestimmte Benutzerrollen, die erstellt werden können)\n\nKönntest du diese Informationen bereitstellen?'), type='text')], created_a

Hinweis! Im Gegensatz zu den Chat-Endpunkt werden bei den Assistenten die Konversationen serverseitig gespeichert. Wenn du die Antwort genau studierst, dann siehst du, dass dort eine _thread\_id_ geliefert wird. Diese ID identifiziert die Konversation.

Hintergrund ist, dass wir dem Assistenten auch Dateien zur Verfügung stellen können. Da wäre es sehr ungünstig, wenn man bei jeder Frage die Dateien erneut übertragen müsste.

### Was geht noch

Den Assistenten können wir Tools an die Hand geben. Aber das sparen wir uns ein wenig auf, denn wir kommen langsam zu den Agenten. Übrigens kannst du den Assistenten oben auch als LangChain-Agent behandeln. Dazu muss man als Parameter _as_agent=True_ übergeben.
Die Agenten schauen wir uns in den folgenden Abschnitten an!