# KI Agenten - Workshop

## Worum geht es und was haben wir vor?

KI Agenten sind laut vielen Experten das nächste große Ding in Sachen KIs. Ganz unabhängig davon, ob das stimmt, können (autonome) KI Agenten hilfreich sein und es lohnt sich, sich damit auseinander zu setzen.
Meiner Einschätzung nach erweitern KI Agenten das Spektrum an Werkzeugen, die man zum Lösen von Aufgaben benötigt. Diese ermöglichen auch Aufgaben zu löschen, die zuvor eigentlich nicht automatisierbar waren.

Dennoch, bei aller Euphorie, muss man sagen, dass Stand jetzt autonome Agenten noch in den Kinderschuhen stecken und häufig Fehler begehen. Komplexe Aufgaben sind also noch in weiter Ferne.

Heute schauen wir uns an, wie man Agenten erstellt und wozu sie gut sein könnten. Wir beginnen mit sehr einfachen Formen und steigern uns dann und setzen das Agentenframework LangGraph ein.


## Was sind denn Agenten überhaupt?

Die Definitionen, was ein Agent ist, gehen wie so oft stark auseinander. Wo sich die meisten jedoch einig sind, ist dass wenn man der KI Werkzeuge zur Verfügung stellt und die KI selbst entscheidet, wann sie diese Werkzeuge einsetzen möchte, die erste Stufe eines Agenten erreicht ist.
Es gibt aber je nach Definition auch Agenten ohne Werkzeuge, also z.B. Agenten, die durch Prompting-Techniken erzeugt werden. 

Meist weist man einem Agenten eine Rolle zu, z.B. Organisator, Qualitätssicherer, Coder usw. Der Hintergrund ist der, dass Sprachmodelle häufig besser performen, wenn man sie in eine Rolle versetzt. In Agentensystemen, hat man also meist ein paar Agenten mit unterschiedlichen Rollen.
In diesen Systemen tauschen die Agenten Daten aus, sei es dadurch, dass sie einen Prompt mit allen notwenigen Informationen bekommen und die Antwort wird z.B. einen anderen Agenten übergeben, oder z.B. durch einen gemeinsamen Speicher, auf den jeder Agent Zugriff hat.

Gibt man einer KI die Möglichkeit Werkzeuge zu nutzen, läuft das häufig so ab, dass die KI die Ausführung anfragt und jemand oder etwas führt das Werkzeug aus und übergibt das Ergebnis wiederum an die KI, die dann damit arbeiten kann. D.h. die KI kann nicht einfach selbst etwas ausführen. Allerings bieten Agentensysteme die Möglichkeit an, dass diese Tool-Anfragen automatisch ausgeführt werden, ohne dass ein Mensch die Ausführung genehmigen muss oder gar selbst ausführen muss. Hier sprechen wir dann von *autonomen* Agenten. Häufig kombiniert man das aber mit _Human-In-The-Loop_ Ansätzen. D.h. bei kritischen Ausführungen wird ein Mensch erstmal um Erlaubnis gebeten. Auch wird das genutzt um z.B. zu entscheiden, wie etwas weitergehen soll, im Sinne von entweder Weg A, B oder C z.B. Oder um weitere Informationen abzufragen.

Bei Systemen mit mehreren Agenten kann man für jeden Agent unterschiedliche Modelle verwenden. So kann man für jede Aufgabe das beste Modell auswählen. Während z.B. der Organisator-Agent ein Modell einsetzt, das gut logisch kombinieren kann, setzt der Coder ein Modell ein, das besonders gut Code produzieren kann.




## Es wird Zeit anzufangen...

Starten wir mit einer sehr knappen und schnellen LangChain-Einführung. Ach ja, dieser Workshop nutzt Python. In der Welt der KIs und Datascience ist Python quasi die Standardsprache. Keine Sorge... wenn du irgendeine andere Programmiersprache kannst, wie Java, TypeScript, C# usw. kannst, dann wird es für dich kein großes Problem sein Python zu verstehen und anzuwenden. Da der Workshop voll mit Beispielen ist, sollte das Meiste was man braucht irgendwo zu sehen sein.

### Was ist LangChain?
LangChain ist ein Framework um programmatisch mit KIs zu kommunizieren. In seiner einfachsten Form ist es eine einheitliche API für alle möglichen Sprachmodelle. Zusätzlich bietet es zahlreiche Utilities und Helferlein für alle erdenklichen Aufgaben rund um das Thema KI. Der Vorteil bei der Nutzung von solchen Frameworks ist, dass man sich weniger stark an den Anbieter von dem jeweiligen KI-Modells bindet, die ja meist ihre eigenen APIs anbieten. So kann man sehr leicht bestehenden Code auf ein anderes Modell jagen, ohne dabei viel anpassen zu müssen.

Wenn du dich selber ein wenig Schlau machen möchtest, so findest du hier eine Einführungsseite für LangChain: https://python.langchain.com/v0.2/docs/introduction/

![LangChain Stack](https://python.langchain.com/v0.2/svg/langchain_stack_dark.svg)


## Übung #1 - Installation und erster Aufruf
Damit wir loslegen können, müssen wir zunächst alles was wir brauchen installieren. In der Python-Welt übernimmt das häufig der Paket-Manager `pip`.
Als erstes brauchen wir natürlich LangChain selbst.

In [4]:
!pip install langchain langchain_openai python-dotenv

Collecting langchain_openai
  Downloading langchain_openai-0.1.9-py3-none-any.whl.metadata (2.5 kB)
Collecting openai<2.0.0,>=1.26.0 (from langchain_openai)
  Downloading openai-1.35.3-py3-none-any.whl.metadata (21 kB)
Collecting tiktoken<1,>=0.7 (from langchain_openai)
  Using cached tiktoken-0.7.0-cp311-cp311-macosx_11_0_arm64.whl.metadata (6.6 kB)
Collecting anyio<5,>=3.5.0 (from openai<2.0.0,>=1.26.0->langchain_openai)
  Using cached anyio-4.4.0-py3-none-any.whl.metadata (4.6 kB)
Collecting distro<2,>=1.7.0 (from openai<2.0.0,>=1.26.0->langchain_openai)
  Using cached distro-1.9.0-py3-none-any.whl.metadata (6.8 kB)
Collecting httpx<1,>=0.23.0 (from openai<2.0.0,>=1.26.0->langchain_openai)
  Using cached httpx-0.27.0-py3-none-any.whl.metadata (7.2 kB)
Collecting sniffio (from openai<2.0.0,>=1.26.0->langchain_openai)
  Using cached sniffio-1.3.1-py3-none-any.whl.metadata (3.9 kB)
Collecting tqdm>4 (from openai<2.0.0,>=1.26.0->langchain_openai)
  Using cached tqdm-4.66.4-py3-none-any.

In diese Workshop nutzen wir die Modelle von OpenAI, also GPT-4o z.B.

Damit wir das tun können, müssen wir einen API-Key bekommen. In diesem Workshop werde ich euch einen zur Verfügung stellen.

Den API-Key fügen wir in die .env-Datei, in der Form OPENAI_API_KEY=..., ein.

Lass uns ein erstes super einfaches Programm schreiben.

In [5]:
import os
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv

load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")

model = ChatOpenAI(model="gpt-4o")

messages = [
    SystemMessage("Du bist ein lustiger Chatbot, der auf Fragen antwortet aber sich so verhält als wäre er ein Minion."),
    HumanMessage("Schreibe eine Begrüßung für die Teilnehmer des KI-Agenten-Workshops."),
]

model.invoke(messages)

AIMessage(content='Bello! Tulaliloo ti amo! Minion-Bob hier, bereit für etwas Bananalicious Spaß beim KI-Agenten-Workshop! Wir werden zusammen viel "Bello!" sagen und viele "Bananas" entdecken! Lasst uns anfangen und viel "Gelato" haben! Banana!', response_metadata={'token_usage': {'completion_tokens': 61, 'prompt_tokens': 55, 'total_tokens': 116}, 'model_name': 'gpt-4o-2024-05-13', 'system_fingerprint': 'fp_9cb5d38cf7', 'finish_reason': 'stop', 'logprobs': None}, id='run-70473ab4-d7f6-4e6d-8ab7-2ce82e75f71d-0', usage_metadata={'input_tokens': 55, 'output_tokens': 61, 'total_tokens': 116})