![GenAI Banner](https://raw.githubusercontent.com/ralf-42/Image/main/genai-banner-2.jpg)


<p><font size="5" color='grey'> <b>
Agenten
</b></font> </br></p>


---

In [None]:
#@title
#@markdown   <p><font size="4" color='green'>Umgebung einrichten</font> </br></p>
!uv pip install --system --prerelease allow -q git+https://github.com/ralf-42/genai_lib
from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint
setup_api_keys(['OPENAI_API_KEY', 'HF_TOKEN', 'WEATHER_API_KEY', 'SERPAPI_API_KEY', 'TAVILY_API_KEY'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()

# 1 | Unterschied LLM vs Agenten

Der Unterschied zwischen einem LLM und einem Agenten ist wie der Unterschied zwischen einem Buch und einem Menschen mit Zugang zu Werkzeugen und Internet. Diese Unterscheidung ist entscheidend f√ºr das Verst√§ndnis moderner KI-Anwendungen.

**Problem: Wo LLMs an ihre Grenzen sto√üen**

Ein Large Language Model ist im Grunde ein sehr fortgeschrittenes Textverarbeitungsystem, das auf Basis seiner Trainingsdaten antwortet. Diese Begrenzung f√ºhrt zu vier grundlegenden Problemen:

+ **Veraltete Informationen**: LLMs kennen nur Daten bis zu ihrem Trainingsstichtag. Fragen Sie nach aktuellen Ereignissen, B√∂rsenkursen oder dem heutigen Wetter, erhalten Sie veraltete oder keine Informationen.

+ **Ungenaue Berechnungen**: W√§hrend LLMs einfache Mathematik verstehen, sind sie bei komplexeren Berechnungen oft ungenau. Sie "raten" Ergebnisse basierend auf Mustern, anstatt tats√§chlich zu rechnen.

+ **Keine externe Interaktion**: Ein LLM kann nicht im Internet suchen, APIs aufrufen oder Dateien lesen. Es ist vollst√§ndig isoliert von der Au√üenwelt.

+ **Fehlende Planung**: LLMs k√∂nnen keine mehrstufigen Prozesse durchf√ºhren, bei denen das Ergebnis eines Schritts den n√§chsten beeinflusst.

<br>

**L√∂sung: Agenten erweitern LLMs**

Ein Agent l√∂st diese Probleme durch drei Schl√ºsselkomponenten: Er nutzt das LLM als "Gehirn" f√ºr Sprachverst√§ndnis und Reasoning, erweitert es aber um Tools f√ºr externe Interaktionen und implementiert einen iterativen Denkprozess.

+ **Aktuelle Daten durch Tools**: Agenten k√∂nnen √ºber spezielle Werkzeuge auf aktuelle Informationen zugreifen - von Wetterapis bis zu Internetsuchmaschinen.

+ **Pr√§zise Berechnungen**: Statt zu raten, verwenden Agenten Rechner-Tools f√ºr exakte mathematische Operationen.

+ **Unbegrenzte Erweiterbarkeit**: Neue F√§higkeiten entstehen durch neue Tools - von Datenbankzugriff bis zu Bildbearbeitung.

+ **Transparente Planung**: Der Denkprozess des Agenten ist sichtbar und nachvollziehbar, was Vertrauen und Debugging erm√∂glicht.

# 2 | Direkter Vergleich
---

## 2.1 Setup und Tools

Bevor wir vergleichen k√∂nnen, m√ºssen wir die notwendigen Tools f√ºr unseren Agenten definieren. Diese Tools repr√§sentieren die erweiterten F√§higkeiten, die einem einfachen LLM fehlen.



In [None]:
# Installationen
!uv pip install --system --prerelease allow -q google-search-results

In [None]:
# Einfache Tools definieren
from langchain_core.tools import Tool
from langchain_community.utilities.serpapi import SerpAPIWrapper
import requests

def simple_calculator(expression):
    """Einfacher Rechner - Das kann ein LLM oft nicht pr√§zise"""
    try:
        # Sicherheitscheck
        if any(x in expression for x in ['import', 'exec', '__']):
            return "Unsichere Operation"
        result = eval(expression)
        return f"{expression} = {result}"
    except:
        return "Berechnungsfehler"

def get_weather(city):
    """Aktuelle Wetterdaten - Das kann ein LLM GAR NICHT"""
    # Vereinfachte Demo-Version
    return f"üå§Ô∏è Aktuelles Wetter in {city}: 22¬∞C, sonnig (Demo-Version)"

# Tool-Liste erstellen
serpapi = SerpAPIWrapper()

tools = [
    Tool(
        name="internet_search",
        func=serpapi.run,
        description="üåê INTERNETSUCHE - Aktuelle Informationen finden (was LLM NICHT kann)"
    ),
    Tool(
        name="calculator",
        func=simple_calculator,
        description="üî¢ RECHNER - Pr√§zise Berechnungen (was LLM oft falsch macht)"
    ),
    Tool(
        name="weather",
        func=get_weather,
        description="üå§Ô∏è WETTER - Echtzeitdaten abrufen (was LLM unm√∂glich ist)"
    )
]

print("‚úÖ Tools definiert:")
for tool in tools:
    print(f"   ‚Ä¢ {tool.name}: {tool.description}")

## 2.2 Vergleichstest

Wir verwenden eine Frage, die sowohl aktuelle Daten als auch eine Berechnung erfordert, um die Grenzen eines LLMs und die St√§rken eines Agenten zu demonstrieren.

In [None]:
from langchain_openai import ChatOpenAI
from langchain.agents import create_tool_calling_agent, AgentExecutor
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
import time

# LLM Setup
llm = ChatOpenAI(model_name="gpt-4o-mini", temperature=0.0)

# Test-Frage die Grenzen aufzeigt
test_question = "Wie ist das Wetter in Berlin und was ist 2847 * 1923?"

mprint("### üß™ VERGLEICHSTEST")
mprint("---")
mprint(f"**Frage:** {test_question}")
print()

# 1. EINFACHES LLM PROBIEREN
mprint("### 1Ô∏è‚É£ EINFACHES LLM:")
mprint("---")

start_time = time.time()
llm_response = llm.invoke(test_question)
llm_time = time.time() - start_time

mprint(f"**Antwort:** {llm_response.content}")
mprint(f"**Zeit:** {llm_time:.2f}s")
print()
mprint("### ‚ùå PROBLEME:")
mprint("+ Keine aktuellen Wetterdaten")
mprint("+ Berechnung m√∂glicherweise ungenau")
mprint("+ Kann nicht √ºberpr√ºfen ob Antwort stimmt")
print()

# 2. AGENT MIT TOOLS
mprint("### 2Ô∏è‚É£ AGENT MIT TOOLS:")
mprint("---")

# Agent erstellen
prompt = ChatPromptTemplate.from_messages([
    ("system", "Du bist ein hilfreicher Agent. Nutze Tools f√ºr aktuelle Daten und Berechnungen."),
    ("human", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad")
])

agent = create_tool_calling_agent(llm, tools, prompt)
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,  # Zeigt Denkprozess
    return_intermediate_steps=True
)

start_time = time.time()
agent_response = agent_executor.invoke({"input": test_question})
agent_time = time.time() - start_time

mprint(f"**Antwort:**  {agent_response['output']}")
mprint(f"**Zeit:** {agent_time:.2f}s")
print()
mprint("### ‚úÖ VORTEILE:")
mprint("+ Aktuelle Wetterdaten abgerufen")
mprint("+ Pr√§zise Berechnung durchgef√ºhrt")
mprint("+ Transparenter Denkprozess sichtbar")
mprint("+ Schritte nachvollziehbar")


## 2.3 Unterschiede



Die Unterschiede zwischen LLM und Agent lassen sich in f√ºnf Kernbereichen zusammenfassen, die den Paradigmenwechsel von statischer zu dynamischer KI verdeutlichen.

**Vergleich der F√§higkeiten:**

| Aspekt | Einfaches LLM | Agent |
|--------|---------------|-------|
| **Aktuelle Daten** | ‚ùå Nur Trainingsdaten | ‚úÖ √úber Tools |
| **Berechnungen** | ‚ö†Ô∏è Oft ungenau | ‚úÖ Pr√§zise Tools |
| **Externe APIs** | ‚ùå Unm√∂glich | ‚úÖ Beliebig erweiterbar |
| **Transparenz** | üîí Verborgen | üëÅÔ∏è Sichtbar |
| **Erweiterbarkeit** | ‚ùå Statisch | ‚úÖ Modular |



**üéØ FAZIT:**
- **Agent = LLM + Tools + Reasoning**
- ‚û°Ô∏è Aus reaktiv wird proaktiv
- ‚û°Ô∏è Aus statisch wird dynamisch
- ‚û°Ô∏è Aus isoliert wird vernetzt


# 3 | Anatomie eines Agenten
---



Um Agenten effektiv einsetzen zu k√∂nnen, muss man  ihre innere Struktur verstehen. Ein Agent besteht aus vier Hauptkomponenten, die zusammenarbeiten, um komplexe Aufgaben zu l√∂sen. Diese Architektur erm√∂glicht es, die St√§rken von LLMs mit praktischen Werkzeugen zu kombinieren.

**Die 4 Kern-Komponenten**

Jede Komponente eines Agenten hat eine spezifische Rolle im Gesamtsystem. Das Verst√§ndnis dieser Rollen hilft beim Design eigener Agenten und bei der Fehlersuche.

+ **LLM (Das Gehirn)**: Das Large Language Model fungiert als zentrale Intelligenz des Agenten. Es versteht die Benutzeranfrage, interpretiert Tool-Ergebnisse und entscheidet √ºber n√§chste Schritte. Ohne das LLM w√§re der Agent nur eine Sammlung unverbundener Werkzeuge.

+ **Tools (Die H√§nde)**: Tools sind spezialisierte Funktionen, die dem Agenten erlauben, mit der Au√üenwelt zu interagieren. Sie k√∂nnen so einfach sein wie ein Rechner oder so komplex wie eine Datenbankverbindung. Jedes Tool erweitert die F√§higkeiten des Agenten erheblich.

+ **Agent-Scratchpad (Das Ged√§chtnis)**: Das Scratchpad speichert Zwischenergebnisse und den Verlauf der Tool-Aufrufe. Es erm√∂glicht dem Agenten, aus vorherigen Schritten zu lernen und komplexe, mehrstufige Reasoning-Prozesse durchzuf√ºhren.

+ **Executor (Der Koordinator)**: Der Executor orchestriert das Zusammenspiel aller Komponenten. Er entscheidet, wann Tools aufgerufen werden, wann genug Informationen gesammelt wurden und wann die finale Antwort generiert werden soll.


<br>

**Der Agent-Denkprozess**

Der Denkprozess eines Agenten ist fundamental anders als der eines LLMs. W√§hrend ein LLM linear von Eingabe zu Ausgabe arbeitet, durchl√§uft ein Agent einen iterativen Zyklus aus Reasoning, Tool-Nutzung und Bewertung.

+ **Schritt 1 - Verstehen**: Der Agent analysiert die Benutzeranfrage und identifiziert, welche Informationen oder Aktionen ben√∂tigt werden. Dies geschieht durch das LLM, das die nat√ºrliche Sprache interpretiert.

+ **Schritt 2 - Planen**: Basierend auf dem Verst√§ndnis der Anfrage plant der Agent, welche Tools in welcher Reihenfolge verwendet werden sollten. Diese Planung kann sich w√§hrend der Ausf√ºhrung √§ndern.

+ **Schritt 3 - Ausf√ºhren**: Der Agent ruft das gew√§hlte Tool auf und erh√§lt ein Ergebnis. Dieses Ergebnis wird im Scratchpad gespeichert und steht f√ºr weitere Entscheidungen zur Verf√ºgung.

+ **Schritt 4 - Bewerten**: Nach jedem Tool-Aufruf bewertet der Agent, ob gen√ºgend Informationen vorliegen oder weitere Schritte notwendig sind. Diese Bewertung bestimmt den weiteren Verlauf.

+ **Schritt 5 - Iterieren oder Antworten**: Je nach Bewertung kehrt der Agent zu Schritt 2 zur√ºck oder generiert die finale Antwort. Diese Flexibilit√§t erm√∂glicht die L√∂sung komplexer, unvorhersehbarer Probleme.



# 4 | Praktische Beispiele
---

Praktische Beispiele helfen dabei, die Konzepte von Agenten greifbar zu machen. Wir beginnen mit einfachen, fokussierten Agenten und steigern die Komplexit√§t schrittweise. Diese Progression zeigt, wie Agenten f√ºr verschiedene Anwendungsf√§lle optimiert werden k√∂nnen.



## 4.1 Rechner-Agent

Ein Rechner-Agent demonstriert die Grundprinzipien der Agent-Architektur mit minimaler Komplexit√§t. Er zeigt, wie ein Agent eine spezifische Dom√§ne (Mathematik) abdecken kann, ohne von anderen Funktionen abgelenkt zu werden.


**üî¢ RECHNER-AGENT DEMO**

**Konfiguration:** Agent nur mit Calculator-Tool ausgestattet

**Test-Fragen und Ergebnisse:**
- **"Was ist 15 * 23?"** ‚Üí ‚úÖ 345
- **"Berechne (100 + 50) * 3"** ‚Üí ‚úÖ 450  
- **"Was ist 2 hoch 10?"** ‚Üí ‚úÖ 1024

**Erkenntnisse:**
- **Fokussierung** auf eine Dom√§ne macht den Agenten zuverl√§ssiger
- **Wiederverwendbarkeit** derselben Tool-Logik f√ºr verschiedene Probleme
- **Transparenz** durch sichtbare Reasoning-Schritte


Dieser Agent zeigt drei wichtige Prinzipien: **Fokussierung** auf eine Dom√§ne macht den Agenten zuverl√§ssiger, **Wiederverwendbarkeit** derselben Tool-Logik f√ºr verschiedene Probleme, und **Transparenz** durch sichtbare Reasoning-Schritte.

## 4.2 Recherche-Agent

Ein Recherche-Agent erweitert die F√§higkeiten erheblich, indem er Zugang zu aktuellen Informationen erh√§lt. Dies zeigt, wie Agenten die fundamentale Begrenzung von LLMs (veraltete Trainingsdaten) √ºberwinden.


**üîç RECHERCHE-AGENT DEMO**

**Konfiguration:** Agent nur mit Internet Search-Tool ausgestattet

**Test-Frage:** "Was sind die neuesten Nachrichten √ºber k√ºnstliche Intelligenz?"

**Verhalten:**
- Agent ruft automatisch das Internet Search-Tool auf
- Durchsucht aktuelle Nachrichtenquellen
- Fasst relevante Informationen zusammen

**Beispiel-Ergebnis:**
"Aktuelle KI-Entwicklungen umfassen Durchbr√ºche in der Sprachverarbeitung, neue Robotik-Anwendungen in der Industrie und verst√§rkte Diskussionen √ºber KI-Regulierung in Europa..."

**Key-Features:**
- **Aktualit√§t** durch Zugriff auf Live-Daten
- **Validierung** von Informationen durch mehrere Quellen
- **Kontextualisierung** von Suchergebnissen f√ºr die spezifische Anfrage


Der Recherche-Agent demonstriert **Aktualit√§t** durch Zugriff auf Live-Daten, **Validierung** von Informationen durch mehrere Quellen, und **Kontextualisierung** von Suchergebnissen f√ºr die spezifische Anfrage.



## 4.3 Multi-Tool Agent



Ein Multi-Tool Agent kombiniert verschiedene F√§higkeiten und zeigt die wahre St√§rke der Agent-Architektur: die Orchestrierung mehrerer Tools zur L√∂sung komplexer, mehrdimensionaler Probleme.


**üõ†Ô∏è MULTI-TOOL AGENT DEMO**

**Konfiguration:** Agent mit allen verf√ºgbaren Tools (Internet, Rechner, Wetter)

**Komplexe Test-Anfrage:**
"Ich plane eine Reise nach M√ºnchen n√§chste Woche. Kannst du das aktuelle Wetter dort pr√ºfen und berechnen was 3 Hotel√ºbernachtungen √† 120‚Ç¨ plus 2 Zugtickets √† 89‚Ç¨ kosten w√ºrden?"

**Agent-Verhalten:**
1. **Wetter-Tool** ‚Üí Aktuelle Wetterdaten f√ºr M√ºnchen abrufen
2. **Calculator-Tool** ‚Üí Reisekosten berechnen: (3 √ó 120‚Ç¨) + (2 √ó 89‚Ç¨) = 538‚Ç¨
3. **Synthese** ‚Üí Beide Informationen in koh√§rente Antwort zusammenfassen

**Beispiel-Antwort:**
"Das aktuelle Wetter in M√ºnchen betr√§gt 18¬∞C mit teilweise bew√∂lktem Himmel - ideal f√ºr eine St√§dtereise. Die Gesamtkosten f√ºr Ihre Reise belaufen sich auf 538‚Ç¨ (360‚Ç¨ f√ºr Hotels + 178‚Ç¨ f√ºr Zugtickets)."

**Besondere F√§higkeiten:**
- **Tool-Orchestrierung** durch intelligente Auswahl und Sequenzierung
- **Kontext-Erhaltung** zwischen verschiedenen Tool-Aufrufen
- **Synthesef√§higkeit** beim Kombinieren verschiedener Informationstypen


Dieser Agent zeigt **Tool-Orchestrierung** durch intelligente Auswahl und Sequenzierung, **Kontext-Erhaltung** zwischen verschiedenen Tool-Aufrufen, und **Synthesef√§higkeit** beim Kombinieren verschiedener Informationstypen.

# 5 | Wann braucht man einen Agent?
---

Die Entscheidung zwischen einem einfachen LLM und einem Agenten h√§ngt von den spezifischen Anforderungen Ihrer Anwendung ab. Eine klare Entscheidungsmatrix hilft dabei, die richtige Technologie f√ºr den jeweiligen Anwendungsfall zu w√§hlen und Ressourcen effizient einzusetzen.



Die Wahl der richtigen Technologie beginnt mit der Analyse der Aufgabenanforderungen. W√§hrend LLMs f√ºr viele Textverarbeitungsaufgaben ausreichen, sind Agenten unverzichtbar, wenn externe Interaktionen oder aktuelle Daten ben√∂tigt werden.

**Verwenden Sie einen Agenten wenn:**

+ Sie aktuelle oder dynamische Daten ben√∂tigen, die sich h√§ufig √§ndern (Aktienkurse, Wetter, Nachrichten). Agenten k√∂nnen √ºber APIs auf Live-Daten zugreifen und diese in ihre Antworten integrieren.

+ Pr√§zise Berechnungen erforderlich sind, bei denen Genauigkeit kritisch ist. LLMs approximieren mathematische Operationen, w√§hrend Agenten echte Rechner-Tools verwenden.

+ Externe Systeme angesprochen werden m√ºssen, wie Datenbanken, APIs oder andere Services. Agenten k√∂nnen diese Integrationen nahtlos abwickeln.

+ Komplexe, mehrstufige Prozesse durchgef√ºhrt werden sollen, bei denen jeder Schritt vom vorherigen abh√§ngt. Der Agent-Reasoning-Loop ist f√ºr solche Szenarien optimiert.

**Ein einfaches LLM reicht wenn:**

+ Reine Textverarbeitung ohne externe Daten im Fokus steht. F√ºr Zusammenfassungen, √úbersetzungen oder Textanalysen sind LLMs optimal.

+ Kreative Aufgaben gel√∂st werden sollen, wie das Schreiben von Geschichten, Gedichten oder Marketing-Texten. Hier sind die kreativen F√§higkeiten des LLMs gefragt.

+ Erkl√§rungen oder Bildungsinhalt basierend auf allgemeinem Wissen ben√∂tigt werden. LLMs haben Zugang zu einem enormen Wissensfundus.

+ Statische Code-Generierung ohne externe Abh√§ngigkeiten erforderlich ist. F√ºr einfache Programmieraufgaben sind LLMs sehr effektiv.

<br>

**Die Faustregel lautet**:    
Wenn Sie Tools, aktuelle Daten oder externe Interaktionen ben√∂tigen, w√§hlen Sie einen Agenten. F√ºr reine Textverarbeitung reicht ein LLM aus.

# 6 | Hands-On: Agent bauen
---

In [None]:
!uv pip install --system --prerelease allow -q tavily-python wikipedia

In [None]:
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.messages import SystemMessage
from langchain.agents import Tool, AgentExecutor, create_tool_calling_agent
from langchain_openai import ChatOpenAI
from langchain.utilities import WikipediaAPIWrapper
from tavily import TavilyClient
import os

In [None]:
# Tools definieren

def read_file(filename):
    try:
        with open(filename, 'r') as f:
            return f.read()
    except:
        return f"Datei {filename} nicht gefunden"

def write_file(content):
    filename, text = content.split("|", 1)
    with open(filename, 'w') as f:
        f.write(text)
    return f"Datei {filename} geschrieben"

# Tavily Web-Suche
tavily = TavilyClient(api_key=os.getenv("TAVILY_API_KEY"))  # API-Key als Umgebungsvariable setzen

def web_search(query):
    try:
        result = tavily.search(query=query, search_depth="basic")
        return f"Suchergebnis: {result['results'][0]['content']}"
    except Exception as e:
        return f"Fehler bei Tavily-Suche: {e}"

# Wikipedia-Suche
def wiki_search(term):
    wiki = WikipediaAPIWrapper()
    try:
        return wiki.run(term)
    except Exception as e:
        return f"Wikipedia-Fehler: {e}"

custom_tools = [
    Tool(name="read_file", func=read_file, description="Datei lesen"),
    Tool(name="write_file", func=write_file, description="Datei schreiben (Format: datei.txt|inhalt)"),
    Tool(name="search", func=web_search, description="F√ºhre eine Websuche mit Tavily durch"),
    Tool(name="wiki", func=wiki_search, description="Frage einen Begriff in Wikipedia nach")
]

In [None]:
# Modell und ChatPrompt-Template definieren
model_name = "gpt-4o-mini"
temperature = 0.0

llm = ChatOpenAI(model=model_name, temperature=temperature)

# Prompt als Template definieren
prompt = ChatPromptTemplate.from_messages([
    ("system", "Du bist ein hilfreicher Assistent mit Zugriff auf Tools."),
    ("human", "{input}"),
    MessagesPlaceholder(variable_name="agent_scratchpad"),
])

In [None]:
# üîß Agenten-Logik
agent_runnable = create_tool_calling_agent(llm, custom_tools, prompt)

# Agenten erstellen
custom_agent = AgentExecutor(
    agent=agent_runnable,
    tools=custom_tools,
    verbose=True,
)

In [None]:
# üîß Test
input = """
Erstelle eine Datei 'notiz.txt' mit dem Inhalt 'Agenten k√∂nnen autonom agieren. ü§ñ',
lies sie dann wieder,
suche nach 'Python Programmierung' im Web.
was steht zu Taylor Swift auf Wikipedia
"""

response = custom_agent.invoke({"input": input})

In [None]:
mprint("## üõ†Ô∏è Hands-On Agent")
mprint("---")
mprint("**Input:**")
mprint(response['input'])
mprint("**Output**:")
mprint(response['output'])

# A | Aufgabe
---

Die Aufgabestellungen unten bieten Anregungen, Sie k√∂nnen aber auch gerne eine andere Herausforderung angehen.

<p><font color='black' size="5">
Kalkulation
</font></p>

Gegeben ist eine Datei, die eine Reihe von Gleichungen enth√§lt.
Der Dateiname ist GenAI/02 data/gleichungen.txt

**Gleichung:**    
41748459 - 87226336    
92995162 * 46769739    
61530438 * 56074589    
95329602 + 45418854    
412907 + 3731910    
...

Verwenden Sie einen LangChain-Agenten mit einem Tool, um jede dieser Gleichungen zu berechnen, und erstellen Sie eine Datei √§hnlich dieser:

**Ergebnisse:**  
41748459 - 87226336 = 45477877   
92995162 * 46769739 = 4349359455002718   
61530438 * 56074589 = 3450294021839982   
95329602 + 45418854 = 140748456   
412907 + 3731910 = 4144817   
... ...



# B | Model Context Protocol (MCP)
---



**Wichtige Ressourcen:**

[Anthropic MCP](https://www.anthropic.com/news/model-context-protocol)

[OpenAI MCP](https://openai.github.io/openai-agents-python/mcp/)

[MCPServer](https://github.com/modelcontextprotocol/servers)




<p><font color='black' size="5">
5.1 Was ist MCP?
</font></p>


Ein Protokoll ist ein Regelwerk, das bestimmt, wie zwei Systeme miteinander kommunizieren. Protokolle regeln die Daten√ºbertragung in Computernetzwerken, bei der Internetkommunikation und zwischen Softwaresystemen.

**Zum Beispiel:**

+ HTTP (Hypertext Transfer Protocol): Erm√∂glicht Websites die Kommunikation mit Browsern.
+ TCP/IP (Transmission Control Protocol/Internetprotokoll): Definiert, wie Datenpakete im Internet geroutet werden.
+ JSON-RPC (Aufrufen von Remoteprozeduren): Ein Protokoll, das den Datenaustausch im JSON-Format erm√∂glicht.    

Das **Model Context Protocol (MCP)** ist ein offenes Protokoll, das es gro√üen Sprachmodellen (LLMs) erm√∂glicht, sich auf standardisierte Weise in externe Datenquellen und Tools zu integrieren. Dieses von Anthropic entwickelte Protokoll macht es KI-Modellen leicht, nahtlos mit einer Vielzahl von Tools und Datenquellen zusammenzuarbeiten.

Es soll die Interaktion von KI-Modellen, insbesondere Large Language Models (LLMs) und autonomen Agenten, mit externen Datenquellen und Tools zu **standardisieren und zu vereinfachen**. Ziel ist es, einen **einheitlichen Rahmen** zu schaffen, der es KI-Agenten erm√∂glicht, auf strukturierte Daten aus verschiedenen Quellen wie Datenbanken, APIs, Cloud-Speicher und Unternehmensanwendungen auf standardisierte Weise zuzugreifen, diese zu verarbeiten und darauf zu reagieren, **ohne dass f√ºr jede Quelle spezifische API-Integrationen erforderlich sind**.




<p><font color='black' size="5">
5.2 Warum wurde MCP entwickelt?
</font></p>



Die Notwendigkeit von MCP ergibt sich aus den **Ineffizienzen und Herausforderungen** aktueller KI-API-Interaktionen. Derzeit ist der Aufbau von KI-Agenten, die Daten aus verschiedenen Quellen abrufen, **fragmentiert, repetitiv und schwer zu skalieren**. Jedes Tool spricht seine eigene Sprache und erfordert **individuelle Integrationen**. MCP zielt darauf ab, diese Komplexit√§t zu reduzieren und den **Entwicklungsaufwand zu minimieren**.




<p><font color='black' size="5">
5.3 Wie funktioniert MCP?
</font></p>



MCP basiert auf einer **Client-Server-Architektur**.

*   **MCP-Clients** sind typischerweise KI-Agenten, Anwendungen oder Systeme, die strukturierte Daten ben√∂tigen. Beispiele hierf√ºr sind Claude Desktop, Cursor, Windsurf und Frameworks wie Langchain und Pydantic AI.
*   **MCP-Server** fungieren als **Vermittler**, die Daten von verschiedenen APIs, Datenbanken oder Unternehmenssystemen abrufen und diese in einem **einheitlichen Format** an die Clients zur√ºckgeben.

Der Interaktionsprozess folgt einem strukturierten **Anfrage-Antwort-Zyklus**:

1.  Der KI-Agent (Client) sendet eine **strukturierte Anfrage** an den MCP-Server, in der die ben√∂tigten Daten oder die auszuf√ºhrende Aktion in einem standardisierten Format definiert sind.
2.  Der MCP-Server **verarbeitet** diese Anfrage, authentifiziert sie, pr√ºft die Berechtigungen und ermittelt, welche externen Systeme abgefragt werden m√ºssen.
3.  Die eigentlichen **Datenabfragen** an die verschiedenen Quellen k√∂nnen parallel erfolgen.
4.  Die **Antworten** der verschiedenen Quellen werden vom MCP-Server in einem **einheitlichen, strukturierten Format standardisiert**, das f√ºr KI-Modelle leicht zu verarbeiten ist.

Ein wesentliches Konzept von MCP ist die **Reflection**. Dies bedeutet, dass ein MCP-Client einen MCP-Server nach seinen **verf√ºgbaren Tools und Ressourcen** fragen kann, ohne vorherige Kenntnisse dieser Schnittstellen zu ben√∂tigen.

[Interaktive Visualisierung des MCP-Prozesses](https://claude.site/artifacts/1ba26344-3819-427d-9080-98381785f8df)




<p><font color='black' size="5">
5.4 Kernkonzepte
</font></p>



*   **Tools:** Funktionen, die das Modell nutzen kann, um Aktionen durchzuf√ºhren (z. B. Websuchen, Datenbankabfragen).
*   **Ressourcen:** Anh√§nge oder Daten, die dem Modell zur Verf√ºgung gestellt werden (z. B. Dateien, Datenbankinhalte).
*   **Prompts:** Vorlagen, die Clients f√ºr Anfragen an das Modell verwenden k√∂nnen.




<p><font color='black' size="5">
5.5 Vorteile von MCP
</font></p>


*   **Vereinfachte Integrationen** und **reduzierte Komplexit√§t**.
*   **Verbesserte Skalierbarkeit** und **Wiederverwendbarkeit** von Integrationen.
*   **Erh√∂hte Interoperabilit√§t** zwischen KI-Modellen und externen Systemen.
*   **Zeitersparnis f√ºr Entwickler** durch weniger benutzerdefinierte API-Implementierungen.
*   Potenzial f√ºr eine **zentrale Authentifizierung** (zuk√ºnftig).

[Interaktive Visualisierung](https://claude.site/artifacts/1ba26344-3819-427d-9080-98381785f8df)

<p><font color='black' size="5">
Code-Beispiel zur Interaktion
</font></p>

In [None]:
import json
import uuid
from typing import Dict, Any

class MCPClient:
    """Einfacher MCP-Client f√ºr die Kommunikation mit MCP-Servern."""

    def __init__(self, client_id: str, api_key: str):
        self.client_id = client_id
        self.api_key = api_key
        self.headers = {
            "Authorization": f"Bearer {api_key}",
            "Client-ID": client_id
        }

    def create_request(self, tool_name: str, parameters: Dict[str, Any]) -> Dict[str, Any]:
        """Erstellt eine strukturierte MCP-Anfrage."""
        request_data = {
            "protocol_version": "1.0",
            "request_id": str(uuid.uuid4()),
            "tool": {
                "name": tool_name,
                "parameters": parameters
            }
        }
        return request_data

    def send_request(self, request_data: Dict[str, Any]) -> Dict[str, Any]:
        """Sendet eine MCP-Anfrage an den MCP-Server."""
        # In einer realen Implementierung w√ºrde hier ein HTTP-Request erfolgen
        return {"status": "success", "result": {}}  # Platzhalter


class MCPServer:
    """Simulierter MCP-Server zum Testen der Interaktion."""

    def __init__(self):
        self.registered_tools = {
            "weather_info": self._get_weather_data,
            "database_query": self._execute_database_query,
            "text_translation": self._translate_text
        }

    def validate_request(self, request: Dict[str, Any]) -> bool:
        """√úberpr√ºft, ob die Anfrage dem MCP-Protokoll entspricht."""
        required_fields = ["protocol_version", "request_id", "tool"]
        if not all(field in request for field in required_fields):
            return False

        if "name" not in request["tool"] or request["tool"]["name"] not in self.registered_tools:
            return False

        return True

    def process_request(self, request: Dict[str, Any]) -> Dict[str, Any]:
        """Verarbeitet eine validierte MCP-Anfrage."""
        if not self.validate_request(request):
            return {"error": "Ung√ºltige Anfrage", "status": "error"}

        tool_name = request["tool"]["name"]
        parameters = request["tool"].get("parameters", {})

        # Tool ausf√ºhren
        tool_func = self.registered_tools[tool_name]
        result = tool_func(parameters)

        # Antwort standardisieren
        response = {
            "request_id": request["request_id"],
            "status": "success",
            "result": result
        }
        return response

    def _get_weather_data(self, params: Dict[str, Any]) -> Dict[str, Any]:
        """Simuliert den Abruf von Wetterdaten von einem externen Dienst."""
        return {
            "city": params.get("city", "Berlin"),
            "temperature": 22,
            "condition": "sonnig",
            "humidity": 65
        }

    def _execute_database_query(self, params: Dict[str, Any]) -> Dict[str, Any]:
        """Simuliert eine Datenbankabfrage."""
        return {
            "rows": [
                {"id": 1, "name": "Produkt A", "price": 29.99},
                {"id": 2, "name": "Produkt B", "price": 49.99}
            ],
            "total_rows": 2
        }

    def _translate_text(self, params: Dict[str, Any]) -> Dict[str, Any]:
        """Simuliert einen √úbersetzungsdienst."""
        target_lang = params.get("target_language", "en")

        translations = {
            "en": "Hello world",
            "fr": "Bonjour le monde",
            "de": "Hallo Welt"
        }

        return {
            "original_text": params.get("text", ""),
            "translated_text": translations.get(target_lang, "√úbersetzung nicht verf√ºgbar"),
            "target_language": target_lang
        }


class LLMApplication:
    """LLM-Anwendung, die den MCP-Client verwendet."""

    def __init__(self, mcp_client: MCPClient):
        self.mcp_client = mcp_client

    def process_user_query(self, query: str) -> str:
        """Verarbeitet eine Nutzeranfrage mit MCP f√ºr zus√§tzliche Daten."""
        if "wetter" in query.lower():
            # Extrahiere Stadt (vereinfacht)
            city = "Berlin"

            # Erstelle und sende MCP-Anfrage
            request = self.mcp_client.create_request("weather_info", {"city": city})
            response = self.mcp_client.send_request(request)

            if response.get("status") == "success":
                weather_data = response.get("result", {})
                return self._format_weather_response(weather_data)
            return "Entschuldigung, ich konnte keine Wetterdaten abrufen."

        elif "√ºbersetze" in query.lower():
            text = "Hallo, wie geht es dir?"
            target_lang = "en"

            request = self.mcp_client.create_request("text_translation", {
                "text": text,
                "target_language": target_lang
            })
            response = self.mcp_client.send_request(request)

            if response.get("status") == "success":
                translation_data = response.get("result", {})
                return self._format_translation_response(translation_data)
            return "Entschuldigung, ich konnte den Text nicht √ºbersetzen."

        return "Ich verstehe Ihre Anfrage. Wie kann ich Ihnen helfen?"

    def _format_weather_response(self, weather_data: Dict[str, Any]) -> str:
        """Formatiert Wetterdaten f√ºr die Anzeige."""
        return (f"Das aktuelle Wetter in {weather_data.get('city')}: "
                f"{weather_data.get('temperature')}¬∞C, {weather_data.get('condition')}.")

    def _format_translation_response(self, translation_data: Dict[str, Any]) -> str:
        """Formatiert √úbersetzungsdaten f√ºr die Anzeige."""
        return (f"√úbersetzung ({translation_data.get('target_language')}): "
                f"{translation_data.get('translated_text')}")


def run_example():
    """F√ºhrt ein Beispiel der MCP-Interaktion aus."""
    print("=== MCP-Interaktionsbeispiel ===\n")

    # MCP-Server initialisieren
    server = MCPServer()

    # MCP-Client initialisieren
    client = MCPClient(
        client_id="llm_app_123",
        api_key="sk_test_12345"
    )

    # LLM-Anwendung initialisieren
    llm_app = LLMApplication(client)

    # Mock f√ºr send_request
    def mock_send_request(request_data):
        print("\n[1] LLM-Anwendung erstellt MCP-Anfrage:")
        print(json.dumps(request_data, indent=2))

        print("\n[2] MCP-Client sendet Anfrage an MCP-Server")

        print("\n[3] MCP-Server validiert die Anfrage")
        valid = server.validate_request(request_data)
        print(f"Anfrage ist g√ºltig: {valid}")

        print("\n[4] MCP-Server verarbeitet die Anfrage und kommuniziert mit externen Systemen")
        response = server.process_request(request_data)

        print("\n[5] Externe Systeme liefern Daten an MCP-Server")

        print("\n[6] MCP-Server standardisiert die Antwort:")
        print(json.dumps(response, indent=2))

        print("\n[7] MCP-Server sendet Antwort an MCP-Client")

        print("\n[8] MCP-Client stellt Kontext der LLM-Anwendung zur Verf√ºgung")

        return response

    # √úberschreiben der Methode
    client.send_request = mock_send_request

    # Beispiel-Nutzeranfrage
    query = "Wie ist das Wetter in Berlin?"

    print(f"\nNutzer fragt: '{query}'")
    print("\n[0] LLM-Anwendung analysiert die Nutzeranfrage")

    # LLM verarbeitet die Anfrage und nutzt MCP
    response = llm_app.process_user_query(query)

    print("\n[9] LLM-Anwendung nutzt den Kontext zur Beantwortung")
    print(f"\nAntwort an den Nutzer: '{response}'")


if __name__ == "__main__":
    run_example()

<p><font color='black' size="5">
Fazit
</font></p>





Das Model Context Protocol (MCP) stellt einen vielversprechenden Ansatz dar, um die Integration von KI-Modellen mit der Au√üenwelt zu **standardisieren und zu vereinfachen**. Durch die Definition eines gemeinsamen Protokolls und die Bereitstellung von Konzepten wie Tools und Ressourcen erm√∂glicht MCP die Entwicklung **flexiblerer, skalierbarer und wiederverwendbarer** KI-Anwendungen. Obwohl es noch Herausforderungen zu bew√§ltigen gibt, hat MCP das Potenzial, die Art und Weise, wie KI-Agenten mit Daten und Tools interagieren, **grundlegend zu ver√§ndern**.