<p><font size="6" color='grey'> <b>

Generative KI. Verstehen. Anwenden. Gestalten.
</b></font> </br></p>

<p><font size="5" color='grey'> <b>
MCP - Model Context Protocol mit LangChain Agent
</b></font> </br></p>

---

In [None]:
#@title üîß Umgebung einrichten{ display-mode: "form" }
!uv pip install --system -q git+https://github.com/ralf-42/GenAI.git#subdirectory=04_modul
!uv pip install --system -q fastmcp langchain-mcp-adapters nest_asyncio uvicorn

from genai_lib.utilities import check_environment, get_ipinfo, setup_api_keys, mprint
import nest_asyncio

nest_asyncio.apply()  # Wichtig f√ºr asyncio in Jupyter

setup_api_keys(['OPENAI_API_KEY'], create_globals=False)
print()
check_environment()
print()
get_ipinfo()

# 1 | √úbersicht

---

<p><font color='black' size="5">
Was lernst du in diesem Notebook?
</font></p>

**Nach diesem Notebook kannst du:**

1. ‚úÖ **MCP-Server erstellen** - Eigene Tools mit FastMCP definieren
2. ‚úÖ **Tools bereitstellen** - Server √ºber HTTP erreichbar machen
3. ‚úÖ **Client verbinden** - LangChain mit MCP-Server verbinden
4. ‚úÖ **Agent orchestrieren** - LLM nutzt Tools automatisch
5. ‚úÖ **Production-Ready** - Echte Netzwerk-Kommunikation verstehen

**Voraussetzungen:**
- Grundkenntnisse in Python
- Verst√§ndnis von LLMs und Agents (siehe M04a/M04b)
- Optional: HTTP/REST-Grundlagen

**Zeitbedarf:** Ca. 30-45 Minuten

<p><font color='black' size="5">
Was ist dieses Notebook?
</font></p>

Dieses Notebook zeigt, wie man einen **echten MCP-Server** mit **LangChain Agents** verbindet:

1. **FastMCP Server** - Stellt mathematische Tools bereit
2. **LangChain MCP Client** - Verbindet sich √ºber HTTP mit dem Server
3. **LangChain 1.0+ Agent** - Nutzt die MCP-Tools intelligent
4. **Praktische Beispiele** - Mathematische Berechnungen durchf√ºhren

**Was ist MCP (Model Context Protocol)?**

MCP ist ein **standardisiertes Protokoll**, das LLMs (Large Language Models) mit externen Tools und Datenquellen verbindet. Denke an MCP wie an **USB f√ºr AI** - ein universeller Standard f√ºr Tool-Integration.

**Warum MCP?**
- ‚úÖ **Standardisiert**: Ein Protokoll f√ºr alle Tools
- ‚úÖ **Wiederverwendbar**: Einmal erstellen, √ºberall nutzen
- ‚úÖ **Skalierbar**: Einfach neue Tools hinzuf√ºgen
- ‚úÖ **Production-Ready**: F√ºr echte Anwendungen gedacht

**Architektur:**
```
LangChain Agent (dein Code)
        ‚Üì
MCP Client (langchain-mcp-adapters)
        ‚Üì HTTP POST (JSON-RPC 2.0)
MCP Server (FastMCP auf localhost:8000)
        ‚Üì
Tools (add, multiply, subtract, divide)
```

<p><font color='black' size="5">
Wie funktioniert MCP?
</font></p>

MCP basiert auf einem **Client-Server-Modell** mit drei Hauptkomponenten:

**1. MCP Server**
- Stellt **Tools** (Funktionen) bereit
- Kann **Ressourcen** (Daten) anbieten
- Implementiert das MCP-Protokoll (JSON-RPC 2.0)
- L√§uft als eigenst√§ndiger Prozess

**2. MCP Client**
- Verbindet sich mit einem oder mehreren Servern
- L√§dt verf√ºgbare Tools vom Server
- √úbersetzt LLM-Anfragen in MCP-Protokoll
- Verwaltet die Kommunikation

**3. LLM/Agent**
- Entscheidet, welche Tools ben√∂tigt werden
- Orchestriert mehrere Tool-Aufrufe
- Generiert nat√ºrlichsprachliche Antworten
- Nutzt Tools √ºber den Client

**Transport-Optionen:**
- `stdio`: Standard Input/Output (f√ºr CLI-Tools)
- `streamable_http`: HTTP-basiert (f√ºr Web-Services) ‚úÖ In diesem Notebook
- `sse`: Server-Sent Events
- `websocket`: WebSocket-Verbindung

<p><font color='black' size="5">
Praktisches Beispiel: Was passiert?
</font></p>

Stell dir vor, du fragst einen AI-Assistenten: **Berechne (3+5) ‚úï 12**

**Ohne MCP:**
```
AI: "Das Ergebnis ist ungef√§hr 96."
```
‚Üí AI r√§t oder rechnet im *Kopf* (fehleranf√§llig)

**Mit MCP:**
```
1. AI: "Ich brauche das add-Tool"
2. MCP Client ‚Üí Server: add(3, 5)
3. Server ‚Üí Client: 8
4. AI: "Ich brauche das multiply-Tool"
5. MCP Client ‚Üí Server: multiply(8, 12)
6. Server ‚Üí Client: 96
7. AI: "Das Ergebnis ist 96."
```
‚Üí AI nutzt echte Tools (pr√§zise, nachvollziehbar)

**Der Vorteil:**
- ‚úÖ Pr√§zise Ergebnisse (keine Halluzinationen)
- ‚úÖ Erweiterbar (neue Tools einfach hinzuf√ºgen)
- ‚úÖ Wiederverwendbar (gleicher Server f√ºr viele AIs)
- ‚úÖ Nachvollziehbar (jeder Tool-Call ist dokumentiert)

<p><font color='black' size="5">
Notebook-Roadmap
</font></p>

Dieses Notebook ist in **5 praktische Schritte** unterteilt:

**üìö Kapitel 1: √úbersicht** _(du bist hier)_
- Was ist MCP?
- Wie funktioniert es?
- Praktisches Beispiel

**üöÄ Kapitel 2: MCP-Server erstellen**
- FastMCP Server definieren
- Mathematische Tools implementieren
- Server starten und testen

**üîå Kapitel 3: Client verbinden**
- LangChain MCP Client konfigurieren
- Tools vom Server laden
- Verbindung pr√ºfen

**ü§ñ Kapitel 4: LangChain Agent**
- Agent mit MCP-Tools erstellen
- LangChain 1.0+ Best Practices
- Agent orchestrieren

**üí° Kapitel 5: Praktische Beispiele**
- Einfache Berechnungen
- Komplexe Multi-Tool-Queries
- Debugging mit direkten HTTP-Calls

**‚úèÔ∏è Aufgabe: Eigene Tools**
- Erweitere den Server mit neuen Tools
- Teste deine Implementierung

**üí° Tipp:** F√ºhre die Zellen nacheinander aus. Jeder Schritt baut auf dem vorherigen auf!

# 2 | FastMCP HTTP-Server starten

---

<p><font color='black' size="5">
Server-Datei erstellen
</font></p>

Wir erstellen eine **separate Python-Datei** f√ºr den FastMCP-Server, die wir dann als **subprocess** starten k√∂nnen.

In [None]:
#@title üöÄ MCP HTTP-Server erstellen und starten{ display-mode: "form" }

import subprocess
import time
import sys
import os

mprint("### üöÄ MCP HTTP-Server erstellen")
mprint("---")

# SCHRITT 1: Server-Datei erstellen
server_code = '''
"""FastMCP Math Server - HTTP Transport"""
from fastmcp import FastMCP

# FastMCP Server initialisieren
mcp = FastMCP("MathTools")

@mcp.tool()
def add(a: int, b: int) -> int:
    """Addiert zwei Zahlen."""
    return a + b

@mcp.tool()
def multiply(a: int, b: int) -> int:
    """Multipliziert zwei Zahlen."""
    return a * b

@mcp.tool()
def subtract(a: int, b: int) -> int:
    """Subtrahiert b von a."""
    return a - b

@mcp.tool()
def divide(a: float, b: float) -> float:
    """Teilt a durch b."""
    if b == 0:
        raise ValueError("Division durch 0 ist nicht erlaubt")
    return a / b

if __name__ == "__main__":
    # Server mit HTTP Transport starten
    mcp.run(transport="http", host="127.0.0.1", port=8000, path="/mcp")
'''

# Server-Datei schreiben
with open('math_mcp_server.py', 'w', encoding='utf-8') as f:
    f.write(server_code)

print("‚úÖ Server-Datei erstellt: math_mcp_server.py")
print("   ‚Ä¢ 4 Tools: add, multiply, subtract, divide\n")

# SCHRITT 2: Server als subprocess starten
print("‚è≥ Starte Server als subprocess...")

# Pr√ºfe ob Server bereits l√§uft und beende ihn
try:
    import requests
    requests.get("http://127.0.0.1:8000", timeout=1)
    print("‚ö†Ô∏è Server l√§uft bereits, versuche zu beenden...")
    # Warte kurz und versuche erneut
    time.sleep(2)
except:
    pass  # Server l√§uft nicht, gut!

# Server starten
server_process = subprocess.Popen(
    [sys.executable, "math_mcp_server.py"],
    stdout=subprocess.DEVNULL,
    stderr=subprocess.DEVNULL
)

# Warte bis Server bereit ist
print("‚è≥ Warte auf Server-Start...")
max_retries = 10
for i in range(max_retries):
    try:
        import requests
        response = requests.post(
            "http://127.0.0.1:8000/mcp",
            json={"jsonrpc": "2.0", "method": "tools/list", "id": 1},
            timeout=2
        )
        if response.status_code == 200:
            break
    except:
        time.sleep(1)
        if i == max_retries - 1:
            print("‚ùå Server konnte nicht gestartet werden!")
            server_process.kill()
            raise Exception("Server-Start fehlgeschlagen")

mprint("\n‚úÖ MCP-Server l√§uft auf http://127.0.0.1:8000/mcp")
print(f"üí° Server-Prozess PID: {server_process.pid}")
print("üí° Der Server l√§uft als echter subprocess!")

<p><font color='black' size="5">
Server-Status testen
</font></p>

Wir k√∂nnen den Server direkt √ºber HTTP testen:

In [None]:
#@title üß™ Server-Health-Check{ display-mode: "form" }

import requests
import json

mprint("### üß™ Server Health Check")
mprint("---")

try:
    # Test-Request an Server
    response = requests.post(
        "http://127.0.0.1:8000/mcp",
        json={
            "jsonrpc": "2.0",
            "method": "tools/list",
            "id": 1
        },
        timeout=5
    )

    if response.status_code == 200:
        data = response.json()
        tools_count = len(data.get('result', {}).get('tools', []))
        print(f"‚úÖ Server antwortet korrekt")
        print(f"üìä Verf√ºgbare Tools: {tools_count}")
        print(f"üåê URL: http://127.0.0.1:8000/mcp")
    else:
        print(f"‚ö†Ô∏è Server antwortet mit Status {response.status_code}")

except Exception as e:
    print(f"‚ùå Server nicht erreichbar: {e}")
    print("üí° F√ºhre die vorherige Zelle erneut aus")

# 3 | LangChain MCP Client

---

<p><font color='black' size="5">
Client mit streamable_http Transport erstellen
</font></p>

Der **MultiServerMCPClient** verbindet sich √ºber **streamable_http** mit dem Server:

**Wichtig:** Der Transport hei√üt `streamable_http`, nicht `http`!

In [None]:
#@title üîå MCP Client mit HTTP initialisieren{ display-mode: "form" }

from langchain_mcp_adapters.client import MultiServerMCPClient

mprint("### üîå MCP Client Setup (HTTP)")
mprint("---")

# Client konfigurieren mit streamable_http Transport (nicht "http"!)
client = MultiServerMCPClient(
    {
        "math": {
            "transport": "streamable_http",  # ‚úÖ Richtiger Transport-Name!
            "url": "http://127.0.0.1:8000/mcp"  # HTTP-Endpoint
        }
    }
)

print("‚úÖ Client konfiguriert")
print(f"   Transport: streamable_http")
print(f"   Server-URL: http://127.0.0.1:8000/mcp")

<p><font color='black' size="5">
Tools vom Server laden
</font></p>

Der Client l√§dt jetzt die Tools √ºber **streamable_http** vom Server:

In [None]:
#@title üîß Tools vom Server laden (streamable_http)  { display-mode: "form" }

mprint("### üîß Tools vom MCP-Server laden")
mprint("---")

# Tools asynchron laden √ºber streamable_http
tools = await client.get_tools()

print(f"‚úÖ {len(tools)} Tools geladen vom Server:")
for tool in tools:
    print(f"   ‚Ä¢ {tool.name}: {tool.description}")

mprint("\nüí° Kommunikation erfolgt √ºber streamable_http (JSON-RPC 2.0)!")

# 4 | LangChain 1.0+ Agent

---

<p><font color='black' size="5">
Agent mit MCP-Tools erstellen
</font></p>

Jetzt erstellen wir einen **LangChain 1.0+ Agent** mit den MCP-Tools. Der Agent kommuniziert √ºber **streamable_http** mit dem Server!

In [None]:
#@title ü§ñ LangChain 1.0+ Agent erstellen{ display-mode: "form" }

from langchain.chat_models import init_chat_model
from langchain.agents import create_agent

mprint("### ü§ñ LangChain 1.0+ Agent erstellen")
mprint("---")

# SCHRITT 1: LLM initialisieren (LangChain 1.0+ API)
print("1Ô∏è‚É£ LLM initialisieren...")
llm = init_chat_model("openai:gpt-4o-mini", temperature=0.0)
print("   ‚úÖ GPT-4o-mini geladen\n")

# SCHRITT 2: Agent erstellen mit MCP-Tools
print("2Ô∏è‚É£ Agent erstellen...")
agent = create_agent(
    model=llm,
    tools=tools,  # Tools vom MCP-Server (√ºber streamable_http)
    system_prompt="""Du bist ein hilfreicher Mathe-Assistent.
    Du hast Zugriff auf folgende Rechen-Tools √ºber einen MCP HTTP-Server:
    - add: Addiert zwei Zahlen
    - multiply: Multipliziert zwei Zahlen
    - subtract: Subtrahiert zwei Zahlen
    - divide: Teilt zwei Zahlen

    Nutze diese Tools, um komplexe Berechnungen durchzuf√ºhren.
    Antworte immer auf Deutsch und erkl√§re deine Rechenschritte.""",
    debug=False  # Weniger Output
)
print("   ‚úÖ Agent bereit\n")

mprint("üéØ Agent ist bereit f√ºr Queries!")
mprint("üí° Der Agent kommuniziert √ºber streamable_http mit dem MCP-Server")

# 5 | Praktische Beispiele

---

<p><font color='black' size="5">
Einfache Berechnungen
</font></p>

In [None]:
#@title ü§ñ Query 1: Addition (3 + 5){ display-mode: "form" }

query = "Berechne 3 + 5"

mprint(f"### ü§ñ Query: {query}")
mprint("---")

# Agent aufrufen
response = await agent.ainvoke({
    "messages": [{"role": "user", "content": query}]
})

# Antwort extrahieren
final_message = response["messages"][-1]
mprint(f"\nü§ñ **Antwort:** {final_message.content}")

In [None]:
#@title ü§ñ Query 2: Multiplikation (12 * 24){ display-mode: "form" }

query = "Was ist 12 mal 24?"

mprint(f"### ü§ñ Query: {query}")
mprint("---")

response = await agent.ainvoke({
    "messages": [{"role": "user", "content": query}]
})

final_message = response["messages"][-1]
mprint(f"\nü§ñ **Antwort:** {final_message.content}")

<p><font color='black' size="5">
Komplexe Berechnungen (Multi-Tool)
</font></p>

Der Agent orchestriert mehrere HTTP-Calls zum Server:

In [None]:
#@title ü§ñ Query 3: Komplexe Berechnung (3+5)*12*2{ display-mode: "form" }

query = "Berechne (3+5)*12*2 mit den MCP-Mathe-Tools."

mprint(f"### ü§ñ Query: {query}")
mprint("---")
print("üí° Erwarteter Ablauf (3 HTTP-Calls zum Server):")
print("   1. HTTP POST: add(3, 5) = 8")
print("   2. HTTP POST: multiply(8, 12) = 96")
print("   3. HTTP POST: multiply(96, 2) = 192\n")

response = await agent.ainvoke({
    "messages": [{"role": "user", "content": query}]
})

final_message = response["messages"][-1]
mprint(f"\nü§ñ **Antwort:** {final_message.content}")

In [None]:
#@title ü§ñ Query 4: Division und Subtraktion{ display-mode: "form" }

query = "Berechne (100 - 20) / 4"

mprint(f"### ü§ñ Query: {query}")
mprint("---")
print("üí° Erwarteter Ablauf:")
print("   1. HTTP POST: subtract(100, 20) = 80")
print("   2. HTTP POST: divide(80, 4) = 20.0\n")

response = await agent.ainvoke({
    "messages": [{"role": "user", "content": query}]
})

final_message = response["messages"][-1]
mprint(f"\nü§ñ **Antwort:** {final_message.content}")

# 6 | HTTP-Kommunikation pr√ºfen

---

<p><font color='black' size="5">
Direkter HTTP-Call zum Server
</font></p>

Wir k√∂nnen auch direkt HTTP-Requests an den Server senden:

In [None]:
#@title üîç Direkter HTTP-Call testen{ display-mode: "form" }

import requests

mprint("### üîç Direkter HTTP-Call zum MCP-Server")
mprint("---")

# Tool-Call √ºber HTTP
request_data = {
    "jsonrpc": "2.0",
    "method": "tools/call",
    "params": {
        "name": "multiply",
        "arguments": {"a": 7, "b": 8}
    },
    "id": 1
}

print("üì§ Sende HTTP POST Request:")
print(f"   URL: http://127.0.0.1:8000/mcp")
print(f"   Method: tools/call")
print(f"   Tool: multiply(7, 8)\n")

response = requests.post(
    "http://127.0.0.1:8000/mcp",
    json=request_data,
    timeout=5
)

print(f"üì• Response Status: {response.status_code}")
print(f"üìä Ergebnis: {response.json()}\n")

mprint("üí° **Best√§tigung:**")
print("Der MCP-Server l√§uft als ECHTER HTTP-Server!")
print("Kommunikation erfolgt √ºber HTTP POST (JSON-RPC 2.0)")
print("Der Server ist von au√üerhalb erreichbar (localhost:8000)")

In [None]:
#@title üõë MCP-Server beenden{ display-mode: "form" }

mprint("### üõë MCP-Server Cleanup")
mprint("---")

try:
    # Versuche den subprocess zu beenden
    if 'server_process' in globals():
        server_process.terminate()
        server_process.wait(timeout=5)
        print(f"‚úÖ Server-Prozess (PID {server_process.pid}) wurde beendet")
    else:
        print("‚ö†Ô∏è Keine server_process Variable gefunden")
except Exception as e:
    print(f"‚ö†Ô∏è Fehler beim Beenden: {e}")
    print("üí° Server l√§uft m√∂glicherweise noch. Kernel neu starten empfohlen.")

<p><font color='black' size="5">
Eigene MCP-Tools hinzuf√ºgen
</font></p>

**Ziel:** Erweitere den MCP-Server mit neuen Tools.

**Aufgabe 1: Potenzrechnung**
F√ºge ein `power(a, b)` Tool hinzu (bearbeite `math_mcp_server.py`, dann Server neu starten).

**Aufgabe 2: Modulo-Operation**
F√ºge ein `modulo(a, b)` Tool hinzu.

**Aufgabe 3: Komplexe Query**
Teste mit: `"Berechne (5 hoch 2) modulo 7"`

**Schritte:**
1. Bearbeite die Server-Datei `math_mcp_server.py`
2. Starte Server neu (f√ºhre Cleanup-Zelle aus, dann Zelle 2 neu)
3. Teste mit eigenen Queries

**Bonus:** Teste den Server von einem anderen Terminal mit `curl`:
```bash
curl -X POST http://localhost:8000/mcp \
  -H "Content-Type: application/json" \
  -d '{"jsonrpc":"2.0","method":"tools/list","id":1}'
```

# 8 | Zusammenfassung

---

<p><font color='black' size="5">
Was haben wir gelernt?
</font></p>

**In diesem Notebook haben wir:**

1. ‚úÖ **MCP-Server erstellt** - Mit FastMCP und 4 mathematischen Tools
2. ‚úÖ **HTTP-Kommunikation** - Server √ºber `streamable_http` bereitgestellt
3. ‚úÖ **Client verbunden** - Mit `MultiServerMCPClient` und Tools geladen
4. ‚úÖ **LangChain 1.0+ Agent** - Mit `init_chat_model()` und `create_agent()`
5. ‚úÖ **Praktische Anwendungen** - Komplexe Berechnungen durchgef√ºhrt
6. ‚úÖ **Debugging-Skills** - Direkte HTTP-Calls zum Server getestet

**Wichtige Konzepte:**

**MCP (Model Context Protocol)**
- Standardisiertes Protokoll f√ºr Tool-Integration
- Client-Server-Architektur
- JSON-RPC 2.0 f√ºr Kommunikation

**FastMCP**
- Python-Bibliothek f√ºr MCP-Server
- Einfache Tool-Definition mit `@mcp.tool()`
- Unterst√ºtzt HTTP, stdio, SSE, WebSocket

**LangChain Integration**
- `langchain-mcp-adapters` f√ºr Client-Integration
- Seamless Integration mit LangChain Agents
- Tools werden automatisch als LangChain Tools verf√ºgbar

**Best Practices:**
- Server als subprocess starten (nicht im Thread)
- Transport `streamable_http` f√ºr Web-Anwendungen
- Cleanup: Server sauber beenden
- Health Checks vor Client-Verbindung

**Anwendungsf√§lle f√ºr MCP:**

| Bereich | Beispiel-Tools |
|---------|---------------|
| **Datenbanken** | SQL-Queries, CRUD-Operationen |
| **Dateisystem** | Lesen, Schreiben, Suchen |
| **Web-APIs** | REST-Calls, Webhooks |
| **Cloud-Services** | AWS, Azure, GCP |
| **Entwicklung** | Git, CI/CD, Testing |

**Ressourcen:**
- [FastMCP Documentation](https://gofastmcp.com/deployment/running-server)
- [FastMCP GitHub](https://github.com/jlowin/fastmcp)
- [LangChain MCP Adapters](https://github.com/langchain-ai/langchain-mcp-adapters)
- [MCP Official Docs](https://modelcontextprotocol.io/)

**N√§chste Schritte:**
- üîß Eigene Tools implementieren (z.B. Datei-System, APIs)
- üåê MCP-Server deployen (Docker, Cloud)
- üîê Security hinzuf√ºgen (API Keys, Rate Limiting)
- üîÑ Multiple Server orchestrieren

# 7 | Zusammenfassung

---

<p><font color='black' size="5">
Was haben wir gelernt?
</font></p>

**In diesem Notebook haben wir:**

1. ‚úÖ **Echten MCP HTTP-Server** mit FastMCP erstellt
2. ‚úÖ **HTTP-Client-Server-Kommunikation** (JSON-RPC 2.0)
3. ‚úÖ **LangChain 1.0+ Agent** mit `init_chat_model()` und `create_agent()`
4. ‚úÖ **MultiServerMCPClient** mit `streamable_http` Transport
5. ‚úÖ **Praktische Queries** mit Multi-Tool-Orchestrierung
6. ‚úÖ **Echte Netzwerk-Kommunikation** √ºber HTTP POST

**Wichtiger Hinweis:**
- Der Transport hei√üt `streamable_http`, nicht `http`!
- Unterst√ºtzte Transports: `stdio`, `sse`, `websocket`, `streamable_http`

**Warum streamable_http statt stdio?**

| Feature | stdio | streamable_http (dieses Notebook) |
|---------|-------|-----------------------------------|
| **Jupyter/Colab** | ‚ùå Nicht unterst√ºtzt | ‚úÖ Funktioniert |
| **Remote-Server** | ‚ùå Nur lokal | ‚úÖ √úber Netzwerk |
| **Debugging** | Schwieriger | ‚úÖ Einfach (curl, Postman) |
| **Production** | M√∂glich | ‚úÖ Standard |

**Ressourcen:**
- [FastMCP Documentation](https://www.prefect.io/fastmcp)
- [LangChain MCP Adapters](https://github.com/langchain-ai/langchain-mcp-adapters)
- [MCP Official Docs](https://modelcontextprotocol.io/)

**N√§chste Schritte:**
- üåê Deployment auf echtem Server (AWS, GCP, Azure)
- üîê Authentication und Security (API Keys)
- üê≥ Docker-Containerisierung
- üîÑ Multi-Server-Integration