# MLOps Workshop: Model Packaging und Containerisierung

## EinfÃ¼hrung
In diesem Notebook lernen wir, wie wir unseren Customer Churn Predictor in einen Docker Container verpacken. Wir werden sowohl das trainierte Modell als auch die FastAPI-Anwendung containerisieren.

## Lernziele
Nach Abschluss dieses Notebooks kÃ¶nnen Sie:
- Ein ML-Modell fÃ¼r die Produktion vorbereiten
- Eine FastAPI-Anwendung containerisieren
- Best Practices fÃ¼r ML-Model-Serving implementieren
- Docker-Container fÃ¼r ML-Anwendungen erstellen und testen

## Prerequisites
- Abgeschlossenes Modelltraining und -evaluierung (Notebooks 03 und 04)
- Docker auf dem System installiert
- FastAPI Backend implementiert

## 1. Modell-Export und Verifikation

Zuerst laden wir unsere benÃ¶tigten Bibliotheken:


In [2]:
import mlflow
import pandas as pd
import numpy as np
from mlflow.tracking import MlflowClient
import os
from pathlib import Path

# MLflow Setup
mlflow.set_tracking_uri("file:./mlruns")
client = MlflowClient()


### Aufgabe 1: Modell laden und Ã¼berprÃ¼fen
Verifizieren Sie das trainierte Modell und seine Features.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```python
# Modell laden
model_name = "customer_churn_predictor"
model_version = client.get_latest_versions(model_name, stages=["Staging"])[0]
model = mlflow.sklearn.load_model(f"runs:/{model_version.run_id}/model")

# Features Ã¼berprÃ¼fen
print("Modell Features:", model.feature_names_in_)

# Beispiel-Prediction durchfÃ¼hren
test_data = pd.DataFrame({
    'gender': [1],
    'tenure': [12],
    'MonthlyCharges': [89.9],
    'TotalCharges': [1078.8],
    'AvgCostPerService': [29.97],
    'CustomerAge': [42]
})

prediction = model.predict_proba(test_data)
print("\nTest Prediction:", prediction[:, 1])
```
</details>


In [None]:
# Modell laden
model_name = "customer_churn_predictor"
model_version = client.get_latest_versions(model_name, stages=["Staging"])[0]
model = mlflow.sklearn.load_model(f"runs:/{model_version.run_id}/model")

# Features Ã¼berprÃ¼fen
print("Modell Features:", model.feature_names_in_)

# Beispiel-Prediction durchfÃ¼hren
test_data = pd.DataFrame({
    'gender': [1],
    'tenure': [12],
    'MonthlyCharges': [89.9],
    'TotalCharges': [1078.8],
    'AvgCostPerService': [29.97],
    'CustomerAge': [42]
})

prediction = model.predict_proba(test_data)
print("\nTest Prediction:", prediction[:, 1])

## 2. API-Dateien vorbereiten

### Aufgabe 2: Erstellen Sie die requirements.txt
Erstellen Sie eine requirements.txt mit allen benÃ¶tigten Paketen.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```bash
# requirements.txt
fastapi==0.104.1
uvicorn==0.24.0
pandas==2.1.3
numpy==1.26.2
scikit-learn==1.3.2
mlflow==2.8.1
pydantic==2.5.2
python-multipart==0.0.6
```
</details>


### Aufgabe 3: Projektstruktur erstellen
Erstellen Sie die benÃ¶tigte Verzeichnisstruktur.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```bash
project_root/
â”œâ”€â”€ src/
â”‚   â””â”€â”€ api/
â”‚       â”œâ”€â”€ main.py
â”‚       â””â”€â”€ test_main.py
â”œâ”€â”€ models/
â”‚   â””â”€â”€ model/
â”œâ”€â”€ notebooks/
â”‚   â””â”€â”€ mlruns/
â”œâ”€â”€ Dockerfile
â”œâ”€â”€ docker-compose.yml
â””â”€â”€ requirements.txt
```
</details>


## 3. Docker Configuration

### Aufgabe 4: Dockerfile erstellen
Erstellen Sie ein Dockerfile fÃ¼r die FastAPI-Anwendung.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```dockerfile
# Base image
FROM python:3.9-slim

# Set working directory
WORKDIR /app

# Copy requirements first for better caching
COPY requirements.txt .

# Install dependencies
RUN pip install --no-cache-dir -r requirements.txt

# Copy the rest of the application
COPY src/api /app/api
COPY notebooks/mlruns /app/mlruns

# Environment variables
ENV PYTHONPATH=/app
ENV MODEL_PATH=/app/mlruns

# Switch to non-root user
RUN useradd -m appuser
USER appuser

# Command to run the application
CMD ["uvicorn", "api.main:app", "--host", "0.0.0.0", "--port", "8000"]
```
</details>


### Aufgabe 5: Docker Compose erstellen
Erstellen Sie eine docker-compose.yml fÃ¼r einfaches Deployment.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```yaml
version: '3.8'

services:
  churn-predictor:
    build: .
    ports:
      - "8000:8000"
    volumes:
      - ./notebooks/mlruns:/app/mlruns
    environment:
      - MODEL_PATH=/app/mlruns
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8000/health"]
      interval: 30s
      timeout: 10s
      retries: 3
```
</details>


## 4. Container Build und Test

### Aufgabe 6: Container erstellen und testen
Bauen und testen Sie den Docker Container.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```bash
# Container bauen
docker build -t churn-predictor:latest .

# Container starten
docker run -p 8000:8000 churn-predictor:latest

# Test mit curl
curl -X 'POST' \
  'http://localhost:8000/predict' \
  -H 'Content-Type: application/json' \
  -d '{
    "data": [{
        "gender": 1,
        "tenure": 12,
        "MonthlyCharges": 89.9,
        "TotalCharges": 1078.8,
        "AvgCostPerService": 29.97,
        "CustomerAge": 42
    }]
}'
```

Python-Code zum Testen:
```python
import requests
import json

# Test-Daten
test_data = {
    "data": [{
        "gender": 1,
        "tenure": 12,
        "MonthlyCharges": 89.9,
        "TotalCharges": 1078.8,
        "AvgCostPerService": 29.97,
        "CustomerAge": 42
    }]
}

# API-Request
response = requests.post(
    'http://localhost:8000/predict',
    json=test_data
)

print("Status Code:", response.status_code)
print("Response:", response.json())
```
</details>


## 5. Performance Testing

### Aufgabe 7: Last- und Performance-Tests
Implementieren Sie einfache Last-Tests.

<details>
<summary>ðŸ‘‰ LÃ¶sung anzeigen</summary>

```python
import time
import concurrent.futures
import statistics

def make_prediction_request():
    """Einzelne Prediction durchfÃ¼hren"""
    response = requests.post(
        'http://localhost:8000/predict',
        json=test_data
    )
    return response.elapsed.total_seconds()

def run_load_test(num_requests=100, concurrent_requests=10):
    """Load Test durchfÃ¼hren"""
    response_times = []
    
    with concurrent.futures.ThreadPoolExecutor(max_workers=concurrent_requests) as executor:
        futures = [executor.submit(make_prediction_request) for _ in range(num_requests)]
        for future in concurrent.futures.as_completed(futures):
            response_times.append(future.result())
    
    print(f"\nLoad Test Results (n={num_requests}):")
    print(f"Mean response time: {statistics.mean(response_times):.3f}s")
    print(f"Median response time: {statistics.median(response_times):.3f}s")
    print(f"95th percentile: {np.percentile(response_times, 95):.3f}s")

# Load Test ausfÃ¼hren
run_load_test()
```
</details>



## Hausaufgaben und weiterfÃ¼hrende Ãœbungen
1. Implementieren Sie ein Multi-Stage Docker Build
2. FÃ¼gen Sie Prometheus Metriken hinzu
3. Implementieren Sie ein Blue-Green Deployment
4. Erstellen Sie ein Kubernetes Deployment Manifest
5. Implementieren Sie automatische Skalierung

## NÃ¤chste Schritte
- Deployment in einer Cloud-Umgebung
- Implementierung von Monitoring und Logging
- CI/CD Pipeline aufsetzen
- Kubernetes Deployment vorbereiten

## Hilfreiche Befehle

```bash
# Docker
docker build -t churn-predictor .
docker run -p 8000:8000 churn-predictor
docker ps
docker logs <container_id>

# Docker Compose
docker-compose up -d
docker-compose logs
docker-compose down

# Curl Tests
curl http://localhost:8000/health
curl http://localhost:8000/model-info
```

## ZusÃ¤tzliche Hinweise
- Verwenden Sie immer spezifische Versionen in requirements.txt
- Implementieren Sie Health Checks fÃ¼r Container Orchestration
- Nutzen Sie Docker Layer Caching effektiv
- Minimieren Sie die Image-GrÃ¶ÃŸe
- Beachten Sie Security Best Practices