# Modelltraining f√ºr Telco Customer Churn

Dieses Notebook f√ºhrt das komplette Modelltraining durch:
1. Daten laden und vorbereiten
2. Features ausw√§hlen und encodieren
3. Train/Test Split
4. Mehrere Modelle trainieren
5. Evaluation und Vergleich

In [None]:
# ============================================================================
# IMPORTS
# ============================================================================
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import (accuracy_score, classification_report, confusion_matrix, 
                             roc_auc_score, roc_curve)
import matplotlib.pyplot as plt
import seaborn as sns

# Plot-Einstellungen
plt.style.use('seaborn-v0_8-whitegrid')
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 11

print("‚úì Alle Libraries importiert!")

---
## Schritt 1: Daten Laden

Wir laden den Telco Customer Churn Datensatz. 

**Passe den Pfad an deinen Datensatz an!**

In [None]:
# ============================================================================
# SCHRITT 1: DATEN LADEN
# ============================================================================
# Hier laden wir den Telco Datensatz.
# WICHTIG: Passe den Pfad an, falls deine Datei woanders liegt!
# ============================================================================

# === PFAD ANPASSEN! ===
data = pd.read_csv('../../data/day_3/telco-customer-churn/train.csv')

print(f"Datensatz geladen: {data.shape[0]} Zeilen, {data.shape[1]} Spalten")
print(f"\nSpalten:\n{data.columns.tolist()}")
data.head()

In [None]:
# ============================================================================
# SCHRITT 1b: ZIELVARIABLE PR√úFEN
# ============================================================================
# Die Zielvariable ist 'Churn' - das ist was wir vorhersagen wollen.
# Wir pr√ºfen:
#   - Welche Werte gibt es? (0/1 oder Yes/No?)
#   - Wie ist die Verteilung? (Wie viele Kunden sind abgewandert?)
#
# Eine unbalancierte Verteilung (z.B. 90% No Churn, 10% Churn) kann 
# das Training erschweren!
# ============================================================================

print("=" * 50)
print("ZIELVARIABLE: Churn")
print("=" * 50)

print(f"\nWerte: {data['Churn'].unique()}")
print(f"\nVerteilung:")
print(data['Churn'].value_counts())
print(f"\nProzentual:")
print((data['Churn'].value_counts(normalize=True) * 100).round(1))

---
## Schritt 2: Features Ausw√§hlen

Nicht alle Spalten sind n√ºtzlich f√ºr die Vorhersage:
- **Customer ID**: Nur eine ID, kein Vorhersagewert
- **Churn**: Das ist unsere ZIELVARIABLE (was wir vorhersagen wollen)
- **Churn Category/Reason**: Das wissen wir nur NACHDEM jemand churned ‚Üí Data Leakage!
- **City, State, Zip Code, Lat/Long**: Zu granular, w√ºrde Overfitting verursachen

In [None]:
# ============================================================================
# SCHRITT 2: FEATURES AUSW√ÑHLEN
# ============================================================================
# Wir entfernen Spalten die:
#   1. Keine Vorhersagekraft haben (IDs)
#   2. Data Leakage verursachen (Info die wir nur nach Churn wissen)
#   3. Zu granular sind (jeder Kunde hat eigenen Wert ‚Üí Overfitting)
#
# X = Features (alle Eingabe-Variablen)
# y = Target (was wir vorhersagen wollen = Churn)
# ============================================================================

print("=" * 50)
print("SCHRITT 2: FEATURES AUSW√ÑHLEN")
print("=" * 50)

# Spalten die wir NICHT als Features wollen
drop_cols = [
    'Customer ID',           # Nur eine ID, kein Vorhersagewert
    'Churn',                 # Zielvariable (nicht als Feature!)
    'Churn Category',        # Data Leakage - wissen wir nur nach Churn
    'Churn Reason',          # Data Leakage - wissen wir nur nach Churn
    'Customer Status',       # Data Leakage - h√§ngt direkt mit Churn zusammen
    'City',                  # Zu granular (zu viele einzigartige Werte)
    'State',                 # K√∂nnten wir behalten, aber vereinfachen wir
    'Country',               # Nur ein Wert (United States) - nutzlos
    'Zip Code',              # Zu granular
    'Lat Long',              # Redundant mit Latitude/Longitude
    'Latitude',              # Geografische Daten, nicht relevant
    'Longitude'              # Geografische Daten, nicht relevant
]

# Nur Spalten droppen die tats√§chlich existieren
drop_cols = [c for c in drop_cols if c in data.columns]
print(f"\nEntfernte Spalten ({len(drop_cols)}):")
for col in drop_cols:
    print(f"   - {col}")

# Features und Target trennen
X = data.drop(columns=drop_cols)
y = data['Churn']

print(f"\n‚úì Features (X): {X.shape[1]} Spalten")
print(f"‚úì Target (y): {y.shape[0]} Werte")
print(f"\nVerbleibende Features:")
print(X.columns.tolist())

---
## Schritt 3: Kategorische Variablen Encodieren

Machine Learning Modelle k√∂nnen nur mit **Zahlen** arbeiten, nicht mit Text!

**Beispiel:** Die Spalte 'Contract' hat Werte wie:
- "Month-to-Month", "One Year", "Two Year"

Nach **One-Hot Encoding** wird daraus:

| Contract_One Year | Contract_Two Year |
|-------------------|-------------------|
| 0                 | 0                 | ‚Üê Month-to-Month
| 1                 | 0                 | ‚Üê One Year
| 0                 | 1                 | ‚Üê Two Year

`drop_first=True`: Wir lassen eine Kategorie weg (Referenzkategorie)

In [None]:
# ============================================================================
# SCHRITT 3: KATEGORISCHE VARIABLEN ENCODIEREN
# ============================================================================
# One-Hot Encoding wandelt Text-Kategorien in Zahlen um.
# 
# F√ºr jede Kategorie wird eine neue Spalte erstellt:
#   - 1 = diese Kategorie trifft zu
#   - 0 = diese Kategorie trifft nicht zu
#
# drop_first=True: Eine Kategorie wird weggelassen (Referenz)
# Beispiel: Wenn Contract_One Year=0 und Contract_Two Year=0, 
#           dann MUSS es Month-to-Month sein.
# ============================================================================

print("=" * 50)
print("SCHRITT 3: KATEGORISCHE VARIABLEN ENCODIEREN")
print("=" * 50)

# Kategorische Spalten finden (Datentyp = object)
cat_cols = X.select_dtypes(include=['object']).columns.tolist()

print(f"\nKategorische Spalten ({len(cat_cols)}):")
for col in cat_cols:
    unique_vals = X[col].nunique()
    print(f"   - {col}: {unique_vals} Kategorien")
    if unique_vals <= 10:  # Nur anzeigen wenn wenige Kategorien
        print(f"     Werte: {X[col].unique().tolist()}")

# One-Hot Encoding durchf√ºhren
X_encoded = pd.get_dummies(X, columns=cat_cols, drop_first=True)

print(f"\n‚úì Vorher:  {X.shape[1]} Spalten")
print(f"‚úì Nachher: {X_encoded.shape[1]} Spalten (durch One-Hot Encoding)")

---
## Schritt 4: Fehlende Werte Behandeln

Fehlende Werte (NaN) k√∂nnen Modelle nicht verarbeiten!

**Optionen:**
1. Zeilen mit NaN l√∂schen (schlecht wenn viele Daten verloren gehen)
2. NaN mit sinnvollen Werten f√ºllen (besser!)

Wir verwenden den **Median** (Mittelwert der sortierten Daten):
- Robust gegen Ausrei√üer
- Beispiel: [1, 2, 3, 100] ‚Üí Median=2.5, Mean=26.5

In [None]:
# ============================================================================
# SCHRITT 4: FEHLENDE WERTE BEHANDELN
# ============================================================================
# Wir pr√ºfen auf fehlende Werte (NaN) und f√ºllen sie mit dem Median.
# Der Median ist robust gegen Ausrei√üer.
# ============================================================================

print("=" * 50)
print("SCHRITT 4: FEHLENDE WERTE BEHANDELN")
print("=" * 50)

# Fehlende Werte z√§hlen
missing = X_encoded.isnull().sum()
missing_cols = missing[missing > 0]

if len(missing_cols) > 0:
    print(f"\n‚ö†Ô∏è  Spalten mit fehlenden Werten:")
    for col, count in missing_cols.items():
        pct = count / len(X_encoded) * 100
        print(f"   - {col}: {count} ({pct:.1f}%)")
    
    # Mit Median auff√ºllen
    X_encoded = X_encoded.fillna(X_encoded.median())
    print(f"\n‚úì Fehlende Werte mit Median aufgef√ºllt!")
else:
    print("\n‚úì Keine fehlenden Werte gefunden!")

print(f"\nFinale Anzahl fehlender Werte: {X_encoded.isnull().sum().sum()}")

---
## Schritt 5: Train/Test Split

Wir teilen die Daten in zwei Teile:
- **Training Set (80%)**: Damit LERNT das Modell
- **Test Set (20%)**: Damit PR√úFEN wir wie gut das Modell ist

**WICHTIG:** Das Modell sieht die Testdaten NIEMALS w√§hrend des Trainings!

So simulieren wir "echte" neue Kunden, die das Modell noch nie gesehen hat.

In [None]:
# ============================================================================
# SCHRITT 5: TRAIN/TEST SPLIT
# ============================================================================
# Wir teilen die Daten auf:
#   - 80% zum Trainieren (das Modell lernt daraus)
#   - 20% zum Testen (um zu pr√ºfen wie gut das Modell ist)
#
# stratify=y: Stellt sicher, dass Train und Test die gleiche 
#             Churn-Verteilung haben (wichtig bei unbalancierten Daten!)
#
# random_state=42: Macht das Ergebnis reproduzierbar
#                  (gleiche Zufallszahlen bei jedem Durchlauf)
# ============================================================================

print("=" * 50)
print("SCHRITT 5: TRAIN/TEST SPLIT")
print("=" * 50)

X_train, X_test, y_train, y_test = train_test_split(
    X_encoded, 
    y, 
    test_size=0.2,       # 20% f√ºr Test
    random_state=42,     # Reproduzierbarkeit
    stratify=y           # Gleiche Churn-Verteilung
)

print(f"\nüìä Aufteilung:")
print(f"   Training Set: {X_train.shape[0]} Samples ({X_train.shape[0]/len(X_encoded)*100:.0f}%)")
print(f"   Test Set:     {X_test.shape[0]} Samples ({X_test.shape[0]/len(X_encoded)*100:.0f}%)")

print(f"\nüéØ Churn-Verteilung im Training Set:")
print(f"   No Churn (0): {(y_train == 0).sum()} ({(y_train == 0).mean()*100:.1f}%)")
print(f"   Churn (1):    {(y_train == 1).sum()} ({(y_train == 1).mean()*100:.1f}%)")

print(f"\nüéØ Churn-Verteilung im Test Set:")
print(f"   No Churn (0): {(y_test == 0).sum()} ({(y_test == 0).mean()*100:.1f}%)")
print(f"   Churn (1):    {(y_test == 1).sum()} ({(y_test == 1).mean()*100:.1f}%)")

---
## Schritt 6: Features Skalieren

Verschiedene Features haben verschiedene Skalen:
- **Tenure in Months**: 0-72
- **Total Revenue**: 0-10000+
- **Monthly Charge**: 20-100

**Problem:** Features mit gro√üen Werten dominieren das Modell!

**StandardScaler** transformiert alle Features auf:
- Mittelwert = 0
- Standardabweichung = 1

**WICHTIG:** 
- `fit_transform` auf TRAINING (lernt die Skalierung)
- `transform` auf TEST (wendet gleiche Skalierung an)
- NIE fit auf Testdaten! (sonst "Data Leakage")

In [None]:
# ============================================================================
# SCHRITT 6: FEATURES SKALIEREN
# ============================================================================
# StandardScaler bringt alle Features auf die gleiche Skala:
#   - Mittelwert = 0
#   - Standardabweichung = 1
#
# Das ist wichtig f√ºr Modelle wie Logistic Regression und SVM!
# Random Forest braucht keine Skalierung, schadet aber auch nicht.
#
# WICHTIG: Wir fitten NUR auf Trainingsdaten, dann transformieren wir beide!
# ============================================================================

print("=" * 50)
print("SCHRITT 6: FEATURES SKALIEREN")
print("=" * 50)

scaler = StandardScaler()

# fit_transform auf Training (lernt Mittelwert und Std)
X_train_scaled = scaler.fit_transform(X_train)

# NUR transform auf Test (wendet gelernte Werte an)
X_test_scaled = scaler.transform(X_test)

# Beispiel: Erste numerische Spalte
example_col = X_train.columns[0]
print(f"\nBeispiel Skalierung f√ºr '{example_col}':")
print(f"   Vorher:  Min={X_train[example_col].min():.2f}, Max={X_train[example_col].max():.2f}")
print(f"   Nachher: Min={X_train_scaled[:, 0].min():.2f}, Max={X_train_scaled[:, 0].max():.2f}")

print("\n‚úì Features skaliert mit StandardScaler")

---
## Schritt 7: Modelle Trainieren

Wir trainieren verschiedene Algorithmen und vergleichen sie:

| Modell | Beschreibung | Vorteile |
|--------|--------------|----------|
| **Logistic Regression** | Klassiker f√ºr bin√§re Klassifikation | Schnell, interpretierbar |
| **Random Forest** | Ensemble aus vielen Entscheidungsb√§umen | Robust, keine Skalierung n√∂tig |
| **Gradient Boosting** | B√§ume werden nacheinander trainiert | Oft beste Performance |
| **K-Nearest Neighbors** | Klassifiziert nach n√§chsten Nachbarn | Einfach zu verstehen |
| **SVM** | Findet optimale Trennlinie | Gut bei kleinen Datens√§tzen |

In [None]:
# ============================================================================
# SCHRITT 7: MODELLE TRAINIEREN
# ============================================================================
# Wir trainieren 5 verschiedene Modelle und vergleichen ihre Performance.
# 
# F√ºr jedes Modell berechnen wir:
#   - Accuracy: Anteil korrekter Vorhersagen
#   - ROC-AUC: Fl√§che unter der ROC-Kurve (0.5=Zufall, 1.0=Perfekt)
# ============================================================================

print("=" * 50)
print("SCHRITT 7: MODELLE TRAINIEREN")
print("=" * 50)

# Dictionary mit allen Modellen
models = {
    'Logistic Regression': LogisticRegression(max_iter=1000, random_state=42),
    'Random Forest': RandomForestClassifier(n_estimators=100, random_state=42, n_jobs=-1),
    'Gradient Boosting': GradientBoostingClassifier(n_estimators=100, random_state=42),
    'K-Nearest Neighbors': KNeighborsClassifier(n_neighbors=5),
    'SVM': SVC(probability=True, random_state=42)
}

# Ergebnisse speichern
results = []

print("\nüöÄ Training l√§uft...\n")

for name, model in models.items():
    print(f"   Training: {name}...", end=" ")
    
    # Modell trainieren (skalierte Daten f√ºr die meisten Modelle)
    if name == 'Random Forest':
        # Random Forest braucht keine Skalierung
        model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        y_prob = model.predict_proba(X_test)[:, 1]
    else:
        # Alle anderen Modelle mit skalierten Daten
        model.fit(X_train_scaled, y_train)
        y_pred = model.predict(X_test_scaled)
        y_prob = model.predict_proba(X_test_scaled)[:, 1]
    
    # Metriken berechnen
    acc = accuracy_score(y_test, y_pred)
    auc = roc_auc_score(y_test, y_prob)
    
    results.append({
        'Model': name,
        'Accuracy': acc,
        'ROC-AUC': auc,
        'model_object': model,
        'y_pred': y_pred,
        'y_prob': y_prob
    })
    
    print(f"‚úì Accuracy: {acc:.3f}, ROC-AUC: {auc:.3f}")

# Ergebnisse als DataFrame
results_df = pd.DataFrame(results)[['Model', 'Accuracy', 'ROC-AUC']]
results_df = results_df.sort_values('ROC-AUC', ascending=False)

print("\n" + "-" * 50)
print("üìä MODELL-VERGLEICH (sortiert nach ROC-AUC):")
print("-" * 50)
print(results_df.to_string(index=False))

---
## Schritt 8: Evaluation - Confusion Matrix & ROC Curve

### Confusion Matrix
Zeigt die 4 m√∂glichen Outcomes:
- **True Negative (TN)**: Kein Churn vorhergesagt, tats√§chlich kein Churn ‚úì
- **True Positive (TP)**: Churn vorhergesagt, tats√§chlich Churn ‚úì
- **False Negative (FN)**: Kein Churn vorhergesagt, aber tats√§chlich Churn ‚úó (SCHLECHT!)
- **False Positive (FP)**: Churn vorhergesagt, aber kein Churn ‚úó

### ROC Curve
Zeigt den Trade-off zwischen:
- **True Positive Rate**: Wie viele Churner erkennen wir?
- **False Positive Rate**: Wie viele Nicht-Churner klassifizieren wir falsch?

**AUC (Area Under Curve):**
- 0.5 = Zuf√§lliges Raten
- 0.7-0.8 = Akzeptabel
- 0.8-0.9 = Gut
- > 0.9 = Exzellent

In [None]:
# ============================================================================
# SCHRITT 8: EVALUATION - CONFUSION MATRIX & ROC CURVE
# ============================================================================
# Wir visualisieren die Performance des besten Modells.
# ============================================================================

print("=" * 50)
print("SCHRITT 8: EVALUATION")
print("=" * 50)

# Bestes Modell finden
best_result = max(results, key=lambda x: x['ROC-AUC'])
best_model_name = best_result['Model']
best_y_pred = best_result['y_pred']
best_y_prob = best_result['y_prob']

print(f"\nüèÜ Bestes Modell: {best_model_name}")

# Visualisierung
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# 1. Confusion Matrix
cm = confusion_matrix(y_test, best_y_pred)
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', ax=axes[0],
            xticklabels=['No Churn', 'Churn'], 
            yticklabels=['No Churn', 'Churn'],
            annot_kws={'size': 14})
axes[0].set_title(f'Confusion Matrix ({best_model_name})', fontsize=12)
axes[0].set_xlabel('Vorhergesagt', fontsize=11)
axes[0].set_ylabel('Tats√§chlich', fontsize=11)

# 2. ROC Curve f√ºr alle Modelle
for result in results:
    fpr, tpr, _ = roc_curve(y_test, result['y_prob'])
    auc = roc_auc_score(y_test, result['y_prob'])
    axes[1].plot(fpr, tpr, label=f"{result['Model']} (AUC={auc:.3f})", linewidth=2)

axes[1].plot([0, 1], [0, 1], 'k--', label='Zuf√§lliges Raten (AUC=0.5)', linewidth=1)
axes[1].set_xlabel('False Positive Rate', fontsize=11)
axes[1].set_ylabel('True Positive Rate', fontsize=11)
axes[1].set_title('ROC Curve - Modellvergleich', fontsize=12)
axes[1].legend(loc='lower right', fontsize=9)
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Confusion Matrix interpretieren
tn, fp, fn, tp = cm.ravel()
print(f"\nüìã Confusion Matrix Interpretation:")
print(f"   ‚úì {tn} Kunden korrekt als 'No Churn' erkannt (True Negative)")
print(f"   ‚úì {tp} Kunden korrekt als 'Churn' erkannt (True Positive)")
print(f"   ‚úó {fp} Kunden f√§lschlich als 'Churn' markiert (False Positive)")
print(f"   ‚úó {fn} Churner NICHT erkannt - das ist besonders schlecht! (False Negative)")

---
## Schritt 9: Feature Importance

Random Forest kann uns sagen, **welche Features am wichtigsten** sind!

**Wie funktioniert das?**
- Der Algorithmus misst, wie stark jedes Feature zur Trennung von Churn/No-Churn beitr√§gt
- Features die oft f√ºr Splits verwendet werden = wichtiger

**Das hilft uns zu verstehen:**
- WARUM Kunden churnen
- Welche Faktoren wir beeinflussen sollten

In [None]:
# ============================================================================
# SCHRITT 9: FEATURE IMPORTANCE
# ============================================================================
# Random Forest zeigt uns welche Features am wichtigsten f√ºr die
# Churn-Vorhersage sind. Das gibt wertvolle Business Insights!
# ============================================================================

print("=" * 50)
print("SCHRITT 9: FEATURE IMPORTANCE")
print("=" * 50)

# Random Forest Modell aus den Ergebnissen holen
rf_result = [r for r in results if r['Model'] == 'Random Forest'][0]
rf_model = rf_result['model_object']

# Feature Importance extrahieren
feature_importance = pd.DataFrame({
    'Feature': X_encoded.columns,
    'Importance': rf_model.feature_importances_
}).sort_values('Importance', ascending=False)

# Top 15 visualisieren
plt.figure(figsize=(10, 8))
top_15 = feature_importance.head(15)
colors = plt.cm.viridis(np.linspace(0.2, 0.8, len(top_15)))
sns.barplot(data=top_15, x='Importance', y='Feature', palette=colors)
plt.title('Top 15 Wichtigste Features f√ºr Churn-Vorhersage', fontsize=14)
plt.xlabel('Importance Score', fontsize=11)
plt.ylabel('Feature', fontsize=11)
plt.tight_layout()
plt.show()

print("\nüìä Top 10 wichtigste Features:")
print("-" * 40)
for i, row in feature_importance.head(10).iterrows():
    print(f"   {row['Feature']}: {row['Importance']:.4f}")

---
## Schritt 10: Classification Report

Detaillierte Metriken f√ºr jede Klasse:

| Metrik | Beschreibung | Formel |
|--------|--------------|--------|
| **Precision** | Wenn das Modell 'Churn' sagt, wie oft stimmt das? | TP / (TP + FP) |
| **Recall** | Von allen echten Churnern, wie viele erkennen wir? | TP / (TP + FN) |
| **F1-Score** | Harmonic Mean von Precision und Recall | 2 √ó (P√óR)/(P+R) |

**F√ºr Churn ist RECALL besonders wichtig!** Wir wollen m√∂glichst alle Churner finden.

In [None]:
# ============================================================================
# SCHRITT 10: CLASSIFICATION REPORT
# ============================================================================
# Detaillierte Metriken f√ºr jede Klasse.
#
# PRECISION: "Wenn das Modell 'Churn' sagt, wie oft stimmt das?"
# RECALL: "Von allen echten Churnern, wie viele erkennen wir?" (WICHTIG!)
# F1-SCORE: Balance zwischen Precision und Recall
# ============================================================================

print("=" * 50)
print("SCHRITT 10: CLASSIFICATION REPORT")
print("=" * 50)

print(f"\nüìä Detaillierter Report f√ºr {best_model_name}:\n")
print(classification_report(y_test, best_y_pred, target_names=['No Churn', 'Churn']))

# Zusammenfassung
print("\n" + "=" * 60)
print("üéØ ZUSAMMENFASSUNG")
print("=" * 60)
print(f"\nBestes Modell: {best_model_name}")
print(f"Accuracy:      {accuracy_score(y_test, best_y_pred)*100:.1f}%")
print(f"ROC-AUC:       {roc_auc_score(y_test, best_y_prob):.3f}")
print(f"\nDas Modell erkennt {tp} von {tp+fn} Churnern ({tp/(tp+fn)*100:.1f}% Recall)")
print(f"Das Modell macht {fp} False Alarms (sagt Churn, aber kein Churn)")

---
## Bonus: Modell-Vergleich Visualisierung

In [None]:
# ============================================================================
# BONUS: MODELL-VERGLEICH VISUALISIERUNG
# ============================================================================

fig, ax = plt.subplots(figsize=(10, 6))

# Daten vorbereiten
models_sorted = results_df.sort_values('ROC-AUC', ascending=True)
x = range(len(models_sorted))
width = 0.35

# Bars erstellen
bars1 = ax.barh([i - width/2 for i in x], models_sorted['Accuracy'], width, 
                label='Accuracy', color='steelblue')
bars2 = ax.barh([i + width/2 for i in x], models_sorted['ROC-AUC'], width, 
                label='ROC-AUC', color='coral')

# Beschriftung
ax.set_xlabel('Score', fontsize=11)
ax.set_title('Modell-Vergleich: Accuracy vs ROC-AUC', fontsize=14)
ax.set_yticks(x)
ax.set_yticklabels(models_sorted['Model'])
ax.legend(loc='lower right')
ax.set_xlim(0, 1)

# Werte anzeigen
for bar in bars1:
    width_val = bar.get_width()
    ax.text(width_val + 0.01, bar.get_y() + bar.get_height()/2, 
            f'{width_val:.3f}', va='center', fontsize=9)
for bar in bars2:
    width_val = bar.get_width()
    ax.text(width_val + 0.01, bar.get_y() + bar.get_height()/2, 
            f'{width_val:.3f}', va='center', fontsize=9)

plt.tight_layout()
plt.show()

print("\n‚úÖ Modelltraining abgeschlossen!")