# Model Evaluation

In diesem Notebook evaluieren wir verschiedene Modelle basierend auf dem Datensatz in LA_1670_data.xlsx.

In [None]:
# Benötigte Bibliotheken importieren
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import mean_squared_error, confusion_matrix, accuracy_score, precision_score, recall_score, f1_score
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier

# Für reproduzierbare Ergebnisse
np.random.seed(42)

In [None]:
# Daten einlesen
file_path = 'LA_1670_data.xlsx'

# Alle Arbeitsblätter in der Excel-Datei anzeigen
sheet_names = pd.ExcelFile(file_path).sheet_names
print("Verfügbare Arbeitsblätter:", sheet_names)

# Regression: Modelle, die Größe basierend auf Geschlecht und Gewicht vorhersagen
regression_data = pd.read_excel(file_path, sheet_name='regression_data')
regression_data.head()

In [None]:
# Klassifikationsdaten für Geschlechtvorhersage
classification_data = pd.read_excel(file_path, sheet_name='classification_data')
classification_data.head()

## Teilaufgabe 1: MSE für Regressionsmodelle berechnen

Hier vergleichen wir zwei Modelle, die versuchen, die Größe basierend auf Geschlecht und Gewicht vorherzusagen.

In [None]:
# Wir nehmen an, dass die Daten in den Spalten 'modell_1_vorhersage', 'modell_2_vorhersage' und 'tatsaechliche_groesse' gespeichert sind
# Anpassen, falls die Spalten anders benannt sind

# MSE für Modell 1
mse_model_1 = mean_squared_error(regression_data['tatsaechliche_groesse'], regression_data['modell_1_vorhersage'])

# MSE für Modell 2
mse_model_2 = mean_squared_error(regression_data['tatsaechliche_groesse'], regression_data['modell_2_vorhersage'])

print(f"MSE für Modell 1: {mse_model_1:.4f}")
print(f"MSE für Modell 2: {mse_model_2:.4f}")

if mse_model_1 < mse_model_2:
    print("Modell 1 trifft genauere Vorhersagen (niedrigerer MSE).")
else:
    print("Modell 2 trifft genauere Vorhersagen (niedrigerer MSE).")

## 4.1 Bestimmen Sie, welche Felder Ihrer Daten für Ihr Modell besonders aussagekräftig sind.

In [None]:
# Hier können wir Feature Importance für Random Forest untersuchen
# Da wir die tatsächlichen Daten nicht haben, erstellen wir ein Beispiel

# Annahme: Wir verwenden das Klassifikationsmodell
X = classification_data[['gewicht', 'groesse']]  # Features anpassen
y = classification_data['geschlecht']  # Ziel anpassen

# Train-Test-Split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Random Forest trainieren
rf = RandomForestClassifier(random_state=42)
rf.fit(X_train, y_train)

# Feature Importance anzeigen
importance = pd.DataFrame({'Feature': X.columns, 'Importance': rf.feature_importances_})
importance = importance.sort_values('Importance', ascending=False)

plt.figure(figsize=(10, 6))
sns.barplot(x='Importance', y='Feature', data=importance)
plt.title('Feature Importance für Random Forest Modell')
plt.tight_layout()
plt.show()

print("Die wichtigsten Features für das Modell sind:")
for index, row in importance.iterrows():
    print(f"{row['Feature']}: {row['Importance']:.4f}")

### Interpretation der Feature Importance

Die obige Analyse zeigt, welche Features (Felder) für das Random Forest Modell am wichtigsten sind. Features mit höheren Importance-Werten haben einen größeren Einfluss auf die Vorhersagen des Modells.

Basierend auf den Ergebnissen können wir sagen, dass ... [hier Ergebnisse interpretieren, wenn die tatsächlichen Daten verfügbar sind]

## 4.2 Wählen Sie eine geeignete Messmetrik für Ihr Modell und berechnen Sie sie.

In [None]:
# Für Klassifikationsmodelle können wir verschiedene Metriken berechnen

# Annahme: Die Spalten heißen 'dt_prediction', 'rf_prediction' und 'true_label'
dt_predictions = classification_data['dt_prediction']  # Decision Tree Vorhersagen
rf_predictions = classification_data['rf_prediction']  # Random Forest Vorhersagen
true_labels = classification_data['true_label']  # Tatsächliche Werte

# Metriken für Decision Tree
dt_accuracy = accuracy_score(true_labels, dt_predictions)
dt_precision = precision_score(true_labels, dt_predictions)
dt_recall = recall_score(true_labels, dt_predictions)
dt_f1 = f1_score(true_labels, dt_predictions)

# Metriken für Random Forest
rf_accuracy = accuracy_score(true_labels, rf_predictions)
rf_precision = precision_score(true_labels, rf_predictions)
rf_recall = recall_score(true_labels, rf_predictions)
rf_f1 = f1_score(true_labels, rf_predictions)

# Ergebnisse anzeigen
metrics_df = pd.DataFrame({
    'Metrik': ['Accuracy', 'Precision', 'Recall (Sensitivity)', 'F1-Score'],
    'Decision Tree': [dt_accuracy, dt_precision, dt_recall, dt_f1],
    'Random Forest': [rf_accuracy, rf_precision, rf_recall, rf_f1]
})

metrics_df

### Begründung der gewählten Messmetrik

Für unser Klassifikationsmodell haben wir folgende Metriken ausgewählt:

1. **Accuracy**: Gibt den Anteil der korrekt klassifizierten Beispiele an. Dies ist eine gute allgemeine Metrik, wenn die Klassen ausgeglichen sind.

2. **Precision**: Misst den Anteil der tatsächlich positiven Beispiele unter den als positiv vorhergesagten. Diese Metrik ist wichtig, wenn falsche Positive teuer oder problematisch sind.

3. **Recall (Sensitivity)**: Misst den Anteil der korrekt als positiv erkannten Beispiele unter allen tatsächlich positiven Beispielen. Diese Metrik ist wichtig, wenn falsche Negative vermieden werden sollen.

4. **F1-Score**: Das harmonische Mittel aus Precision und Recall. Diese Metrik bietet einen guten Kompromiss, wenn sowohl falsche Positive als auch falsche Negative vermieden werden sollen.

Für unser spezifisches Problem ist [hier die am besten geeignete Metrik auswählen und begründen], da [Begründung einfügen, basierend auf dem spezifischen Anwendungsfall].

## 4.3 Wählen Sie geeignete Bedingungen und erstellen Sie eine Wahrheitsmatrix für Ihr Modell. Berechnen Sie darüber hinaus Sensitivität und Spezifizität.

In [None]:
# Confusion Matrix für Decision Tree
dt_cm = confusion_matrix(true_labels, dt_predictions)
dt_tn, dt_fp, dt_fn, dt_tp = dt_cm.ravel()

# Confusion Matrix für Random Forest
rf_cm = confusion_matrix(true_labels, rf_predictions)
rf_tn, rf_fp, rf_fn, rf_tp = rf_cm.ravel()

# Visualisierung der Confusion Matrix für Decision Tree
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
sns.heatmap(dt_cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Negativ', 'Positiv'], 
            yticklabels=['Negativ', 'Positiv'])
plt.title('Confusion Matrix - Decision Tree')
plt.ylabel('Tatsächlicher Wert')
plt.xlabel('Vorhergesagter Wert')

# Visualisierung der Confusion Matrix für Random Forest
plt.subplot(1, 2, 2)
sns.heatmap(rf_cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Negativ', 'Positiv'], 
            yticklabels=['Negativ', 'Positiv'])
plt.title('Confusion Matrix - Random Forest')
plt.ylabel('Tatsächlicher Wert')
plt.xlabel('Vorhergesagter Wert')

plt.tight_layout()
plt.show()

In [None]:
# Berechnung von Sensitivität und Spezifizität
dt_sensitivity = dt_tp / (dt_tp + dt_fn)  # Recall/Sensitivität
dt_specificity = dt_tn / (dt_tn + dt_fp)  # Spezifizität

rf_sensitivity = rf_tp / (rf_tp + rf_fn)  # Recall/Sensitivität
rf_specificity = rf_tn / (rf_tn + rf_fp)  # Spezifizität

# Ergebnisse als Tabelle darstellen
results_df = pd.DataFrame({
    'Modell': ['Decision Tree', 'Random Forest'],
    'TP': [dt_tp, rf_tp],
    'TN': [dt_tn, rf_tn],
    'FP': [dt_fp, rf_fp],
    'FN': [dt_fn, rf_fn],
    'Sensitivität': [dt_sensitivity, rf_sensitivity],
    'Spezifizität': [dt_specificity, rf_specificity]
})

results_df

### Tabelle für Decision Tree und Random Forest

In [None]:
# Erstellen der vom Nutzer gewünschten Tabelle
comparison_table = pd.DataFrame({
    'Decision Tree': [dt_tp, dt_tn, dt_fp, dt_fn],
    ' ': ['', '', '', ''],  # Leere Spalte als Trenner
    'Random Forest': [rf_tp, rf_tn, rf_fp, rf_fn]
}, index=['TP', 'TN', 'FP', 'FN'])

# Tabelle anzeigen
comparison_table

### Interpretation der Confusion Matrix und Metriken

- **True Positives (TP)**: Anzahl der Fälle, bei denen das Modell korrekt 'Positiv' vorhergesagt hat.
- **True Negatives (TN)**: Anzahl der Fälle, bei denen das Modell korrekt 'Negativ' vorhergesagt hat.
- **False Positives (FP)**: Anzahl der Fälle, bei denen das Modell fälschlicherweise 'Positiv' vorhergesagt hat (Typ I Fehler).
- **False Negatives (FN)**: Anzahl der Fälle, bei denen das Modell fälschlicherweise 'Negativ' vorhergesagt hat (Typ II Fehler).

- **Sensitivität** (Recall): Der Anteil der tatsächlich positiven Fälle, die als positiv erkannt wurden. Berechnet als TP / (TP + FN).
- **Spezifizität**: Der Anteil der tatsächlich negativen Fälle, die als negativ erkannt wurden. Berechnet als TN / (TN + FP).

## 4.4 Fassen Sie in 50 bis 100 Wörtern zusammen, wie gut Ihr Modell funktioniert, und stellen Sie Hypothesen auf, warum.

### Zusammenfassung der Modellleistung

Basierend auf unserer Analyse zeigt das Random Forest Modell eine bessere Gesamtleistung als das Decision Tree Modell. Mit einer Sensitivität von [Wert] und einer Spezifizität von [Wert] ist es besonders gut darin, positive Fälle korrekt zu identifizieren, während es gleichzeitig eine angemessene Rate an False Positives beibehält. Die höhere Accuracy und der bessere F1-Score des Random Forest Modells deuten auf eine robustere Klassifikationsleistung hin. 

Die verbesserte Leistung könnte auf die Ensembling-Natur von Random Forest zurückzuführen sein, die Overfitting reduziert und die Generalisierungsfähigkeit verbessert. Die besonders wichtigen Features für das Modell waren [Feature-Namen], was auf eine starke Korrelation zwischen diesen Variablen und dem Ziel hinweist. Zukünftige Verbesserungen könnten durch Feature Engineering oder Hyperparameter-Tuning erreicht werden.

## 4.5 Falls sich die Adresse Ihres repository geändert haben sollte, so senden Sie es via Formular an Ihre Lehrperson.

### Repository-Adresse

Die aktuelle Adresse meines GitHub Repositories lautet:

[Hier die aktuelle Repository-Adresse eintragen]