## Grundlagen Maschineller Lernverfahren | ML_INF19A | 2021
**Datum: 09.11.2021**

# Modellperformance

In [None]:
# Bibliotheken laden
import numpy as np
import matplotlib.pyplot as plt

# Zufall "beeinflussen"
np.random.seed(2021)

## Datensatz erstellen

In [None]:
# Lade Bibliothek
from sklearn.datasets import make_classification # https://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_classification.html

In [None]:
# Erstelle Datensatz
X,y  = make_classification(n_samples = 3000, n_features = 10, n_classes = 2, random_state = 4711)

In [None]:
# Ein Blick in die Daten werfen
print(X)
print(y)
print(X.shape)
print(y.shape)

In [None]:
# Visualisiere die Daten (nur Features x1 und x6 <- Willkürlich gewählt)
plt.plot(X[:, 0][y==0], X[:, 5][y==0], "bv")
plt.plot(X[:, 0][y==1], X[:, 5][y==1], "go")

# Erinnerung: Visualisierung in höher-dimensionalen Räumen sehr schelcht darstellbar!

In [None]:
# Erstelle Datenmengen für Training und Validierung
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 4711)

## Modell erstellen

In [None]:
# Lade Bibliothek
from sklearn.linear_model import LogisticRegression
import sys

# Erstelle Instanz
model = LogisticRegression()

## Lernkurve zeichnen

In [None]:
# Zeige Verteilung der Instanzen für Training und Testing
num_instances_train = len(X_train)
num_instances_test = len(X_test)

print(num_instances_train, num_instances_test)

In [None]:
from sklearn.metrics import log_loss, accuracy_score

# Lege leere Liste an (darin werden später die Fehlerwerte gespeichert)
list_errors_train_ll = []
list_errors_test_ll = []
list_errors_train_acc = []
list_errors_test_acc = []

# Durchlaufe alle Trainingsinstanzen
for max_instances in range(1, num_instances_train):
  
  # Wähle iterativ immer mehr Trainingsinstanzen aus
  current_X_train = X_train[:max_instances]
  current_y_train = y_train[:max_instances]

  # Zeige die Dimension des aktuellen Trainingsdatensatzes an
  if max_instances % 100 == 0:
    print(current_X_train.shape, " / " , current_y_train.shape)

  try: # Vorkehrung um Fehler im Programmablauf abzufangen
    
    # Trainiere mit aktueller Trainingsdatenmenge
    model.fit(current_X_train, current_y_train)

    # ----------

    # Vorhersagen
    y_predict_train = model.predict(current_X_train) # nur die bisher im Training gesehenen
    y_predict_test = model.predict(X_test) # Alle Validierungsinstanzen!
  
    # ----------

    # Berechne LogLoss Fehlerwerte
    error_train_logloss = log_loss(current_y_train, y_predict_train)
    error_test_logloss = log_loss(y_test, y_predict_test)

    # Speichere Fehlerwerte in Liste
    list_errors_train_ll.append(error_train_logloss)
    list_errors_test_ll.append(error_test_logloss)

    # ----------
    
    # Berechne Accuracy Score (für alternative Darstellung des Performanceverlaufs)
    error_train_accuracy = accuracy_score(current_y_train, y_predict_train)
    error_test_accuracy = accuracy_score(y_test, y_predict_test)

    # Speichere Accurancy Scores in Liste
    list_errors_train_acc.append(error_train_accuracy)
    list_errors_test_acc.append(error_test_accuracy)
  
  except ValueError: # Fange Fehler mit ValueError ab
    print("Ignoriere -> " ,sys.exc_info()) # Gebe Hinweis aus

In [None]:
# Zeichne LogLoss-Fehler Verlauf
plt.figure(figsize=(15,9))
plt.plot(list_errors_train_ll, label="Training")
plt.plot(list_errors_test_ll, label="Validierung")
plt.xlabel("Trainingsdateninstanzen")
plt.ylabel("LogLoss Fehler")
plt.legend()

In [None]:
# Zeichne Accuracy Verlauf
plt.figure(figsize=(15,9))
plt.plot(list_errors_train_acc, label="Training")
plt.plot(list_errors_test_acc, label="Validierung")
plt.xlabel("Trainingsdateninstanzen")
plt.ylabel("Accuracy Score")
plt.legend()

## Confusion Matrix

In [None]:
# Lade Bibliotheken
from sklearn.metrics import confusion_matrix, plot_confusion_matrix

In [None]:
## Hinweis: Trainiere das Modell von oben nochmal neu

# Erstelle Instanz
model = LogisticRegression()

# Trainiere mit aktueller Trainingsdatenmenge
model.fit(X_train, y_train)

# Vorhersagen
y_predict_train = model.predict(X_train) # nur die bisher im Training gesehenen
y_predict_test = model.predict(X_test) # Alle Validierungsinstanzen!

In [None]:
# Aufbau der Confusion Matrix
# TN  FP
# FN  TP

In [None]:
# Berechne ConfusionMatrix für Trainingsdaten
confusion_matrix(y_train, y_predict_train)

In [None]:
# Berechne ConfusionMatrix für Testdaten
confusion_matrix(y_test, y_predict_test)

In [None]:
# Zeichne ConfusionMatrix für Training und Test (mit angepasster Formatierung der Zahlen)
plot_confusion_matrix(model, X_train, y_train, values_format="4d")
plot_confusion_matrix(model, X_test, y_test, values_format="4d")

## Accuracy / Precision / Recall

In [None]:
# Lade Bibliotheken
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
# https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics

In [None]:
# Accuracy Werte
print("[Accuracy] Trainingsdaten:\t", accuracy_score(y_train, y_predict_train))
print("[Accuracy] Testdaten:\t\t", accuracy_score(y_test, y_predict_test))

In [None]:
# Precision Werte
print("[Precision] Trainingsdaten:\t", precision_score(y_train, y_predict_train))
print("[Precision] Testdaten:\t\t", precision_score(y_test, y_predict_test))

In [None]:
# Recall Werte
print("[Recall] Trainingsdaten:\t", recall_score(y_train, y_predict_train))
print("[Recall] Testdaten:\t\t", recall_score(y_test, y_predict_test))

In [None]:
# F1 Score Werte
print("[F1] Trainingsdaten:\t", f1_score(y_train, y_predict_train))
print("[F1] Testdaten:\t\t", f1_score(y_test, y_predict_test))

### Precision - Recall Tradeoff

In [None]:
# Erinnerung:
#############
# Precision = TP / (TP + FP) --> Wieviele Ergebnisse sind "sinnvoll""? (d.h. der Anteil der TP zu den als POSITIVE ermittelten)
# Recall = TP / (TP + FN)    --> Wieviele "sinnvolle" Ergebnisse wurden ermittelt? (d.h. der Anteil der TP zu den wirklich POSITIVEN)

In [None]:
from sklearn.model_selection import cross_val_predict # https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html

# Berechne "Score" Werte -> Wie "sicher" ist sich der Klassifikator bei der Zuordnung der Testinstanzen?
predict_scores_test = cross_val_predict(model, X_test, y_test, cv=5, method="decision_function")

In [None]:
from sklearn.metrics import precision_recall_curve # https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_curve.html

# Berechne Precision und Recall Werte für jede einzelne Dateninstanz in den Testdaten (basierend auf Zielvariable und den berechneten Scores)
precision_test, recall_test, thresholds_test = precision_recall_curve(y_test, predict_scores_test)

In [None]:
# Zeichne Tradeoff
plt.plot(thresholds_test, precision_test[0:-1], label = "Precision")
plt.plot(thresholds_test, recall_test[0:-1], label = "Recall")
plt.xlabel("Threshold")
plt.ylabel("Precision / Recall")
plt.title("Testdaten")
plt.grid()
plt.legend()

#plt.ylim([0.88, 0.91]) # Details