# MLiP Support-Vector-Machine (SVM) am Beispiel Rattern
Kurs Maschinelles Lernen in der Produktion

#### In diesem Notebook wird das Verfahren Support-Vector-Machine (SVM) anhand des Anwendungsbeispiels Rattern geübt. 

Bei der Fertigung von Bauteilen treten manchmal störende Schwingungen auf, sog. Rattern. Dieses schädigt die Werkzeuge und führt zu einer niedrigeren Bauteilqualität.

Im Datensatz "Rattern" werden die Drehzahl der Spindel und die Tiefe des Schnitts einer CNC-Fräse gemessen. Es soll eine Support-Vector-Machine (SVM) erstellt werden welche vorhersagen kann bei welcher Kombination aus Drehzahl und Tiefe das sog. Rattern auftritt. 
### Data-Mining-Prozess:

![Bild konnte nicht geladen werden! 1. Daten erfassen - 2. Daten erkunden - 3. Daten vorbereiten - 4. Modelle bilden - 5. Modelle validieren - 6. Modell testen](Prozess_Modellentwicklung_v2.png "ML Vorgehen")

### 0. Bibliotheken importieren

In [None]:
# Importiere benötigte Bibliotheken
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score, f1_score
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

#Einstellungen für die Grafikausgabe
style = 'seaborn-whitegrid'
plt.style.use(style)
plt.rcParams.update({'font.size': 14})  # Schriftgröße aller Textzeichen im Graphen

TODO:
* Wähle eine Zahl zwischen 1 und 100 für die Generierung deiner spezifischen Zufallszahlen my_seed=

(Wähle für alle Notebooks in allen Übungen immer die gleiche Zahl (z.B. den Tag deines Geburtstags), dann sind die Ergebnisse der verschiedenen Machine-Learning-Verfahren vergleichbar da dann alle Notebooks mit der "gleichen" Folge an Zufallszahlen arbeiten)

AUSGABE:
* Gewählte Zufallszahl

In [None]:
# Erstelle eigene Zufallszahlen
my_seed = TODO

# Ausgabe gewählte Zufallszahlen
print("\nGewählte Zahl für Zufallszahlen: \t" + str(my_seed))

### 1. Daten erfassen - Daten importieren

Import der Daten mittels der read_csv-Funktion von Pandas.  
Achtung, es gibt zwei Datensätze, einen mit den Trainingsdaten und einen mit den Testdaten. 

In [None]:
# Lade Datensatz
df_train = pd.read_csv("Trainingsdaten_Rattern.csv")
df_test = pd.read_csv("Testdaten_Rattern.csv")

### 2. Daten erkunden

In [None]:
# Datensatz anzeigen
df_train.head(10)

In [None]:
# Datensatz beschreiben
df_train.describe()

In [None]:
# Zeige Klassenzugehörigkeit an
fig = plt.figure(figsize=(20, 10))
surf = plt.scatter(df_train["Drehzahl Spindel"],
                   df_train["Tiefe des Schnitts"],
                   c=df_train["Rattern"],
                   cmap=plt.cm.coolwarm,
                   s=150,
                   alpha=0.7,
                   edgecolors="black")
plt.colorbar(surf)
plt.xlim(7750, 16250)
plt.ylim(0, 0.023)
plt.xlabel("Drehzahl Spindel")
plt.ylabel("Tiefe des Schnitts")
plt.title("Effekt des Ratterns über Schnitttiefe und Spindeldrehzahl")

### 3. Daten vorbereiten - Aufteilen in Features und Label

Die Trainingsdaten und Testdaten wurden getrennt importiert, die Validierungsdaten werden mittels Cross-Validation aus den Trainingsdaten gewählt. Somit müssen wir nur noch die Aufteilung in X und y vornehmen. 

In [None]:
# Teile Datensatz in X und y auf
X_train_ = df_train[["Drehzahl Spindel", "Tiefe des Schnitts"]]
y_train = df_train["Rattern"]

X_test_ = df_test[["Drehzahl Spindel", "Tiefe des Schnitts"]]
y_test = df_test["Rattern"]

### 3.2 Daten vorbereiten - Normierung der Daten
__Optional__ können die Input-Parameter (Schnitttiefe und Spindeldrehzahl) normiert werden.   
Es stehen grundsätzlich der StandardScaler, der MinMaxScaler und der MaxAbsScaler zur Verfügung. Für dieses Beispiel wurde der StandardScaler vorbereitet.

TODO: (Optional, wenn die Daten normiert werden sollen)
- Importiere einen Scaler, also entferne das erste Zeichen (#) in Zeilen 7 un 8
- Führe die Skalierung für die Trainingsdaten durch, also entferne das erste Zeichen (#) in Zeilen 9
- Führe die Skalierung für die Trainingsdaten durch, also entferne das erste Zeichen (#) in Zeilen 10

AUSGABE:
- Größe der Datensätze

In [None]:
# Normiere Input-Parameter (optionales TODO)
# hier passiert keine Normierung
X_train = X_train_.copy(deep=True) 
X_test = X_test_.copy(deep=True)

# Durchführung der Normierung:
# from sklearn.preprocessing import StandardScaler
# scaler = StandardScaler() 
# X_train = pd.DataFrame(scaler.fit_transform(X_train.values), index=X_train.index, columns=X_train.columns)
# X_test = pd.DataFrame(scaler.transform(X_test.values), index=X_test.index, columns=X_test.columns)

# Ausgabe Datensätze und Anzahl Datenpunkte
print("\nAnzahl Traingsdaten: \t" + str(len(y_train)) + " / " + str(len(df_train)+len(df_test)))
print("Anzahl Testdaten: \t" + str(len(y_test)) + " / " + str(len(df_train)+len(df_test)))

### 4.1 Modell bilden - Modell importieren
Zuerst müssen wir das SVM Modell importieren, damit wir es später nutzen können. 

TODO:
- Schreibe den Code, um das Modell aus der Bibliothek zu importieren. 

In [None]:
# Importiere das Modell aus der Bibliothek sklearn
TODO

Beschreibung der Hyperparameter:
http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC

### 4.2 Modelle bilden - Hyperparameter Tuning mittels Gittersuche

Für die __SVM mit rbf-Kernel__ werden in diesem Notebook __4 Hyperparameter__ eingestellt:
- kernel: Der Kernel.
- C: Der Strafterm C.
- gamma: Der Kernel Koeffizient gamma.
- random_state: Die Zufallszahlen zur Erzeugung des Modells.

Um die optimalen Werte für die Hyperparameter C und gamma zu finden wird eine __Gittersuche__ durchgeführt:
- Bestimme zu probierende Werte für C, gamma
- Für diese Werte wird für alle Kombinationen:
    - Ein Modell erstellt 
    - Ein Modell trainiert
    - Die Genauigkeit auf den Validationsdaten berechnet
- Die Hyperparameter mit der höchsten Genauigkeit werden für das Vorzugsmodell verwendet

TODO:
- Schreibe die C-Werte für die Gittersuche in eine Liste hinter 'C': (Zeile 7)
- Schreibe die gamma-Werte für die Gittersuche in eine Liste hinter 'gamma': (Zeile 7)
- Es gibt 3 Möglichkeiten die Werte einzutragen:
    - Möglichkeit 1: Manuelles Eintragen in eine Liste: Cs = [0.001, 0.01, 0.1, 1, 10]
    - Möglichkeit 2: Erzeugen einer Liste mit np.linspace(): Cs = np.linspace(von, bis, Anzahl an Werten), z.B. np.linspace(0.1,100, 4)
    - Möglichkeit 3: Erzeugen einer Liste mit np.logspace(): Cs = np.logspace(exp. von, exp. bis, Anzahl an Werten) z.B. np.logspace(-5,3,9)

- __Optional__, füge den Parameter n_jobs=3 hinzu, damit die GridSearch parallel gerechnet wird.

AUSGABE:
- Anzahl der getesteten Hyperparameterkombinationen
- Zeitdauer für Gittersuche

In [None]:
# Werte für die Gittersuche/Hyperparameter
from sklearn.model_selection import GridSearchCV
import time

start_timer = time.monotonic()
hyper_parameters = {"kernel": ["rbf"], 
                    "C": TODO, 
                    "gamma": TODO, 
                    "random_state": [my_seed]}

# Gittersuche: Berechne Genauigkeit auf Validationsdaten für alle möglichen Kombinationen
model = SVC()
gridSearch = GridSearchCV(model, hyper_parameters, return_train_score=True, cv=5)
gridSearch = gridSearch.fit(X_train, y_train)
print("\nDie Gittersuche ("
    + str(len(pd.DataFrame(gridSearch.cv_results_)))
    + " Kombinationen) hat "
    + str("%.1f" % (time.monotonic() - start_timer))
    + " Sekunden gedauert.")

### 5.1 Modelle validieren - GridSearch Ergebnisse begutachten

In der Variablen GridSearch sind nun die Ergebnisse der Gittersuche gespeichert.  

Mit dem Befahl GridSearch.cv_results_ bekommen wir die Ergebnis-Tabelle der Gittersuche (hier: besten 5 Ergebnisse):

In [None]:
# Top 5 Ergebnisse
pd.set_option('display.max_columns', None)
pd.DataFrame(gridSearch.cv_results_).sort_values("mean_test_score", ascending=False).head(5)

__Bonus:__  
Anzeigen einer sog. Heatmap der Hyperparameter C und gamma (nur bei 2 variierenden Hyperparametern möglich):

In [None]:
# Visualisierung des Einflusses der Hyperparameter
results = pd.DataFrame(gridSearch.cv_results_)
xx = results["param_C"].unique()
yy = results["param_gamma"].unique()
zz = np.asarray(results["mean_test_score"]).reshape(len(xx), len(yy)).T
fig = plt.figure(figsize=(16, 8))
plt.xlabel("C")
plt.ylabel("gamma")
plt.yscale("log")
plt.xscale("log")
plt.title("GITTERSUCHE: Genauigkeit (Validationsdaten) über den Hyperparametern C und gamma")
surf = plt.contourf(xx, yy, zz, cmap=plt.cm.coolwarm_r)
fig.colorbar(surf)
plt.show()

### 5.2 Modelle validieren - Modell auswählen 

Mit dem Befehl GridSearch.best_params_ bekommen wir die besten Hyperparameter der Gittersuche

In [None]:
# Beste Kombination der Hyperparameter
gridSearch.best_params_

Nun muss das Modell mit den optimalen Hyperparametern erstellt und dann mit den Trainingsdaten trainiert werden.  
Diese Aufgabe übernimmt bereits die GridSearch-Funktion. Somit muss das beste Modell nur noch extrahiert werden, das geht mit dem Befehl GridSearch.best_estimator_

In [None]:
# Extraktion des Modells
model = gridSearch.best_estimator_

#### 5.3 Modelle validieren - Bewertung des Trainings
Wir berechnen die Genauigkeit des Modells auf den Trainingsdaten (richtige Vorhersagen/alle Vorhersagen).

In [None]:
# Berechnung der Vorhersage basierend auf den Trainingsdaten
y_train_pred = model.predict(X_train)

# Berechne Genauigkeit auf den Trainingsdaten
accuracy_train = accuracy_score(y_train, y_train_pred)

# Berechne den F1-Score auf den Trainingsdaten
f1score_train = f1_score(y_train, y_train_pred)

# Ausgabe der Modellgenauigkeit
print('Ergebnis für das Training:')
print('Accuracy: \t' + str(round(accuracy_train, 3)))
print('F1-Score: \t' + str(round(f1score_train, 3)))

### 6.1 Modell testen & anwenden - Genauigkeit auf Testdaten und Konfusionsmatrix

Um die Qualität/Güte des Modells zu bestimmen wird dieses auf den Testdaten getestet und die Konfusionsmatrix ausgegeben.

In [None]:
# Berechnung der Vorhersage basierend auf den Testdaten
y_test_pred = model.predict(X_test)

# Berechne Genauigkeit auf den Testdaten
accuracy_test = accuracy_score(y_test, y_test_pred)

# Berechne den F1-Score auf den Testdaten
f1score_test = f1_score(y_test, y_test_pred)

# Ausgabe der Modellgenauigkeit
print('Ergebnis für den Test:')
print('Accuracy: \t' + str(round(accuracy_test, 3)))
print('F1-Score: \t' + str(round(f1score_test, 3)))


# Visualisierung der Konfusionsmatrix
ConfusionMatrixDisplay.from_estimator(model, X_test, y_test)
plt.grid()
plt.title('Konfusionsmatrix auf Testdaten')
plt.show()

### 6.2 Modell testen & anwenden - Modell visualisieren

Da das Modell nur 2 Input-Parameter benötigt können wir alle möglichen Modell-Vorhersagen grafisch visualisieren.

AUSGABE:
- Grafische Visualisierung der Modellvorhersage

In [None]:
# Erstelle Grid für Modellausgabe
x = np.linspace(X_train["Drehzahl Spindel"].min(), X_train["Drehzahl Spindel"].max(), 200)
y = np.linspace(X_train["Tiefe des Schnitts"].min(), X_train["Tiefe des Schnitts"].max(), 200)
X, Y = np.meshgrid(x, y)

# Berechne Modellvorhersage
z = pd.DataFrame({"Drehzahl Spindel": X.ravel(), "Tiefe des Schnitts": Y.ravel()})
z = model.predict(z)

# Ausgabe Modellvorhersage
Z = np.asarray(z).reshape(200, 200)
fig = plt.figure(figsize=(20, 12))
plt.title("Modellvorhersage und Datensätze (Train = Kreis, Test = Raute)")
plt.xlabel("Drehzahl Spindel")
plt.ylabel("Tiefe des Schnitts")
surf = plt.contourf(X, Y, Z, cmap=plt.cm.coolwarm)
plt.colorbar(surf)
plt.scatter(X_train["Drehzahl Spindel"],
            X_train["Tiefe des Schnitts"],
            c=y_train,
            marker="o",
            alpha=0.3,
            edgecolors="black",
            s=70)
plt.scatter(X_test["Drehzahl Spindel"],        
            X_test["Tiefe des Schnitts"],
            c=y_test,
            marker="D",
            edgecolors="black",
            s=70)
plt.show()