# DLfsP Dense Neural Network am Beispiel Rattern
Kurs Deep Learning für sequentielle Prozessdaten  

#### In diesem Notebook wird das TensorFlow mit Dense Layern anhand des Anwendungsbeispiels Rattern geübt.

Bei der Fertigung von Bauteilen treten manchmal störende Schwingungen auf, sog. Rattern. Dieses schädigt die Werkzeuge und führt zu einer niedrigeren Bauteilqualität.

Im Datensatz "Rattern" werden die Drehzahl der Spindel und die Tiefe des Schnitts einer CNC-Fräse gemessen. Es soll ein Entscheidungsbaum erstellt werden. Dises soll vorhersagen können, bei welcher Kombination aus Drehzahl und Schnitttiefe das Rattern auftritt.

![Daten erfassen -> Daten erkunden -> Daten vorbereiten -> Modelle bilden -> Modelle validieren -> Modell testen & anwenden](Prozess_Modellentwicklung_v2.png "model development")

### 0. Bibliotheken importieren

In [None]:
''' Import der wichtigsten Pakete. '''
import numpy as np
import pandas as pd
import random 
import os

import tensorflow as tf
from tensorflow import keras

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score, f1_score
from sklearn.metrics import classification_report, ConfusionMatrixDisplay
import seaborn as sns

#Einstellungen für die Grafikausgabe
style = 'seaborn-whitegrid'
plt.style.use(style)
plt.rcParams.update({'font.size': 14})  # Schriftgröße aller Textzeichen im Graphen


In [None]:
''' Überprüfe, ob TensorFlow installiert ist und die GPU oder die CPU nutzt. '''
print('TF version: ' + tf.__version__)
if tf.test.is_built_with_gpu_support():
    if len(tf.config.list_physical_devices('GPU'))==0:
         print('Achtung, TensorFlow nutzt gerade die CPU und nicht die GPU!')
    else:
        print('Default GPU Device: {}'.format(tf.config.list_physical_devices('GPU')))
        # GPU-Memory-Management:
        config = tf.compat.v1.ConfigProto()
        config.gpu_options.allow_growth = True
        session = tf.compat.v1.Session(config=config)
else:
    print('TensorFlow CPU version active')

TODO:
* Wähle eine Zahl zwischen 1 und 100 für die Generierung deiner spezifischen Zufallszahlen my_seed=

Damit Ergebnisse Reproduzierbar sind, müssen mehrere Seeds für Zufallszahlengeneratoren gesetzt werden. 

AUSGABE:
* Gewählte Zufallszahl

In [None]:
''' Setzen von Seeds, um Reproduzierbarkeit zu ermöglichen. '''
# Erstelle eigene Zufallszahlen
my_seed = TODO

# Ausgabe gewählte Zufallszahlen
print("\nGewählte Zahl für Zufallszahlen: \t" + str(my_seed))

# Seeds für diverse Zufallszahlengeneratoren setzen 
os.environ['PYTHONHASHSEED']=str(my_seed)
tf.random.set_seed(my_seed)
random.seed(my_seed)
np.random.seed(my_seed)

## 1. Daten erfassen 

In [None]:
""" Daten mit pandas einlesen. """
df_train = pd.read_csv("Trainingsdaten_Rattern.csv")
df_test = pd.read_csv("Testdaten_Rattern.csv")
print('Daten erfolgreich importiert')

## 2. Daten erkunden

In [None]:
""" Erste Zeilen des Trainingsdatensatzes als Beispiel. """
df_train.head(5)

In [None]:
""" Statistische Beschreibung des Trainingsdatensatzes. """
df_train.describe()

In [None]:
""" Ausgabe Klassenzugehörigkeit. """
fig = plt.figure(figsize=(20, 10))
surf = plt.scatter(df_train["Drehzahl Spindel"],
                   df_train["Tiefe des Schnitts"],
                   c=df_train["Rattern"],
                   cmap=plt.cm.coolwarm,
                   s=100,
                   alpha=0.7,
                   edgecolors="black")

plt.colorbar(surf)
plt.xlim(7750, 16250)
plt.ylim(0, 0.023)
plt.xlabel("Drehzahl Spindel")
plt.ylabel("Tiefe des Schnitts")
plt.title("Effekt des Ratterns über Schnitttiefe und Spindeldrehzahl")
plt.show()

## 3. Daten vorbereiten

In [None]:
""" Aufteilung in X und y. """
X_train = df_train.drop(columns=['Rattern']).to_numpy()
y_train = df_train['Rattern'].to_numpy(dtype='int32')

X_test = df_test.drop(columns=['Rattern']).to_numpy()
y_test = df_test['Rattern'].to_numpy(dtype='int32')


In [None]:
""" Aufteilen in Trainings- und Validierungsdaten. """
# Festlegen des Anteils an Validierungsdaten
validation_split = 0.15

# Aufteilung der Daten
X_train, X_val, y_train ,y_val = train_test_split(X_train, y_train, test_size=validation_split, shuffle=True, random_state=my_seed)

# Ausgabe, Anzahl der Samples je Datensatz
nr_train = len(X_train)
nr_val = len(X_val)
nr_test = len(X_test)
print(nr_train, "Trainingssequenzen")
print(nr_val, "Validierungssequenzen")
print(nr_test, "Testsequenzen")

In [None]:
""" Daten normalisieren. """
# Importieren und Anlernen des Scalers (d.h. Scaler lernt Mittelwerte und Standardabweichungen der Features)
scaler = StandardScaler().fit(X_train)

# Normierung der Daten mit den gelernten Paramatern und gleichzeitiges Formatieren
X_train = scaler.transform(X_train)
X_val = scaler.transform(X_val)
X_test = scaler.transform(X_test)
print('Datenaufbereitung fertig')

In [None]:
''' Überprüfen der Form der Numpy Arrays. '''
print('Shape X_train: ' + str(X_train.shape))
print('Shape X_val: ' + str(X_val.shape))
print('Shape X_test: ' + str(X_test.shape))

## 4. Modelle bilden
### <span style="color:#0000ff;">1.) Modellaufbau</span>

TODO:
* Zunächst muss die Modellstruktur definiert werden. 
* Die Anzahl der Layer und die Anzahl der Knoten/Nodes pro Layer ist einem selbst überlassen. 
* Probiere also verschiedene Modellgrößen aus, um das beste Modell für die Aufgabe zu finden.

Nützliche Links:
* https://keras.io/guides/sequential_model/   
* https://keras.io/api/layers/core_layers/dense/   

In [None]:
''' Modellaufbau '''
# Import der notwendigen Klassen und Funktionen
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense 

# Bestimmung der Form eines einzelnen Trainingsbeispiels
input_shape = (2,) # Der Input in das Modell, ist ein 1D Tensor der Länge 2 

# Definition des Modells
model = Sequential()
"""
*
* TODO: 
*      Dense Layers hinzufügen
*     
"""
model.summary()



### <span style="color:#0000ff;">2.) Modellkompilierung</span>

Der Optimierer, die Loss Funktion und die Metrik wurden bereits festgelegt. 

In [None]:
''' Modell kompilieren. '''
# Optimizer festlegen
optimizer=tf.keras.optimizers.Adam(learning_rate=1e-3)

# Einstellung für das spätere Training zum Kompilieren festlegen
model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=['acc'])


### <span style="color:#0000ff;">3.) Modelltraining</span>  

TODO:
* Wähle die Anzahl der Epochen aus, für die das Modell trainiert werden soll. 
* Danach müssen die Trainingsinputs, -outputs sowie die Validierungsdaten bestimmt werden.

Ausgabe: 
* Zwischenergebnisse je Epoche

In [None]:
''' Modell trainieren '''
"""
*
* TODO:
*       Füge die fehlenden Variablen ein!
*       (TODO löschen)
*
"""
# Festlegung der Batch_Size und Anzahl der Epoche
batch_size = 32
epochs = TODO
# Durchführen des Trainings. Die Ergebnisse je Epoche werden in der History gespeichert. 
history = model.fit(TODO, TODO, batch_size=batch_size, epochs=epochs,
                    validation_data=(TODO, TODO), shuffle=True)

## 5. Modelle validieren

### Kennzahlen fürs Training und Validierung:

In [None]:
print('Kennzahlen (Loss und Accuracy Metrik) fürs Training:')
print(model.evaluate(X_train, y_train))
print('Kennzahlen (Loss und Accuracy Metrik) für Validierung:')
print(model.evaluate(X_val, y_val))

### Visualisierung des Trainingsverlaufs

In [None]:
""" Trainingsverlauf plotten. """
train_acc = history.history['acc']
val_acc = history.history['val_acc']
train_loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(1,len(train_acc) +1)

plt.figure(figsize=(12,6))
plt.plot(epochs, train_acc,'bo', label='Training accuracy')
plt.plot(epochs, val_acc,'b', label='Validation accuracy')

plt.title('Accuracy', fontsize=16)
plt.xlabel('Epochs', fontsize=14)
plt.ylabel('Accuracy', fontsize=14)
plt.legend()

plt.figure(figsize=(12,6))
plt.plot(epochs, train_loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')

plt.title('Loss', fontsize = 16)
plt.xlabel('Epochs', fontsize=14)
plt.ylabel('Loss', fontsize=14)
plt.legend()

plt.show()

## 6. Modell testen & anwenden

Führen Sie diesen Schritt erst aus, wenn Sie mit Ihrem Modell zufrieden sind.  

Der Test eines Modells soll ermitteln, wie gut das Modell übertragbar und generalisierbar ist.  
Wenn Sie alle Modelle direkt testen, wählen Sie nur das Modell aus, was am Besten zum Testdatensatz passt. Aber nicht welches das Problem grundsätzlich am Besten löst. Sie Overfitten somit den Testdatensatz.

In [None]:
"""Modell anhand Testdaten bewerten"""
y_test_pred = (model.predict(X_test)>0.5).astype("int32")
# Berechne Genauigkeit auf den Testdaten
accuracy_test = accuracy_score(y_test, y_test_pred)

# Berechne den F1-Score auf den Testdaten
f1score_test = f1_score(y_test, y_test_pred)

# Ausgabe der Modellgenauigkeit
print('Ergebnis für den Test:')
print('Accuracy: \t' + str(round(accuracy_test, 4)))
print('F1-Score: \t' + str(round(f1score_test, 4)))

# Visualisierung der Konfusionsmatrix
ConfusionMatrixDisplay.from_predictions(y_test, y_test_pred)
plt.grid()
plt.title('Konfusionsmatrix auf Testdaten')
plt.show()

# Classification Report
print('Classification Report')
print(classification_report(y_test, y_test_pred))

### Modellvorhersagen visualisieren

Da das Modell nur 2 Input-Parameter benötigt können wir alle möglichen Modellvorhersagen grafisch visualisieren.

In [None]:
''' Visualisierung der Modellvorhersagen und Decision Boundary.'''
# Erstelle Grid für Modellausgabe
x = np.linspace(
    X_train[:, 0].min(), X_train[:, 0].max(), 200
)
y = np.linspace(
    X_train[:, 1].min(), X_train[:,1].max(), 200
)
X, Y = np.meshgrid(x, y)

# Berechne Modellvorhersage
z = pd.DataFrame({"Drehzahl Spindel": X.ravel(), "Tiefe des Schnitts": Y.ravel()})
z = model.predict(z)

# Ausgabe Modellvorhersage

Z = np.asarray(z).reshape(200, 200)
fig = plt.figure(figsize=(20, 12))
plt.title("Modellvorhersage und Datensätze (Train = Kreis, VAlidierung = Viereck, Test = Raute)")
plt.xlabel("Drehzahl Spindel")
plt.ylabel("Tiefe des Schnitts")
surf = plt.contourf(X, Y, Z, cmap=plt.cm.coolwarm)
plt.colorbar(surf)
plt.scatter(
    X_train[:, 0],
    X_train[:, 1],
    c=y_train,
    marker="o",
    alpha=0.3,
    edgecolors="black",
    s=70)
plt.scatter(
    X_val[:, 0],
    X_val[:, 1],
    c=y_val,
    marker="s",
    edgecolors="black",
    s=70)
plt.scatter(
    X_test[:, 0],
    X_test[:, 1],
    c=y_test,
    marker="D",
    edgecolors="black",
    s=70)
plt.show()

## 7. Bonus: Modell mit der Functional API definieren

Die functional API ist praktisch für komplexere Modellarchitekturen.  

https://keras.io/guides/functional_api/ 

In [None]:
"""Functional Model"""

inputs = keras.Input(input_shape, dtype="float32")
"""
*
* TODO: 
*      Dense Layers hinzufügen
*            
*     
*
"""

outputs = Dense(1, activation="sigmoid")(x)
model = keras.Model(inputs, outputs)
model.summary()