# Statische Modellbildung mit der DIM-Toolbox

Ziel ist es ein statisches polynomiales Modell zu bestimmen, welches die eingestellen Maschinenparameter auf die resultierende Bauteilqualität abbildet. 

Die für das Modelltraining (Schätzung der Modellparameter) und die Modellvalidierung zu verwendenden Daten wurden im Rahmen eines umfangreichen Versuchsplanes erhoben. Der Trainingsdatensatz umfasst die Daten von 2105 Produktionszyklen, der Validierungsdatensatz umfasst die Daten von 548 Produktionszyklen

In [36]:
import pickle as pkl
import seaborn as sns
import sys
sys.path.insert(0, "/home/alexander/GitHub/DigitalTwinInjectionMolding/")
sys.path.insert(0, 'E:/GitHub/DigitalTwinInjectionMolding/')

from DIM.miscellaneous.PreProcessing import LoadSetpointData,MinMaxScale
from DIM.models.model_structures import Static_MLP
from DIM.optim.param_optim import ModelTraining, static_mode

Spezifiziere Pfad zur Datenbasis und welche Chargen für Modellbildung und -validierung verwendet werden sollen 

In [37]:
path = 'E:/GitHub/DigitalTwinInjectionMolding/data/Versuchsplan/normalized/'
charges = list(range(1,275))
split = 'all'

y_label = ['Durchmesser_innen']

u_label = ['Düsentemperatur', 'Werkzeugtemperatur', 'Einspritzgeschwindigkeit',
 'Umschaltpunkt', 'Nachdruckhöhe', 'Nachdruckzeit', 'Staudruck', 'Kühlzeit']

Die Funktion LoadSetpointData() teilt die abgelegten Daten in Trainings- und Validierungsdaten ein

In [38]:
data_train,data_val = LoadSetpointData(path,charges,split,y_label)

Es ist insbesondere bei der Verwendung Neuronaler Netze zweckmäßig, die Daten auf das Intervall [-1,1] zu skalieren, das geschieht mittels der Funktion MinMaxScale()

In [39]:
data_train = MinMaxScale(data_train,u_label+y_label)
data_val = MinMaxScale(data_val,u_label+y_label)

Ein Neuronales Netz, welches Eingangsgrößen statisch auf Ausgangsgrößen abbildet ist Static_MLP. Bei der Erzeugung einer Instanz der Klasse Static_MLP müssen einige Parameter festgelegt werden:

| Parameter | Typ | Erläuterung |
| --- | --- | :-- |
|dim_u : |int |Anzahl an Modelleingängen |
|dim_hidden | int | Anzahl der Modellausgänge |
|u_label| list of str |Namen der Eingangsgrößen, muss mit den Spaltenüberschriften in data_train, data_val übereinstimmen|
|y_label| list of str |Namen der Ausgangsgrößen, muss mit den Spaltenüberschriften in data_train, data_val übereinstimmen|
|name | str | Name des Modells, wird verwendet, um Modellparameter eindeutig zu identifizieren und bspw. von den Parametern anderer Instanzen der gleichen Klasse zu unterscheiden|
|init_proc | str | Prozedur, die bei der Initialisierung der Modellparameter angewendet werden soll. Implementiert sind 'random', 'xavier' und 'he'|


In [40]:
model = Static_MLP(dim_u=8, dim_out=1, dim_hidden=5,u_label=u_label, y_label=y_label,name='MLP', init_proc='xavier')

Die Routine ModelTraining() erhält als Argument das zu optimierende Modell, Trainings- und Validierungsdaten, wie oft das Optimierungsproblem neu initialisiert und gelöst werden soll (nichtlineares Optimierungsproblem) sowie den Modus der Modellauswertung:

| Parameter | Typ | Erläuterung |
| --- | --- | :-- |
|model : | DIM.models | Zu optimierendes Modell |
|data_train | pd.DataFrame | Trainingsdaten mit Beobachtungen in den Zeilen und Eingangs- / Ausgangsgrößen in den Spalten |
|data_val| pd.DataFrame | Trainingsdaten mit Beobachtungen in den Zeilen und Eingangs- / Ausgangsgrößen in den Spalten |
|initializations| int | Anzahl der Multistarts, i.e. wie oft die Parameter zufällig neu initialisiert und das Optimierungsproblem von vorne gelöst werden soll|
|p_opts | dict | printing Optionen für CasADi, siehe https://web.casadi.org/docs/ |
|s_opts | dict | An IPOPT zu übergebende Parameter, siehe https://coin-or.github.io/Ipopt/OPTIONS.html |
|mode | str | Art der Modellauswertung, es wird unterschieden zwischen 'parallel', 'static' und 'series'|

In [41]:
result = ModelTraining(model,data_train,data_val,initializations=1,mode='static')

Validation loss: 311.542
Validation loss: 298.712
Validation loss: 267.616
Validation loss: 210.863
Validation loss: 145.004
Validation loss: 96.6324
Validation loss: 87.0548
Validation loss: 69.4012
Validation loss: 40.9221
Validation loss: 39.1001
Validation loss: 36.8979
Validation loss: 34.7054
Validation loss: 32.2507
Validation loss: 31.8876
Validation loss: 29.6266
Validation loss: 28.5613
Validation loss: 27.9317
Validation loss: 25.2215
Validation loss: 25.1483
Validation loss: 25.0611
Validation loss: 24.6816
Validation loss: 24.3254
Validation loss: 23.3954
Validation loss: 23.0189
Validation loss: 22.9952
Validation loss: 22.6668
Validation loss: 22.4103
      solver  :   t_proc      (avg)   t_wall      (avg)    n_eval
callback_fun  |   1.06 s (  1.06ms)   1.06 s (  1.06ms)      1001
       nlp_f  |   3.84 s (  1.37ms)   3.85 s (  1.37ms)      2809
  nlp_grad_f  |   4.35 s (  4.34ms)   4.35 s (  4.34ms)      1002
  nlp_hess_l  | 295.64 s (295.64ms) 295.64 s (295.64ms)      

Für gewöhnlich müssen einige Multistarts ausgeführt werden (mindestens 10) für dieses Tutorial wird aus Zeitgründen nur ein einziger Optimierungsdurchlauf durchgeführt

ModelTraining() gibt einen Pandas DataFrame zurück. Dieser enthält den Wert der Kostenfunktion des Modells jeweils auf den Trainings- und Validierungsdaten sowie die zugehörigen Modellparameter. Die Instanz der Klasse Static_MLP selbst ist unverändert. Die neuen Parameter müssen dem Modell erst noch zugewiesen werden: 

In [42]:
 model.Parameters = result.loc[0,'params_val']

Das Modell mit den optimierten Parametern kann nun bspw. auf den Validerungsdaten (oder Daten des laufenden Betriebs) ausgewertet werden. Die Funktion static_mode() wertet ein statisches Modell auf einem gegebenen Datensatz aus.

In [44]:
_,prediction = static_mode(model,data_val)

ValueError: Must pass 2-d input. shape=(548, 1, 1)

Visualisiere die Ergebnisse, indem die bekannten wahren Qualitätswerte sowie die vom Modell prädizierten Qualitätswerte geplottet werden

In [None]:
fig, ax = plt.subplots(figsize=(20, 10))
sns.stripplot(x=data_val.index,y=data_val['Durchmesser_innen'],color='grey',alpha=.8,size=15,ax=ax)
sns.stripplot(x=prediction.index,y=prediction['Durchmesser_innen'],size=15,ax=ax)
ax.set_xlim([1,50]) 