# 3.4 Ein Einfaches Neuronales Netz

In [None]:
#
# Führe diese Zelle aus, um die benötigten Pakete zu installieren.
# Falls du die Pakete bereits installiert hast, kannst du diese Zelle überspringen.
#
%pip install numpy
%pip install pandas
%pip install matplotlib
%pip install scikit-learn

In [None]:
import random
import os.path
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, confusion_matrix  
import matplotlib.pyplot as plt

In [None]:
# Generate random hash
hash = random.getrandbits(16)
print("Hash: ", hash)

In [None]:
# Lade den Iris-Datenset
data_train = pd.read_csv('./input/iris.csv')

In [None]:
# Die 3 zu erkennenden Klassifikationsklassen werden zu numerischen Werten 0, 1 bzw. 2 umgewandelt.
data_train.loc[data_train['species']=='Iris-setosa', 'species']=0
data_train.loc[data_train['species']=='Iris-versicolor', 'species']=1
data_train.loc[data_train['species']=='Iris-virginica', 'species']=2
data_train = data_train.apply(pd.to_numeric)

In [None]:
# Der eingelesene Datenset wird als Matrix dargestellt
data_train_array = data_train.values # oder data_train.to_numpy()

In [None]:
# Zur Sicherstellung der Reproduzierbarkeit der Ergebnisse setzen wir random.seed auf eine festen Wert, z.B. 42
np.random.seed(17)

Das Datenset wird in zwei separate Kategorie gespaltet: Testdaten und Trainingsdaten. 

80% der Daten werden zum Trainieren und 20% zum Testen des Modells verwendet. 

Da es sich bei der Eingabe um einen Vektor handelt, werden wird den Großbuchstaben X benutzen.

Für die Ausgabe hingegen handelt es sich um ein einzelner Werte, 
daher die Bezeichung mit dem Kleinbuchstaben y.

In [None]:
X_train, X_test, y_train, y_test = train_test_split(data_train_array[:,:4],
                                                    data_train_array[:,4],
                                                    test_size=0.2)

### Version 1
Ein neuronales Netz zur Klassifikation (MultiLayerPerceptron) wird mit folgenden Eigenschaften gebildet:
- einem Input-Layer mit 4 Neuronen, die die Merkmale der Iris-Planze repräsentieren
- einem Hidden-Layer mit 10 Neuronen
- einem Output-Layer mit 3 Neuronen, die die zu erkennenden Klassen repräsentieren

Dabei wird als Aktivierungsfunktion relu und als Optimierer adam verwenden.

<img src="img/network_01.png" height="400"/>

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(10,),activation='relu', solver='adam', max_iter=350, batch_size=10, verbose=True)

### Version 2
Erstelle eine zweite Version des neuronalen Netzes mit folgenden Eigenschaften:
- einem Input-Layer mit 4 Neuronen, die die Merkmale der Iris-Planze repräsentieren
- zwei Hidden-Layer mit jeweils 3 und 5 Neuronen
- einem Output-Layer mit 3 Neuronen, die die zu erkennenden Klassen repräsentieren

Füge die Zweite Version direkt unter der Ersten ein. Und führe die neu Zelle und alle folgenden aus.

<img src="img/network_02.png" height="400"/>

In [None]:
# Zweite Version:


In [None]:
# Das neuronale Netz wird mit den Trainingsdaten traniert
mlp.fit(X_train, y_train)

In [None]:
# Das Ergebnis des Training wird ausgegeben
print("Trainingsergebnis: %5.3f" % mlp.score(X_train, y_train))

In [None]:
# Das Modell wird mit den Testdatensdaten evaluiert
predictions = mlp.predict(X_test)
# und die Konfusionsmatrix ausgegeben
print(confusion_matrix(y_test,predictions))  

In [None]:
# Aus der Konfusionsmatrix werden precison, recall und f1-score berechnet und ausgebenen
print(classification_report(y_test,predictions)) 

In [None]:
# Das Modell wird getest und das Ergebnis ausgegeben
print("Testergebnis: %5.3f" % mlp.score(X_test,y_test))

In [None]:
# Folgendes gibt die Werte der Gewichte pro Layer aus
print("WEIGHTS:", mlp.coefs_)
print("BIASES:", mlp.intercepts_) 

In [None]:
# Das Modell wird beispielsweise zur Vorhersage auf folgenden Werten 
# aus dem Testset angewandt mit den Merkmalen [sepal-length, sepal-width, 
# petal-length, petal-width]
print(mlp.predict([[5.1,3.5,1.4,0.2], [5.9,3.,5.1,1.8], [4.9,3.,1.4,0.2], [5.8,2.7,4.1,1.]]))

In [None]:
# Die Loss-Kurve wird visualisiert und in der Datei Plot_of_loss_values.png im PNG-Format gespeichert.
loss_values = mlp.loss_curve_
plt.plot(loss_values)
# Check, if there is already a file with the same name
# If yes, add a number to the filename
i = 0
while os.path.isfile("./output/plot_of_loss_values.png"):
    i += 1
    plt.savefig("./output/plot_of_loss_values" + str(i) + ".png")
plt.show()