# Iris-DB mit MLP

Beim Iris-Datensatz haben wir gesehen, dass die zusammengehörenden Datensätze im vierdimensionalen Raum nahe beieinanderliegen, also __Cluster__ bilden. Durch einfaches Betrachten verschiedener Darstellungen der Daten konnten wir diese Cluster leicht trennen. Der "natürliche" Ansatz, dies zu autimatisieren, war die Methode des __k-means__: Wir suchten k = 3 verschiedene Mittelwerte, um die sich diese Cluster bilden.

Obwohl das Problem dadurch hinreichend gut gelöst ist, wollen wir nun versuchen, das Problem mit einem einfachen Neuronalen Netzwerk, genauer einem Multi-Layered Perceptron, zu lösen. Diese Lösung ist zwar schon fast überdimensioniert, aber da das Problem noch übersichtlich ist, können wir die Wirkungsweise neuronaler Netzwerke hier gut erkennen, bevor wir zu größeren Problemen (was Daten-Dimension und -Volumen anbetrifft) übergehen.

## Laden der Iris-Daten

Wir lesen zunächst die Daten aus der Iris-Datenbank ein und teilen diese dann in eine Menge von Trainingsdaten auf, mit denen das Netzwerk trainiert wird, und eine Menge von Testdaten, mit denen wir dann das Ergebnis überprüfen.

Zuvor skalieren wir aber alle numerischen Werte auf den Bereich zwischen 0 und 1. Das generische MLP, dass wir verwenden, erwartet die Daten in diesem Format.

In [14]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

iris = pd.read_csv('iris.csv')
iris['CName'] = pd.factorize(iris['Name'])[0]

X, y, namen  = iris.iloc[:, :-2].values, iris.iloc[:, -1].values, iris.iloc[:, -2].values

scaler = MinMaxScaler(copy = False)
scaler.fit_transform(X );

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=4576)

## Erzeugung des MLP

Wir erzeugen unser MLP mit 

* 4 Neuronen in der Eingabeschicht (vier Features)
* 3 Neuronen in der versteckten Schicht (?)
* 3 Neuronen in der Ausgabeschicht (drei Iris-Sorten)



In [15]:
from mlp import MLP

mlp = MLP(4,3,3)

mlp.fit(X_train,y_train,epochs = 100)

## Test des Neuronalen Netzes anhand der Testdaten

In [16]:
import numpy as np
pred = np.array([mlp.predict(x) for x in X_test])

print(f'prediction: \t{pred}\nTarget: \t{y_test}')

prediction: 	[2 1 1 1 1 2 1 0 2 2 2 2 1 0 2 2 2 1 2 2 2 0 0 2 1 1 2 2 1 2]
Target: 	[2 1 1 1 1 2 1 0 2 2 2 2 1 0 2 2 2 1 2 2 2 0 0 2 1 1 2 2 1 2]


Wie gut ist unser neuronales Netz? Dazu zählen wir die Treffer auf der gesamten Menge der Testdaten:

In [17]:
score, _ = mlp.score(X_test, y_test)
print (f'Genauigkeit: {score:.1%}')

Genauigkeit: 100.0%


### Wir speichern die Gewichte des Netzwerks zur folgenden Analyse

In [6]:
mlp.save("iris")

Gewichte wurden gespeichert
