<a href="https://akademie.datamics.com/kursliste/">![title](bg_datamics_top.png)</a>

<center><em>© Datamics</em></center><br><center><em>Besuche uns für mehr Informationen auf <a href='https://akademie.datamics.com/kursliste/'>www.akademie.datamics.com</a></em></center>

# Keras Grundlagen

Willkommen im Abschnitt Deep Learning (tiefgehendes Lernen)! Wir werden Keras mit einem TensorFlow-Backend verwenden, um unsere Deep Learning-Operationen auszuführen.

Das bedeutetd, wir sollten uns mit den Grundlagen von Keras bekannt machen.

## Importe



In [None]:
import numpy as np

## Datensatz

Wir werden den Datensatz Bank Authentication Data für den Anfang verwenden. Dieser Datensatz enthält verschiedene Bild-Features (Merkmale) abgeleitet von Bildern im Format 400 x 400 Pixel. Beachte hierbei, **die von uns verwendeten Daten SIND KEINE BILDER**, sie sind **Features** (Merkmale) von Bildern. In der nächsten Lektion werden wir das Bearbeiten von Bildern mit Keras behandeln. Dieses Notebook ist fokussiert auf die Grundlagen des Erzeugens von Neuronalen Netzwerken (neural networks) mit Keras.

_____
Mehr Informationen zum Datensatz:

https://archive.ics.uci.edu/ml/datasets/banknote+authentication

Die Daten wurden extrahiert von Bildern von echten und gefälschten Banknoten-artigen Objekten. Für die Digitalisierung wurde eine für die Inspektion von Druckerzeugnissen entwickelte Industriekamera verwendet. Die endgültigen Bilder haben 400 x 400 Pixel. Durch die Objektivlinse und Entfernung zum untersuchten Objekt konnten Graustufenbilder mit einer Auflösung von etwa 660 dpi gewonnen werden. Wavelet-Transformationswerkzeuge wurden verwendet, um die Features aus den Bildern zu extrahieren.


Attributinformation:

1. Varianz des transformierten Wavelet Bildes (stufenlos) 
2. Asymmetrie des transformierten Wavelet Bildes (stufenlos) 
3. Kurtosis des transformierten Wavelet Bildes (stufenlos) 
4. Entropie des Bildes (stufenlos) 
5. Klasse (Ganzzahl) 

## Den Datensatz einlesen

Wir haben den Datensatz bereits heruntergeladen, er ist im Verzeichnis DATA. Lass ihn uns nun öffnen.

In [None]:
from numpy import genfromtxt
data = genfromtxt('../DATA/bank_note_data.txt', delimiter=',')

In [None]:
data

In [None]:
labels = data[:,4]

In [None]:
labels

In [None]:
features = data[:,0:4]

In [None]:
features

In [None]:
X = features
y = labels

## Teile den Datensatz in Trainings- und Testdaten

Es ist an der Zeit, die Daten aufzuteilen für Training und Test. Behalte im Hinterkopf, dass manche gerne in drei Teile aufteilen, Training/Test/Validierung. Vorerst werden wir bei der einfacheren Variante bleiben. **Bitte beachte die Erklärung im Video, wieso wir aufteilen und was die ganzen Parameter bedeuten!**

In [None]:
from sklearn.model_selection import train_test_split

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

In [None]:
X_train

In [None]:
X_test

In [None]:
y_train

In [None]:
y_test

## Die Daten standardisieren

Bei der Anwendung Neuronaler Netzwerke ist die Leistung üblicherweise besser, wenn die Daten standardisiert werden. Standardisierung bedeutet lediglich, dass die Daten in ein bestimmtes Intervall passen, wie 0-1 oder -1 to 1.

Die Scikit Learn-Bibliothek stellt auch schöne Funktionen dafür bereit.

http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html

In [None]:
from sklearn.preprocessing import MinMaxScaler

In [None]:
scaler_object = MinMaxScaler()

In [None]:
scaler_object.fit(X_train)

In [None]:
scaled_X_train = scaler_object.transform(X_train)

In [None]:
scaled_X_test = scaler_object.transform(X_test)

Ok, jetzt haben wir die Daten skaliert!

In [None]:
X_train.max()

In [None]:
scaled_X_train.max()

In [None]:
X_train

In [None]:
scaled_X_train

## Das Netzwerk mit Keras aufbauen

Lasst uns ein einfaches Neuronales Netzwerk bauen!

In [None]:
from keras.models import Sequential
from keras.layers import Dense

In [None]:
# Erzeuge das Modell
model = Sequential()
# 8 Neuronen, erwarte Eingabe von 4 Features.
# Spiele herum mit der Anzahl von Neuronen!!
model.add(Dense(4, input_dim=4, activation='relu'))
# Füge ein weiteres Densely Connected layer (dicht verbundene Schicht; jedes Neuron ist mit jedem Neuron der nächsten Schicht verbunden) hinzu
model.add(Dense(8, activation='relu'))
# Die letzte Schicht ist eine einfache, sigmoide Funktion zur Ausgabe von 0 oder 1 (unserer Labels [Kennzeichen])
model.add(Dense(1, activation='sigmoid'))

### Modell kompilieren

In [None]:
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

## Modell trainieren

In [None]:
# Spiele auch mit der Anzahl der Epochen herum!
model.fit(scaled_X_train,y_train,epochs=50, verbose=2)

## Vorhersage neuer, ungesehener Daten

Lasst uns mit **neuen Daten** überprüfen, wie gut unsere Vorhersage ist. Wie du dich erinnerst, hat unser Modell **nie** die vorher skalierten Testdaten gesehen! Dies ist genau der gleiche Prozess, den du mit komplett neuen Daten verwenden würdest. Beispielsweise eine brandneue Banknote, die du gerade analysierst.

In [None]:
(model.predict(scaled_X_test) > 0.5).astype("int32")

# Modellleistung evaluieren

Wie gut waren wir? Wie messen wir überhaupt "gut"? Ist 95% Treffsicherheit gut genug? Das ist alles abhängig von der Situation. Wir müssen ausserdem recall (Rückruf) und precision (Präzision) berücksichtigen. Stelle sicher, die Videodiskussion zur Klassifizierungsevaluation vor dem ausführen dieses Codes anzusehen!

In [None]:
model.metrics_names

In [None]:
model.evaluate(x=scaled_X_test,y=y_test)

In [None]:
from sklearn.metrics import confusion_matrix,classification_report

In [None]:
predictions = (model.predict(scaled_X_test) > 0.5).astype("int32")

In [None]:
confusion_matrix(y_test,predictions)

In [None]:
print(classification_report(y_test,predictions))

## Speichern und Laden von Modellen

Nachdem wir nun ein Modell trainiert haben, schauen wir uns an, wie wir es speichern und laden können.

In [None]:
model.save('myfirstmodel.h5')

In [None]:
from keras.models import load_model

In [None]:
newmodel = load_model('myfirstmodel.h5')

In [None]:
newmodel.predict_classes(X_test)

Gut gemacht! Du weißt jetzt, wie die Daten vorzubereiten sind, wie ein Neuronales Netzwerk trainiert wird und wie die Klassifizierungsleistung beurteilt wird!