# Convolutional Neural Networks (CNNs)
In diesem Codebeispiel wird das neuronale Netz aus dem vorherigen Beispiel um Convolutions erweitert. Statistische Abhängigkeiten zwischen Bildern können mit dieser Technik modelliert werden.

Analog zu dem biologischen Konzept von rezeptiven Feldern werden in CNNs mehrere Bildpunkte auf einmal betrachtet. 3x3 Pixel Filtermatrizen werden über das zu verarbeitende Bild geschoben und mit jedem 3x3-Bildbereich verrechnet (siehe Abbildung). Die so entstandenen _activation maps_ werden weiter durch das CNN gereicht und dabei so transformiert, dass auf der letzten Neuronenschicht eine Klassenwahrscheinlichkeit abgelesen werden kann.

![Convolutions](https://upload.wikimedia.org/wikipedia/commons/4/4f/3D_Convolution_Animation.gif)

## Programmbibliotheken einbinden
Wie gewohnt werden alle benötigten Module und Klassen importiert.

In [None]:
import keras
import matplotlib.pyplot as plt
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Activation, Conv2D, MaxPooling2D, Dropout, Flatten

## MNIST-Datensatz laden
Der bekannte MNIST handwritten digits Datensatz wird von `keras.datasets` geladen.

In [None]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

## Datensatz vorverarbeiten
Im ersten Praxisblock wurde das zu verarbeitende Bild für den Input in das Netz durch den _Flatten_-Operator in einen 784-dimensionalen Vektor verwandelt. Bei der Bildverarbeitung mit CNNs geschieht dies nicht, da die Pixel für die Verrechnung mit den Filtermatrizen in ihrer ursprünglichen Anordnung vorliegen müssen.

In [None]:
# Festlegen der Anzahl möglicher Labels
num_classes = 10

# Festlegen der Anzahl für das Training genutzter Bilder
num_train_images = 2000

In [None]:
# Umwandeln der Bilddaten in 28x28x1 Pixel (1-Kanal Graustufe)
x_train = x_train[0:num_train_images].reshape(-1, 28, 28, 1)
x_test = x_test.reshape(-1, 28, 28, 1)

# Normalisierung der Werte von 0 bis 1
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

# Konvertieren der Labels in das One-Hot Format
y_train = keras.utils.to_categorical(y_train, num_classes)[0:num_train_images]
y_test = keras.utils.to_categorical(y_test, num_classes)

## Modellarchitektur

In [None]:
model = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)),
    Conv2D(64, (3, 3), activation='relu'),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(num_classes, activation='softmax')
])

In [None]:
model.reset_states() 
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

## Modell trainieren

In [None]:
training_history = model.fit(x_train, y_train, epochs=10, batch_size=64, validation_data=(x_test[0:500], y_test[0:500]))

## Modell evaluieren
Wie bereits in dem ersten Beispiel kann die Qualität des trainierten Modells mithilfe des Test-Datensatzes und den Kurven der Loss-Entwicklung beurteilt werden.

In [None]:
plt.plot(training_history.history['loss'])
plt.plot(training_history.history['val_loss'])
plt.title('Loss-Entwicklung über den Trainingsverlauf')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'validation'], loc='upper left')
plt.show()

In [None]:
model.evaluate(x_test, y_test)

## Weiterführende Links

[3D visualization of a CNN](http://scs.ryerson.ca/~aharley/vis/conv/): Die Fakultät Computer Science der Universität Ryerson, Kanada hat eine interaktive 3D-Visualisierung entwickelt, um die Funktionsweise von Convolutional Neural Networks nachvollziehbar zu machen.

[The Building Blocks of Interpretability](https://distill.pub/2018/building-blocks/) ist eine anschauliche Visualisierung, die zeigt, welche Muster CNNs lernen und wie diese Muster interpretierbar gemacht werden können.

[Google Colab: Fashion MNIST](https://colab.research.google.com/github/margaretmz/deep-learning/blob/master/fashion_mnist_keras.ipynb): Das in dieser Aufgabe gelöste MNIST-Beispiel gilt teilweise als abgegriffen und mit heutigen Technologien zu einfach lösbar. Fashion-MNIST ist ein Datensatz zur Klassifizierung von Kleidungsstücken. Das Notebook hierzu läuft auf Google Colab, einer von Google bereitgestellten Jupyter Notebook Umgebung mit kostenlosen GPU-Instanzen.

[Seedbank](https://research.google.com/seedbank/seeds?keyword=mlbasics) ist eine Sammlung von interaktiven Jupyter-Notebooks zu den unterschiedlichsten ML- und Deep-Learning-Themen. Alle Notebooks laufen auf Google Colab, weshalb auch hier ein Google Account notwendig ist.