# codecentric.AI Bootcamp - Convolutional Neural Networks

## Aufgaben + Lösungen

Hier findet ihr die Lösungen zu den Convolutional Neural Networkst.

Die folgenden Pakete werden geladen:

In [None]:
import cv2
import numpy as np
import pandas as pd
import random
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# image processing
from keras.preprocessing import image as image_utils
from keras.preprocessing.image import img_to_array

# build your own nets
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten, Conv2D, MaxPooling2D
from keras.optimizers import Adam
from keras.layers.normalization import BatchNormalization
from keras.layers.advanced_activations import LeakyReLU

### Daten

Die Daten (also die Bilder), die wir verwenden, sind von [Kaggle](https://www.kaggle.com/moltean/fruits/data) und zeigen verschiedene Früchte auf weißem Hintergrund. Einen Teil dieser Früchte haben wir euch in den `data` Ordner gelegt, damit ihr direkt loslegen könnt. Diese Bilder sind in dem Ordner `fruits-360` gespeichert, der zwei Unterordner enthält: `Training` und `Test`. Beide Unterordner enthalten wieder Unterordner mit den Namen der einzelnen Früchte. Hier wollen wir die **Trainingsbilder** zu trainieren des CNNs verwenden und die Testbilder zum testen. Entsprechend definieren wir die Pfade:

In [None]:
train_image_files_path = "/data/fruits-360/Training/"
test_image_files_path = "/data/fruits-360/Test/"

### Aufgabe 1: Vorbereitung des Modells

Definiere die folgenden Objekte:

- `fruit_list`: Suche dir 10 verschiedene Früchte aus dem Trainingsordner aus und definiere sie in einer Liste
- `output_n`: Anzahl der **Klassen** (also der zu klassifizierenden Früchte).
- `img_width` und `img_height`: **Größe** der Bilder auf 25 x 25 runterskaliert.
- `channels`: Anzahl der **Farbkanäle**. Hier 3, da wir Farbbilder mit RGB-Kanälen haben.
- `batch_size`: Definiert die Anzahl der Bilder, die gemeinsam den Optimierungs- + Backpropagation-Prozess durchlaufen. Soll hier 16 sein.
- `epochs`: Anzahl der Runden (**Epochen**), die unser CNN trainiert werden soll. Wir starten mit 6.

In [None]:
fruit_list = ___

output_n = ___
img_width = ___
img_height = ___
channels = 3

batch_size = ___
epochs = ___

### Aufgabe 2: Bilder mit Keras einlesen

- Definiere die `ImageDataGenerator` für Trainingsdaten.
- Skaliere die Bilder indem durch den maximalen Pixelwert von 255 geteilt wird.
- Definiere einen Validierungssplit von 30% (**Hinweis:** Gucke dir die Hilfe der Funktion mit `?ImageDataGenerator` an).

In [None]:
train_data_gen = ___(
    rescale = ___,
    ___
)

- Lade die **Trainingsbilder** mit der `flow_from_directory` Funktion.
- Lade die **Validierungsbilder** mit der `flow_from_directory` Funktion.

In [None]:
train_image_array_gen = ___(
    ___,
    target_size = ___,
    class_mode = ___,
    classes = ___,
    color_mode = ___, 
    batch_size = ___,
    ___ = ___,
    seed = 42)

valid_image_array_gen = ___(
    ___,
    target_size = ___,
    class_mode = ___,
    classes = ___,
    color_mode = ___, 
    batch_size = ___,
    ___ = ___,
    seed = 42)

### Aufgabe 3: Das Keras-Modell erstellen

- Starte mit der Initialisierung des sequentiellen Modells.
- Füge einen Convolution Layer hinzu mit 16 Filtern, Fenstergröße von 3x3 und Schrittgröße von 1.
- Füge eine ReLU-Aktivierung hinzu.
- Füge einen zweiten Convolution Layer hinzu mit xx Filtern, Fenstergröße von 3x3 und Schrittgröße von 1.
- Füge eine weitere ReLU-Aktivierung hinzu.
- Füge Batch-Normalisierung hinzu.
- Füge eine Max-Pooling-Schicht mit 2x2 Fenstern hinzu.
- Füge 25% Dropout hinzu.
- "Flatte" die Daten und füge einen Dense Layer mit 300 Knoten hinzu.
- Füge eine weitere ReLU-Aktivierung hinzu.
- Füge nochmal 25% Dropout hinzu.
- Füge die Output-Schicht hinzu.
- Nutze in dieser Schicht die Softmax-Aktivierungsfunktion.

In [None]:
model = ___
___(___ = 16, 
                 kernel_size = ___,
                 strides = ___,
                 padding = "same", 
                 input_shape = ___)
___
___(___, padding = "same"))
___
___
___
___
___
___
___
___
___
___

- Kompiliere das Modell mit kategorischer Kreuzentropie und dem Adam-Optimizer.

In [None]:
___(loss = ___, 
              optimizer = ___(lr = 0.0001),
              metrics = ['accuracy'])

- Definiere die Anzahl der Trainings- und Validierungsproben in den folgenden Objekten:

In [None]:
train_samples = ___
valid_samples = ___

### Aufgabe 4: Das Modell trainieren

- Trainiere das Modell mit Trainings- und Validierungsdaten für die oben definierte Anzahl an Epochen.

In [None]:
history = ___(
    ___,
    steps_per_epoch = int(train_samples / batch_size), 
    epochs = epochs, 
    validation_data = ___,
    validation_steps = int(valid_samples / batch_size),
    verbose = 1
)

In [None]:
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'validation'], loc = 'lower right')
plt.show()

In [None]:
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'validation'], loc = 'upper right')
plt.show()

### Aufgabe 5: Vorhersage auf Testdaten

- Definiere wieder einen `ImageDataGenerator` und benutze `flow_from_directory`, dieses Mal aber für die Testdaten im Ordner "Test", wie wir ihn oben definiert haben.

In [None]:
test_data_gen = ___(
    ___
)

test_image_array_gen = ___(
    ___,
    target_size = (img_width, img_height),
    class_mode = ___,
    classes = ___,
    color_mode = 'rgb', 
    batch_size = batch_size,
    shuffle = False,
    seed = 42)

- Definiere nun die Anzahl der Trainingsbilder.

In [None]:
test_samples = ___

- Bewerte die Vorhersage auf Testbildern.

In [None]:
___(___,
    steps = int(test_samples / batch_size))

Der oben zu sehenden Output zeigt die Performance-Metriken Loss und Genauigkeit (`model.metrics_names`). 

Alternativ können wir auch ohne Kenntnisse der Klassen Vorhersagen auf Testdaten machen. Dafür definieren wir `flow_from_directory` wie folgt mit class mode als "None":

In [None]:
test_image_array_gen = ___(
    ___,
    target_size = (img_width, img_height),
    class_mode = ___,
    color_mode = 'rgb', 
    batch_size = batch_size,
    shuffle = False,
    seed = 42)

- Wende die Vorhersagefunktion aus Keras auf dem `ImageDataGenerator` an.

In [None]:
pred = ___(___,
           steps = int(test_samples / batch_size))
predicted_class_indices=np.argmax(pred,axis=1)
predicted_class_indices

In [None]:
labels = (train_image_array_gen.class_indices)
labels = dict((v,k) for k,v in labels.items())
predictions = [labels[k] for k in predicted_class_indices]

In [None]:
random.sample(predictions, 10)