# Keras und MNIST

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
import random

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

In [None]:
!python --version
print("NumPy: " + np.__version__)
print("Keras: " + tf.keras.__version__)
print("TensorFlow: " + tf.__version__)

# Hardwareunterstützung?
tf.config.list_physical_devices()

### Datensatz importieren

In [None]:
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

In [None]:
# Daten anzeigen
# Anzeige der Größe/Dimensionen der Variablen

print("train_images shape", train_images.shape)
print("train_labels shape", train_labels.shape)
print("test_images shape", test_images.shape)
print("test_labels shape", test_labels.shape)

#### Daten anzeigen/visualisieren

In [None]:
# Hilfsfunktion, um Daten formatiert auszugeben
def matprint(mat, fmt="g"):
    col_maxes = [max([len(("{:"+fmt+"}").format(x)) for x in col]) for col in mat.T]
    for x in mat:
        for i, y in enumerate(x):
            print(("{:"+str(col_maxes[i])+fmt+"}").format(y), end="  ")
        print("")

# Ausgeben eines Wertes
matprint(train_images[2])

In [None]:
# Daten als Bild ausgeben
index = 2678

plt.figure(figsize=(4, 4))
plt.imshow(train_images[index], cmap=plt.get_cmap('gray'));
plt.title("Label: %d" % train_labels[index]);

In [None]:
# Größe der Abbildung ändern
plt.rcParams['figure.figsize'] = (16,7)

# Zufällige Auswahl an Bildern aus dem Trainingsdatensatz
for i in range(18):
    plt.subplot(3,6,i+1)
    num = random.randint(0, len(train_images))
    plt.imshow(train_images[num], cmap='gray', interpolation='none')
    plt.title("Label: {}".format(train_labels[num]))
plt.tight_layout()

#### Serialisieren

In [None]:
# Umformen des Trainings- und Testdatensatzes
# 28x28 Pixel => Vektor mit 784 Pixeln
train_images = train_images.reshape(60000, 784)
test_images  = test_images.reshape(10000, 784)

In [None]:
train_images[0]

#### Normalisieren

In [None]:
# Konvertierung Integer => 32-Bit Fließkommawert
train_images = train_images.astype('float32')
test_images  = test_images.astype('float32')

# Normalisieren der Werte
# Jedes Pixel besitzt einen Wert zwischen 0...1
train_images = train_images / 255
test_images  = test_images / 255

print("Trainingsdaten:", train_images.shape)
print("Testdaten:", test_images.shape)

In [None]:
# Ausgabe der neuen Matrix
def matprintfloat(vector, cols=28, rows=28):
    idx = 0
    for c in range(cols):
        for r in range(rows):
            if (vector[idx] == 0.0):
                print('    ', end='')
            else:
              print("%.1f " % vector[idx], end='')
            idx += 1
        print("")

matprintfloat(train_images[0])

#### Ausgangswerte ins 1-Hot-Format umformen

Umformen der Klassen (eindeutige Ziffern) ins One-Hot-Format:

```
0 -> [1, 0, 0, 0, 0, 0, 0, 0, 0]
1 -> [0, 1, 0, 0, 0, 0, 0, 0, 0]
2 -> [0, 0, 1, 0, 0, 0, 0, 0, 0]
...
9 -> [0, 0, 0, 0, 0, 0, 0, 0, 1]
```

In [None]:
# Labels original
train_labels

In [None]:
nb_classes = 10 # Anzahl an eindeutigen Ziffern

train_labels = tf.keras.utils.to_categorical(train_labels, nb_classes)
test_labels  = tf.keras.utils.to_categorical(test_labels, nb_classes)

In [None]:
#train_labels[0]            # Anzeige der Klasse im One-Hot-Format
train_labels[0].argmax()  # Anzeige der Klasse

### Entwurf des neuronalen Netzes

In [None]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Input(shape=[784,]))
model.add(tf.keras.layers.Dense(128, activation='relu'))
model.add(tf.keras.layers.Dense(64, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# Zusammenfassung
model.summary()

In [None]:
# Kompilierung
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

### Training des neuronalen Netzes

In [None]:
model.fit(train_images, train_labels, batch_size=200, epochs=20, verbose=1)

### Evaluation

In [None]:
scores = model.evaluate(test_images, test_labels, verbose=1)
print("Fehler: %.2f%%" % (100-scores[1]*100))

### Vorhersage

In [None]:
index = 3   # => Indexwert des Testdatensatzes

predict = model.predict(test_images)
#print("Vorhersage: %d" % predict[index].argmax())
#print("Label:      %d" % test_labels[index].argmax())

# Grafische Ausgabe des Ergebnisses
plt.imshow(test_images[index].reshape(28,28), cmap=plt.get_cmap('gray'));
plt.title("Vorhersage: %d, Label: %d" % (predict[index].argmax(), test_labels[index].argmax()));

### Performance

In diesem Abschnitt untersuchen wir, welche Bilder richtig zugeordnet wurden und bei welchen Bildern dies nicht gelingt. Dazu stellt man typischerweise eine sog. Konfusionsmatrix auf. Die Konfusionsmatrix zeigt, welche Klassen erkannt wurden und wie der wahre Wert lautet.

In [None]:
import sklearn
import itertools

print("sklearn: " + sklearn.__version__)

In [None]:
def plot_confusion_matrix(cm, classes,
                          normalize=False,
                          title='Konfusionsmatrix',
                          cmap=plt.cm.Blues):
    """
    This function prints and plots the confusion matrix.
    Normalization can be applied by setting `normalize=True`.
    """
    plt.figure(figsize=(6,6))
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    #plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]

    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, cm[i, j],
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    plt.tight_layout()
    plt.ylabel('Wahre Klasse')
    plt.xlabel('Vorhergesagte Klasse')

In [None]:
confusion_mtx = sklearn.metrics.confusion_matrix(test_labels.argmax(axis=1), predict.round().argmax(axis=1))
plot_confusion_matrix(confusion_mtx, classes = range(10))

### Fehleranalyse

In [None]:
# Finde die Indizes, bei denen die vorhergesagten Werte nicht mit den Labels übereinstimmen
np.where(np.not_equal(np.argmax(predict, axis=1), np.argmax(test_labels, axis=1)))

In [None]:
index = 18

label = ('0', '1', '2', '3', '4', '5', '6', '7', '8', '9')

f = plt.figure(figsize=(10,4))
ax1 = f.add_subplot(121)
ax2 = f.add_subplot(122)

ax1.bar(label, predict[index], align='center')
ax1.set_ylabel('Wahrscheinlichkeit')
ax1.set_title("Vorhersage: %d, Label: %d" % (predict[index].argmax(), test_labels[index].argmax()));

ax2.imshow(test_images[index].reshape(28,28), cmap=plt.get_cmap('gray'));