# Lösung zum MNIST Datensatz mit 99.25% Genauigkeit 

**HINWEIS:** Keine Angst, ihr müsst nicht verstehen was/wie in diesem Notebook gemacht wird. Wir werden euch noch die kommenden Wochen genauer erklären, was die einzelnen Netzeigenschaften sind und wofür sie gut sind. 
Wir wollten euch diese Lösung nur mitgeben, um zu zeigen, dass wir auch eine weitaus bessere Genauigkeit, als in dem Video zu der MNIST Lösung in Woche 2, erreichen können.

Seht es somit als Motivation, was wir in dem Kurs alles noch lernen und wie stark wir uns damit verbessern werden.

In diesem Notebook wird ein "Convolutional Neural Network" (was Convolutional bedeutet erfahrt ihr in Woche 3) mit dem MNIST Datensatz verwendet. 

Dieses Netz erreicht bis zu 99.25% Genauigkeit bei den Testdaten nach 12 Epochen. Hierbei kann eventuell noch eine höhere Genauigkeit erreicht werden, wenn man an den Parametern herum schraubt. Solltet ihr daran interesse haben und generell sehen wollen, wie Veränderungen der Parameter eventuell die Genauigkeit beeinflussen, dann spielt damit doch einmal herum. 

In [0]:
from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense                                                                   # Diese Art von Schicht kennen wir bereits
from keras.layers import Conv2D, MaxPooling2D, Dropout, Flatten                                  # Diese Schichten lernen wir in Woche 3 und 4 näher kennen
from keras import backend as K

batch_size = 128                                                                                 # Batch Größe
num_classes = 10                                                                                 # Anzahl der Klassen (Ausgabeneuronen - Zahlen zwischen 0 und 9)
epochs = 12                                                                                      # Anzahl der Epochen
img_rows, img_cols = 28, 28                                                                      # Dimension der Eingabedaten

(x_train, y_train), (x_test, y_test) = mnist.load_data()                                         # Laden der Daten und aufteilen in Trainings- und Testdaten

# Notwendige Umformungen der Daten für die anschließende Verwendung in dem "Convolutional Neural Network"
if K.image_data_format() == 'channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols)
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

x_train = x_train.astype('float32')                                                              # notwendige Datentypkonvertierung
x_test = x_test.astype('float32')                                                                # notwendige Datentypkonvertierung
x_train /= 255                                                                                   # Normalisierung der Trainingsdaten
x_test /= 255                                                                                    # Normalisierung der Testdaten

# Wie bereits bekannt, erwarten wir die Labels als Vektor (z.b. 5 als [0,0,0,0,0,1,0,0,0,0])
y_train = keras.utils.to_categorical(y_train, num_classes)                                       # Umformung der Trainingslabel
y_test = keras.utils.to_categorical(y_test, num_classes)                                         # Umformung der Testlabel

model = Sequential([
                    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape),  # Werden wir in Woche 3 kennenlernen!
                    Conv2D(64, (3, 3), activation='relu'),                                       # Werden wir in Woche 3 kennenlernen!
                    MaxPooling2D(pool_size=(2, 2)),                                              # Werden wir in Woche 3 kennenlernen!
                    Dropout(0.25),                                                               # Werden wir in Woche 4 kennenlernen!
                    Flatten(),                                                                   # Werden wir in Woche 3 kennenlernen!
                    Dense(128, activation='relu'),                                               # Kennen wir bereits!
                    Dropout(0.5),                                                                # Werden wir in Woche 4 kennenlernen!
                    Dense(num_classes, activation='softmax'),                                    # Die Aktivierungsfunktion Softmax werden wir in Woche 3 kennenlernen!
])

model.compile(loss=keras.losses.categorical_crossentropy,                                        # Die Kostenfunktion categorical_crossentropy werden wir in Woche 3 kennenlernen!
              optimizer=keras.optimizers.Adadelta(),                                             # Den Optimizer Adadelta werden wir in Woche 3 kennenlernen!
              metrics=['accuracy'])

model.fit(x_train, y_train,
          batch_size=batch_size,                                                                 # Kennen wir bereits!
          epochs=epochs,                                                                         # Kennen wir bereits!
          verbose=1,
          validation_data=(x_test, y_test))                                                      # Wir validieren nach jeder Epoche, wie hoch die derzeitige Genauigkeit ist und übergeben hierfür die gesamten Testdaten (mit diesen wird nicht trainiert).

score = model.evaluate(x_test, y_test, verbose=0)                                                # Wir berechnen die Genauigkeit des Netzes, um sie nachfolgend ordentlich anzugeben

print('Fehler auf den Testdaten:', score[0])                                                     # Ausgabe der Ergebnisse
print('Accuracy auf den Testdaten:', score[1])

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz





Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where



Train on 60000 samples, validate on 10000 samples
Epoch 1/12





Epoch 2/12
Epoch 3/12
Epoch 4/12
Epoch 5/12
Epoch 6/12
Epoch 7/12
Epoch 8/12
Epoch 9/12
Epoch 10/12
Epoch 11/12
Epoch 12/12
Fehler auf den Testdaten: 0.02806703284695959
Accuracy auf den Testdaten: 0.9924
